ИССЛЕДОВАНИЕ ОПТИМАЛЬНОГО АЛГОРИТМА УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ИСПОЛЬЗОВАНИЕМ МЕТОДА БЕЛЛМАНА
Ключевые слова:
оптимальное управление; уравнение Беллмана; динамические системы; глубокое Q-обучение; стохастические системыАннотация
Оптимальное управление динамическими системами является одним из важных направлений современной теории управления. В статье изучаются алгоритмы оптимального управления динамическими объектами с использованием метода динамического программирования Беллмана. Описываются новые алгоритмические подходы, их значение в современных приложениях и сравнение с другими подходами.
Библиографические ссылки
R. Bellman, Dynamic Programming, Princeton University Press, 1957.
R. S. Sutton and A. G. Barto, Reinforcement Learning: An Introduction, MIT Press, 2018.
Q. Ma and J. Stachurski, “Dynamic Programming Deconstructed,” arXiv preprint, 2018.
M. I. Gomoyunov, “Dynamic Programming for Fractional-Order Systems,” arXiv preprint, 2019.
G. Barles, A. Briani, and E. Chasseigne, “A Bellman Approach for Two-Domains Optimal Control Problems,” arXiv preprint, 2011.
O. Zaripov and S. Zaripova, “Dinamik boshqarish obyektlar holatini baholash masalalari,” QMII Journal, 2023.
Загрузки
Опубликован
Лицензия
Copyright (c) 2025 Akromxo‘jayev Y, Abdusalomov A. J.

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.