ИССЛЕДОВАНИЕ ОПТИМАЛЬНОГО АЛГОРИТМА УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ИСПОЛЬЗОВАНИЕМ МЕТОДА БЕЛЛМАНА
Ключевые слова:
оптимальное управление; уравнение Беллмана; динамические системы; глубокое Q-обучение; стохастические системыАннотация
Оптимальное управление динамическими системами является одним из важных направлений современной теории управления. В статье изучаются алгоритмы оптимального управления динамическими объектами с использованием метода динамического программирования Беллмана. Описываются новые алгоритмические подходы, их значение в современных приложениях и сравнение с другими подходами.
Библиографические ссылки
R. Bellman, Dynamic Programming, Princeton University Press, 1957.
R. S. Sutton and A. G. Barto, Reinforcement Learning: An Introduction, MIT Press, 2018.
Q. Ma and J. Stachurski, “Dynamic Programming Deconstructed,” arXiv preprint, 2018.
M. I. Gomoyunov, “Dynamic Programming for Fractional-Order Systems,” arXiv preprint, 2019.
G. Barles, A. Briani, and E. Chasseigne, “A Bellman Approach for Two-Domains Optimal Control Problems,” arXiv preprint, 2011.
O. Zaripov and S. Zaripova, “Dinamik boshqarish obyektlar holatini baholash masalalari,” QMII Journal, 2023.
Загрузки
Опубликован
Лицензия
Copyright (c) 2025 Akromxo‘jayev Y , Abdusalomov A. J.

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.