|
На современном этапе общественного развития, сопровождающимся глобальной цифровизацией, особую актуальность приобрели системы помощи водителю при вождении, позволяющие осуществлять контроль дорожно-транспортной ситуации посредством использования искусственного интеллекта. Такие системы, безусловно, сделали современные транспортные средства, управляемые человеком, более эффективными и безопасными. Вместе с тем, технология беспилотных транспортных средств (автомобилей), несмотря на наличие соответствующих технологий, всё еще не стала повседневной реальностью. Такая практическая сложность связана с тем, что новое поколение беспилотных систем нуждается в алгоритмах, способных предотвращать дорожно-транспортные происшествия и справляться со сложным дорожным ситуациями подобно тому, как это делает человек, находясь за рулем транспортного средства с учетом оптимально полного перечня траекторий проезда перекрестков различными участниками дорожного движения.
Исходя из этого, необходима разработка такой модели обучения нейронных сетей, которая позволит сетям обучаться в режиме реального времени, тактически выстраивая сценарии пересечения перекрестков в режиме реального времени, то есть необходимо построение модели решения сложных многоцелевых задач. Вместе с тем, для решения задачи моделирования недостаточно просто разработать модель сети и варианты сценариев для ее обучения - для того, чтобы надлежащим образом обучить искусственную нейронную сеть, необходимо выбрать соответствующий алгоритм обучения, который позволит решить поставленную задачу оптимальным образом. Из имеющихся алгоритмов обучения наиболее оптимальным видится алгоритм глубоко детерминированного градиента политики (DDPG). Специфика работы данного алгоритма позволит обеспечить стабильность и эффективность работы модели. Алгоритм глубоко детерминированного градиента политики (DDPG) сочетает в себе преимущества алгоритмов «Субъект-критик» и DQN ((Deep Q-Learning), выбирая лучшее из них, решая тем самым сложную проблему пространства непрерывного действия через воспроизведение опыта и асинхронное обновление, что приобретает особую актуальность в тех системах, которые связаны с беспилотным управлением транспортными средствами.
Ключевые слова:генетические алгоритмы, задача оптимизации, искусственные нейронные сети, алгоритмы обучения нейронных сетей, алгоритм глубоко детерминированного градиента политики.
|