Канонир Георгий (Аспирант, Университет ИТМО)
Фильченков Андрей Александрович (к.ф.-м.н., Университет ИТМО)
|
Современные методы обучения с подкреплением имеют ряд ограничений, наложенных использующейся парадигмой искусственных нейронных сетей с точечной моделью нейрона. Использование модели «иерархической темпоральной памяти» (HTM) имеет потенциал как для развития уже устоявшихся методов обучения, так и для создания новых. Целью данной работы является предложение нового дизайна блока пространственно-темпоральной памяти, позволяющего агенту на основе модели HTM учитывать темпоральный контекст ограниченной длинны и, за счёт этого, повысить эффективность его обучения при решении задач, в которых фактически получаемое вознаграждение зависит от темпорального контекста размера меньшего, чем максимальная длинна рассматриваемых в рамках решаемой задачи последовательностей наблюдений и действия.
Ключевые слова:биологически-правдоподобные методы машинного обучения, обучение с подкреплением, иерархическая темпоральная память
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Канонир Г. , Фильченков А. А. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ОБУЧЕНИЯ АГЕНТА НА ОСНОВЕ МОДЕЛИ ИЕРАРХИЧЕСКОЙ ТЕМПОРАЛЬНОЙ ПАМЯТИ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2024. -№07. -С. 82-85 DOI 10.37882/2223-2966.2024.7.17 |
|
|