Материалов:
1 005 012

Репозиториев:
30

Авторов:
761 409

Сравнение Online-Q и Experience Replay для обучения нейронной сети в мультиагентной среде

Дата публикации в реестре: 2020-03-03T14:14:33Z

Аннотация:

В данной работе проводится сравнение двух методов обучения с подкреплением, а именно Online-Q и Experience replay. Сравнение проведено для агента, обучаемого в мультиагентной среде, которая представляет собой видеоигру “mitos.is”. При использовании нейронной сети в обучении с подкреплением возникают трудности с высокой корреляцией между примерами, которая осложняет обучение агента. Таким образом использование experience replay позволяет работать с независимыми примерами. В ходе проведенного сравнения выявлено преимущество experience replay для данной среды.

Тип: Article

Права: open access

Источник: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем


Связанные документы (рекомендация CORE)