Сравнение Online-Q и Experience Replay для обучения нейронной сети в мультиагентной среде

Shunin E.V.

Сравнение Online-Q и Experience Replay для обучения нейронной сети в мультиагентной среде

Дата публикации в реестре: 2020-03-03T14:14:33Z

Аннотация:

В данной работе проводится сравнение двух методов обучения с подкреплением, а именно Online-Q и Experience replay. Сравнение проведено для агента, обучаемого в мультиагентной среде, которая представляет собой видеоигру “mitos.is”. При использовании нейронной сети в обучении с подкреплением возникают трудности с высокой корреляцией между примерами, которая осложняет обучение агента. Таким образом использование experience replay позволяет работать с независимыми примерами. В ходе проведенного сравнения выявлено преимущество experience replay для данной среды.

Ключевые слова:
neural networks, reinforcement learning, information technologies, conference proceedings, Q-learning, нейронные сети, обучение с подкреплением, Q обучение, информационные технологии, проведение конференции

Тип: Article

Права: open access

Источник: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем