Одной из основных проблем машинного обучения с подкреплением является обучение агентов в условиях отсутствия или сильной разреженности обратной связи (вознаграждений) в ответ на предпринимаемые агентом действия. В данной статье рассматриваются способы добавления агенту внутренней мотивации – дополнительного механизма вознаграждения за любопытство – с целью повышения эффективности исследования среды на примере игр для Atari 2600. Training agents, when external feedback (reward) to actions is sparse or nonexistent, is a major challenge for reinforcement learning. This article considers ways of adding intrinsic motivation (an additional mechanism for rewarding curiosity) to improve exploration efficiency on Atari 2600 games.