The paper describes implementation of multi-agent
reinforcement learning tool based on temporal differences. The
possibilities of combining learning methods with statistical and
expert methods of forecasting for subsequent integration into the
forecasting subsystem for use in long-term intelligent decision
support system of real-time were considered. The work is supported by RFBR and BRFBR.В статье описываются алгоритмы методов обучения
с подкреплением на основе темпоральных различий.
Оцениваются преимущества мультиагентной технологии в рамках применения в интеллектуальных системах
реального времени. Рассматривается реализация многоагентного инструмента обучения с подкреплением на
основе темпоральных различий. Представлены способы
комбинирования методов обучения со статистическими
и экспертными методами прогнозирования. А так же
рассматриваются возможности их последующей интеграции в подсистему прогнозирования для использования в интеллектуальных системах поддержки принятия
решений реального времени.