Проведено исследование управляемых популяционных моделей с применением машинного обучения с подкреплением. Изучены вопросы синтеза детерминированных и стохастических моделей динамики численности взаимосвязанных видов с учётом внутренних трофических взаимодействий и с учётом управляющих воздействий. Предложена постановка задачи оптимального управления в детерминированном случае. Рассмотрен подход к управлению с учётом мультипликативной зависимости плотности популяций и функций, описывающих внешние воздействия. Проведена оптимизация траекторий детерминированной модели с применением искусственных нейронных сетей. На основе метода построения самосогласованных стохастических моделей построена схема взаимодействия и разработана стохастическая модель популяционной динамики с учётом управляющих воздействий. Предложен подход к созданию алгоритмического обеспечения для программной реализации нейронной сети с учётом введения стохастики. Проведены серии вычислительных экспериментов и изучены качественные эффекты траекторной динамики. Полученные результаты могут найти применение при изучении экологических, социально-экономических и физико-химических процессов.