Рассмотрены вопросы моделирования при навигации с огибанием препятствий мобильного робота с использованием методов машинного обучения: Q-обучения, алгоритма SARSA, глубокого Q-обучения и двойного глубокого Q-обучения. Разработанное программное обеспечение включает средства Mobile Robotics Simulation Toolbox, Reinforcement Learning Toolbox и пакет визуализации Gazebo для моделирования среды. Результаты вычислительного эксперимента показывают, что для моделируемой среды размером 17 на 17 клеток и препятствия длиной в 12 клеток обучение при использовании алгоритма SARSA происходит с лучшей производительностью, чем для остальных. Предложен алгоритм огибания препятствий с исключением методов машинного обучения, и показано, что скорость огибания препятствий роботом с использования данного алгоритма выше, чем скорость обучения при применении глубокого Q-обучения и двойного глубокого Q-обучения, но ниже, чем с использованием алгоритмов SARSA и Q-обучения. Для предложенного алгоритма проведен вычислительный эксперимент с использованием среды моделирования движения робота. В пакете визуализации Gazebo 11 показано, что препятствия кубической формы огибаются быстрее, чем цилиндрической.