Оценка качества политики активации каналов, полученной с помощью обучения с подкреплением

Живцова А.А.; Самуйлов К.Е.

Оценка качества политики активации каналов, полученной с помощью обучения с подкреплением

Дата публикации в реестре: 2025-05-27T14:27:44Z

Аннотация:

Мобильные сети пятого поколения (5G A.) предусматривают использование многошаговой полудуплексной передачи в сети радиодоступа. В такой конфигурации для обеспечения абонентов требуемыми показателями качества необходимо особое внимание уделять задаче планирования передачи по каналам сети. Формулируя эту задачу с помощью Марковского процесса принятия решений со счетным множеством состояний, можно численно найти оптимальную политику управления с помощью методов обучения с подкреплением. Однако, возникает необходимость оценить погрешность решения, полученного с помощью численных алгоритмов. Для этого в данной работе проводится сравнение целевого показателя численно найденной оптимальной политики с результатами других известных политик.

Ключевые слова:
многошаговые беспроводные сети, активация каналов, планирование передачи, обучение с подкреплением, управляемая сеть массового обслуживания, полудуплекс, задержка

Тип: Article

Источник: Математическое моделирование и суперкомпьютерные технологии