Приводятся результаты валидации 6 моделей машинного обучения для определения тональности русскоязычных публикаций по тематике качества жизни населения. Использованы коэффициенты межаннотаторского согласия – альфы Криппендорфа, каппа Коэна и каппа Флейса. Полученные значения коэффициентов показали низкий уровень надежности между экспертными метками и метками, которые были присвоены моделями. Сделаны выводы о наиболее частых причинах разногласий при определении тональности моделями машинного обучения.