Данная работа посвящена решению задачи кластеризации научных текстов. Задача тематического моделирования одна из многих задач обработки естественного языка, заслуживающая отдельного внимания. Использовать кластеризацию можно как мощный инструмент для улучшения качества работы различных сервисов, которыми пользуется человек, например, рекомендательных систем. В данной работе был проведён ряд экспериментов, произведено сравнение различных подходов к векторизации входных текстов с помощью разных метрик качеств, использующихся при решении задачи кластеризации. Результатом данной работы являются сформулированные выводы о том, какой подход самый эффективный. Также были предложены пути дальнейшего улучшения текущих результатов.