Данная работа посвящена проблеме выделения сюжетов и тем из потока новостных сообщений. Кратко рассмотрены алгоритмы кластеризации, такие как алгоритмы k-средних, минимальное покрывающее дерево и др. Проанализированы результаты их работы на новостных текстах. В работе представлена методика комплексного анализа новостного текста, основанная на комбинации статистических алгоритмов извлечения ключевых слов и алгоритмов формирования семантической связности блоков текста. Особое внимание уделено особенностям структуры новостного текста.This paper is devoted to a problem of partition documents from the news flow into groups, where each
group contains documents that are similar to each other. The existing clustering algorithms such as k-means, minimum spanning tree and etc. are considered and analyzed.