Методы тематической кластеризации применительно к анализу новостных статей

Солошенко, А. Н.; Орлова, Ю. А.; Заболеева-Зотова, А. В.

Методы тематической кластеризации применительно к анализу новостных статей

Солошенко, А. Н., Орлова, Ю. А., Заболеева-Зотова, А. В.

Дата публикации: 2015

Дата публикации в реестре: 2021-08-05T18:04:01Z

Аннотация:

Данная работа посвящена проблеме выделения сюжетов и тем из потока новостных сообщений. Кратко рассмотрены алгоритмы кластеризации, такие как алгоритмы k-средних, минимальное покрывающее дерево и др. Проанализированы результаты их работы на новостных текстах. В работе представлена методика комплексного анализа новостного текста, основанная на комбинации статистических алгоритмов извлечения ключевых слов и алгоритмов формирования семантической связности блоков текста. Особое внимание уделено особенностям структуры новостного текста.This paper is devoted to a problem of partition documents from the news flow into groups, where each group contains documents that are similar to each other. The existing clustering algorithms such as k-means, minimum spanning tree and etc. are considered and analyzed.

Ключевые слова:
материалы конференций, Оstis, тематическая кластеризация, алгоритмы кластеризации, новостные статьи, представление документов, thematic clustering, clustering algorithms, news articles, document representation

Тип: Article