Материалов:
1 005 012

Репозиториев:
30

Авторов:
596 024

Методы тематической кластеризации применительно к анализу новостных статей

Дата публикации: 2015

Дата публикации в реестре: 2021-08-05T18:04:01Z

Аннотация:

Данная работа посвящена проблеме выделения сюжетов и тем из потока новостных сообщений. Кратко рассмотрены алгоритмы кластеризации, такие как алгоритмы k-средних, минимальное покрывающее дерево и др. Проанализированы результаты их работы на новостных текстах. В работе представлена методика комплексного анализа новостного текста, основанная на комбинации статистических алгоритмов извлечения ключевых слов и алгоритмов формирования семантической связности блоков текста. Особое внимание уделено особенностям структуры новостного текста.This paper is devoted to a problem of partition documents from the news flow into groups, where each group contains documents that are similar to each other. The existing clustering algorithms such as k-means, minimum spanning tree and etc. are considered and analyzed.

Тип: Article


Связанные документы (рекомендация CORE)