Материалов:
1 005 012

Репозиториев:
30

Авторов:
761 409

Выявление источников заимствования для документа с использованием моделей дистрибутивной семантики

Дата публикации в реестре: 2020-03-03T14:14:32Z

Аннотация:

В статье предложен метод выявления источников заимствований для документа, использующий модель дистрибутивной семантики для формирования множества запросов к поисковой машине. Рассмотрены основные способы выявления заимствований и их источников. Показано, как выделить из документа запросы для поиска источников, используя векторное пространство, построенное на большом корпусе текстов при помощи инструмента Word2Vec. Приведены результаты работы метода.

Тип: Article

Права: open access

Источник: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем


Связанные документы (рекомендация CORE)