Материалов:
1 005 021

Репозиториев:
30

Авторов:
761 409

Программа для классификации междоменной авторской атрибуции на основе pan @ clef 2019

Дата публикации в реестре: 2021-08-05T19:48:52Z

Аннотация:

Программа применяется для использования PAN в CLEF 2019 как совместной задачи в Кросс-доменной Атгрибуции Авторских прав атгрибуции Автора (АА) на таких языках как английский, французский, итальянский и испанский, каждый из которых имеет 5 задач, что в совокупности ставит 20 задач, в которых были идентифицированы 561 неизвестных авторов, где обработка совершается с помощью использования поведенческой характеристик пользователя, которые могут быть использованы для идентификации авторской работы. Программа включает модули загрузки векторных пространств слов, модуль загрузки данных кандидатов для известных авторов, модуль загрузки информации о заданиях об известных и неизвестных авторах, модуль перевода текста в вектор, модуль анализа проблем й определения языка, модуль подготовки данных, модуль оценки проблемы на основе точности, отзыва и f1 баллов, модуль оценки средних значений по каждому языку. Программа содержит вспомогательный модуль, обеспечивающий работу с набором данных. Программа предусматривает определение неизвестных авторов на основании атрибутов. Язык программирования: Python Объем программы для ЭВМ: 40 Кб

Тип: Patent

Права: open access


Связанные документы (рекомендация CORE)