Материалов:
1 005 021

Репозиториев:
30

Авторов:
761 409

Алгарытм і лінгвістычныя рэсурсы для нармалізацыі тэкстаў геаграфічнага дамена

Дата публикации: 2016

Дата публикации в реестре: 2020-03-03T07:03:08Z

Аннотация:

У дадзеным артыкуле апісваецца алгарытм лінгвістычнай апрацоўкі і нармалізацыі тэкстаў геаграфічнага дамена на прыкладзе вучэбнага дапаможніка “Геаграфія Беларусі”. Прыведзена паслядоўнасць крокаў вылучэння ўсіх катэгорый сімвалаў, лікаў і іншых ужыванняў, неабходных для апрацоўкі. This article covers the problem of linguistic processing and text normalization of geographic domain. It introduces steps of symbols categorization, numbers and other cases for text processing. The problem is that not all characters in text can be perceived and vocalized with automatic algorithms.

Тип: Article


Связанные документы (рекомендация CORE)