Материалов:
1 005 012

Репозиториев:
30

Авторов:
761 409

Кто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностей/ WHO AND ABOUT WHAT SPEAKS IN "CHEERFUL" AND "SAD" TEXTS: IN SEARCH OF DISCRIMINATION FEATURES IN TEXTS OF DIFFERENT EMOTIONAL TONALITIES

Дата публикации: 2019

Дата публикации в реестре: 2021-09-06T14:29:39Z

Аннотация:

Статья посвящена рассмотрению специфики лексической сочетаемости и синтаксической комбинаторики глагольной лексемы говорить в русскоязычных Интернет-текстах, принадлежащих различным эмоциональным классам. Целью публикации является обоснование валидности использования выявленных специфических характеристик сочетаемости и комбинаторики лексемы в качестве дискриминантных черт для автоматического определения 8 эмоциональных тональностей в Интернет-текстах на русском языке. В качестве материала исследования выступает коллекция текстов, отобранных из паблика «Подслушано» в социальной сети ВКонтакте Используя восьмичастную классификацию эмоций, предложенную Г. Левхеймом, авторы соотносят каждый из текстов выборки объемом более 1 млн. токенов с определенной эмоцией посредством опоры на соответствующие хештеги и эмоциональную разметку текстов, осуществленную 36 асессорами, носителями русского языка от 19 до 45 лет. Таким образом сформированы 8 эмоциональных подкорпусов текстов. Применение метода TF / IDF взвешивания, а также учет значений относительной частотности лексем в эмоциональных подкорпусах текстов показали, что статус лексемы говорить неравноценен в разных подкорпусах : в 4 из них она имеет высокие относительную частотность и показатели статистической специфичности, а в оставшихся 4 подкорпусах – нет. С помощью использования инструментов корпусной лингвистики доказано, что значимыми для автоматической атрибуции текстов к тому или иному эмоциональному классу оказываются следующие особенности лексической сочетаемости и синтаксической комбинаторики глагола говорить: высокий процент субъектных синтаксических связей; частотность конкретных лексем (например, врач для класса Страх / Ужас) и суммарная частотность лексем одной конкретной лексико-семантической группы в позиции субъекта при глаголе говорить; частотность отдельной коллокации (например, когда люди говорят для Злость / Гнев); частотность отдельных синтаксем (например, «с собой/ себе lemma [говорить]» – для Страдания / Тоска); частотность конкурирующих синтаксем «lemma [говорить], что» и «lemma [говорить]: (прямая речь)», маркирующая склонность автора текста фокусироваться на содержании говоримого в форме прямой или косвенной речи. Будучи применены в качестве параметров, подаваемых на вход компьютерному классификатору текстов, данные дискриминантные черты позволили повысить точность атрибуции текстов к тому или иному эмоциональному классу.

Тип: Journal Article

Другие версии документа

Кто и о чем говорит в «радостных» и «грустных» текстах: В поисках дискриминантных черт текстов разных эмоциональных тональностей=WHO AND ABOUT WHAT SPEAKS IN "CHEERFUL" AND "SAD" TEXTS: IN SEARCH OF DISCRIMINATION FEATURES IN TEXTS OF DIFFERENT EMOTIONAL TONALITIES

Связанные документы (рекомендация CORE)