Материалов:
1 005 021

Репозиториев:
30

Авторов:
761 409

LEARNING TO PREDICT CLOSED QUESTIONS ON STACK OVERFLOW // Ученые записки КФУ. Физико-математические науки 2013 том155 N4

Дата публикации: 2013

Дата публикации в реестре: 2020-03-01T00:16:03Z

Аннотация:

В статье рассматривается задача прогнозирования вероятности того, что вопрос на сервисе Stack Overflow - популярном вопросно-ответном ресурсе, посвященном разработке программного обеспечения - будет закрыт модератором. Задача, данные и метрика оценки качества были предложены в рамках открытого конкурса по машинному обучению на сервисе Kaggle. В процессе решения задачи мы использовали широкий набор признаков для классификации, в том числе признаки, описывающие личные характеристики пользователя, взаимодействие пользователей друг с другом, а также содержание вопросов, в том числе тематическое. В процессе классификации протестировано несколько алгоритмов машинного обучения. По результатам эксперимента были выявлены наиболее важные признаки: личные характеристики пользователя и тематические признаки вопроса. Наилучшие результаты были получены с помощью алгоритма, реализованного в библиотеке Vowpal Wabbit, - интерактивного обучения на основе стохастического градиентного спуска. Наилучшая полученная нами оценка попадает в топ-5 лучших результатов в финальной таблице, но получена после даты завершения конкурса.

Тип: Article

Источник: ELIB18156088-2013-155-4-12


Связанные документы (рекомендация CORE)