Материалов:
1 005 012

Репозиториев:
30

Авторов:
761 409

Обзор структур алгоритмов поиска на основе отпечатков аудиоданных

Дата публикации: 03.02.2016

Дата публикации в реестре: 2020-02-28T10:43:21Z

Аннотация:

Выполнен обзор алгоритмов аудиопоиска и этапов реализации таких алгоритмов. Выявлены ключевые особенности существующих методик аудиопоиска и указаны подходы к решению задачи распознавания образа в контексте аудиоданных. Проведен анализ параметров алгоритмов аудиопоиска, характеризующих область эффективного применения (контекст задачи). В данной работе отмечены критерии устойчивости конкретного алгоритма или включенных в него этапов к искажениям. Представлена информация об эффективности поиска и ее зависимость от объема данных, а также экстремумы. Оценена скорость расчета отдельных параметров, в частности метрик сравнения, необходимых для оценки подобия искомого фрагмента и конкретного вхождения во множество поиска. Предложены методики определения степени достоверности результатов поиска, основанные на коэффициенте ложных срабатываний и коэффициенте ложных отказов. Для проведения анализа за основу брались применяемые на практике в коммерческих продуктах (таких как Shazam, MusicBrainz) алгоритмы. В статье описаны современные тенденции в развитии существующих подходов, основанные на методах анализа данных, в том числе с применением нейронных сетей, а также алгоритмов распознавания изображения. Последние, в свою очередь, требуют преобразования способа представления данных. Двоичное представление оцифрованного входного аудиосигнала можно интерпретировать как набор аудиопризнаков, либо изображений с набором визуальных признаков.


Связанные документы (рекомендация CORE)