The paper considers the application of voice
conversion technology for developing multivoice text-to-speech
synthesis (MVTTS) in natural-language interfaces of intelligent
systems. The main features of the proposed integrated architecture of MVTTS system are presented. Voice conversion model
based on multiple regression mapping function and Gaussian mixture models, as well as the method of text-independent learning
based on hidden Markov models and modified Viterbi algorithm
are observed. Experimental evaluation of the effectiveness of
the proposed solutions on the characteristics of naturality and
similarity of synthesized speech has been done.В докладе рассмотрены вопросы применения технологии конверсии голоса для построения мультиголосовых систем синтез речи по тексту (МГСРТ) для
создания естественно-языковых интерфейсов интеллектуальных систем. Особенности предлагаемой интегрированной архитектуры МГСРТ на базе технологии конверсии голоса, функция конверсии голоса на основе модели Гауссовых смесей и множественной регрессионной
функции отображения, а также метод текстонезависимого обучения на базе скрытых Марковских моделей
и модифицированного алгоритма Витерби. Приведены
экспериментальные оценки эффективности предлагаемых решений по характеристикам узнаваемости и натуральности синтезируемой речи.