Объект исследования – геномы коронавирусов.
Цель работы – сравнение двух методов выявления филогенетического отношения на примере семейства геномов коронавирусов: метода, основанного на выравнивании и метода классификации геномов по частотам триплетов.
В результате проделанной работы было отобрано 69 геномов коронавирусов из двух общедоступных баз данных и проанализированы филогенетические отношения между ними методом полногеномного выравнивания и построения филогении на его основе, а также методом классификации геномов по частотам триплетов. Топологии деревьев, полученных методом максимального правдоподобия и с применением байесовского подхода, идентичны и имели умеренную и высокую поддержку ветвей. При помощи метода динамических ядер с последовательно возрастающим числом классов построено иерархическое дерево, последний слой которого представляет собой классы тесно связанных между собой геномов, точно совпадающих с кластерами геномов, выделяемых на филогенетическом дереве. Метод упругих карт выявляет нелинейные связи между объектами (геномами), дополнительные к линейным связям, выявляемых, например, методом динамических ядер. Кластеры, выделенные методом упругих карт, также хорошо совпадают, как с классами последнего слоя слоистого графа, полученного методом динамических ядер, так и с классическим выравниванием. Проведенные вычисления показали высокую эффективность каждого из этих методов. Оба метода также показали хорошее расхождение геномов по таксономическому признаку, но по характеру вызываемых заболеваний соответствие меньше.