Изменчивость и неоднородность цифровой медицинской информации требует разработки современных алгоритмов по структурированию массивов данных с целью их дальнейшей статистической обработки. Цель исследования - определить ход работы по созданию набора данных (НД) при исследовании аневризм сосудов головного мозга от этапа формирования технического задания до получения финального НД. Материал и методы . Процесс создания, обработки и анализа НД пациентов с аневризмами проводился на базе университетской клиники города Турку, Финляндия. В течение последних 20 лет клиника осуществляет медицинский документооборот в цифровом формате, что позволило создать на ее базе отдел хранения цифровых данных с целью максимального сохранения любой доступной цифровой информации. Автоматизированное получение данных пациентов проводилось дата-инженером с использованием языка программирования «R» на основании кодов Международной классификации болезней (МКБ-10). Результаты и их обсуждение. В период с января 2000 по май 2018 г. в ходе первичного получения данных выявлено 3850 пациентов. После независимой перекрестной проверки электронных их историй болезни отсеяно 1218 (32 %) ложноположительных случаев. Данные по оставшимся пациентам были разделены на клинический и реанимационный блоки. Каждое событие, относящееся к конкретной временной дате в НД, определено как инфо-единица. Вся информация в обоих блоках структурирована в формате Excel и представлена в хронологическом порядке для каждого отдельного больного. В целом весь набор данных состоял из более чем 70 000 000 рядов инфо-единиц, выявленных у 2632 пациентов. Заключение. Автоматизированный поиск данных позволил создать многокомпонентный структурированный набор данных пациентов с аневризмами сосудов головного мозга. Выработанный алгоритм автоматизированного получения данных имел ограничение в отношении ложнопозитивных случаев, выявленных в 32 % случаев. Таким образом, анализ клинического материала, полученного с помощью цифровых алгоритмов, требует тщательной перекрестной проверки членами исследовательской группы.