Рассмотрены особенности разметки научно-технических документов при создании корпуса узкоспециализированных текстов. Перечислены научно-технические тексты и их структурные элементы как источники наполнения корпуса. Дан их анализ с позиции разметки текстовых элементов разных уровней. Обоснована необходимость введения межуровневых видов разметки. Подчеркнута значимость введения структурной разметки при создании корпуса научно-технических текстов. Обсуждены проблемы автоматического извлечения терминов из научно-технических текстов. Показано, что наибольшую сложность представляет разметка многокомпонентных терминологических единиц в корпусе научно-технических текстов. Выделены литеральные термины как объекты, требующие разработки дополнительного инструментария для их обработки, в состав которых могут входить различные буквы, символы, цифры или их комбинации. Проанализированы референции как фактор влияния на классификацию и рубрикацию научно-технических текстов. Обоснована необходимость изучения видов референций и способов их автоматической разметки, а также введения отдельной разметки примеров в научно-технических текстах.