Вследствие постоянного увеличения объема электронной текстовой информации современное общество испытывает острую потребность в автоматизированной обработке естественного языка (ЕЯ). Главное предназначение систем автоматической обработки ЕЯ – анализировать и синтезировать тексты, то есть преобразовывать тексты из их исходного вида в некоторое абстрактное представление, приближенное к представлению смысла, и обратно. Целью предлагаемой работы является разработка лингвистического и информационного обеспечения автоматической системы для обработки англоязычных публицистических текстов и ее последующая реализация в виде обучающей компьютерной программы. В статье рассматриваются примеры различных подходов к технологии создания лингвистической базы данных для систем обработки текста естественного языка. Автор дает подробное описание основных структурных блоков принципиально нового лингвистического процессора: лексико-семантического, синтаксического и семантико-синтаксического. Основным преимуществом данного процессора является использование в алфавитном словаре специальных семантических кодов в соответствии с разработанной лексико-семантической классификацией. Это позволяет автоматической системе точно определять семантические функции ключевых слов, входящих
в выделенные в процессе синтаксического анализа группы. Что, в свою очередь, помогает избежать ошибок, характерных для такого рода систем.