Для более эффективной обработки текстовой информации необходимо всячески структурировать её. Существует множество способов структурирования, но наиболее доступным и наглядным является построение графа слов.
Для этого удобно использовать Томита-парсер.