Анализ задачи обработки текстов на естественном языке и существующих методов ее решения

УДК 004(06) Информационные технологии С.Д. КУЛИК, К.И. ТКАЧЕНКО, И.А. ЛУКЬЯНОВНациональный исследовательский ядерный университет «МИФИ»АНАЛИЗ ЗАДАЧИ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ И СУЩЕСТВУЮЩИХ МЕТОДОВ ЕЕ РЕШЕНИЯПроведен анализ проблемной области. Дана классификация существующих систем обработки естественного языка. Выполнен обзор наиболее распространенных методов, используемых на разных уровнях решения задач обработки текстов на естественном языке. Проанализированы достоинства и недостатки методов. Описана модель процесса получения информации при чтении текста. Сформулирована сильная задача обработки текстов на естественном языке. Рассмотрены возможные пути ее решения. Выдвинута гипотеза о взаимосвязи смысла и выражающего его речевого акта. Выдвинута гипотеза о естественной метрике в пространстве слов естественного языка. Предложены направления развития систем обработки текстов на естественном языке и направления дальнейших исследований.