Теория поиска информации

Министерство образования Республики Беларусь Белорусский государственный университет информатики и радиоэлектроники Факультет информационных технологий и управления Кафедра информационных технологий автоматизированных систем ОТЧЁТ по лабораторной работе №1 “Технология поиска информации ” Выполнил: Студент гр.920603 Моторный А.В. Проверил: Заяц Минск 2011 1 Цель работы Практическое освоение технологии эффективного поиска информации. 2 Краткая характеристика использованных операторов и конструкций языка запросов. Поиск по индексу заключается в том, что пользователь формирует запрос и передает его поисковой машине. В случае, когда у пользователя имеется несколько ключевых слов, весьма полезно использование операторов и конструкций языка запросов: AND — все термины, соединенные AND, должны присутствовать в предлагаемом документе. Аналогичный результат будет получен при использовании символа “&” вместо AND; OR — как минимум одно из ключевых слов, соединенных OR, должно присутствовать в искомом документе; NOT — ключевое слово (слова), следующее за NOT, не должно появляться в искомом документе.; NEAR — одно из слов должно отстоять на определенное количество слов от другого; Кавычки — слова внутри кавычек являются фразой, которая должна быть найдена в пределах документа или файла. Скобки могут использоваться для построения вложенных запросов, изменения области действия операторов, а также для изменения принятых по умолчанию приоритетов логических операторов. При использовании скобок часть запроса, которая заключена в скобки, интерпретируется как запрос, так что на нее распространяются правила языка запросов. Существует огромное количество поисковых систем. Наиболее популярные поисковые системы — Google (http://www.google.com/), Яндекс (http://www.yandex.ru/) и Рамблер (http://www.rambler.ru/),AltaVista (http://www.altavista.com/) и др. 3 Описание результатов поиска документов Проводился поиск по теме «Синхронизирующие объекты ОС Windows». Использовались поисковые системы Google, Rambler ,Yahoo, Yandex. Вначале был создан простой запрос «синхронизирующие объекты and windows». На рисунках 1,2,3,4 приведены результаты поиска в различных поисковых системах: Рис. 1 Google Получено результатов примерно 9 580  Рис. 2 Yandex Получено результатов примерно 780 тыс. Рис. 3 Rambler По запросу найдено 9 тыс. сайтов, 49 тыс. Документов Рис. 4 Yahoo Получено результатов примерно 222 Рис. 5 Яндекс каталог Найдено по сайтам — 12455 Затем был создан более сложный запрос «"синхронизирующие объекты" NEAR windows». Полученные результаты в тех же поисковых машинных представлены на рисунках 6-9: Рис. 6 Google Получено результатов: 6 Рис. 7 Yandex Получено результатов: 6 Рис. 8 Yandex Получено результатов: 3 Для поисковой машины Ramdler создаем специальный запрос: «(5,"синхронизирующие объекты" and windows)» Рис. 9 Rambler По запросу найдено 2 сайта, 36 документов 4 Анализ результатов Наиболее эффективная поисковая система предоставлена Google, т.к. найденные страницы наиболее релевантные, т.е. они включают в себя те документы, которые содержат необходимую информацию. Также проводился поиск нужной информации в «Яндекс каталоге», где тоже были получены неплохие результаты. Использование операторов и конструкций языка запросов значительно улучшило качество полученных результатов. Количество найденных страниц существенно отличается в различных поисковых системах: Количество найденных страниц Тип поисковой системы Google Rambler Yandex Yahoo Простой запрос 9580 49000 780000 222 Сложный запрос 6 36 6 3 По результатам поиска получено, что синхронизирующие объекты ядра Windows (семафоры, мыотексы, события) нужны для того, чтобы процессы ОС Windows могли записывать информацию в общую память. 5 Выводы В данной работе была освоена технология эффективного поиска информации. Эта технология позволяет получить наиболее конкретные, релевантные результаты при осуществлении поиска информации, тем самым позволяет сэкономить время.