Поиск и сохранение информации в сети Internet
РЕФЕРАТ ПО ИНФОРМАТИКЕ
Internet — глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 15 миллионов абонентов в более чем 150 странах мира. Ежемесячно размер сетиувеличивается на 7—10%. Internet образует как бы ядро, обеспечивающее связь различных информационныхсетей, принадлежащих различным учреждениям во всем мире, одна с другой.
Если ранее сетьиспользовалась исключительно в качестве среды передачи файлов и сообщений электронной почты, то сегодня решаются более сложные задачи распределенного доступа к ресурсам. Фактически Internet состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, связанных между собой различными линиями связи. Internet можно представить себе в виде мозаики, сложенной из небольших сетейразной величины, которые активно взаимодействуют одна с другой, пересылая файлы, сообщения и т.п.
Поиск информации
Существует во многом справедливое мнение, что уже сегодня в Интернет “есть все” и проблема лишь в том, как найти нужную информацию. Сама открытая архитектура Сети способствует тому, что в ней отсутствует какая-либо централизация и ценнейшие для Вас данные, которые Вы безуспешно искали по всему свету, могут оказаться расположенными на сервере в одном городе с Вами.
Можно выделить 2 взаимодополняющих подхода к сбору информации о ресурсах Интернет – создание индексови создание каталогов:
При первом способе мощные поисковые серверынепрерывно “обыскивают” Интернет, создавая и пополняя базы данных, содержащие информацию о том, в каких документах Сети встречаются те или иные ключевые слова. Преимущество поискового сервера – простота работы с ним, недостаток – низкая степень отбора документов по запросу.
Во втором случае сервер организован как библиотечный каталог, содержащий иерархию разделов и подразделов, в которых хранятся ссылки на документы, соответствующие теме подраздела. Пополнение каталога обычно производится самими пользователями после проверки введенных ими данных администрацией сервера. Каталог ресурсов всегда лучше упорядочен и структурирован, но требуется время для поиска нужной категории, которую, к тому же, не всегда легко определить.
Работа с поисковыми серверами. При входе на главную страницу поискового сервера достаточно набрать в поле ввода свой запрос в виде набора ключевых слов и нажать кнопку начала поиска.
Запросы могут содержать любые слова, причем, не обязательно заботиться о падежах и склонениях – например, запросы “реферат по философии” и “философия реферат” вполне корректны.
Современные поисковые сервера достаточно хорошо понимают естественный язык, однако, на многих из них сохранены возможности расширенного или специального поиска, позволяющие искать слова по маске, объединять слова запроса логическими операциями “И”, “ИЛИ”, и т.д.
После завершения поиска в базе данных сервер выводит на экран первую порцию из 10 или более документов, содержащих ключевые слова. Кроме ссылки, обычно приведено несколько строк текста описания документа или просто его начало. Открывая ссылки в новом или этом же окне браузера, можно переходить к выбранным документам, а строка ссылок внизу страницы позволяет перейти к следующей порции документов. Эта строка выглядит примерно так:
12 3456789след
По отсутствию одной ссылки видно, что сейчас открыта вторая порция найденных документов.
Различные серверы сортируют найденные документы по разному – по дате создания, по посещаемости документа, по наличию в документе всех или части слов запроса (релевантности), некоторые серверы позволяют сузить область поиска, выбрав на главной странице категорию искомого документа – например, по запросу “банки” в категории “деловой мир” вряд ли будут найдены сведения о банках консервных.
Из популярных средств русскоязычного поиска можно назвать серверы www.yandex.ru, www.aport.ruи www.rambler.ru, индексирующие десятки тысяч серверов и десятки миллионов документов. Из зарубежных серверов популярны www.altavista.com, www.hotbot.com, www.lycos.com, www.excite.com, www.opentext.com.
Наконец, в Интернет немало страниц для метапоиска, позволяющих обратиться сразу к нескольким популярным поисковым серверам с одним и тем же запросом – посмотрите, например, страницы www.find.ruили www.rinet.ru/buki.
Работа с каталогами ресурсов. При входе на главную страницу каталога мы попадаем в обширное меню или таблицу выбора категорий, каждая из которых может содержать вложенные подкатегории. Стандарта здесь нет, но все-таки структуры каталогов во многом похожи, везде можно найди разделы “бизнес” или “деловой мир”, “компьютеры”, “программирование” или “интернет”, “юмор” или “хобби” и т.д. Перемещаясь по категориям, можно добраться до ссылок на конкретные документы, которые, так же как на поисковом сервере, выдаются порциями и сопровождаются краткой информацией.
Сегодня существует множество крупных каталогов с десятками тысяч ссылок, из отечественных каталогов можно назвать www.list.ru, www.weblist.ru, www.stars.ru, www.au.ru, www.ru, www.ulitka.ru, а из зарубежных — www.yahoo.com, www.magellan.com.
Часто в каталоге есть также форма для поиска по ключевым словам среди занесенных в него документов.
Правила поиска. Попробуем дать несколько простых советов, касающихся поиска в Сети:
заранее четко определите тему поиска, ключевые слова и время, которое Вы готовы на этот поиск потратить; выберите поисковый сервер – ссылки на лучшие из них полезно хранить в Избранном;
не бойтесь естественного языка, но проверяйте правильность написания слов, например, при помощи Microsoft Word;
используйте большие буквы только в именах и названиях. Многие поисковые сервера правильно обработают запрос “реферат”, но не “Реферат”;
не ставьте в запросах знаков препинания и избегайте “стоп-слов”, таких как “что”, “как”, “и”, “зачем” и т.д. Запрос “что такое когнитивная психология” нисколько не информативнее, чем запрос “когнитивная психология”;
локализуйте поиск – найдя сервер подходящей организации, перейдите на его главную страницу и попытайтесь поискать там;
в процессе поиска не отвлекайтесь на посторонние ссылки, какими бы интересными они ни казались.
Сохранение информации
Работа в Интернете иногда требует сохранения нужных данных и их печати. Самый простой способ копирования данных с веб–страницы – это копирование текста и вставка его в документы программ Office. Данный прием выполняется стандартным копированием через буфер обмена.
Для копирования текста с веб–страницы следует выделить нужный фрагмент, поместить в буфер обмена данных командой Правка – Копировать (или сочетанием клавиш CTRL+C). Затем отрыть программу, в который этот текст следует поместить и в нужном месте дать команду вставки: Правка – Вставить (или сочетание клавиш CTRL + V). Для быстрой сборки текстового документа очень удобны стандартные программы Windows – блокнот и WordPad. при этом следует учитывать, что графические элементы, стилевое оформление пропадают. Если есть потребность сохранения всех данных веб–страницы, рекомендуется использовать Microsoft Word. Данная программа сохраняет стилевое оформление, графические элементы и гиперссылки, но при этом объем документа выходит значительным, а сохранить документ без искажений получается только в родном формате Word.
Иногда перенос содержимого веб–страницы в другую программу неприемлемо для пользователя, тогда помогает функция сохранения страницы целиком или ее части в формате веб–документа. Для сохранения даем команду Файл – Сохранить как. В открывшемся диалоговом окне указывается место сохранения, имя файла и формат, в котором будет храниться документ. Пользователю предлагается 4 варианта:
1. Формат Веб–страница, полностью – страница сохраняется целиком вместе с используемыми шрифтами, графикой, стилями и гиперссылками. Открыв такой документ можно увидеть страницу в исходном виде в окне браузера. Исходная структура ссылок не сохраняется, при сохранении создается отдельная папка с изображениями и дополнительными файлами, необходимыми для полноценного просмотра веб–страницы.
2. Формат Веб–страница, только HTML сохраняет страницу без изображений, структура ссылок исходной страницы сохраняется.
3. Формат Текстовые файлы – сохраняет страницу в виде текстового файла, структура ссылок нарушается.
4. Формат Все файлы – используется для сохранения в каком – либо ином формате.
Многие веб–страницы используют фреймы – отдельные блоки на странице. Данные в фреймах могут формироваться отдельно от содержимого сайта. Поэтому возникает необходимость обособленно сохранять информацию во фреймах. Для сохранения отдельного фрейма на веб-странице следует поместить курсор мыши в данный фрейм и дать команду: Файл – Сохранить фрейм как. Сохранение происходит также как сохранение веб–страницы.
Современный Интернет насыщен различной информацией: статьями, книгами, рисунками, фотографиями, анимацией и др. Использование широкополостного доступа позволяет пользователям беспрепятственно копировать любую информацию. Единственным ограничением здесь является соблюдение авторских прав владельцев.