|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Поиск web-страниц с помощью GoogleРассмотрим работу с поисковой машиной Google, мировым лидером среди поисковых машин Интернета. Эта поисковая машина обрабатывав более 50 миллионов поисковых запросов в сутки и ежедневно обновляет в своей базе данных более 8 миллиардов web-страниц. Google позволяет обнаружить не только необходимые текстовые документы, но и изображения или звуковые файлы. Как и в большинстве других машин, для поиска нужных сведений следует ввести ключевое слово или более сложный запрос с помощью специальных операций. Найденные машиной ссылки на документы будут располагаться в порядке уменьшения их соответствия запросу. Вы можете ограничить область поиска документов заголовками, датой последнего изменения или языком, например русским. Поисковая машина Google позволяет искать информацию в русскоязычной части Интернета, но более эффективна для всемирного поиска. ü Чтобы начать поиск, сначала перейдем на главную страницу поисковой машины Google. ü Установите связь с Интернетом. ü Запустите программу Microsoft Internet Explorer 7. ü В левое верхнее поле ввода введите электронный адрес поисковой машины Google http://www.google.ru. Допускается ввод и более короткого адреса google.ru, программа Microsoft Internet Explorer 7 автоматически добавит недостающие элементы адреса. ü Нажмите клавишу Enter. После загрузки на экране появится главная страница поисковой машины (см. рис. 104). Рисунок 104 — Главная страница поисковой машины Google Сущестенно, что мы можем ограничить область поиска только русскоязычными web-страницами, установив переключатель в положение Поиск страниц на русском. В противном случае поисковая машина будет производить поиск документов на всех доступных ей. После ввода запроса и нажатия кнопки Поиск в Google (Google Search) поисковая машина покажет ссылки на все страницы, которые внесены в ее базу данных и соответствуют запросу. При нажатии кнопки Мне повезет! (I'm Feeling Lucky!) результаты показаны не будут, а сразу откроется web-страница, максимально соответствующая введенному запросу. Над полем ввода расположены ссылки на дополнительные страницы поиска: Картинки (Images) –страница поиска изображений, Группы (Groups) – поиск в конференциях по интересам, Новости (News) – поиск в новостях. ü Давайте найдем документы на волейбольную тему. ü Введите в поле ввода главной страницы слово volley (Волейбол). ü Нажмите кнопку Поиск в Google (Google Search). На экране появится страница с результатами поиска информации о волейболе (см. рис. 105). Поисковая машина Google автоматически определяет язык операционной системы пользователя, поэтому не удивительно, что в результатах поиска в первую очередь отображаются ссылки на русскоязычные ресурсы Интернета. В начале страницы расположена строка с информацией о примерном количестве найденных web-страниц и указанием времени, затраченного на поиск. Ниже находятся (выделены синим цветом) ссылки на обнаруженные документы с дополнительной информацией. Последняя включает фрагмент и дату последнего изменения страницы, а также электронный адрес найденного узла в Интернете.
Рисунок 105 — Страница с результатами поиска информации о волейболе При виде количества найденных страниц стоит упомянуть, что «Google» – это искаженное написание английского слова «googol», придуманного племянником американского математика Эдварда Каснера, для обозначения числа, состоящего из единицы и ста нулей. ü Щелкните мышью на любой ссылке на документ. После загрузки на экране появится выбранная web-страница. ü Нажмите кнопку Назад (Back) на панели инструментов, чтобы вернуться на страницу с результатами поиска. На одной странице вы можете увидеть только небольшую группу найденных ссылок. Чтобы перейти на другую страницу с результатами поиска информации о волейболе, выполните следующие шаги. ü Прокрутите страницу со ссылками до конца вниз с помощью ползунка вертикальной полосы прокрутки (см. рис. 106). Обратите внимание на цифровые ссылки с подчеркиванием справа от строки Страница результатов (Results Page), которые позволяют переходить на другие страницы с результатами поиска. Ссылка без подчеркивания означает текущую страницу. Щелкните мышью на ссылке 2. На экране появится вторая страница с результатами поиска о футболе. Рисунок 106 — Нижняя часть страницы с результатами поиска Иногда необходимо найти документы, содержащие определенные сочетания слов, идущих в заданном порядке, например для поиска книг или журналов. В поисковой машине Google такие словосочетания следует заключать в двойные кавычки. Попробуем найти информацию о книге или фильме. Введите в поле ввода запроса строку «Тихий Дон». Нажмите кнопку Поиск (Search). На экране появится страница с результатами поиска (см. рис. 107). Если вы введете в поле для запроса несколько ключевых слов через пробел и без кавычек, то поисковая машина будет искать документы, которые содержат хотя бы одно слово. Кроме того, можно сформулировать запрос в виде обычного вопроса на естественном языке. Правда, в этом случае нет гарантии, что поисковая машина найдет именно то, что вам нужно. Одной из проблем при поиске информации в Интернете является чрезмерное количество найденных документов, часто достигающее сотен тысяч. К тому же, некоторые слова имеют более одного значения. Например, слово «нота» может относиться как к музыке, так и к политике. Для исключения лишних ссылок полезно уточнить запрос с помощью специальных символов, добавляемых в строку запроса. Например, по запросу Bass (Окунь, Бас) поисковая машина найдет множество страниц, касающихся музыки и рыб. Чтобы ограничить диапазон поиска любой тематикой, кроме музыкальной, следует ввести запрос в таком виде: Bass -music. Пробел перед знаком «минус» обязателен. С другой стороны, поисковая машина Google игнорирует в запросе общие слова («что», «где»), одиночные цифры и буквы, чтобы ускорить поиск. Если ищется web-страница, непременно содержащая такие слова, необходимо поставить перед ними знак «+». Пробел перед «+» обязателен. Например, Назад в будущее Часть + 2 (Back to the Future Part + 2).
Рисунок 107 — Страница с результатами поиска книги или фильма Ввиду того, что поисковые запросы при сложных условиях становятся слишком громоздкими, разработчики поисковой машины Google упростили задачу и создали специальную страницу Расширенный поиск (Advanced Search) (Рис. 5.51). На этой странице не требуется вводить никаких специальных символов, достаточно только заполнить нужные поля и выбрать дополнительные условия из открывающихся списков. Потренируемся использовать сложные запросы в поисковой машине Google. ü Щелкните мышью на ссылке Расширенный поиск (Advanced Search) в правой верхней части главной страницы поисковой машины. На экране появится страница для ввода сложного запроса (см. рис. 108). Поисковая машина Google сразу определила, что ранее мы искали слово с точной фразой «Тихий Дон» и поместила его в нужное поле ввода. Оставим эту фразу без изменений и добавим несколько дополнительных условий поиска. ü Введите в поле ввода со всеми словами (With all of the words) строку Russia film (Россия фильм), чтобы найти документы, которые содержат оба этих слова, следовательно – упоминания о России и о фильмах одновременно. Рисунок 108 — Страница для ввода сложного запроса ü В поле ввода без слов (Without the words) введите слово book (Книга), чтобы исключить поиск страниц, в которых упоминаются книги. В заключение определим сайт, на котором должны располагаться искомые web-страницы. ü Для этого в поле Домен (Domain) введите имя нужного домена, например ru.wikipedia.org. Этот домен принадлежит популярной интернет-энциклопедии. ü Нажмите кнопку Поиск в Google (Google Search). На экране появится страница с результатами поиска. В нашем случае было найдено всего 62 документов, удовлетворяющим условиям. Жесткие условия поиска сделали свое дело. Теперь немного расширим диапазон поиска. Будем искать web-страницы, на которых есть упоминания либо о России, либо о фильме, вне зависимости от того, встречается ли эти два слова в документе одновременно. ü Удалите строку Russia film (Россия фильм) из поля ввода со всеми словами (With all of the words) и введите ее в поле с любым из слов (With at least one of the words). ü Нажмите кнопку Поиск в Google (Google Search). На экране появится страница с результатами поиска. В нашем случае было найдено уже 108 документов, то есть, количество ссылок по сравнению с предыдущим запросом увеличилось, как и должно было быть. Чтобы найти не простое упоминание наших поисковых слов в документе, а web-страницы, полностью посвященные фильму «Тихий Дон», нам следует искать нужные слова в заголовках страниц: ü В открывающемся списке Показывать результаты, содержащие эти слова (Return results where my terms occur) выберите пункт в заголовке страницы (In the title of the page). ü Нажмите кнопку Поиск в Google (Google Search). На экране появится страница с результатами поиска. Теперь было найдено всего две web-страниц, расположенных на сайте ru.wikipedia.org, но зато мы уверены, что найденные документы полностью посвящены фильму «Тихий Дон», а не просто вскользь упоминают о нем. Отметим, что сложные запросы часто требуют тщательного анализа для получения нужного результата. Если не удалось обнаружить необходимую информацию с помощью поисковой машины Google, то можно воспользоваться другими поисковыми машинами с адресами: http://www.yahoo.com; http://search.msn.com; http://www.hotbot.com; http://www.yandex.ru; Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.) |