АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Лабораторная работа № 423. Глобальные средства поиска данных и поисковые серверы Интернета

Читайте также:
  1. AKM Работа с цепочками событий
  2. B) глобальные
  3. File — единственный объект в java.io, который работает непосредственно с дисковыми файлами.
  4. I. Противотуберкулезные средства.
  5. II. Методы прогнозирования и поиска идей
  6. III. ВЛИЯНИЕ ФАКТОРОВ РАБОЧЕЙ СРЕДЫ НА СОСТОЯНИЕ ЗДОРОВЬЯ РАБОТАЮЩИХ.
  7. IV класс. Средства обработки документов
  8. V1: Глобальные проблемы окружающей среды
  9. VI. Работа сновидения
  10. VIII. Работа над задачей
  11. WWW и Интернет. Основные сведения об интернете. Сервисы интернета.
  12. А) Обычные средства (системы) поражения

Цель работы. Приобрести практические навыки работы с поисковыми службами (серверами) Интернета.

Число сайтов в Интернете превысило сто миллионов и продолжает быстро увеличиваться. Поскольку во Всемирной паутине отсутствует единая систематизация ресурсов сети, ориентироваться в таком «информационном океане» становится все сложнее, особенно если неизвестен электронный адрес документа с нужной информацией. Почти все сайты в Интернете взаимосвязаны, поэтому можно найти необходимый сайт, путешествуя по сети с помощью ссылок, однако на подобный поиск может не хватить всей вашей жизни.

Для поиска нужных сведений удобнее всего воспользоваться современными поисковыми машинами, которые позволяют быстро обнаружить необходимые сведения и обеспечивают точность и полноту поиска. При работе с этими машинами достаточно задать ключевые слова, наиболее точно отражающие искомую информацию, или составить более сложный запрос из ключевых слов для уточнения области поиска. После ввода запроса на поиск вы получите список ссылок на документы в Интернете, обычно называемые web-страницами или просто страницами, в которых содержатся указанные ключевые слова. Обычно ссылки дополняются фрагментами текста из обнаруженного документа, которые часто помогают сразу определить тематику найденной страницы. Щелкнув мышью на ссылке, можно перейти к выбранному документу.

Случается, что поисковые машины возвращают миллионы ссылок на «искомые» документы. Для ускорения доступа к нужному документу многие машины сортируют свои результаты поиска так, чтобы в начале списка располагались ссылки на страницы, наиболее соответствующие запросу. Например, сначала могут отображаться ссылки на документы, в которых часто встречаются ключевые слова или которые расположены близко друг к другу или находятся в начале страницы. В современных документах Всемирной паутины размещается вспомогательная информация, предназначенная для поисковых машин и описывающая содержимое web-страницы. Данная информация также может влиять на порядок расположения найденных ссылок.

При поиске сведений машина не обращается к информационным ресурсам Интернета.

Поисковые машины используют собственные базы данных, в которых практически для каждого слова естественного языка хранятся ссылки на документы, содержащие это слово. Специальные программы поисковых машин постоянно обновляют базы данных, чтобы учесть возможные изменения и увеличение ресурсов Интернета. B процессе обновления базы данных программа, которую называют Spider (Паук), исследует все ссылки, размещенные на сайте, и передает найденные по этим ссылкам страницы другой программе, называемой Indexer (Индексатор), которая анализирует содержание и добавляет страницы в базу данных. Даже если web-страница будет удалена из Всемирной паутины, ее содержание навсегда останется в базе данных поисковой машины и с ним можно будет ознакомится в любое время.

Информационное наполнение Интернета растет настолько стремительно, что поисковые машины не успевают обновлять свои базы данных. Поэтому для повышения использовать несколько машин.


1 | 2 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.)