Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Инструменты поиска информации в Интернет

Основная задача Интернет – предоставление необходимой информации. Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки, стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По различным данным, в 2004 г. количество пользователей глобальной системы Интернет составило от 600 до 900 миллионов человек. Это число продолжает стремительно расти и уже в 2014 г. оно достигло 3 миллиарда человек. Сегодня глобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологий появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым.

Поисковые системы общего назначения

Поисковые системы общего назначения являются базами данных, содержащим тематически сгруппированную информацию об информационных ресурсах Всемирной паутины. Такие поисковые системы позволяют находить Web-страницы, по ключевым словам, в базе данных или путем поиска в иерархической системе каталогов.

Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для поиска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его.

Заполнение баз данных осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-серверы Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и так далее), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещённого документа.

В целях обеспечения большего соответствия между содержанием базы данных поисковой системы и реальным состоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит URL-адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Сайты в базе данных ранжируются по количеству их посещений в день, неделю или месяц. Посещаемость сайтов определяется с помощью специальных счетчиков, которые могут быть установлены на сайте. Счетчики фиксирует каждое посещение сайта и передают информацию о количестве посещений на сервер поисковой системы.

Специализированные поисковые системы

С появлением систем пользовательского поиска от Google (Google Custom Search Engine) специализированные поисковые системы стали появляться как грибы после дождя. В чем же их преимущества перед обычными поисковыми системами? По сути, оно только одно, но весьма весомое – если искать информацию по какой-то узкой теме в специализированной поисковой системе, выдача, которая получается в результате запроса, будет гораздо более чистой – не придется отсеивать десятки, а то и сотни ссылок рекламного характера и прочего мусора. Небольшой список специализированных поисковых систем:

  • beeMP3 – специализированный поисковые системы по музыке. Можно искать по альбому, исполнителю, песне или всему сразу. У beeMP3 достаточно интересна организована выдача — сразу получаются ссылки на конкретный файл (а не на страницу с ним). Кроме того, наведя курсор мышки на ссылку, можно узнать жанр песни, альбом, год выпуска, битрейт и др.
  • Tagoo – русскоязычная специализированная поисковая система по музыке
  • keeperweb.com – специализированная медиа поисковая системы по mp3 музыке, кино, клипам, мелодиям для мобильных телефонов и много другого.
  • FindSounds – поиск звуковых эффектов и музыкальных синглов. В отличие от других мультимедийных поисковых систем, которые ищут песни, радиопередачи и тому подобное, FindSounds ищет только простые звуки и короткие отрывки.
  • eBdb – поиск электронных книг.
  • poiskknig.ru – поиск электронных книг, свободно распространяемых в Интернете.
  • WikiPoisk – поиск по энциклопедиям.
  • Qwika – специализированная поисковая система, предназначенная для работы с онлайновой энциклопедией Wikipedia. Является единственной в мире поисковой системой, индексирующей информацию, полученную посредством систем автоматического перевода.
  • Scirus – поисковая система для ученых, ищет web-страницы с научным содержанием (ищет и русскоязычные сайты): сайты университетов, библиотек и т.д.
  • ILIGENT – поиск информации на бизнес-сайтах.
  • PureVideo – поиск видеофайлов.
  • PicSearch – поиск изображений.

Средства поиска и их разновидность

Средства поиска: поисковые машины, тематические каталоги, метапоисковые системы, программы ускоренного поиска.

Из вышеизложенного следует, что основными инструментами поиска информации в WWW являются ИПС. Однако в Internet существуют средства поиска, имеющие принципиальные отличия от рассмотренных выше ИПС. В общем случае, можно выделить следующие поисковые инструменты для WWW: поисковые системы, метапоисковые системы (поисковые службы) и программы ускоренного поиска (поисковые агенты).

Центральное место по праву принадлежит поисковым системам, которые в свою очередь подразделяются на каталоги, автоматические индексы (поисковые машины) и каталоги-машины. Только поисковые системы почти в полном объеме обладают возможностями и свойствами ИПС.

Разновидность:

  • Каталог (Directory) – поисковая система, в которой описание ресурсов проводится персоналом (людьми). Затем проводится сортировка описанных ресурсов по темам.
  • Поисковая машина (Search Engine) – поисковая система, которая для автоматизации процедуры описания информационных ресурсов использует программу-робот.

Последнее время во всемирной паутине стали появляться системы, автоматически осуществляющие поиск сразу в двух индексах (индексе каталога и индексе поисковой машины). Подобные системы позволяют использовать преимущества поисковых серверов обоих типов и называются каталогами-машинами. Принципиальным отличием метапоисковых систем и программ ускоренного поиска от ИПС является отсутствие своего собственного индекса. Данные инструменты проводят поиск в индексах других поисковых систем.

  • Метапоисковая система (Metacrawler) – поисковая система, не имеющая своего индекса, но способная послать запросы пользователя одновременно нескольким поисковым серверам, затем отобрать самые релевантные результаты, объединить их и представить пользователю в виде документа со ссылками.
  • Программа ускоренного поиска (Searchbots) – это программа, устанавливаемая на компьютере пользователя, способная отправить запрос нескольким поисковым серверам и отсортировать полученные результаты, удаляя дубликаты. Заметим, что большинство поисковых систем являются одним из компонентов многофункциональных Web-сайтов Internet – так называемых порталов.
  • Портал – многофункциональный Web-узел Internet, предлагающий разнообразные услуги: поиск информации, бесплатная электронная почта и т.д.

World Wide Web

Без сомнения, служба World Wide Web (или просто Web) сегодня наиболее привлекательна и популярна. Ее очень часто путают с самим Интернетом. Но отождествлять работу в Интернете и в World Wide Web не совсем корректно. На самом деле это лишь одна из многочисленных служб Сети, хотя и обладающая наибольшей популярностью, потому что отличается особой комфортностью работы и предоставляет доступ к наибольшим массивам информационных ресурсов.

Информационные ресурсы World Wide Web представлены так называемыми Web-документами (их еще называют Web-страницами). Первоначально, к моменту зарождения WWW, это были обычные текстовые документы, обладавшие важной отличительной чертой: отдельные фрагменты текста Web-документа можно пометить специальным образом и связать с ними адреса URL других документов. Такие помеченные фрагменты получили название гипертекстовых ссылок. При активизации гиперссылки происходит подгруздка документа, связанного с ней, и далее этот процесс может повторяться.

Принцип использования гипертекста позволяет выполнять навигацию в информационном поле Web-документов без необходимости запоминать, хранить и вводить какие-либо адреса. Постепенно, по мере развития WWW, появилась возможность встраивать в Web-документы иллюстрации, звук, музыку и другие мультимедийные объекты, например анимацию и видео. Современные Web-документы могут содержать также и так называемые активные объекты, которые являются по своей сути микропрограммами, работающими на компьютере пользователя во время просмотра им Web-документа. На момент написания данной книги (2000 г.) количество Web-документов в информационном пространстве WWW превысило символическую отметку 1 миллиард, причем увеличение размеров пространства продолжается нарастающими темпами.

Программы-серверы, обеспечивающие работу службы WWW, называются Web-серверами. Программы-клиенты, обеспечивающие прием и воспроизведение Web-документов, называются Web-браузерами. И тот и другой термины не являются «устоявшимися», поэтому в научной литературе может использоваться более строгий термин — средство просмотра Web. Если компьютер клиентской стороны работает в операционной системе Windows, то специально приобретать и устанавливать Web-клиента не нужно. В эту систему уже входит стандартное средство просмотра Web — программа Microsoft Internet Explorer. Ее номер версии зависит от номера версии операционной системы. К работе со службой можно приступать немедленно после создания соединения с сервис-провайдером. Запуск службы осуществляется запуском программы-браузеры, но спешить с этим не рекомендуется.

Заключение

В сети Интернет хранится очень большой объем информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио и видеофайлов и многого другого. Путешествуя по Интернет, можно найти любую информацию, не выходя из дома или офиса, иначе говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее всего их можно найти где-то на необозримых просторах Интернет. Для этого нужен только непосредственно сам компьютер, подключенный к Интернет с установленной специальной программой – браузером, предназначенной для просмотра содержимого Web-страниц.

С появлением World Wide Web (WWW) - гипертекстовой информационной системы, опутавшей весь мир, связавшей сотни и сотни компьютеров, тысячи и тысячи страниц гипертекстовых документов - без высокоэффективных средств поиска просто не обойтись. Благодаря разнообразию поисковых систем, специально разработанных для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.

Список литературы

https://mf.bmstu.ru/links/search_help.shtml

https://studopedia.su/15_76289_instrumenti-poiska-informatsii-v-internet.html

https://compress.ru/article.aspx?id=9893

https://helpiks.org/6-8022.html