Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Поиск информации с использованием компьютера. Программные поисковые системы.

С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Поэтому особенно актуально правильно и грамотно научиться искать информацию.

Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.).

Технология поиска - Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи. При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?» В решении данной проблемы на помощь приходят поисковые инструменты. Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

1) Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

2) Поиск информации по запросу пользователя.

3) Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

1) Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

2) Индекс поисковой системы – это информационная база, содержащая результат анализа веб - страниц, составленная по определенным правилам.

3) Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее.

Наиболее развитый сервис поиска русскоязычной информации предоставляет поисковый сервер Яndex

Каталог Интернет-ресурсов – это постоянно обновляющийся и пополняющийся иерархический каталог, содержащий множество категорий и отдельных web-серверов с кратким описанием их содержимого. Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным. Одним из преимуществ тематических каталогов является то, что пояснения к ссылкам дают создатели каталога и полностью отражают его содержание, то есть дает Вам возможность точнее определить, насколько соответствует содержание сервера цели Вашего поиска.

Основным критерием поиска является название файла, задаваемое разными способами (точное соответствие, подстрока, регулярное выражение и т.д.). Данный тип поиска, конечно же, не может соперничать по возможностям с поисковыми машинами, так как содержимое файлов никак не учитывается при поиске, а файлам, как известно, можно давать произвольные имена. Тем не менее, если Вам требуется найти какую-нибудь известную программу или описание стандарта, то с большой долей вероятности файл, его содержащий, будет иметь соответствующее имя, и Вы сможете найти его при помощи одного из серверов FTP Search:

FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если Вы ищете какую-либо программу или еще что-то, то на WWW-серверах Вы скорее найдете их описание, а с FTP-серверов Вы сможете перекачать их к себе.

Internet − очень быстро развивающаяся сеть, и причина этого не в свойствах самой сети, а в общих тенденциях развития компьютерной индустрии. Самым многообещающим направлением развития Internet и сетевых технологий в целом является проект Java компании Sun Microsystems. Java − это интерпретируемый язык, специально рассчитанный на работу в открытой сетевой среде. В настоящее время появляются все новые навигаторы с поддержкой сетевого языка Java. Вполне вероятно, что его поддержку будут обеспечивать все WWW-навигаторы, а значит и многие серверы. Если Java станет стандартом де-факто, сеть Internet и вся компьютерная технология выйдут на качественно новый уровень развития, когда ресурсы компьютеров всего мира будут объединены в один компьютер под названием «Сеть»

Информационно-поисковые машины - это службы, включающие в себя огромные базы данных , которые автоматически пополняются с помощью поискового робота (специальная программа, сканирующая содержание сети Интернет).

Робот обращается к Web-страницам, изучает содержимое этих страниц и в зависимости от заложенной программы, может сохранить всю страницу у себя в базе данных, либо формирует и прописывает, в базу данных, ключевые слова со страниц. Такие действия называют индексированием.

Если страницы сайта не связаны с помощью гиперссылок с другими сайтами, вероятность обнаружения данной страницы очень мала. Так же существует механизм ручной индексации в базе данных поисковой системы: владельцы сайтов могут сами поставить свои страницы в очередь на индексирование.

Каталоги представляют собой огромную базу данных URL-адресов сайтов самой различной тематики. Каталоги могут быть устроены по-разному, т.е. имеющие либо линейную, либо иерархическую структуру.

Первоначально осуществляется поиск по общей тематике, затем запрос более конкретизируется. Отличительным признаком каталога является то, что вся информация заносится человеком. Поэтому характерными особенностями каталога является малая скорость пополнения и небольшой, по сравнению с поисковой системой, объём, хотя данная характеристика способствует увеличению точности поиска.

Организация работы с каталогом достаточно проста. На странице Web-сайта обычно представлен список определённых рубрик, каждая из которых соединена гиперссылкой с другими ссылками, где находятся либо список подрубрик, либо список документов, соответствующих заданной рубрике.

Организовать поиск можно по-разному, и одна из проблем - это снижение уровня ненужной информации. Необходимо отметить, что поиск и отбор информации не относится к рядовым умениям человека, этому необходимо специально обучать. Здесь требуется владеть основами математической логики, понимать, что чем точнее сформулирован запрос - тем выше соответствие представляемой информации в ответе на запрос.

Правила поиска по ключевым словам

Чтобы начать поиск нужно ввести ключевые слова. Эти слова должны максимально точно отражать суть запроса. Нельзя задавать какое-то одно ключевое слово, имеющее общий смысл, например "информатика" или "история". Лучше сузить область поиска с помощью дополнительных ключевых слов.

Основная задача пользователя: правильно задать сочетание ключевых слов, чтобы поиск не был чрезвычайно широким и привёл к нужному результату. При этом следует придерживаться определённых правил, устанавливаемых поисковой системой.

Индексные поисковые системы, работая в автоматическом режиме обновления своей информации, просматривают в сети Интернет содержимое серверов, индексируют всю информацию, содержащуюся в них и вносят информацию о расположении слов на страницах сайтов в свои базы данных.

Каталоговые системы поиска содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный сервер. В одних случаях бывает удобнее воспользоваться первым типом поисковой системы, в других - вторым типом.

Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, программу телепередач, узнать о погоде, курсах валют и многое другое.

Существуют так же специализированные поисковые системы позволяющие искать информацию в других информационных "слоях" Интернета: серверах файловых архивов, почтовых серверах и др. Для поиска файлов на серверах файловых архивов существует специализированные системы двух типов: поисковые системы на основе использования баз данных и каталоги файлов. Для поиска файла в системе с использованием базы данных достаточно ввести имя файла в поле поиска и поисковая система выдаст URL-адрес мест хранения данного файла. Если имя файла неизвестно, но известно его назначение (например, музыкальный файл), то можно воспользоваться тематическим каталогом музыкальных файлов.

Для получения качественного результата поиска, необходимо использовать возможности различных поисковых систем.

Я считаю что интернет это главный учитель человека в новом поколении Интернет в нашей жизни играет серьезную роль. Но его однозначно нельзя назвать добром или злом. В этом отношении можно метафорически сравнить Всемирную сеть с кухонным ножом. С его помощью можно приготовить вкусный обед. А можно и убить человека. И каждый делает свой выбор, несет ответственность за его последствия. Интернет в жизни человека является добром или злом в зависимости от самого индивида. Ведь если он выбирает для себя зависимость или вред для здоровья – ему в будущем придется самостоятельно «платить по счетам». Тот же, кто использует Интернет во благо, будет усматривать в нем положительные стороны.