Первый способ поиска информации множественного числа

16.Поиск информации в интернете

Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы.

3. Обращение к поисковой системе (поисковому серверу).

Способ 1: Указание адреса страницы

Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Способ 3: Обращение к поисковой системе

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

Поисковая система - веб-сайт, предоставляющий возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

Поисковые каталоги служат для тематического поиска.

Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог - структурированный набор ссылок на сайты с кратким их описанием.

Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, - и получает список ссылок на web-страницы, содержащие указанные термины.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

Как работает поисковой индекс?

Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Поисковый робот («веб-паук») - программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

http://www.yandex.ru/

Яндекс - российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

http://www.google.ru/

Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

По одной из версий, Google - искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

http://www.rambler.ru/

Rambler Media Group - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

Rambler создан в 1996 году.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

Приветствую Вас, дорогие читатели! В этой статье мы рассмотрим различные способы для эффективной и быстрой работы в Интернете. Во всемирной паутине существует очень много информации на всевозможные темы.

По этой причине поиск может усложняться. При использовании определённых способов его можно облегчить. По каким правилам составлять запрос?

Как вносить в строку поиска именно то словосочетание, которое выдаст вам наиболее точную информацию?

Иногда поисковая система вообще не находит никакой информации. Рассмотрим простые правила для успешного информационного поиска.

Когда поисковая система выдаёт большое количество ссылок на ресурсы, нужно написать свой запрос более детально и расширенно. При огромном количестве вариантов результатов поиска это поможет выделить именно то, что нужно Вам.

Если в результатах поиска вообще не были найдены совпадения, то упростите начальную поисковую фразу. Хотя на практике бывает проблематично подобрать правильный способ поиска информации.

Можно выделить 2 типа поиска информации в Интернет.

1. Поиск информации единственного числа

Например, сюда можно отнести запрос такого вида: «Какой город является столицей Португалии?» Чтобы получить ответ на него, вводим в своем запрос: столица португалии (для поисковика не имеет значения, заглавную или прописную букву Вы введете в слове — Португалия, что Вы можете при желании легко проверить). Нажимаем на клавишу Enter, получаем ответ:



Рис. 1 Поиск информации единственного числа

Результаты поиска, представленные на рис. 1, могут у Вас отличаться в зависимости от выбранного Вами поисковика и браузера.

Или так: «Как звали писателя Чехова?» Для получения ответа можно немного изменить запрос, например, вводим в браузере: имя отчество писателя Чехова, после чего поисковик выдает ответы.

Ещё один вариант: «В каком году были проведены первые Олимпийские Игры?» Можно упростить и ввести в браузере такой запрос: дата первых олимпийских игр.

В таком случае мы находим какую-либо конкретную информацию. Например, она может быть в виде названия, даты или цифры.

2. Поиск информации множественного числа

Примером такого способа поиска информации может служить запрос следующего вида: «Какие магазины спортивного питания находятся в городе Минске?». При желании его можно упростить и ввести следующий запрос: магазины спортивного питания Минск. Как мы видим, в предложенном варианте нам уже нужно найти не одну единицу информации, а несколько (2 и более магазинов спортивного питания).

Эти способы отличаются тем, что в первом из них результат поиска будет расположен на конкретной странице одного веб-сайта, а во втором – на разных страницах нескольких веб-сайтов.

Разберём конкретные примеры. Сначала рассмотрим случай поиска информации единственного числа.

Например, вам нужно узнать место и дату рождения Пушкина. Какую фразу нужно ввести в поисковое поле системы Яндекса или Гугла? Скорее всего, что те пользователи, которые мало знакомы с эффективными способами поиска информации в Internet, введут следующий вариант: «Место и дата рождения Пушкина». В итоге мы получаем, что на одной веб-странице мы узнаем только место его рождения, а на другой – дату.

Первый способ поиска информации множественного числа

Но наша цель – нахождение полной информации на одной единственной веб-странице. Перефразируем нашу поисковую фразу в другой вариант: «Пушкин родился». В первых же ссылках поиска мы узнаём, когда и где родился этот величайший русский поэт. Даже не нужно делать переходы по ссылкам на другие сайты. Информация, которая нам нужна, будет находиться на главной веб-странице поисковой системы.



Рис. 2 Пример поиска информации множественного числа

Результаты поиска, представленные на рис. 2, могут у Вас отличаться в зависимости от выбранного Вами поисковика и браузера.

Подобный способ поиска информации не только сэкономит ваше время, но и Интернет-трафик. Благодаря такому свойству поисковых систем, как релевантность, в результатах поиска выводятся самые близкие на данную тему документы, что упрощает поиск и экономит время интернет-пользователя.

2-ой способ поиска информации множественного числа

Чтобы использовать такой способ, нужно понимать, что начальные данные могут приходиться на разные области. Чтобы найти более точный вариант, введите в поисковой фразе как можно больше наименований по ним. Для этого используются отдельные слова или словосочетания.

Например, введём следующий запрос: «Покупка, стиральная машина, LG, белый цвет, Пермь». Таким образом, будет найдена информация о покупке стиральной машины марки LG белого цвета в городе Пермь. Можно заметить, что все поисковые слова этого запроса в единственном числе и именительном падеже. Это необходимо для того, чтобы в результатах поиска выводилось именно то, что нужно.

Можно использовать и другие падежи, склонения и числа русского языка, но в таком случае можно заключить поисковые слова в кавычки. Такой приём приведёт к тому, что результаты поиска будут конкретными, то есть именно в такой форме, в которой были указаны в кавычках.

Запрос, заключенный в кавычки, является для поисковой системы сигналом, что надо искать точное соответствие этому запросу, то есть, максимально релевантный.

Спасибо за внимание, друзья. Мы познакомились с 3-я способами поиска информации:

  • поиск информации единственного числа,
  • поиск информации множественного числа,
  • использование кавычек.

А чтобы эта теоретическая информация принесла Вам пользу, конечно, следует применить ее на практике. Для этого прямо сейчас открываем в своем браузере и набираем все запросы, приведенные в данной статье, сравниваем результаты, анализируем, в общем, учимся грамотному поиску информации в Интернете. Удачи, любви и успешного поиска (сёрфинга) во всемирной паутине!

P.S. По интернет-грамотности можно еще прочитать.

Проблема поиска и средства его организации

Гигантские и непрерывно увеличивающиеся объемы доступной в Интернет информации, в том числе оперативной, делает проблему поиска необходимых сведений весьма актуальной и сложной. Скорость поиска нужной информации определяет в значительной степени профессионализм пользователя Интернет. Для автоматизации этой задачи разработаны различные, как зарубежные, так и отечественные системы поиска, представляющие собой Web-страницы специального вида. Однако, несмотря на наличие многочисленных средств автоматизации поиска, эта задача остается достаточно трудоемкой, требующей от пользователя определенного опыта, интуиции, знания терминологии, используемой в его предметной области.

По оценке, опубликованной в журнале Nature от 8 июля 1999 г., число публично индексируемых Web-страниц составляло 800 млн. Спустя год автор исследования (Стив Лоуренс из института NEC Research Institute) полагал, что их число увеличилось почти вдвое – до 1,5 млрд. Даже лучшие поисковые механизмы индексируют не более чем одну страницу из шести. Для того чтобы извлечь полезную информацию из сети Интернет, нужно знать, где и как вести поиск.

Имеющийся в Internet Explorer инструмент Поиск упрощает обращение к средствам поиска, избавляя от знания адресов поисковых машин. Однако лучше непосредственно обращаться к поисковым системам, загружая соответствующую страницу.

По способу организации поиска и по предоставляемым возможностям все средства поиска могут быть условно разбиты на следующие группы:

каталоги и специализированные базы данных;

поисковые системы;

метапоисковые системы.

Каталоги и базы данных

Каталоги в WWW аналогичны систематическим библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями. На первой странице каталога содержится ссылки на крупные темы, например, Культура и искусство; Медицина и здоровье; Общество и политика; Бизнес и экономика; Развлечения и др. Щелчок мыши на соответствующей ссылке (категории) открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрику). Двигаясь вниз по детализирующим категориям, можно найти страницу с нужной информацией. На каждой странице, открываемой при движении по каталогу тем или иным способом, указывается последовательность просмотренных вложенных рубрик, например, Деловой мир: Финансы: Аналитика и т.д.

Все каталоги создаются и поддерживаются в актуальном состоянии вручную специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги. Описание документа делается либо составителями каталога, либо автором. Благодаря этому, содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены. Но, учитывая скорость пополнения и изменения информации в Интернет, «ручной» способ ведения каталогов не позволяет равноценно отражать реальное состояние ресурсов Интернет на данную тему.

Поисковые системы

(поисковые машины, поисковые серверы, поисковые роботы)

Существуют десятки крупных и тысячи малых и специализированных Web-узлов, предназначенных для поиска в Интернете. Средства поиска этой группы позволят пользователю по определенным правилам сформулировать требования к необходимой ему информации (с помощью языка запросов создать запрос). После этого машина поиска автоматически просматривает документы на контролируемых (индексируемых) ею сайтах и отбирает те из них, которые, «по мнению» поискового сервера, соответствуют сформулированным пользователем требованиям (релевантны запросу). В поисковых узлах используются собственные индексы Интернета, постоянно обновляемые особыми программами, называемыми пауками (spiders). Программа-паук обследует Web, проверяя каждую ссылку на данной странице, затем на страницах, адресуемых ссылками, и т. д., и сообщает своему владельцу сведения обо всех страницах для последующей индексации.

В результате поиска создается одна или несколько страниц, содержащих ссылки на релевантные запросу документы (Web-страницы). Для каждой ссылки обычно также указываются дата создания документа, его объем, степень соответствия релевантности запросу, фрагменты текста, характеризующие содержание документа. Щелчок мышью на такой ссылке позволяет загрузить заинтересовавшую страницу. В случае очень большого количества найденных документов можно уточнить запрос и в соответствии с ним повторить поиск, но только среди отобранных страниц (такой поиск в разных машинах называется по-разному, но обычно это – искать в найденном). В ряде машин поиска можно определенным способом поменять ссылку на страницу, содержание которой в наибольшей степени удовлетворяет вашим потребностям, и повторить поиск, потребовав искать похожие.

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации, имеющейся в Интернет в данный момент. Однако сложность точного описания запроса, адекватно отражающего ваши информационные потребности, а также еще большая сложность задачи автоматического определения степени соответствия вашему запросу просматриваемых страниц, приводит к тому, что количество страниц, отобранных «с первого захода», как правило, или очень мало, или чрезмерно велико. В целом поиск с использованием поисковой машины представляет собой итерационный (многоходовой) процесс, в результате которого постепенно уточняется форма запроса.

Метапоисковые системы

Как отмечалось выше, любая поисковая система просматривает определенный набор серверов и отбирает документы в соответствии с присущими ей критериями. В итоге поиск разными системами по одним и тем же ключевым словам дает различные результаты. Это привело к идее создания так называемых метапоисковых (или мультипоисковых) систем, которые сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым системам. Каждая из метапоисковых систем имеет свой язык запросов. Система переводит сформулированный на ее языке запрос на языки запросов, используемые каждой машиной поиска. Далее, результаты поиска всеми системами объединяются и представляются в соответствующей форме. Естественно, что поиск с помощью метапоисковых систем занимает большее время по сравнению с обычными системами поиска.

Обзор наиболее популярных поисковых систем

В Интернет имеется большое количество поисковых систем, и каждый пользователь ориентируется на ту, к которой он привык или которую ему посоветовали его коллеги. Воспользуемся краткой характеристикой наиболее популярных поисковых систем, которая приводится на одном из сайтов.

1. Google (www.google.com) Самая быстрая и самая большая поисковая система. Проиндексировано более 1,3 миллиарда страниц (из них полностью - немногим более 700 миллионов, про остальные известен только адрес и текст ссылки). Нормально ищет по русскоязычным ресурсам (разумеется, без словоформ), есть возможность выбрать язык интерфейса. Можно включать/исключать результаты с определенных сайтов и/или доменов. В отличие от большинства поисковых систем, Google оценивает популярность ресурса по количеству ссылок, ведущих к нему с других страниц. Присутствует тематически ориентированный поиск - Apple Macintosh, BSD UNIX, Linux, правительство США и University searches - поиск в ресурсах ведущих научных и учебных институтов.

2. Яndex (www.yandex.ru) Лучшая из поисковых систем отечественного производства. Индексирует в основном русскоязычные ресурсы, при этом по возможностям не уступает зарубежным системам. Поиск можно осуществлять точно или в любых словоформах, с ограничением по дате, с указанием сайта или его поддиректории. Можно вести поиск с учетом так называемого индекса цитируемости, искать изображения, скрипты, апплеты; задавать язык документа. Нужные ссылки, как правило, обнаруживаются уже в первой десятке результатов. Имеет "облегченную" версию (с минимумом элементов дизайна) на http://www.ya.ru.

3. AltaVista (www.altavista.com) Предоставляет большое расширение критериев поиска: в Advanced search есть выбор отрезка времени, к которому относится дата создания или изменения ресурса, поддержка 25 языков; присутствует возможность выдачи одного результата на сайт (это сужает круг поиска без ущерба для качества). Power search имеет стандартный набор возможностей. До недавнего времени AV была крупным порталом, но по причинам финансового (и не только) характера значительно сократила количество сервисов.

4. Yahoo! (www.yahoo.com) Один из первых поисковых серверов в Интернет. Помимо стандартного набора функций, позволяет отбирать ресурсы по дате (4 года, 1, 3, 6 месяцев, неделя, 1, 3 дня). Поддерживает возможность указания знака "*" вместо любой последовательности символов в ключевых словах. На Yahoo! составлен большой структурированный каталог категорий (categories). Сначала поиск осуществляется в них, потом в собственном архиве, потом - с использованием системы Google. Поиск в категориях дает хорошие результаты - их немного и соответствие хорошее.

5. Lycos (www.lycos.com) В последнее время - одна из самых популярных систем. В то же время никаких особенных возможностей она не предоставляет - "AND" "OR", поиск фраз, обязательное присутствие/отсутствие слова; в расширенных возможностях - поиск в названии, URL, имени хоста и/или названии домена; 25 языков, включая русский, - словом, весь "общепринятый" набор. Можно указать тип содержания ресурса - авто, книги, ftp, download, новости и т.д. Очевидно, популярность Lycos - следствие масштаба этого крупного проекта.

6. Рамблер (www.rambler.ru) До недавнего времени самая известная русская поисковая система. Расширенный поиск не позволяет искать фразы, а обычный поиск до февраля этого года редко выдавал приемлемые результаты. С февраля в этой системе используется улучшенный механизм поиска, сменился дизайн, но по качеству Rambler все равно не сравнялся с Яндексом и Апортом (по мнению автора, проводящего анализ поисковых систем). На сайте присутствует рейтинг-каталог ресурсов Rambler Top 100, один из признанных источников статистической информации об интернет-проектах.

7. Апорт (www.aport.ru) Другой хороший русский поисковый сервер. Поиск ведется по тексту (только во всех словоформах) и по URL, с использованием логических операторов и оператора "…" (однако стоп-слова во фразе все равно игнорируются), по дате и в отдельных полях (название, описание и т.д.), поддерживаются мета-символы * и! Представление результатов поиска наиболее хорошо оформлено по сравнению с остальными русскими поисковыми машинами. Некоторые сомнения вызывает дизайн главной страницы, которая явно перегружена информацией. Имеется немного более "легкая" версия на http://aport.ru.

Как выбрать поисковую машину

При поиске в Интернет важны две составляющие - полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом - релевантность, то есть соответствие ответа вопросу.

1. Охват и глубина

Под охватом имеется в виду объем базы поисковой машины, который измеряется тремя показателями – общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается – существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.

Как проверить: Некоторые машины пишут на своем сайте статистику робота. Но можно проверить и самому – надо задать несколько поисковых запросов, состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе – различного трактования пробела), и при этом смотреть на статистику результатов, выдаваемую машиной – обычно в начале списка указано, сколько всего было найдено документов. Помимо того, что слова должны быть из разных областей, хорошо еще взять слова разных весов – редкие, «средние» и «тяжелые» (частотные), и сравнить количество найденного. Тяжелые слова, в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой машины.

Глубину хождения робота проверить сложнее - для этого надо взять какие-то сайты, например, с разветвленной структурой архивов, и проверить, проиндексированы ли документы, на которые можно попасть только, например, за 6 переходов по ссылкам.

2. Скорость обхода и актуальность ссылок

Скорость обхода Сети показывает, насколько быстро происходит индексация свежедобавленного ресурса и насколько быстро обновляется информация в базе. Важным показателем качества поисковой машины (ее робота) является не только захват новых территорий: но и отслеживание состояния уже охваченных. Сервера исчезают и появляются, страницы на них обновляются. Ссылки, которые выдает поисковая машина в списке найденного, должны, во-первых, существовать, и, во-вторых, их содержание должно соответствовать запросу.

Как проверить: Объективную информацию можно получить, проанализировав логи серверов – робот поисковой машины представляется обычно именем своей машины (или похожим образом), так что можно увидеть, как часто он бывает на сервере, сколько страниц просматривает и т.д. К сожалению, обычно для изучения бывает доступен лог только своего сайта, поэтому остается экспериментальный способ.

Для определения скорости обхода надо создать где-нибудь страничку текста, добавить ее в поисковые машины и посмотреть, как быстро она начнет находиться. Или изменить уже имеющуюся страничку. Для определения актуальности ссылок – проверить документы хотя бы на первой странице списка найденного по нескольким запросам. Сообщение Not Found свидетельствует о том, что документ более не существует.

3. Качество поиска (субъективный показатель)

Каждая поисковая машина имеет свои алгоритм сортировки результатов поиска. Чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность.

Как проверить: Только путем эксперимента. Рекомендуется для сравнения делать запросы разной длины. Можно также использовать язык запросов, при этом те, кому неохота читать описание, могут воспользоваться развернутой страницей запроса («расширенный поиск» в Апорте и Яндексе, «детальный запрос» в Рэмблере – варианты перевода на русский язык «advanced search»).

Кроме релевантности, существуют важные пользовательские характеристики.

4. Скорость поиска

Если поисковая машина отвечает медленно, работать с ней неэффективно. Стоит добавить, что видимая пользователю скорость зависит не только от самой поисковой машины, но и от Интернет-каналов.

Как проверить: Путем эксперимента – надо поискать запросы разной длины, разной <тяжести> слов и в разное время суток (загрузка серверов существенно неравномерна по суткам, пик – около трех-четырех часов дня).

5. Поисковые возможности (работа с языком документа, язык запросов)

Еще один пункт сравнения - что именно и как поисковая машина вносит в индекс. Полнотекстовая поисковая машина индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к картинкам и т.д.).

Язык запросов в виде стандартных логических операторов (И, ИЛИ, НЕ) есть практически у всех машин. Некоторые умеют искать словосочетания или слова на заданном расстоянии - это часто важно для получения разумного результата. Дополнительной возможностью является поиск в зонах документа – заголовках, ссылках, ключевых словах (META KEYWORDS) и т.д. Дополнительная возможность языка запросов - естественно-языковый запрос, который не требует знания операторов.

Как проверить: Обычно эта информация публикуется на сервере поисковой машины (в Help"е). Тем не менее, рекомендуется проверить на реальных запросах, поскольку иногда желаемое выдается за действительное.

6. Дополнительные удобства

Это - дополнительные возможности, которые предоставляет пользователям поисковая машина. Сюда входит всевозможные варианты поиска (специализированные страницы, поиск похожих документов, ограничение области поиска), и список найденных серверов, и поиск по датам и серверам, и удобный интерфейс поисковой машины, и возможность его персонализации.

Как проверить: Информация может быть частично опубликована на сервере поисковой машины, но лучше всего попробовать самому поработать с этими возможностями.

Понятно, что указанный анализ займет некоторое время. Кроме этого, поисковые машины, как и весь Интернет, не стоят на месте. Однако, учитывая, что поиск информации – одна из важных составляющих компьютерных технологий, этому стоит уделить достаточное внимание – по крайней мере, не меньшее, чем умению работать в локальной сети.

На Yandex.ru был проведен опрос: зачем нужен Интернет и чего в нем не хватает (http://www.yandex.ru/polling/9.html). В порядке убывания данные опроса распределились следующим образом: Интернет используют как справочник (23,76%), инструмент исследования (15,.45%), развлечение (14,15%), и только на четвертом месте - источник новостей (12,32%). Оптимистично прозвучало, что 10% пользователей всегда, а 73% часто удается найти нужную информацию. А не хватает в Интернете: информации, хорошего поиска и порядка (в том числе: упорядоченности, структуры, структурности, структурированности, структуризации, а также системы, систематизации, системности, систематичности и систематизированности).

ОТВЕТЬТЕ НА ВОПРОСЫ:

Назовите, какие способы организации поиска существую в сети Интернет?

Как осуществляется поиск информации в каталогах и базах данных?

Как заносится информация в каталоги и базы данных?

Что в Интернет относится к поисковым системам?

Как формируется информационная база данных в поисковых машинах?

С чего начинается поиск информации в поисковых системах?

Что такое запрос?

Как осуществляется поиск информации в поисковых машинах?

Что понимают под релевантностью запросу?

Что можно предпринять в случае очень большого количества найденных документов при дальнейшем поиске?

Что такое метапоисковые системы?

В чем состоит принципиальное отличие метапоисковых систем от обычных поисковых машин?

Какие из следующих систем являются метапоисковыми:

Yandex,

AltaVista,

Krasu,

Google,

Aport.

Назовите наиболее популярные отечественные поисковые системы?

Назовите наиболее популярные зарубежные поисковые системы?

Какие две составляющие важны при поиске информации в сети Интернет?

Какие характеристики определяют эффективность поисковых систем при проведении поиска информации в сети Интернет?



Поиск информации – одна из задач, которую приходится решать каждому пользователю интернета.

Приступая к поиску данных в интернете, стоит определить цель поиска . Полезно ответить для себя на следующие вопросы:

  • известны ли вам адреса ресурсов сети, с которых можно начать поиск?
  • что вы уже знаете о проблеме, информацию о которой ищете?
  • с каких ключевых слов стоит начать поиск?
  • сколько времени вы готовы потратить на поиск нужных данных?
От того, как именно поставлена задача, во многом зависит и стратегия поисковой деятельности, и выбор соответствующих поисковых средств.

Существуют три основных способа поиска информации в интернете:

Способ 1: Указание адреса страницы
Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Способ 2: Передвижение по гиперссылкам
Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу. Но этот способ очень простой и подходит для начинающего пользователя.

Способ 3: Обращение к поисковой системе
На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами).
Результатом выполнения запроса является перечень ссылок на Web-страницы, рядом с которыми присутствуют заданные текстовые фрагменты. Наиболее популярные поисковые серверы: Яндекс (yandex.ru), Гугл (google.ru) и Рамблер (rambler.ru).Языки запросов различных поисковиков несколько отличаются друг от друга.
Поисковая система Яндекс

  • Ч тобы найти информацию с помощью поисковой системы Яндекс, откроем главную страницу . Строка для ввода поискового запроса расположена в верхней части страницы, в области, выделенной желтым фоном.
Укажем в ней необходимые ключевые слова и нажмем на клавиатуре клавишу или щелкнем мышью на кнопке «Найти», размещенной возле строки поиска.
Получив такую команду, Яндекс просмотрит всю свою базу данных и попытается найти в ней веб-страницы, где встречается введенное нами слово или словосочетание. При этом нужно заранее учитывать, что чем обширнее наш запрос, тем меньшее количество веб-страниц будет ему соответствовать.
  • П о умолчанию на одной странице Яндекс отображает только 10 таких ссылок, поэтому для ознакомления с полными результатами поиска необходимо будет листать страницы с помощью цифр-ссылок.
  • К аждый обнаруженный ресурс в результатах поиска представлен названием веб-страницы и текстом ссылки. Кроме того, в большинстве случаев поисковая система демонстрирует небольшой фрагмент текста, содержащегося на той или иной найденной веб-странице, в котором обнаружено совпадение с текстом вашего запроса. При этом слова, которые мы ввели для поиска, в этих фрагментах будут выделены полужирным начертанием.
  • В низу страницы с результатами поиска, есть строка «в других поисковых системах» . Рядом с этими словами имеются ссылки на несколько других популярных поисковых систем. Поэтому, если мы не нашли с помощью Яндекса нужной нам информации, можно воспользоваться другими поисковыми системами, перейдя по ссылке.

Поиск информации в Яндексе можно осуществлять

в простом и расширенном поисковом режиме .

  • Простой поиск
Поиск по одному или нескольким ключевым словам, введенным в строку запроса.
Перед тем как начинать вводить в строку поиска поисковой системы запрос, тщательно его сформулируйте .
Чем более четкой будет выбранная формулировка, тем меньше ненужных вам сайтов предложит в результатах поиска поисковая система.
  • Расширенный поиск
Все популярные поисковые системы располагают специальными возможностями для расширенного поиска ресурсов.

Чтобы попасть на веб-страницу, предоставляющую такие возможности, необходимо воспользоваться ссылкой с названием типа «Расширенный поиск» .

Перейдя по этой ссылке, мы увидим большую поисковую форму, в которой можно указать множество параметров.
Поисковая система Яндекс позволяет, например, настраивать параметры поиска слов в зависимости от их расположения (рядом, в одном предложении, на одной странице) и формы.
Кроме того, она может искать веб-страницы по их языку (русский, украинский, белорусский и т.д.), по дате последнего изменения и даже по формату файла веб-страницы.
Наконец, с помощью Яндекса информацию можно искать на каком-то конкретном сайте. Это бывает полезно в том случае, если на нужном вам сайте нет встроенной поисковой системы.

Для каждой поисковой системы существуют свои языки запросов. Мы познакомимся с логическим языком запросов для Яндекса, который позволяет в режиме обычного поиска вводить в строку поиска дополнительные служебные команды, уточняющие ваши требования. Рассмотрим некоторые такие команды.
  • Используйте знаки "+" и "-".
Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса (-). И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс (+). Обратите внимание, что слово и знак плюс-минус должны быть написаны слитно.
Например, если вы хотите узнать про аквариумных рыбок, но без продажи и разведения, то набираем в поисковой строке:
«аквариумные рыбки -разведение -продажа».
  • Поиск точного соответствия - знак "!".
Искать по точной словоформе . Вы можете дать команду Яндексу не учитывать формы слов из запроса при поиске.
Например, запрос!иванов найдет только страницы с упоминанием этой фамилии, а не города "Иваново".
  • Поиск точной фразы – кавычки.
Помещать поисковый запрос в кавычки (например, «кто виноват и что делать») нужно только в том случае, если мы хотим найти фразу, на 100% совпадающую с текстом нашего запроса.
Кавычки заставляют поисковый механизм отбирать лишь документы, в которых слова из запроса стоят в точно таком же порядке, в котором мы указали их в поисковом запросе. Если же кавычек нет, то по запросу «кто виноват и что делать» поисковая система может предложить нам страницу, содержащую фразу «кто виноват - тому и делать, что скажут» или же «ну и кто виноват, что Петр Петрович не умеет делать пельмени». Формально при этом поисковая система справится со своей работой, ведь в указанных отрывках есть все слова из введенной фразы. А то, что они стоят совсем не в том порядке, в котором нам нужно, — это уже другой вопрос, которыйи уточняется использованием кавычек .
При работе с поисковыми системами рано или поздно мы встретим слово «релевантность» .
Релевантность — это степень соответствия найденных документов нашему запросу. Например, в Яндексе его можно обнаружить внизу каждой веб-страницы, содержащей результаты поиска, сразу под набором цифр-ссылок. Здесь оно используется в качестве параметра для функции «Отсортировано». Помимо параметра по релевантности, доступен также вариант по дате.
Если страницы в результатах поиска сортируются по релевантности, то это значит, что в самом начале указываются сайты с наибольшим уровнем соответствия вашему запросу, после них располагаются ресурсы с меньшим уровнем релевантности и т.д.
Детские поисковые системы
  • Чтобы обезопасить детей от ненужной информации, созданы специальные детские поисковые системы, которые индексируют не все сайты, а только сайты с детской или околодетской тематикой.
Для самых юных пользователей Интернета создана специальная поисковая система АгА, которая предназначена для поиска информации детских ресурсов. Она содержит много ресурсов по воспитанию и здоровью детей, поэтому ее можно рекомендовать не только детям, но и родителям. Очень удобно искать в этой поисковой системе, используя карту сайта.

АгА не только поисковый сервис. Здесь есть всеми любимые мультики, раскраски, просмотр диафильмов, помощь по разным школьным предметам и т.д.
Quintura для Детей – визуальный поиск по детским ресурсам, разработанный специально для детей и ориентирован на школьников младших и средних классов.

Для поиска используется интерактивное облако Quintura. Красочный и привлекательный интерфейс сервиса содержит несколько интерактивных картинок, кликая на которые, дети сразу могут выбрать интересную для себя тему, например: наука, музыка, динозавры или игры.

  • Началка - Детский поиск.


Понравилась статья? Поделиться с друзьями: