Понятие специализированных поисковых систем. Обмен ссылками обязательно влечет наложение санкций. Гарантия роста контактов и количества клиентов

ПОИСК ИНФОРМАЦИИ В ИНТЕРНЕТЕ

Средства поиска информации в Интернете

В настоящее время рост информационных ресурсов Интернета происходит высокими темпами. Всемирная сеть напоминает читальный зал библиотеки, где хра­нятся гигантские объемы текстовых, графических, муль­тимедийных, архивных и прочих файлов. Этот зал невоз­можно обойти полностью. Здесь все ежечасно меняется, число разнообразных документов возрастает каждую секунду. Найти необходимую информацию становится все труднее. Различные печатные справочники устарева­ют еще до их выхода в свет. Единственным надежным способом поиска информации является использование специальных поисковых систем, которые постоянно от­слеживают изменения информации в сети.

Поисковые системы - это специальное программное обеспечение, основная задача которого заключается организации наиболее оптимального поиска информации в Интернете.

Известные на сегодняшний день поисковые системы южно условно разделить на следующие основные группы:

Поисковые системы общего назначения (автоматические индексы);

Тематические каталоги (справочники) Интернета;

Специализированные поисковые системы;

Метапоисковые системы.

Поисковые системы общего назначения

Создание универсального поискового сервиса, позволяющего находить информацию из различных ресурсов Интернета, стало возможным лишь с появлением в началe 90-х годов серверов World Wide Web. Одновременно с появлением серверов Всемирной паутины были созданы специальные поисковые серверы, основная функция которых состоит в поиске информации среди различных информационных ресурсов Интернета, включая серверы World Wide Web, FTP, Gopher, телеконференции Usenet, списки адресов E-mail.

Стратегия работы современных поисковых серверов базируется на двух подходах. В первом случае созда­ются и непрерывно пополняются огромные базы данных, хранящие информацию о миллионах документов, имею­щихся в Интернете. Сбор информации автоматически выполняется специальными программами (их называют роботами, пауками и т. п.), которые просматривают серверы Интернета, копируют документы, анализируют встречающиеся слова и выполняют индексацию.

Индексация заключается в выборе всех значащих слов, называемых ключевыми. Одни поисковые системы обрабатывают весь документ, другие только отдельные части документа: названия, заголовки, начальные слова разделов. Сформированные таким образом индексы до­кументов - базы данных ключевых слов - добавляются к уже существующим и хранятся на поисковых серверах. Обычно этот процесс не требует никаких усилий со стороны человека, так как данные инструменты полно­стью скрывают от пользователя способ организации базы данных и ее содержимое. Поисковые системы тако­го рода чаще всего называют поисковыми системами общего назначения или автоматическими индексами. Ав­томатический индекс состоит из трех частей:

Программы-робота;

Базы данных, собираемой этим роботом;

Интерфейса для осуществления поиска в базе данных.

Типичными представителями автоматических индек­сов являются, например, Alta Vista и Lycos . С точки зрения пользователя автоматические индексы работают достаточно просто: пользователь задает ключевое слово или фразу, построенную из ключевых слов по опреде­ленным правилам, а поисковая машина в ответ на запрос выдает списки и точные адреса (URL) тех доку­ментов, которые соответствуют этому, запросу.

Тематические каталоги

Другой подход предполагает организацию поискового сервера как предметно-ориентированной системы, где информация по отдельным темам собрана в соответству­ющих каталогах. Примерами могут служить серверы Yahoo и Galaxy . Поисковые системы такого рода часто называют предметными или тематическими каталогами. Тематические каталоги используют в тех случаях, когда сформулировать запрос с помощью ключевых слов труд­но в силу специфики разыскиваемой информации или недостаточности знаний по интересующей теме.

В каталог информация заносится по инициативе че­ловека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Результа­том является постоянно обновляющийся древовидный каталог, на верхнем уровне которого собраны самые общие категории, такие, как «бизнес», «наука», «образо­вание» и т. п., а элементы самого нижнего уровня пред­ставляют собой ссылки на отдельные Web-страницы и Web-узлы вместе с кратким описанием их содержи­мого.

Выбрав нужный раздел, пользователь получает спи­сок подразделов, сужающий круг, и так до тех пор, пока не попадет на страницу, содержащую ссылки на нужную информацию. Тематические каталоги не могут конкури­ровать с поисковыми машинами по широте охвата ин­формации. Их преимущество заключается в том, что вероятность обращения к информации, не имеющей отно­шения к теме поиска, очень мала. Для облегчения про­смотра информационных ресурсов многие тематические каталоги имеют собственные простые поисковые систе­мы, позволяющие проводить поиск по ключевым словам внутри самого каталога. Только поиск осуществляется не в содержимом самих Web-серверов по всему миру, а в их кратких описаниях, хранящихся в базе данных каталога. Отметим, что старейший каталог Yahoo представляет собой иерархически организованный Web-каталог, кото­рый генерируется полуавтоматически. Ссылки на раз­личные ресурсы собираются двумя способами: присыла­ются пользователями и извлекаются программами-робо­тами.

Специализированные поисковые системы

В ту пору, когда в Интернете еще не существовали серверы World Wide Web, поиск информации в гло­бальной сети уже был доступен с помощью нескольких сетевых поисковых систем, каждая из которых вела поиск только в своей области: поиск в архивах Usenet, поиск адресов электронной почты и т. п. Такие системы используются до сих пор и называются специализиро­ванными поисковыми системами. Например, для нахож­дения файлов по их именам на FTP-серверах применя­ется система Archie. Программа Veronica осуществляет аналогичную функцию среди серверов, обслуживаемых системой Gopher.

В специализированных поисковых системах использу­ется достаточно простая технология поиска. Главное их достоинство заключается в высокой степени соответствия найденной информации запросам пользователя. Однако такие специализированные каталоги и индексы системы работают медленнее, чем популярные поисковые систе­мы общего назначения.

Метапоисковые системы

Если один и тот же запрос направить различным поисковым инструментам, то результат поиска будет разным и по количеству найденных документов, и по их соответствию сделанному запросу. Метапоисковые систе­мы, или метаиндексы, позволяют усовершенствовать по­иск путем передачи запроса одновременно нескольким поисковым системам. Полученные в результате поиска документы объединяются в общий упорядоченный опре­деленным способом список.

Метапоиск экономит время, так как нет необходимо­сти опрашивать каждую поисковую систему отдельно, и увеличивает вероятность получения нужной пользова­телю информации. Недостатком метапоиска является то, что при обращении к разным поисковым машинам за­прос приходится формулировать в форме, понятной всем машинам. Это не позволяет использовать тонкие индиви­дуальные настройки и возможности каждой отдельной машины.

Вопросы

1. Какие виды поисковых систем используются для поиска инфор­мации в сети Интернет?

2. Опишите принципы работы автоматических индексов.

3. Что такое метапоисковые системы?

4. Каковы достоинства и недостатки метапоисковых систем?

5. Для чего используются специализированные поисковые сис­темы?

Технология поиска информации в Интернете

Первые шаги по поиску необходимой информации определяются тем, в какой мере пользователь владеет изучаемой темой. Если имеется только общее представ­ление о теме, то естественно начинать поиск с тематиче­ских каталогов. Здесь особых проблем не возникает. Пользователь обязательно найдет ссылки на информаци­онные базы данных или отдельные документы.

В тех случаях, когда пользователь владеет термино­логией и ищет оригинальные, специфические документы, удобнее проводить поиск с помощью поисковых систем общего назначения.

Требования к поисковым системам общего назна­чения

С точки зрения пользователя общение с поисковыми машинами должно быть простым, не требующим подго­товки и специальных навыков. Пользователь должен иметь возможность.

1. Сделать запрос на родном языке в естественной форме. Например, «Использование компьютеров для проведения уроков истории в средней школе».

2. Ограничить область поиска документов. Это огра­ничение может определяться местом и временем созда­ния документа, языком, на котором он написан, темати­кой разыскиваемой информации. 3. В ответ на запрос получить перечень найденных документов с кратким их описанием. Документы должны максимально соответствовать запросу.

4. При необходимости загрузить нужные документы на свой компьютер для дальнейшего использования.

Действия поисковой машины, скрытые от пользовате­ля, должны сводиться к следующему.

1. Перевод ключевых слов на заданный язык.

2. Подбор синонимов к ключевым словам.

3. Учет морфологических вариантов слов. Например, искать документы, содержащие не только слово «автомо­биль», но и «автомобили», «автомобилей» и т. д.

4. Проведение поиска на указанных пользователем языках.

5. Смысловой отбор найденных документов по со­ответствию их тематике запроса.

6. Систематизация документов по степени их соответ­ствия запросу.

7. Представление найденных документов в удобном и понятном для пользователя виде.

Каждая из поисковых систем предлагает два способа поиска - простой и сложный.

Простой поиск заключается в том, что запрос состоит из набора ключевых слов, а поисковая машина возвра­щает документы, содержащие хотя бы одно из этих слов. Понятно, что при таком поиске будет найдено множество лишних документов, не представляющих интерес для пользователя.

Для повышения эффективности поиска необходимо использовать развитые средства поиска, позволяющие формулировать точные сложные запросы. Правила по­строения сложных запросов можно найти в справочных файлах каждой поисковой системы.

Поиск всех форм слова

Для поиска всех слов, имеющих общий корень, ис­пользуется знак *. Например, в результате поиска по запросу компьютер* будут найдены документы, содер­жащие слова: компьютер, компьютеры, компьютером, компьютерные и т. д. Ряд поисковых систем делают это автоматически, разыскивая документы, содержащие все морфологиче­ские формы ключевого слова.

Поиск фразы

Для поиска в документе фразы или словосочетания используются двойные кавычки. По запросу «информа­ционные технологии» будут найдены документы, содер­жащие это словосочетание без вариантов.

Включение и исключение ключевых слов

Знак плюс, указанный перед словом или фразой без пробела, требует включения этого слова (фразы) в доку­мент, а знак минус - его исключения. Это означает, что по запросу «Поиск в Интернете» - «поисковые машины» из списка документов, найденных по запросу «Поиск в Интернете», будут исключены документы, содержащие фразу «поисковые машины».

Логические запросы

В таких запросах применяются логические операторы OR, AND, NOT и NEAR, связывающие несколько слов или фраз в один запрос.

OR (или)

Когда элементы запроса связаны оператором OR, это означает, что в любом из найденных документов должен присутствовать хотя бы один из них. Пример: сыщик OR детектив. По этому запросу будут найдены документы, содержащие как оба слова, так и каждое из них в от­дельности.

AND (и)

Этот логический оператор употребляется в том слу­чае, когда необходимо присутствие всех соединенных им слов. Пример: информационные AND технологии. В най­денных документах будут присутствовать оба слова. Но это не означает, что они находятся в тексте близко друг от друга или связаны по смыслу.

NOT (не)

Слова или фразы, перед которыми стоит этот опера­тор, будут исключены из результатов поиска. Пример: «поиск в Интернете» NOT «поисковые машины». Такой запрос аналогичен запросу +«поиск в Интернете»-«поисковые машины».

Оператор указывает на то, что два слова должны быть разделены не более чем десятью словами. В ряде поисковых систем для запроса на поиск слов, располо­женных на определенном расстоянии, применяются фи­гурные и квадратные скобки.

Вывод результатов поиска

Каждая поисковая система по-разному представляет пользователям результаты поиска. Обычно это нумеро­ванный список найденных по запросу документов. Для каждого документа, как правило, сообщается его назва­ние, URL, размер, время обновления документа и не­сколько первых фраз текста, по которым можно судить о его содержании. Ряд поисковых систем дают краткое резюме, из которого можно получить представление о том, в каком контексте употребляются ключевые слова.

Название документа и его URL оформляются в виде гиперссылки, по которой пользователь имеет возмож­ность загрузить документ на свой компьютер для прочте­ния, сохранения и печати. Поисковая система оценивает результаты поиска и выводит список документов в опре­деленном порядке (ранжирует документы). Таким образом, в начале списка будут находиться докумен­ты, имеющие более высокую степень соответствия запросу.

Каждая поисковая система использует собственные критерии ранжирования документов как при анализе результатов поиска, так и при формировании индекса. Вследствие этого результат поиска по одинаковому за­просу будет различным для каждого поискового инстру­мента.

Пользователь может сам повлиять на порядок ран­жирования документов, указав в соответствующем окне наиболее значимые слова и фразы. В этом случае ран­жирование будет проводиться таким образом, чтобы в начале списка оказались документы, содержащие именно эти слова и фразы.

Вопросы

1. В каких случаях целесообразно использовать тематические ката­логи для поиска информации в сети Интернет?

2. Какие возможности поиска должна предоставлять пользователю поисковая система общего назначения?

3. Составьте запрос на поиск документов, содержащих слово фрук­ты и одно из слов свежие или экзотические.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем:

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.

Для большинства индивидуальных пользователей доступным по цене является доступ в Интернет по коммутируемым телефонным каналам со скоростью до 56 Кбит/с. Подключение по коммутируемым телефонным линиям обеспечивается провайдерами услуг Интернета.

При выборе провайдера целесообразно, во-первых, получить от него информацию о количестве и пропускной способности каналов, соединяющих его с Интернетом. Чем больше таких каналов и их пропускная способность, тем надежнее и быстрее ваша работа в Интернете. Во-вторых, полезно знать, каким количеством входных телефонных линий располагает провайдер. Чем оно больше, тем быстрее можно до него дозвониться. Наконец, в-третьих, в целях экономии, необходимо выяснить схему оплаты и стоимость подключения.

Скорость модуляции и скорость передачи данных. Для подключения компьютера к телефонной линии используется модем. На выходе компьютера данные представлены в форме последовательностей электрических импульсов, которые модем преобразует в модулированный аналоговый сигнал.

В простейшем случае производится амплитудная модуляция, когда амплитуда несущей (аналогового синусоидального сигнала) скачкообразно меняется и принимает одно из двух возможных значений. В процессе частотной модуляции скачкообразно меняется частота аналогового сигнала, а при фазовой модуляции - фаза сигнала. В каждом из этих случаев имеется два возможных состояния несущего аналогового сигнала и, соответственно, каждое его изменение несет информацию 1 бит.

Скорость модуляции характеризуется количеством переключений с одного аналогового сигнала на другой за 1 секунду и измеряется в бодах . Например, если за одну секунду изменение аналогового сигнала происходит 9600 раз, то скорость модуляции составляет 9600 бод. Однако практически важной характеристикой модема являются скорость передачи данных , измеряемая в битах в секунду (сокращенно бит/с).

Если применяется только один вид модуляции (например, только амплитудная модуляция), то 1 бод соответствует 1 бит/с и скорость передачи данных в вышеуказанном случае составляет 9600 бит/с. Если одновременно реализуются два вида модуляции (например, амплитудная и частотная), то при каждом изменении аналогового сигнала происходит выбор одного из четырех состояний и, следовательно, каждое такое изменение несет 2 бита информации.

Стандарты скорости передачи данных (протоколы модемной связи). Скорость передачи данных определяются используемой скоростью и методом модуляции, которые стандартизированы протоколами модемной связи для того, чтобы модемы могли "понимать" друг друга. Первый "древний" модемный протокол давал возможность модемам обмениваться информацией со скоростью всего лишь 300 бит/с. Затем, по мере совершенствования модемной связи, различными фирмами разрабатывались различные более высокоскоростные "фирменные" протоколы, которые обычно затем стандартизировались.

В 1994 году был принят стандартный протокол V.34, который обеспечивает скорость передачи данных до 28 800 бит/с, в 1996 году он был усовершенствован, получил название V.34+ и стал обеспечивать скорость передачи до 33 600 бит/с.

Современные модемы могут обеспечить скорость передачи до 57 600 бит/с, которая достигается при использовании "фирменных" протоколов х2 или K56Flex и стандартного протокола V.90. Обычно современные модемы поддерживают также несколько принятых ранее протоколов, что позволяет сохранить возможность обмена информацией с ранее выпущенными модемами.

Для того, чтобы определить протокол, по которому будут обмениваться информацией два модема, сначала между ними производится обмен специальными сигналами, с помощью которых модемы сообщают друг другу перечень поддерживаемых протоколов. Процесс установления соединения (по-английски handshaking, т.е. рукопожатие) сопровождается характерным свистом различной частоты, который можно слышать из динамика модема. В результате модемы выбирают для обмена информацией наиболее высокоскоростной протокол, из имеющихся у обоих модемов.

Браузеры. Глобальная компьютерная сеть Интернет включает в себя более 100 миллионов серверов, на которых размещены миллиарды Web-страниц. Web-страницы с помощью гиперссылок связаны между собой и образуют Всемирную паутину. Для путешествий по Всемирной паутине используются специальные программы - браузеры. Браузер загружает Web-страницу и отображает ее в соответствии с тэгами языка разметки гипертекста (HTML). Браузеры существуют для всех операционных систем, например, для MS-DOS - Arachne, для Windows - Microsoft Internet Explorer, Netscape Communicator, NeoPlanet, Opera и др.

Для просмотра в браузере определенной Web-страницы в текстовое поле Адрес: необходимо ввести адрес Web-страницы (URL - Universal Resourse Locator). URL включает в себя протокол доступа, доменное имя или IP-адрес сервера и путь к Web-странице. Например, URL для начальной страницы сайта "Информатика 2000" можно записать в следующих формах:
http://schools.keldysh.ru/info2000/index.htm
http://194.226.57.46/info2000/index.htm

Если начальная страница сайта имеет имя index.htm, то в URL ее имя можно не указывать (по умолчания в браузер из указанного каталога загружается страница с именем index.htm).

Для поиска информации в Интернете используются специальные поисковые сервера, которые содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail адресах и других информационных ресурсах Интернета. Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации.

Поисковые сервера Интернета можно разделить на две группы: поисковые системы общего назначения и специализированные поисковые системы.

Поисковые системы общего назначения. Поисковые системы общего назначения позволяют находить документы во Всемирной паутине по ключевым словам , которые вводятся в поле поиска и/или с помощью иерархической системы каталогов .

Поисковые машины . Автоматическое заполнение баз данных поисковых систем производится роботизированными системами (Search Engines). Специальная программа-робот, которую называют паук (spider), постоянно обходит Интернет в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

Мощная поисковая машина обходит весь Интернет за несколько дней. При этом составляется новый индекс - опись доступных ресурсов. При каждом новом цикле обхода индекс обновляется, и старые недействительные адреса удаляются.

При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными для искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т.д.

Каталоги . Каталоги составляются редакторами, просматривающими каждый новый сайт до его включения в индекс. В процессе наполнения каталогов могут участвовать и сами разработчики сайтов при его регистрации в поисковой системе. Каталоги обычно организованы в соответствии с предметной классификацией.

Качество систематизации сайтов при этом выше, чем у поисковых машин, но люди не могут успеть за темпами расширения и изменения Интернета: индекс популярного каталога Yahoo! содержит лишь немногим более миллиона записей.

Интерфейс каталогов содержит список разделов , в которые сгруппированы ссылки на URL-адреса наиболее важных документов. Каждая ссылка обычно аннотирована, т.е. содержит краткое описание содержания документа.

Наиболее популярными поисковыми системами общего назначения в рускоязычном Интернете (Рунете) являются Яндекс (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru), а в англоязычном - Yahoo! (www.yahoo.com).

Важными показателями качества поискового сервера являются:

  • объем базы данных (количество документов);
  • скорость обхода Интернета программным роботом (с этим связана скорость обновления информации в базе данных);
  • алгоритм индексации (только по ключевым словам Web-страницы или по всему тексту);
  • возможности расширенного поиска с использованием языка запросов;
  • структура системы каталогов.
  1. Ефимова О., Морозов В., Угринович Н. Курс компьютерной технологии с основами информатики. Учебное пособие для старших классов. - М.: ООО "Издательство АСТ"; АВF, 2000 г.
  2. Угринович Н. Информатика и информационные технологии. 10-11 класс- М.: Лаборатория Базовых Знаний, АО "Московские учебники", 2001 г.
  3. Интернет. Энциклопедия. Второе издание./ Под ред. Л. Мелиховой. - С.-Пб., М., Харьков, Минск: Питер, 2001 г.

Задачи и тесты по теме "Компьютерные коммуникации. Сети: глобальные и локальные. Интернет. Структура, адресация, основные виды услуг"

  • Локальные и глобальные компьютерные сети

    Уроков: 2 Заданий: 9 Тестов: 1

  • Всемирная компьютерная сеть Интернет - Коммуникационные технологии 9 класс

    Уроков: 4 Заданий: 9 Тестов: 1

  • В Работе 1 представлены три темы, лежащие в основе курса "Информационные технологии". Надеемся, что Вы уже имеете минимальный опыт работы с компьютером и познакомились с его устройством еще в средних классах школы.

    Тема "Компьютерные коммуникации. Интернет" вызывает большой интерес в последнее время, многие молодые люди проводят в глобальной сети почти все свое свободное время. Хочется напомнить, что виртуозное владение Интернет подразумевает не просто умение "бродить" в сети и посещать время от времени интересные "чат"ы", но и разбираться в принципах организации информации в глобальной сети, разбираться в ее структуре, протоколах, уметь настраивать браузер и почтовые программы, знать и соблюдать этику работы в Интернет. Ну и конечно использовать сеть по самому важному из ее назначений - для расширения своего кругозора.

    Мы не рассматривали в этом курсе технологию создания Web-сайтов, полагая, что минимальные знания для создания домашней веб-страницы можно почерпнуть из дополнительной литературы. Создание же сайтов на профессиональном уровне требует определенной подготовки, в основе которой лежат навыки работы с текстом и графикой, а также умение программировать.

    Тема "Логика" обычно вызывает некоторое недоумение учащихся, не все понимают важность изучения данной темы. Хочется отметить, что знание логики важно не только как основа для дальнейшего изучения языков программирования и принципов работы с базами данных, но и как "тренажер" для развития особого типа мышления. Человек, преуспевший в изучении логики, имеет огромные преимущества в общении. Очень лестно услышать в свой адрес: "Логично", "в Ваших рассуждениях присутствует логика".

Поиск информации в Интернет. Поисковые системы общего назначения. Поиск по ключевым словам и в иерархической системе каталогов. Формирование почтовых сообщений. Подпись в электронном письме. Работа с адресной книгой. Вставка адреса в сообщение.

Соглашение об использовании материалов сайта

Просим использовать работы, опубликованные на сайте , исключительно в личных целях. Публикация материалов на других сайтах запрещена.
Данная работа (и все другие) доступна для скачивания совершенно бесплатно. Мысленно можете поблагодарить ее автора и коллектив сайта.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Развитие информационной среды. Ключевые принципы работы Интернет. Русскоязычные и англоязычные термины Интернет. Расширения веб-страниц. Имена тестовых файлов. URL-адрес в Интернет. Страница поисковой машины Рамблер. Поиск по ключевым словам в Интернет.

    контрольная работа , добавлен 04.10.2011

    Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.

    курсовая работа , добавлен 25.09.2013

    Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация , добавлен 16.02.2015

    Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.

    реферат , добавлен 02.12.2010

    Приемы поиска информации в Интернете. Поиск по известному адресу, конструирование адреса пользователем. Специальные информационно-поисковые системы: классификационные (рубрикаторы) и словарные. Поиск информационных ресурсов по различным направлениям.

    реферат , добавлен 03.04.2010

    Информационная революция, которую сейчас переживает общество. Проведение структурного анализа документов. Поиск аналоговой информации в системных областях. Поиск информации через сеть интернет. Виды поисковых ресурсов: каталоги и поисковые роботы.

    курсовая работа , добавлен 16.12.2012

    Понятие "информация". Интерактивность. Информационный поиск. Интернет как основное средство интерактивного поиска информации. История создания Интернета. Доступ в Интернет. Поисковые ресурсы. Типы поисковых систем. Электронная почта.

    курсовая работа , добавлен 15.02.2007

Итак, специализированные поисковые системы - это поисковые системы, сосредоточенные на поиске информации на конкретную тему. Они имеют свои преимущества перед поисковыми системами общего назначения. Но, конечно же, есть и свои минусы.

Для того, чтобы найти в Интернете требуемую информацию, необходимо знать либо адрес её местоположения (например, адрес html-страницы или файла), либо пользователя Интернета, который может предоставить информацию. Если мы не знаем ни адреса, ни человека, который мог бы нам помочь, то следует перейти к вопросам "Как можно узнать адрес размещения информации?" или "Как найти человека, который мог бы нам помочь с поиском информации?". При этом не следует переоценивать возможности Интернета. Лучшие результаты может дать совмещение онлайновых и офлайновых методов поиска информации.

Где ищем?

Информация может размещаться на веб-серверах, в блогах, в новостях, в книгах, в словарях, в товарах, на географических картах, в справочниках адресов организаций, среди афиш театров и музеев, в телепрограммах, в каталогах, в Википедии, в архивах Интернета, в пиринговых сетях, в базах данных, в веб-закладках или в рейтинговых системах. Поэтому лучше заранее определиться где мы начнём свой поиск.

    источники информации;

    поиск по блогам;

    поиск в новостях;

    новости Google;

    новости Yandex;

    поиск книг;

    поиск в картинках;

    поиск в товарах;

    поиск по карте;

    поиск афиши;

    поиск в Википедии...

Как ищем?

Методы поиска зависят от того, как мы ответили на два первых вопроса. Поиск может осуществляться в поисковых индексах, через размещение собственной публикации по определенной теме, через экспертов и т.д.

    карты поиска информации;

    поисковые индексы;

    язык запросов в поисковых индексах;

    поиск на сайтах правовых систем;

    поисковые системы:

      @MAIL.RU

      Rambler

Приложения

    советы по поиску

Методов поиска в Интернете и через Интернет достаточно много. Поэтому поиск информации сводится к выбору методов поиска, требующих их оценки со стороны поставленной задачи. Успешность поиска зависит от знаний возможных методов и навыков владения ими, знания этнических языков, на которых эта информация может быть представлена. Таким образом, планирование поиска сводится к трём вопросам: "Что ищем?", "Где ищем?", "Как ищем?".

Что ищем?

Поисковые запросы бывают явные и неявные. В явных вопросах конкретно указывается объект поиска. В неявных вопросах, например, « какая сегодня погода », « происходит ли сейчас что-то важное », « можно ли проехать по городу », или у А. С. Пушкина в «Сказке о мертвой царевне и о семи богатырях»:

Свет мои, зеркальце! скажи

Да всю правду доложи:

Я ль на свете всех милее,

Всех румяней и белее?

объект поиска конкретно не указывается.

Поисковые запросы также делятся в зависимости от требуемой системы поиска. Первая группа поисковых систем предназначена лишь для линейного поиска информации, то есть для обнаружения в текстах фрагментов, аналогичных заданному. Следовательно, в запросе должен содержаться фрагмент текста. Вторая группа систем позволяет выбирать данные о связях между объектами, что требует указания в запросе на связь между теми или иными объектами.

Чтобы спланировать поиск, следует:

    Определить объект поиска,

    сформулировать какую информацию необходимо найти.

Если однозначно ответить на этот вопрос не представляется возможным, то поиск следует разделить на задачи с разными объектами. В планировании поиска также следует определить соотношение видов информации в поисковой задаче.

Пример: если необходимо представить какую-то компанию, то полезными могут стать не только стандартные характеристики фирмы (данные об обороте, клиентах и пр.), но и сведения о связях ее первых лиц. И наоборот - физическое лицо можно охарактеризовать через компанию, которой оно владеет или в которой работает.

Надо определиться и с возможными форматами файлов в которых может содержаться требуемая информация. Это может быть html-страница, текстовый документ в форматах txt, rtf, odt, doc или docx, документ pdf, презентация в форматах odp, ppt или pptx, электронная таблица в форматах

    браузеры

    панель быстрого доступа к поисковой системе Google

    панель быстрого доступа к поисковой системе Яндекс

    вопросы и задания

Поиск в новостях

Google News

В 2002 году Google запустила новый сервис Google News, суть которого заключается в сборе информации из наиболее популярных мировых источников информации - BBC, CNN, Guardian, Washington Post и др. - с последующей публикацией заголовков новостей, сгруппированных по нескольким категориям и степени важности.

В настоящее время новостные сервисы имеются практически во всех русских поисковых системах.

Яндекс. Новости

Яндекс.Новости - первая в России служба автоматической обработки и систематизации новостей. Поступающие в Яндекс данные анализируются компьютерной программой, которая объединяет близкие по содержанию новости в сюжеты и выделяет главные темы дня. Информация на сайте предоставлена ведущими мировыми и российскими СМИ. Формируется она автоматически, что гарантирует беспристрастное отражение текущей картины дня. Отсутствие человеческого вмешательства позволяет объективно формировать сюжеты, помещая рядом сообщения, содержащие совершенно разные точки зрения.

Яндекс. Новости обновляются в режиме реального времени 24 часа в сутки.

Аннотирование сюжетов в этой службе также происходит автоматически. Актуальные заголовки и аннотации формируются компьютерной программой. При этом тексты аннотаций выбираются так, чтобы дополнять информацию из заголовка.

На сайте доступен поиск не только по свежим новостям, но и по огромному архиву информационных сообщений с 2000 года. Кроме того, на основе проанализированных публикаций составляется рейтинг наиболее популярных персон в СМИ.

Поиск по блогам

Бурное развитие в последние годы частных онлайн-дневников, так называемых блогов , также нашло свое отражение в поисковых службах. В 2004 году поисковая система Яндекс начала тестирование сервиса, позволяющего осуществлять поиск в блогах. В марте 2006 года сервис был обновлен и сейчас является по сути дела индикатором общественного мнения Рунета.

Поиск в книгах

В октябре 2004 года, на книжной выставке во Франкфурте, Google представила сервис Google Print. 17 ноября 2005 г. его название было изменено на Google Book Search . Этот сервис выполняет полнотекстовый поиск по книгам, которые Google сканирует и сохраняет в своей цифровой базе данных.

Поиск в словарях

Цель службы Яндекс.Словари - предоставление пользователям Интернета максимально качественной, достоверной и актуальной информации обо всех сферах жизни человека. Источниками такой информации выступают универсальные и тематические энциклопедии, справочники, различные словари русского языка и иностранных языков.

В сентябре 2006 года Яндекс открыл программу по созданию электронной библиотеки справочной литературы. В рамках этой программы компания приобретает права, оцифровывает и публикует в Интернете наиболее интересные словари и энциклопедии по разным отраслям знания. Проект предусматривает регулярное поступление новых словарей и энциклопедий.

Поиск в картинках

Служба Яндекс автоматически собирает картинки в стандартных графических форматах (jpeg, gif и png), находящиеся в Рунете.



Понравилась статья? Поделиться с друзьями: