Разные поисковые системы. Поисковые системы интернета

Эта статья будет полезна и тем, кто собирается заняться поисковой оптимизацией сайтов и тем, кто этого делать не собирается. Для первых, знать, что такое поисковые системы и какими они бывают крайне важно, чтобы качественно продвигать сайты, приносящие доход. Для остальных информация будет скорее «для общего развития», которое также необходимо.

Итак, все знают, что количество сайтов в сети Интернет поистине огромно и пользователям нужно как-то в них ориентироваться. Иначе человек всю жизнь будет пользоваться только теми сайтами, которые он знает, но где гарантия, что это лучший сайт в сети? Изначально люди просто делились друг с другом ссылками на эти самые «лучшие» сайты. Позже началось упорядочивание сайтов в каталоги — базы ссылок, отсортированные по тематикам. С помощью каталогов пользователи уже могли найти интересные для себя сайты, но искать информацию было по-прежнему очень трудно. И тогда появились настоящие поисковые системы.

Ниже будет рассказано о том, как работают основные поисковые системы интернета, о том, когда и как появились первые поисковые системы России и мира и будет приведен список поисковых систем. Теперь обо всем по порядку.

Поисковые системы интернета представляют собой сложные программы для поиска информации на сайтах сети и web-интерфейс для взаимодействия с пользователем.

Программная часть поисковика занимается сбором информации с сайтов, обработкой текстов с web-страниц, хранением этих текстов специальной форме, поиском по хранящимся текстам и выводом пользователю ссылок на релевантные страницы в определенном порядке.

Web-интерфейс — это сайт, где пользователь вводит в специальное окно свой поисковый запрос и получает результат поиска — ссылки на найденные страницы с небольшим анонсом.

Поисковый запрос — введенные в поисковик слова, например, «список поисковых систем интернета».

Релевантные страницы — страницы, которые удовлетворяли бы желаниям пользователя, то есть были ему полезны, то есть отвечали на его вопрос и давали полный ответ. Естественно, что хороший поисковик должен выдавать в результатах поиска только релевантные страницы, поэтому все поисковые системы мира постоянно улучшают алгоритмы поиска своей поисковой машины.

В каком порядке выводят результат поисковые системы интернета:

Поисковые системы мира стремятся выводить в начале списка ссылок самые релевантные страницы, но проблема в том, что этим процессом занимаются специальные программы, которые естественно понятия не имеют, что пользователь хочет найти. Поэтому поисковики работают примерно следующим образом: они ищут среди своей базы сайтов текст поискового запроса, то есть те слова, которые ввел пользователь. Логика простая: чем чаще на странице встречаются слова, введенные пользователем, тем страница будет более релевантна запросу пользователю. Конечно, в реальности алгоритмы поисковиков невероятно сложные и их знают только разработчики.

Совет пользователям:
Когда вы что-то ищите в интернете, используя поисковую систему, пишите запрос, помня о том, что на страницах в выдаче поисковика будет находиться этот же текст. То есть, если Вы пишите «как мне бросить курить в 20 лет», то в лучшем случае поисковая система предложит вам ссылку на форум с таким вопросом, а вовсе не то, что вы пытались найти. Ищите так, как может быть написано в полезных вам статьях.

Еще одной проблемой поисковых систем на пути к идеальной релевантной выдаче является то, что пользователи не точно вводят свои запросы. Например, пользователь вводит «телевизоры» и в таком случае не понятно, что он ищет: магазин бытовой техники, обзоры новых моделей или вообще реферат про историю возникновения телевидения. Но это уже проблемы поисковых систем.

Теперь давайте отдельно остановимся на том, какие существуют поисковые системы мира и России, а также посмотрим список поисковиков с охватом аудитории пользователей в процентах.

Ее создали два студента Стэнфордского университета в 1998 году. Их имена Ларри Пейдж и Сергей Брин. Причем последний и дал название новому поисковику, сделав ошибку в слове Googol (число 10 в 100 степени). Сегодня Google это крупнейшая поисковая система мира, работающая с сайтами на 191 языках.

Крупнейшая же из Российских поисковых систем Вам конечно знакома — это Яндекс . В 2010 году она превысила 60% в общем количестве поисковых запросов в рунете. Также в 2010 году компания запустила поисковую систему yandex.com и тем самым вышла на международный рынок.

А общий список поисковых систем России выглядит примерно так:

* Яндекс (46,3 % Рунета)

* Mail.ru (8,9 % Рунета)

* Rambler (3,3 % Рунета)

* Nigma (0,5 % Рунета)

* Генон (0,1 % Рунета)

* Gogo.ru (<0,1 % Рунета)

* Aport (<0,1 % Рунета)

Вот такой список Российских поисковиков.

Лучшие поисковые системы Интернета. Поисковая система интернетаэто специальные программы для поиска, установленные на целый комплекс специализированных машин. А по-простому — это тот же сайт с комплексом программ, только на специальной поисковой машине (сервере). Именно при помощи поисковых систем вы находите всю нужную вам информацию. Поисковых систем очень много.

1. Что такое поисковая система Интернета

2. Популярные поисковые системы нашей страны

3. Популярные поисковые системы Зарубежья

4. Необычные поисковые системы

5. Как правильно искать информацию в Интернете

Самые лучшие п оисковые системы в нашей стране:

http://www.yandex.ru


http://www.google.com


http://www.aport.ru


http://www.rambler.ru/


http://go.mail.ru


http://www.webalta.ru/

Самый всеми нелюбимый и навязчивый поисковик.

Популярные поисковики зарубежья

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

У каждой страны существую свои популярные поисковые системы.

Необычные поисковые системы

  • DuckDuckGo (https://duckduckgo.com/)- гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.


  • TinEye (http://tineye.com/) - поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Google ввел такую же функцию в своем поиске по картинкам.


  • Генон (http://www.genon.ru/) - поисковая система, собирающая и создающая контент у себя на сайте.


Почти в каждой поисковой системе помимо окна поиска расположены ссылки на самые популярные новостные сайты, и сайты определенной тематики.

Как правильно искать информацию в Интернете

В каждой поисковой системе есть свои алгоритмы (правила) поиска информации.

Для того, чтобы найти какую-то информацию в Интернете через поисковую систему, необходимо в поле поиска ввести запрос . Если вы введете какое-то одно слово, то вам по этому запросу выдадут тысячи ссылок на сайты, в которых это слово упоминается.

Поэтому необходимо вводить как можно более конкретный запрос, состоящий из двух, трех и более словосочетаний.

Давайте рассмотрим пример запроса в поисковой системе Яндекс .

Допустим, вы хотите найти информацию по вопросу о покупке компьютера. Если вы напишите в окне поиска одно слово «Компьютер », то вам выдадут 133 млн ответов


Надо задать более конкретный запрос. Лучше указать какой именно компьютер вы хотите купить и где (в каком городе).


Тогда уже поисковая система выдаст вам намного меньше ответов на ваш запрос.

Поисковой системе совершенно без разницы, какими буквами вы введете запрос – большими или маленькими.

Яндекс различает существительные и прилагательные, но совершенно игнорирует окончания.

Также ему совершенно безразличны падежи, множественное число и тому подобное.

Для того чтобы поиск был более точным, необходимо взять запрос в кавычки или поставить перед словом восклицательный знак.


А теперь посмотрите на тот же самый запрос, но без восклицательных знаков.


Видите разницу? С восклицательными знаками количество ответов не 2 млн, а 186 тыс.

Если вы поставите восклицательный знак перед словом с большой буква, то вам выдадут ответы, в которых встречается именно это слово с большой буквы.

Если слово в именительном падеже, и вам необходима информация именно по такому слову, и именно так, как вы его написали, то поставьте перед этим словом два восклицательных знака. Например: !!Мяч .

Поиск выдаст вам ответы именно по этому слову «Мяч » так, как вы его написали. Не «мячик », не «мячи », и с большой буквы.

Если вы напишите словосочетание со словом «на », то Яндекс проигнорирует «на ». Например: «на полке ». Поиск будет производиться только по слову «полка ».

Для того, чтобы он его учел и не игнорировал, надо перед словом «на » поставить знак плюса – «+на ».

У каждой поисковой системы свой алгоритм поиска, поэтому если вы пользуетесь каким-то определенным поисковиком, и хотите научиться правильно составлять запросы, то надо просто набрать в поисковой строке «правила поиска в Google » или «правила поиска в Яндекс », перейти по ссылке ответа на ваш запрос и почитать нужную информацию.

Обновлено: 28 июля 2017

Здравствуйте, уважаемые читатели блога сайт. , то его немногочисленным пользователям было достаточно собственных закладок. Однако, как вы помните, происходил в геометрической прогрессии, и совсем скоро ориентироваться во всем ее многообразии стало сложнее.

Тогда появились каталоги (Яху, Дмоз и другие), в которых их авторы добавляли и сортировали по категориям различные сайты. Это сразу же облегчило жизнь тогдашним, еще не очень многочисленным пользователям глобальной сети. Многие из этих каталогов живы и до сих пор.

Но через некоторое время размеры их баз стали настолько большими, что разработчики сначала задумались о создании поиска внутри них, а потом уже и о создании автоматизированной системы индексации всего содержимого интернета, чтобы сделать его доступным всем желающим.

Основные поисковики русскоязычного сегмента интернета

Как вы понимаете, идея эта реализовалась с ошеломительным успехом, но, правда, все сложилось хорошо только для горстки избранных компаний, которым удалось не сгинуть на просторах интернета. Почти все поисковые системы, которые появились на первой волне, сейчас либо исчезли, либо прозябают, либо были куплены более удачными конкурентами.

Поисковая система представляет из себя очень сложный и, что немаловажно, очень ресурсоемкий механизм (имеются в виду не только материальные ресурсы, но и людские). За внешне простой , или ее аскетичным аналогом от Гугла, стоят тысячи сотрудников, сотни тысяч серверов и многие миллиарды вложений, которые необходимы для того, чтобы эта махина продолжала работать и оставалась конкурентоспособной.

Выйти на этот рынок сейчас и начать все с нуля — это скорее утопия, чем реальный бизнес проект. Например, одна из богатейших в мире корпораций Микрософт десятилетиями пыталась закрепиться на рынке поиска, и только сейчас их поисковик Бинг начинает потихоньку оправдывать их ожидания. А до этого была целая череда провалов и неудач.

Что уж говорить о том, чтобы выйти на этот рынок без особых финансовых влияний. К примеру, наша отечественная поисковая система Нигма имеет много чего полезного и инновационного в своем арсенале, но их посещаемость в тысячи раз уступает лидерам рынка России. Для примера взгляните на суточную аудиторию Яндекса:


В связи с этим можно считать, что список основных (лучших и самых удачливых) поисковиков рунета и всего интернета уже сформировался и вся интрига заключается только в том, кто кого в итоге сожрет, ну или каким образом распределится их процентная доля, если все они уцелеют и останутся на плаву.

Рынок поисковых систем России очень хорошо просматривается и тут, наверное, можно выделить двух или трех основных игроков и парочку второстепенных. Вообще, в рунете сложилась достаточно уникальная ситуация, которая повторилась, как я понимаю, только еще в двух странах в мире.

Я говорю о том, что поисковик Google, придя в Россию в 2004 году, не смог до сих пор захватить лидерства. На самом деле, они пытались примерно в этот период купить Яндекс, но что-то там не сложилось и сейчас «наша Раша» вместе с Чехией и Китаем являются теми местами, где всемогущий Гугл, если не потерпел поражение, то, во всяком случае, встретил серьезное сопротивление.

На самом деле, увидеть текущее положение дел среди лучших поисковиков рунета может любой желающий. Достаточно будет вставить этот Урл в адресную строку вашего браузера:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Дело в том, что большая часть использует на своих сайтах , а данный Урл позволяет увидеть статистику захода посетителей с различных поисковых систем на все сайты, которые принадлежат доменной зоне RU.

После ввода приведенного Урла вы увидите не очень приглядную и презентабельную, но зато хорошо отражающую суть дела картинку. Обратите внимание на первую пятерку поисковых систем, с которых сайты на русском языке получают трафик:

Да, конечно же, не все ресурсы с русскоязычным контентом размещаются в этой зоне. Есть еще и SU, и РФ, да и общих зонах типа COM или NET полно интернет проектов ориентированных на рунет, но все же, выборка получается довольно-таки репрезентативная.

Эту зависимость можно оформить и более красочно, как, например, сделал кто-то в сети для своей презентации:


Сути это не меняет. Есть пара лидеров и несколько сильно и очень сильно отстающих поисковых систем. Кстати, о многих из них я уже писал. Иногда бывает довольно занимательно окунуться в историю успеха или, наоборот, покопаться в причинах неудач когда-то перспективных поисковиков.

Итак, в порядке значимости для России и рунета в целом, перечислю их и дам им краткие характеристики:

Сам процесс индексации и следующий за ним процесс обновления индексных баз довольно времязатратный. Хотя Гугл делает это значительно быстрее конкурентов, во всяком случае Яндекса, которому на это дело требует неделя-другая (читайте про ).

Обычно текстовое содержимое интернет страницы поисковик разбивает на отдельные слова, которые приводит к базовым основам, чтобы потом можно было давать правильные ответы на вопросы, заданные в разных морфологических формах. Весь лишний обвес в виде Html тегов, пробелов и т.п. вещей удаляется, а оставшиеся слова сортируются по алфавиту и рядом с ними указывается их позиция в данном документе.

Такая шняга называется обратным индексом и позволяет искать уже не по вебстраницам, а по структурированным данным, находящимся на серверах поисковой системы.

Число таких серверов у Яндекса (который ищет в основном только по русскоязычным сайтам и чуток по украинским и турецким) исчисляется десятками или даже сотнями тысяч, а у Google (который ищет на сотнях языков) — миллионами.

Многие сервера имеют копии, которые служат как для повышения сохранности документов, так и помогают увеличить скорость обработки запроса (за счет распределения нагрузки). Оцените расходы на поддержание всего этого хозяйства.

Запрос пользователя будет направляться балансировщиком нагрузки на тот серверный сегмент, который менее всего сейчас нагружен. Потом проводится анализ региона, откуда пользователь поисковой системы отправил свой запрос, и делается его морфологически разбор. Если аналогичный запрос недавно вводили в поисковой строке, то пользователю подсовываются данные из кеша, чтобы лишний раз не грузить сервера.

Если запрос еще не был закеширован, то его передают в область, где расположена индексная база поисковика. В ответ будет получен список всех интернет страниц, которые имеют хоть какое-то отношение к запросу. Учитываются не только прямые вхождения, но и другие морфологические формы, а так же синонимы, омонимы и т.п. вещи.

Их нужно отранжировать, и на этом этапе в дело вступает алгоритм (искусственный интеллект). Фактически запрос пользователя размножается за счет всех возможных вариантов его интерпретации и ищутся одновременно ответы на множество запросов (за счет использования операторов языка запросов, некоторые из которых доступны и обычным пользователям).

Как правило, в выдаче присутствует по одной странице от каждого сайта (иногда больше). сейчас очень сложны и учитывают множество факторов. К тому же, для их корректировки используются и , которые вручную оценивают реперные сайты, что позволяет скорректировать работу алгоритма в целом.

В общем, дело ясное, что дело темное. Говорить об этом можно долго, но и так понято, что удовлетворенность пользователей поисковой системой достигается, ох как не просто. И всегда найдутся те, кому что-то не нравится, как, например, нам с вами, уважаемые читатели.

Удачи вам! До скорых встреч на страницах блога сайт Как работают поисковые системы - сниппеты, алгоритм обратного поиска, индексация страниц и особенности работы Яндекса

Как проверить сайт на битые ссылки - Xenu Link Sleuth, плагин и онлайн-сервис Broken Link Checker, а так же поисковые системы

Электронные деньги России и рунета, а также кошельки в международных платежных системах Paypal - что это такое, регистрация, пополнение счета и как им пользоваться, а так же как выводить деньги с Пайпал в России Bing вебмастер - центр для вебмастеров от поисковой системы Бинг

Как вы, наверное, уже знаете, общая методика пользования поисковыми системами достаточна проста: зашел на сайт поисковой системы, ввел искомое слово (фразу), нажал на «Enter» (или кнопку «Найти») - получи результат - список ссылок на интернет-страницы, содержащих указанное вами слово или фразу.

Сложность заключается в деталях, которые на самом деле и являются важными: как избежать «кучи мусора» в результатах поиска; как сделать так, чтобы поисковая система нашла именно нужное вам упоминание искомого слова (фразы), а не все упоминания подряд по всем сайтам Интернета; почему в списке найденных ресурсов самые нужные и интересные сайты находятся далеко не на первом месте. А также почему поисковая система вообще ничего полезного не нашла, хотя вы точно знаете, что данная информация в Интернете есть, и еще несколько десятков «почему?» и «как?».

Ранее было сказано, что самыми лучшими и наиболее используемыми российскими поисковыми сайтами являются Гугл (Google) , Яндекс (Yandex) , Поиск@mail.ru , Рамблер (Rambler) . Лучшими иностранными поисковыми системами - www.Google.com и www.yahoo.com . При этом необходимо иметь в виду, что все эти поисковые системы имеют свои индивидуальные особенности.

Для начала могут отличаться их «зоны покрытия» - интернет-пространства, которые проиндексированы поисковыми системами, то есть, изучены ими, и именно на которых и производится поиск.

    Поисковые системы обычно состоят из трех компонентов:
  • программы - робота (паука), который перемещается по сети и собирает информацию о ее ресурсах;
  • базы данных, в которой содержатся сведения о ресурсах сети, собранные поисковым роботом;
  • поискового механизма, служащего для взаимодействия пользователя с базой данных.

Поисковые роботы-пауки во время своих блужданий по сети извлекают и индексируют (оценивают) различные виды информации. Причем различные программы-роботы имеют свои поисковые особенности и приоритеты. Одни из них индексируют каждое слово в документе, другие - только наиболее часто встречающиеся слова. В общем случае индексирование документа производится по многим параметрам: по количеству слов в документе, по размеру документа, по его названию, заголовкам, ссылкам и т.д.

Обычно поисковые роботы работают «по наводке», то есть создатель web-страницы пишет запрос в поисковую систему с просьбой проиндексировать его документ. На указанный им URL-адрес посылается поисковый робот и делает свое дело.

Но поисковые роботы-пауки могут и самостоятельно перемещаться по сети, переходя по ссылкам в посещаемых документах.

Собранную информацию роботы помещают в базу данных с которой и взаимодействует пользователь, осуществляя поиск. У каждой поисковой системы вырабатывается своя база данных, при этом большинство информации в ней может быть такой же, как и у других поисковых систем, но имеются и существенные различия.

Немаловажным также является то, по какому признаку поисковая система сортирует найденные результаты (одни web-страницы помещая в начале списка, а другие в конце - ).



Понравилась статья? Поделиться с друзьями: