Qidiruv mexanizmi www Rambler

Internet hamjamiyatining aksariyat foydalanuvchilari o'z kunlarini qidirish mexanizmlaridan boshlaydilar, u erda kerakli ma'lumotlarni topishga va muammolarini hal qilishga harakat qiladilar. Afsuski, qidiruv tizimlari ko'pincha manbalarni aniq va adolatli talqin qila olmaydilar. Natijada, hal qilinadigan masaladan uzoq bo'lgan saytlar ko'pincha qidiruvning birinchi pozitsiyalarida. Shu bilan birga, haqiqiy imtiyozlarni aks ettiruvchi manbalar qidiruvni "haddan tashqari oshirib yuborish" dir.

Ushbu vaziyatning sababi oddiy va qidiruv tizimlari tomonidan natijalarni olish va taqdim etish texnologiyasida yotadi. Shuni tushunish kerakki, asosiy muammo barcha xohlovchilar uchun ochiq va ochiq bo'lgan aniq qoidalarning yo'qligi. Qidiruv indekslarini (algoritmini) yaratish algoritmlarida noaniqlik qancha ko'p bo'lsa, qidiruv tizimlari shunchaki haqiqiy ma'lumotni yaratish jarayonini aks ettiradi. Va shunga ko'ra, qidiruv tizimlarining qidiruv natijalariga ishonch darajasi past bo'ladi.

Bu paradoksal emas, ammo bu qidiruv tizimlarining aybi emas, chunki ular qidirish indekslarini qurish qoidalarini yashirishga majburdirlar. Bu qidiruvni tashkil qilishda texnologiyaning o'zi aybdor. O'zida qidirish mexanizmining texnologiyasi passiv foydalanuvchiga qaratilgan. Faqatgina saytni ro'yxatdan o'tkazish kerak, keyin qidiruv roboti hamma narsani qiladi. U manba sahifasini sahifalar bo'yicha skanerlaydi, ularning har birining tarkibini tahlil qilishga harakat qiladi. Foydalanuvchi uchun murakkablik minimal, bu sizga ko'p kuch va pul sarflash evaziga qidiruv robotlarini "aldash" uchun turli usullardan foydalanishga imkon beradi. Ushbu ish sxemasida qidiruv tizimlari resurslarni indekslash va qidirish indeksini tuzish algoritmlari va qoidalarini o'zgartirishlari kerak.

Albatta, ko'pchilik foydalanuvchilar klassik qidiruv tizimlaridan foydalanganlar, foydalanmoqdalar va foydalanadilar. Bu oddiy, qulay va keng tarqalgan. Qidiruv tizimlaridan foydalanish odat tusiga kiradi.

  Qidiruv motorlar haqida umumiy ma'lumot

Qidiruv mexanizmi   - Ushbu dastur yomon tuzilgan ma'lumotlar to'plamiga kirishni ta'minlaydi. Yomon tuzilgan ma'lumotlarga e'tibor qarating, ya'ni. Nisbiy jadval ko'rinishida taqdim etilishi mumkin bo'lmagan ma'lumotlar qidirish tizimini DBMS-dan ajratib turadi.

Izlash tizimining ushbu ta'rifida turli xil ma'lumotlar nazarda tutiladi, ya'ni. matn, audio, video, rasmlar va hk. Biroq, shuni ta'kidlash kerakki, bu qidiruv tizimining to'liq funktsiyasini tavsiflash uchun ideal bo'lgan matnli ma'lumotlar, chunki multimedia ma'lumotlarini qidirish algoritmlari asosan matn qidirish algoritmlariga asoslanadi.

Qidiruv tizimining asosiy vazifasi   - foydalanuvchi tomonidan tegishli ma'lumot so'rovini qidirish uchun vaqtni kamaytirish. Muvofiqlik fandagi eng sub'ektiv va chalkash tushunchalardan biridir. ma'lumot olish. Ko'pincha ular foydalanuvchi nuqtai nazaridan dolzarblik haqida gapirishadi, keyin so'rovga tegishli bo'lgan "" ma'lumotlar va foydalanuvchi uchun zarur bo'lgan ma'lumotlar "" bitta va bir xil bo'ladi. Bu biz ushbu bo'limda muhokama qilayotgan dolzarblik. Foydalanuvchi qanday ma'lumotlarni zarur deb hisoblaydi, degan savol tug'iladi. Ba'zi holatlarda tegishli ma'lumotlar so'rov bilan bog'liq bo'lgan ma'lumotlar bazasidagi barcha ma'lumotlar kabi belgilanishi mumkin. Shunday qilib, masalan, foydalanuvchi ma'lum bir kompaniya haqida hamma narsani bilishi kerak bo'lsa, u ushbu kompaniyani eslatuvchi barcha hujjatlarni topishga qiziqadi. Boshqa hollarda, tegishli ma'lumotlar faqat foydalanuvchining muayyan vazifasini bajarish uchun etarli bo'lgan ma'lumot, masalan, ma'lum bir savolga javob topish. Agar ikkinchi holda qidirish natijalarida ortiqcha ma'lumotlar ko'p bo'lsa, ya'ni. so'rov bilan bog'liq bo'lgan, ammo ushbu vazifani bajarish uchun zarur bo'lmagan ma'lumotlar, keyin zarur / tegishli ma'lumotlarni tanlash foydalanuvchi uchun qo'shimcha vaqtni oladi.

Shunday qilib, qidiruv tizimiga an'anaviy ravishda ikkita asosiy xususiyat qo'llaniladi:   aniqligi va to'liqligi yoki aniqrog'i, ularning qaramligi. Har safar foydalanuvchi tizimdan so'rov yuboradi va shu bilan qidiruvni boshlaydi, qidiruv tizimidagi barcha hujjatlar to'rt qismga bo'linadi. Aniqlik qidiruvning bir tomonini, ya'ni qidiruv tizimi foydalanuvchini izlashga ketadigan vaqtni minimallashtirish qobiliyatini aniqlaydi. bu talab  ma'lumotlar. To'liqlik yana bir jihatni belgilaydi - tizim ushbu so'rovga tegishli ma'lumotlarni topishga qodir. Har bir topilgan va tegishli hujjat topilganida siz optimal so'rov (lar) ni tanlashingiz mumkin.

Internetdan foydalanganda qidiruv tizimlari juda muhim rol o'ynaydi. Internetda shunchalik ko'p ma'lumot to'planganki, uni qidirish allaqachon alohida vazifaga aylanib bormoqda va ko'p vaqt talab etadi. Qidiruv tizimlari sizga kerak bo'lgan ma'lumot mavjud bo'lgan bir nechta sahifalar o'rniga so'rovga minglab havolalarni taqdim etadi. Dunyo miqyosidagi Internet foydalanuvchilari fazoviy ma'lumotlarni tahlil qilish qobiliyatining afzalliklarini inobatga olib, ko'pgina davlat, tijorat va akademik tashkilotlarda to'plangan hududning raqamli suratlari va boshqa fazoviy ma'lumotlarga tez va qulay qidirish va kirish imkoniyatini beradigan vositaga muhtoj.

Biroz tarix ...

Qidiruv mexanizmi (qidiruv serveri, qidiruv tizimi)   - foydalanuvchi ushbu so'rov uchun ushbu so'rovga mos keladigan saytlarga havolalarni olishi mumkin bo'lgan maxsus veb-sayt.

Qidiruv mexanizmi, qoida tariqasida, ikki bosqichdan iborat. Birinchisi maxsus dastur  (qidiruv roboti) yoki kishi veb-sahifalardan ma'lumot to'playdi va ularni indekslaydi. Foydalanuvchi so'rov yuborganda, qidiruv oldindan tuzilgan indeks bo'yicha davom etadi. Qidiruv natijasi deb ataladigan narsa qidiruv natijalari  - so'rovga mos keladigan hujjatlar (veb-sahifalar) ga havolalar ro'yxati.

Ko'pgina qidiruv tizimlari Internet saytlarida ma'lumot qidirishadi, ammo shuningdek, ftp-serverlarda, hujjatlarda va ma'lumotlarni qidirishda ham qidiruv tizimlari mavjud. ichki tarmoqlar  va boshqa. Ichida yaqinda  RSS texnologiyasiga asoslangan qidiruv tizimining yangi turi paydo bo'ldi.

Qidiruv tizimining ishi "qidiruv tizimi" ishiga asoslanadi. Izlash tizimining sifatining asosiy mezonlari - bu muhimlik, ma'lumotlar bazasining to'liqligi va til morfologiyasini hisobga olish.

Eng mashhur qidiruv tizimlari  Rossiyada bugungi kunda Google, Yandex va Rambler hisoblanadi.

Birinchi qidiruv mexanizmi 1993 yilda Massachusets texnologiya instituti mutaxassisi Metyu Graham tomonidan yaratilgan Wandex nomli veb-sayt edi. Bir oz vaqt o'tgach, Aliweb qidiruv tizimi paydo bo'ladi. Birinchi to'liq matnli qidiruv tizimi 1994 yilda ishga tushirilgan "WebCrawler" ga aylandi. O'zidan oldingilaridan farqli o'laroq, u foydalanuvchilarga istalgan veb-sahifada har qanday kalit so'zlarni qidirishga imkon berdi, shundan beri u barcha yirik qidiruv tizimlarida standart bo'lib qoldi. Bundan tashqari, u birinchi bo'lib keng ommalashgan qidiruv tizimi edi. 1994 yilda Karnegi Melon Universitetida ishlab chiqarilgan "Lycos" ishlab chiqarila boshlandi.

Rossiyaning rivojlanishi qidiruv tizimlari  Bu 1996 yilda Altavista qidiruv tizimiga morfologik kengayish paydo bo'lishi va ruslarning original Rambler va Aport qidiruv tizimlarining ishga tushirilishi bilan boshlandi. Ko'p o'tmay, 1997 yilda Yandex qidiruv tizimi ochildi.

Bugungi kunda dunyoda ixtisoslashuvi, imkoniyatlari va qidirish usullari bilan farq qiluvchi bir necha yuz turli xil qidiruv tizimlari mavjud.

Yangiliklar

  • 20/ 12/ 2005

    TOKYO, 20-dekabr - RIA Novosti, Andrey Fesyun. Yaponiya, Amerikaning Google tizimining tobora ommalashib borayotganiga qarshi, Internet uchun o'ziga xos qidiruv tizimini ishlab chiqadi.

    Bo'lim xodimiga ko'ra axborot siyosati  Iqtisodiyot, savdo va sanoat vazirligi Fumixiro Kajikava, shu maqsadda yigirma universitet va elektronika kompaniyalari vakillari ishtirokida tadqiqot guruhi tuziladi.

      "Biz Google yoki Yahoo bilan raqobatlashmoqchi emasmiz, lekin biz faqat Yaponiya uchun noyob tizim yaratish haqida o'ylayapmiz", dedi Kazikawa. Uning so'zlariga ko'ra, tizim asosan rasmlarni, xususan fotosuratlarni qidirish uchun ishlab chiqiladi.

    Vazirlik vakilining ta'kidlashicha, guruh o'zining birinchi yig'ilishini keyingi juma kuni o'tkazadi, o'z faoliyati to'g'risida mart oyida vazirlikda, yakuniy yig'ilish kelasi yilning iyulida taqdim etadi.

  • 09.2005
      G.I. Ruzaykin
      PC World :: Yangiliklar tasmasi

    Inklyuziv axborot makoniga borish yo'lida Internetda ma'lumot qidirish muammolari ayniqsa dolzarb bo'lib bormoqda. Bu Internet rivojlanishidagi texnologik yutuqlar fonida, xususan, foydalanuvchiga ma'lumotlarni etkazib berish (ma'lumotlar uzatish tezligi, uning hajmi va sifati haqida) haqida gap ketganda yaqqol ko'rinadi. Shu sababli, axborot olish uchun texnologiyalar va dasturiy mahsulotlarning rivojlanishi to'g'risidagi hisobotlar IT bozorida juda muhimdir.

    DVYGUN (www.dvygun.com) shaxsiy qidiruv tizimining DVYGUN Smart Search 2.5.2.5 Beta-ning yangi versiyasi chiqarilgani haqida e'lon qildi, bu hujjatlar, xabarlar qatorida to'liq matnli qidiruvni amalga oshirishga imkon beradi. elektron pochta, multimedia fayllari, tashrif buyuradigan veb-sahifalarda va foydalanuvchi kompyuterida saqlanadigan aloqa ma'lumotlari orasida.

    Shu bilan birga, DVYGUN Smart Search dasturi quyidagi turdagi ma'lumotlarni (fayllarni) qidiradi:

    • elektron pochta xabarlari va Outlook / Outlook Express qo'shimchalari
    • fayllar pDF formatlari, MS Word, MS Excel, RTF, HTML va matnlar;
    • ma'lumotlar zIP arxivlari, RAR, GZIP, CAB va hk.;
    • rasmlar, musiqa va videofayllar
    • tashrif buyurgan veb-sahifalar, tanlangan Internet manzillari internet-brauzer  Izohlovchi
    • windows va Outlook-da manzillar kitobi kontaktlari.

    Ma'lumotni barcha turdagi va sevimlilar uchun qidirish mumkin. Qidiruv parametrlarini belgilashda qidiruv maydonini yanada toraytirish amalga oshiriladi. Masalan, fayllar uchun ular "Fayl nomi", "Jild", "Hajm" va "Sana o'zgartirilgan" bo'lishi mumkin. Topilgan hujjatlarning reytingi qidiruv so'roviga muvofiqlik darajasiga qarab amalga oshiriladi. Og'zaki so'rovlarda so'zlarning kontekstual yaqinligi hisobga olinadi, shuning uchun topilgan har bir hujjat qidiruv natijalarida kontekstli kotirovka bilan birga ko'rsatiladi, aksariyat hollarda uning mazmunini tushunishni tezlashtiradi.

    Tezkor qidiruvni tashkil qilish uchun DVYGUN Smart Search ushbu qidiruv amalga oshiriladigan maxsus ma'lumotlar bazasini (indeksini) yaratish uchun dastlabki ma'lumotlarni qayta ishlashni amalga oshiradi. Ushbu dasturda ushbu funktsiyani amalga oshirishning bir nechta xususiyatlari bor: qidirish va indekslash bir vaqtning o'zida o'tishi mumkin, indekslashni qidirishni boshlash uchun kutish kerak emas; indeks fonda yangilanadi, dastur doimiy ravishda foydalanuvchining harakatlarini kuzatib boradi, shunda o'zgartirilgan va yangi ma'lumotlar darhol indeksga kiritiladi, ya'ni. qidiruv natijalarini yangilash; tizim resurslari yetarli bo'lmagan taqdirda, foydalanuvchining kompyuterini sekinlashtirmaslik uchun indeksatsiya jarayoni to'xtatiladi.

    DVYGUN Smart Search dasturchilarining fikriga ko'ra, ularning dasturlarini qidiruv atributlarining mavjudligi va sifati bo'yicha tekshirish (indeksni tez yangilash, natijalarning ahamiyatini hisoblash, sozlash, tezlikni indekslash va rus tilining morfologiyasini qo'llab-quvvatlash) uni Google, Yahoo, Microsoft, kabi taniqli qidiruv tizimlaridan ustun qo'yadi. Kopernik va Blinkx. Hech bir raqib ushbu atributlarning mavjudligi va sifatiga qo'yiladigan talablarni to'liq qondirmaydi. DVYGUN Smart Search dasturi 5 Gb / s tezlikda indekslashni amalga oshiradi va rus va morfologik ishlov berishlarni amalga oshiradi. ukraina tillari. Afsuski, taniqli mahalliy va ukrainalik qidiruv tizimlarining birortasi ham bunday tez indekslashga qodir emas. Shu bilan birga, ishlab chiquvchilar DVYGUN Smart Search tomonidan ishlov berilgan oz sonli fayl formatlarini ushbu versiyaning kamchiliklari bilan bog'laydilar: muammoni tegishli filtrlarni sotib olish yoki o'zingiz ishlab chiqarish orqali hal qilishingiz mumkin.

    Mavjud qidiruv tizimlarining rivojlanishi Yandex-dan (http://company.yandex.ru/news/2005/0628) Yandex.Server-ning yangi versiyasi Windows va Unix-ning barcha mashhur versiyalari ishlayotganligi haqidagi xabar bilan tasdiqlanadi. , tezroq ishlay boshladi. Bu to'liq matnli ma'lumot olish uchun mahsulotlar guruhini kengaytirdi va hujjatlarni qayta ishlash tezligini bir yarim baravarga oshirdi. Qayta ishlangan hujjatlar turlari soni ko'paytirildi: endi .txt, .doc, .rtf, .html, .xml va .pdf, .xls, .ppt va.swf formatlariga qo'shimcha ravishda qo'llab-quvvatlanadi. Shuningdek, fayllarni indekslash tezligi 25 dan 40 MB / s gacha oshdi.

    Qidiruv natijalari dizaynini boshqarishi kerak bo'lgan foydalanuvchilarga ushbu dasturning yangi versiyasini avvalgidan deyarli ikki baravar arzon narxda atigi $ 170 evaziga etkazib berish paketi taklif etiladi. Bundan tashqari, Standard + va Professional + veb-saytlari egalari uchun ushbu dasturning nashrlari paydo bo'ldi. rivojlangan xususiyatlar.

    Rossiyaning CONVERA vakolatxonasi (www.convera.su) ma'lumotlariga ko'ra, kelgusi yil Rossiyada uning harakatlari yangi Excalibur qidiruv tizimini ilgari surish va RetriewalWare 8.2-ning mahalliylashtirilgan versiyasini ishlab chiqishga yo'naltiriladi. Matndan ob'ektlarni ajratib olish kabi standart funktsiyalarni amalga oshiradi (birinchi nashrda ular geografik nomlar, tegishli nomlar, vaqtlar, valyutalar, sanalar, raqamlar - telefon, kredit kartalari va avtomobillarni, shuningdek ular orasidagi aloqalarni o'z ichiga oladi). Websphere, Sharepoint portali, Documentum, yangi Lotus, Windchill va Teamlink dasturiy paketlari.

    Bu kuzda Excalibur Rossiyada paydo bo'ladi. Ushbu mahsulot va boshqa shunga o'xshash global qidiruv tizimlari o'rtasidagi eng muhim farq qidirish natijasida taqdim etilgan tegishli ma'lumot miqdorini aniqlashdir. Bunday samaradorlik dasturga kiritilgan 12 million taksonomiya tufayli mumkin bo'lib, ularning yordamida ma'lumot so'rov bo'yicha ishlov beriladi. So'rovni qayta ishlash jarayonida uning taksonomik tushunchasi ( mavzu maydoni), buning natijasida barcha ma'lumotlar ikki guruhga bo'linadi - talabga bog'liq va ahamiyatsiz. Bundan tashqari, so'rov natijalari jadvallar, grafik rasmlar, matnlar va boshqalar ko'rinishida berilishi mumkin axborot havolalari, ya’ni javob so'rovning mohiyati va qidirish natijasida taklif qilingan hujjatlar to'plamidagi o'zaro munosabat aks etadi.

  • 1998 yil 23 mart
      Yangi Internet qidiruvi

    Newman Search for Information Technologies qidiruv tizimining yangi katalogi ishga tushirildi. Newman Search brauzer va kataloglarning fazilatlarini bir vaqtning o'zida birlashtiradi. Qidirilayotgan barcha manbalar "Computer Press", "News", "mavzular bo'yicha guruhlangan. Kompyuter firmalari"va hokazo. Foydalanuvchilar" izlash shovqinini "va kerakli hujjatni topish vaqtini sezilarli darajada kamaytirgan holda qidiruv maydonini tegishli bo'limlar bilan cheklashlari mumkin.

    Newman Search veb-saytlarining mavzusi faqat kompyuterlar, Internet va boshqa narsalar bilan cheklangan axborot texnologiyalari. Sistemali ma'lumotlarni o'z ichiga olgan birlamchi manbalar va saytlarga ustunlik beriladi (hujjatlar, tavsiflar, testlar, narxlar, fikrlar, yangiliklar, press-relizlar).

    Newman Search serverlarni kundalik operatsion indeksatsiyasi bilan ajralib turadi - 1 kundan ("Yangiliklar" bo'limi uchun) 7 kungacha (kompaniya veb-saytlari uchun) kompyuter ishi) Odatiy qidiruv tizimlarida, ma'lumot yangilanishlari bir necha oy kutishi kerak.

    Qidiruv rus tilining morfologiyasi va kompyuter terminologiyasini hisobga olgan holda amalga oshiriladi. Masalan, agar siz "HDD" ni qidirsangiz, "HDD", "WINCHESTER", "HARD DISK", "HDD" va hokazolarni qidirasiz.

    Ochiq konversiya statistikasi ma'lumotlarning tarkibiga kompyuter veb-saytlarining reytingini shakllantiradi. Bundan tashqari, reyting har bir bo'lim uchun "Yangiliklar", "Kompyuter kompaniyalari" va boshqalar uchun alohida qo'llab-quvvatlanadi.

  Yandex qidiruvi

Yandex qidiruv tizimining tarixi

Yandeks tarixi 1990 yilda Arkadiyada qidirish dasturlarini ishlab chiqish bilan boshlangan.

1993 yilda Arcadia CompTek bo'linmasiga aylandi. 1993-1994 yillarda dasturiy ta'minot texnologiyasi  Yu. D. Apresyan (Rossiya Fanlar akademiyasining Axborot uzatish muammolari instituti) laboratoriyasi bilan hamkorlik tufayli sezilarli darajada yaxshilandi.

1996 yil yozida CompTek menejmenti va qidiruv tizimini ishlab chiquvchilar qidiruvga asoslangan dasturlarni yaratishdan ko'ra, texnologiyalarning rivojlanishi muhimroq va qiziqroq degan xulosaga kelishdi. Bozorni o'rganish qidirish texnologiyalarining o'z vaqtida va katta istiqbollarini namoyish etdi.

"Yandex" so'zi bir necha yil oldin qidiruv tizimining asosiy va eng qadimgi ishlab chiquvchilaridan biri tomonidan ixtiro qilingan. "Yandex" "Til indeksi" yoki ingliz tilida "Yandex" - "Yana bir indeksator" degan ma'noni anglatadi.

Rasmiy ravishda Yandex.Ru qidiruv tizimi 1997 yil 23 sentyabrda Softool ko'rgazmasida e'lon qilindi. Yandex.Ru-ning o'sha paytdagi asosiy farqlovchi xususiyati bu hujjatlarning noyobligini tekshirish edi (nusxalar bundan mustasno) turli xil kodlashlar), shuningdek, Yandex qidirish yadrosining asosiy xususiyatlari, xususan: rus tilining morfologiyasini (aniq so'z shaklida qidirishni hisobga olgan holda), masofadan qidirishni (xatbosh ichida, aniq iborani qo'shgan holda) va sinchkovlik bilan ishlab chiqilgan aloqani baholash algoritmini nafaqat matnda joylashgan so'rov so'zlarining sonini, balki so'zning "kontrastini" (ushbu hujjat uchun nisbatan chastotasini), so'zlar orasidagi masofani va hujjatdagi so'zning o'rnini ham hisobga olgan holda (so'rovga javobni moslang).

1997 yil noyabr oyida tabiiy tillar bo'yicha so'rov amalga oshirildi. Endi Yandex.Ru-ga "rus tilida" kirish mumkin, uzoq so'rovlarni so'rang, masalan: "kompyuterni qaerdan sotib olish kerak", "genetik jihatdan o'zgartirilgan mahsulotlar" yoki "xalqaro kodlar". telefon aloqasi"va aniq javoblarni oling. Yandex.Ru-da so'rovlarning o'rtacha uzunligi endi 2,7 so'zni tashkil etadi. 1997 yilda bu 1,2 so'zni tashkil etdi, keyin qidiruv tizimlari foydalanuvchilari telegraf uslubiga odatlanib qolishgan.

1998 yilda Yandex.Ru "shunga o'xshash hujjatni", topilgan serverlar ro'yxatini, berilgan sana oralig'ida qidirish va qidiruv natijalarini oxirgi o'zgarish paytida saralash imkoniyatiga ega bo'ldi.

1999 yilda Yandex Runet saytlarini tezlashtirishni optimallashtirish va tezlashtirishga imkon beradigan yangi qidiruv robotini chiqardi. Yangi robot foydalanuvchilarga yangi imkoniyatlarni taqdim etdi - matnning turli sohalarida qidirish (sarlavhalar, havolalar, izohlar, manzillar, rasmlarga izohlar), saytlar guruhida qidirishni cheklash, havolalar va rasmlar bo'yicha qidirish, shuningdek, rus tilidagi hujjatlarni ajratib ko'rsatish. Katalog kategoriyalarida qidiruv paydo bo'ldi va birinchi marta Runetda "iqtiboslar indeksi" tushunchasi kiritildi.

2000 yilda Yandex kompaniyasi tashkil etildi. Yandex kompaniyasi Yandex loyihasini uzoq vaqt ishlab chiqqan va ishlab chiqqan CompTek kompaniyasi aktsiyadorlari tomonidan tashkil etilgan. Ru-Net Holdings 5.280.000 AQSh dollari miqdorida mablag 'kiritdi va yangi kompaniyaning 35.72% ulushini oldi. Aktsiyadorlar tarkibiga menejment va qidiruv tizimlarining etakchi ishlab chiqaruvchilari kiradi. Bosh direktor Arkadiy Voloj edi.

Yandex brendiga va www.yandex.ru veb-saytiga, shuningdek unga tegishli bo'lgan barcha huquqlar qidirish texnologiyasi  Yandex va bir xil nomdagi dasturiy mahsulotlar oilasi. Bundan tashqari, yaqinda boshlangan www.narod.ru loyihasi Yandex-ga o'tkazildi.

Yandeksni indekslashni boshqarish

Indekslashni taqiqlash robotlar.txt faylidan olinadi. Yandex META yorlig'i robotlarini, NOINDEX yorlig'ini va maxsus robots.txt kengaytmasini, Xost ko'rsatmasini qo'llab-quvvatlaydi. Indekslashni taqiqlash barcha qidiruv tizimlari tomonidan serverning ildiz katalogida joylashgan robots.txt faylidan olinadi. Bir qator sahifalarni indekslashni taqiqlash, masalan, indeks qilmaslik istagi tufayli paydo bo'lishi mumkin bir xil hujjatlar  turli xil kodlashlarda. Server qanchalik kichik bo'lsa, tezroq robot uni chetlab o'tadi. Shuning uchun, indeksatsiya qilishning ma'nosi bo'lmagan robots.txt faylidagi barcha hujjatlarni taqiqlash tavsiya etiladi.

Yandex qidiruvi robot.txt maxsus kengaytmasini, Xost ko'rsatmalarini qo'llab-quvvatlaydi. Xost ko'rsatmalarining argumenti - bu domen nomi (IP-manzili bo'lmagan bitta xost nomi), port raqami bilan (sukut bo'yicha 80), ustun bilan ajratilgan. Agar biron-bir sayt Xost uchun argument sifatida ko'rsatilmagan bo'lsa, bu Ruxsat bermaslik direktivasi mavjudligini anglatadi: /, i.e. indeksatsiyani to'liq taqiqlash (agar guruhda kamida bitta tegishli Host ko'rsatmasi bo'lsa).

Ushbu maxsus kengaytma qidiruv tizimiga indekslash uchun to'g'ri oynani tanlashga yordam beradi. Aslida, Xost ko'rsatmasi saytning asosiy oynasini belgilaydi, boshqa barcha nometalllarni indeksatsiya qilish taqiqlanadi.

Robots.txt standartiga to'liq mos kelmaydigan robotlar bilan moslik uchun, Xost direktivasi foydalanuvchi-agent yozuvidan boshlab, guruhga kirishni taqiqlashdan keyin darhol qo'shilishi kerak.

Yandex qidiruv tizimi META yorlig'i robotlarining ko'rsatmalarini tahlil qiladi va ularga amal qiladi. Matnning ba'zi qismlarini indekslashni oldini olish uchun ularni teglash mumkin.

Yandex qidiruv tizimiga sahifalarni qo'shish

Yandex har kuni yuz minglab veb-sahifalarni o'zgartirish yoki yangi havolalarni ko'rib chiqadi. Resurs egalari AddURL shaklini to'ldirish orqali o'z saytlarini qo'shishlari mumkin. Yandex har kuni yuz minglab veb-sahifalarni o'zgartirish yoki yangi havolalarni ko'rib chiqadi. Resurs egalari AddURL shaklini to'ldirish orqali o'z saytlarini qo'shishlari mumkin.

Yandex indekslari rossiya tarmog'i, shuning uchun, su, ru, am, az, by, ge, kg, kz, md, ua, uz domenlaridagi serverlar qidiruv tizimiga kiritiladi. Qolgan serverlar faqat rus tilidagi matn topilgan taqdirda yoki manba egalari qidiruv tizimi ma'muriyatiga ularning serverlari rus tilida so'zlashuvchi Internet foydalanuvchilari uchun qiziq ekanligiga ishonch hosil qilsalar kiritiladi (odatda bu quyidagicha yozish orqali amalga oshiriladi). [elektron pochta himoyalangan]).

Odatda sahifalar paydo bo'lganidan yoki o'zgargandan keyin bir hafta ichida qidiruv ma'lumotlar bazasida paydo bo'ladi. AddURL yordamida bazaga kiritilgan yangi sahifalar tezroq paydo bo'ladi (agar ular tarmoqning rus tilida bo'lsa va qo'lda tekshirishni talab qilmasa).

Yandex qidiruvi to'liq matnli, ya'ni faqat sayt sahifalarida yozilgan so'zlar uning indeksiga tushadi (va qidirish mumkin bo'ladi).

Qidiruv natijalari ro'yxatida, sahifa manzilidan so'ng, sarlavha (sarlavha yorlig'i), tavsif (meta nomi \u003d "Ta'rif" tarkib \u003d "" yorlig'i) yoki hujjat boshida (agar bunday yorliq bo'lmasa) va kontekstlardan iborat matn mavjud - eski varaqdagi matnning qismlari. so'rov so'zlari.

Yandex qidiruv tizimida indekslash

Yandex yangi yoki o'zgartirilgan sahifani topganda, uni indekslaydi. Jarayon davomida sahifa tarkibiga kiradigan elementlarga bo'linadi. Yandex yangi yoki o'zgartirilgan sahifani topganda, uni indekslaydi. Jarayon jarayonida sahifa tarkibiy qismlariga indeks kiritilgan elementlarga (matn, sarlavha, rasm sarlavhalari, havolalar va hokazo) bo'linadi. Bu so'zlarning pozitsiyasini, ya'ni ularning hujjat yoki uning elementidagi o'rnini hisobga oladi. Hujjatning o'zi ma'lumotlar bazasida saqlanmaydi.

Yandex sahifalarni haqiqiy manzillari bo'yicha indekslaydi. Bu shuni anglatadiki, agar yo'naltirish sahifada bo'lsa, robot uni yangi manzilga havola sifatida qabul qiladi va indekslash navbatiga qo'yadi.

Standart sifatida talab qilinadi hTTP protokoli, Yandex, javob sarlavhasida ushbu URL qayta yo'naltirish (3xx kodlari) haqida ma'lumot olgandan so'ng, qayta yo'naltirishni chetlab o'tadigan manzillar ro'yxatiga olib keladigan URL manzilini qo'shadi. Agar qayta yo'naltirish doimiy bo'lsa (kod 301) yoki sahifada meta-yangilash topilgan bo'lsa, unda eski URL manzillar ro'yxatidan o'chiriladi.

Yandex roboti har bir varaqning oxirgi tekshiruvi, uning o'zgargan sanasi (veb-server tomonidan yuborilgan) va qidirish ma'lumotlar bazasida oxirgi o'zgartirish (sana) sana saqlaydi. U tez-tez o'zgartirilgan serverlarga tez-tez tashrif buyuradigan qilib veb-tarashni optimallashtiradi. Yandex roboti avtomatik ravishda ishlaydi va odatda har ikki-uch haftada reindekslash amalga oshiriladi.

Yandex roboti saytga keyingi tashrifida allaqachon indekslangan sahifalardagi o'zgarishlarni kuzatib boradi. Robotning o'z ish jadvali bor va uni o'zgartirish mumkin emas.

Yandex hujjatni to'liq indekslaydi: matn, sarlavha, rasm taglavhalari, tavsif, kalit so'zlar  va ba'zi boshqa ma'lumotlar.

Yandex roboti "dinamik" sahifalarni chetlab o'tib, ularga "statik" sahifalar singari muomala qiladi. Oddiy HTML-dan tashqari, Yandex qidiruv robotlari indekslari: PDF, DOC, RTF va Flash fayl formatlari.

Dublikat   - Bu bir xil matn, masalan, saytga borganingizda, o'nlab turli xil manzillar ostida. Ko'p sonli nusxalari bo'lgan saytlar vaqti-vaqti bilan shafqatsiz tozalanadi.

Sayt nometalllari

Ko'zgu   - saytning qisman yoki to'liq nusxasi. Takroriy manbalarning mavjudligi ba'zan tashrif buyuradigan saytlarning egalari xizmatlarining ishonchliligi va ulardan foydalanish imkoniyatlarini oshirish uchun zarurdir.

Ko'zgularning ko'pligi qidiruv tizimining ma'lumotlar bazalariga to'sqinlik qiladi va qidiruv natijalarining takrorlanishiga olib keladi. Shuning uchun, Yandex roboti bir nechta sayt oynalarini aniqlasa, ulardan birini asosiy deb tanlaydi, qolganlari indeksdan o'chiriladi. Odatiy bo'lib, robot asosiy oynada o'z mulohazalari asosida tanlaydi. Va odatda, resurs egasi ko'rishni xohlagan narsa emas.

Asosiy oyna sifatida kerakli saytni tanlash uchun siz bir qator choralarni ko'rishingiz mumkin.

Birinchidan, siz saytga tegishli bo'lmagan nometalllarni olib tashlashingiz mumkin.

Ikkinchidan, barcha oynalarda, asosiyini tanlash kerak bo'lganidan tashqari, saytni indekslashni mutlaqo taqiqlaydigan robots.txt faylini joylashtiring. Yoki Host direktivasi bilan ko'zgularga robots.txt qo'ying.

Uchinchidan, kichik oynalarning asosiy sahifalariga yorliqlarni joylashtiring, bu ularni indekslashni va havolalar bo'yicha sudralishni taqiqlaydi.

To'rtinchidan, boshlang'ich bo'lmagan nometalllardagi asosiy sahifalar kodini o'zgartiring, shunda ularning ichidan saytga ulanadigan barcha (yoki deyarli barchalari) mutloq va asosiy oynaga olib keladi.

Yuqoridagi maslahatlardan birini amalga oshirgan holda, Yandex qidiruv robotini chetlab o'tib, asosiy oyna avtomatik ravishda o'zgartiriladi.

Yandex qidiruv tizimining ishlash usullari

Yandex qidirish mexanizmi o'z indeksida matnning har bir so'zi haqida hujjat raqamini, jumladagi so'zlarni, jumladagi so'zlarni va har bir so'zning og'irligini o'z ichiga oladi. Yandex qidiruv roboti sahifalarni indekslaydi va ular to'g'risidagi ma'lumotlarga asoslanib, qidiruv indeksini hosil qiladi.

Ushbu ma'lumotlarning barchasi qidirishda ishlatiladi. Har bir so'rovda so'rovga to'g'ri keladigan iboralar (va yuqori darajaga erishish), keyin so'rovning barcha so'zlari bo'lgan jumlalar va boshqalar qidiriladi. So'zlarning nisbiy pozitsiyasi muhim rol o'ynaydi. Shunday qilib, masalan, agar to'rt so'zli so'rovda ma'lumotlar bazasida aniq javob bo'lmasa, so'rovda uchta so'zdan iborat jumlalar yuqoridagi tartibda joylashtirilgan. Bu odatiy qidirish muammolarini - hujjatni "noto'g'ri kotirovka" orqali qidirishni hal qilishga imkon beradi.

  Rambler qidiruvi

Rambler qidiruv tizimining tarixi

"Rambler" qidiruv tizimining tarixi 1991 yilda Moskva viloyati Pushchino shahrida boshlanadi. Aynan o'sha erda Stack kompaniyasini bir-biriga o'xshash odamlar guruhi yaratgan. "Stack" kompaniyasini Sergey Lysakov boshqargan. Kompaniya shug'ullangan mahalliy tarmoqlar  va internet aloqasi.

1996 yilda Sergey Lysakov va dasturchi Dmitriy Kryukov Internetda birinchi rus qidiruv tizimini ishlab chiqishga qaror qilishdi. Dmitriy Kryukov loyihaning nomi - Rambler bilan chiqdi. Rambler tomonidan tarjima qilingan qidiruv robotining printsipiga mos keladigan "kezuvchi, sayr qilguvchi, tramp" degan ma'noni anglatadi.

2006 yil 26 sentyabrda rambler.ru domeni ro'yxatdan o'tkazildi va 8 oktyabr kuni Stack kompaniyasi tizimni faollashtirdi. 1997 yil bahorida Rambler s Top100 paydo bo'ldi - ob'ektiv ma'lumotlar asosida Rossiya resurslarining mashhurligini baholaydigan reyting tasnifi.

2003 yil iyun oyida kompaniya ishga tushdi yangi versiya  avvalgisidan ikki asosiy parametrda farq qiladigan qidirish mexanizmi: yangi tizim arxitekturasi tufayli qidiruv tezligi sezilarli darajada oshdi, qidiruv indeksi kuniga bir necha marta yangilanadi.

Nimani qidirayotganini aniq biladigan va ko'p vaqt sarflashni xohlamaydiganlar uchun r0.ru saytida Rambler qidiruvining maxsus lakonik versiyasi ochildi (yoki, ular aytganidek, Arnold).

Rambler uyushmasi mexanizmi

Kimdir Rambler qidiruv tizimida ketma-ket so'rovlarni amalga oshirganda, bu so'zlar va iboralar bir-biriga bog'liq bo'ladi - Rambler uyushmalari. Rambler qidiruv tizimining foydalanuvchilari Rambler birlashmasining dvigatelidan foydalanishlari mumkin.   Rambler uyushmalari - Bular foydalanuvchining asl so'rovi bilan tematik (assotsiativ) bog'liq bo'lgan so'rovlar. Kimdir Rambler qidiruv tizimida ketma-ket qidiruvlarni amalga oshirganda, bu so'zlar va iboralar bir-biriga bog'liq bo'ladi. Va bu ketma-ketlik Rambler uyushmalarini yaratadi. Aslida, bu "Ular ham bizni qidiradi" tushunchasi.

Bir tomondan, Rambler assotsiatsiyasining mexanizmidan foydalanib, foydalanuvchi tezda uning talabini aniqlashtirishi yoki kengaytirishi mumkin. Boshqa tomondan, odatiy birlashmalar zanjiri dastlabki so'rovning kamchiliklarini, noaniqligini va "xiralashganligini" ochib beradi. Natijada, Rambler qidiruv tizimiga tashrif buyuruvchi vaqtni behuda sarf qilmasdan to'g'ri so'rashni o'rganadi, aslida "jamoaviy ong" yordamiga murojaat qiladi.

"Ular bizni ham qidiradi" birlashmalar mexanizmi tarmoqning minglab va minglab tashrif buyuruvchilari nimani o'ylayotganini ko'rishni istaganlar uchun qiziq. Bu qidiruv vositasi, shuningdek tilshunoslar va veb-ustalar uchun qimmatli ma'lumot manbai.

Rambler qidiruv tizimini indekslashni boshqarish

Rambler qidiruv tizimida manba sahifalarini indekslashni robotlar.txt yoki META "Robotlar" yorlig'i bilan cheklashingiz mumkin.Rambler qidiruv tizimining roboti "StackRambler" deb nomlanadi. Bu Internetda joylashtirilgan hujjatlarni yuklab olib, boshqa hujjatlarga havolalarni topib, ularni yana yuklab oladi va hokazo. StackRambler roboti robots.txt faylini tahlil qiladi va uning ko'rsatmalariga muvofiq manbani skanerlashni cheklaydi. Robots.txt orqali ma'lum kataloglarga va / yoki fayllarga kirishni cheklashingiz mumkin.

Bundan tashqari, META "Robotlar" yorlig'i orqali Rambler qidiruvi robot qidiruv tizimi bilan manba sahifalarini skanerlashni cheklashingiz mumkin. Yorliq ma'lum bir veb-sahifani indekslashni boshqaradi. Shu bilan birga, robotlarga nafaqat hujjatni o'zi indekslashni, balki undagi havolalarni bosishni taqiqlash mumkin.

Rambler qidiruv tizimiga sahifalar qo'shish

Rambler roboti Internetni ishoratlar orqali chetlab o'tib, yangi manbalarni qidirmoqda. Ro'yxatdan o'tish shaklini to'ldirishingiz mumkin. Rambler roboti faqat milliy domenlar.ru, .su, .ua, .by, .kz, .kg, .uz, .ge joylashgan saytlarga mustaqil ravishda tashrif buyuradi. Agar sayt boshqa domen zonalaridan birida joylashgan bo'lsa (masalan, in.com, .net or.org yoki boshqa milliy domenlarda), Rambler robotlari bunday manbalar sahifalariga kirmaydi. Rus tilida so'zlashadigan foydalanuvchilarga bunday qiziqish manbalarini qo'shish uchun, skanerlangan foydalanuvchilar sonini Rambler qidiruv tizimining ma'muriga yuborish kerak.

Rambler roboti Internetni ishoratlar yordamida aylantiradi va shu bilan indekslash uchun yangi manbalarni qidiradi. Rambler qidiruv tizimida ro'yxatdan o'tish formasini to'ldirishingiz mumkin. Ushbu so'rovnomaning maydonlari - "Sayt nomi" va "Ta'rif" qidirish uchun ishlatilmaydi. Ular faqat tahrirlovchilar tomonidan o'qish uchun mo'ljallangan va Rambler ichki ma'lumotlar bazalarida ishlatiladi.

Robot ro'yxatdan o'tgan kundan (yoki manbani topgandan) boshlab bir kun ichida sayt sahifalarini tekshiradi. Shu bilan birga, u darhol saytni ma'lum bir chuqurlikka o'tkazadi (ro'yxatdan o'tgan sahifaga bog'langan sahifalarni skanerdan o'tkazadi). Robot tomonidan yuklab olingan sahifalar qidiruv ma'lumotlar bazasida biroz kechikish bilan paydo bo'ladi. Qabul qilingan hujjatlarni qayta indeksatsiyalash taxminan ikki hafta oralig'ida amalga oshiriladi.

Qidiruv mexanizmini indekslash

Rambler qidiruv tizimi tomonidan indekslashda faqat foydalanuvchi sahifada ko'rishi mumkin bo'lgan ma'lumotlar hisobga olinadi. Saytning asosiy tushunchalari va kalit so'zlarini quyidagi HTML teglariga kiritish tavsiya etiladi (ahamiyatlilik uchun): sarlavha h1 ... h4 b, kuchli, u bu sohalarda so'z qanchalik tez-tez paydo bo'lsa, Rambler qidiruv tizimiga havolani beradi. ushbu hujjat qidiruv natijalari ro'yxatining yuqori qismiga yaqinroq.

Rambler robotlari uchun maksimal hujjat hajmi 200 kilobaytni tashkil etadi. Kattaroq hujjatlar belgilangan hajmga kesiladi.

Indekslash dasturi qayta yo'naltirish (qayta yo'naltirish) ni amalga oshiradi, faqat domen.ru yoki boshqa MDH mamlakatlarining domenlariga qayta yo'naltirish amalga oshirilsa.

Rambler barcha "dinamik" sahifalarni * .asp *, * .php *, * .pl *, * / cgi-bin / * va hokazolarning shakllarini, tashrif buyurilgan saytlar (shuningdek, top100 ga muvofiq) uchun qayta ishlaydi. noyob ma'lumotlarni o'z ichiga oladi foydalanuvchilar uchun foydali  qidiruv tizimi Boshqa saytlar uchun bunday sahifalarning faqat bir qismi qayta ishlanadi.

Belgilangan HTML parchalar Rambler tomonidan indekslanmaydi.

Rambler qidiruv tizimi flesh-ob'ektlardan havolalarni chiqarib olishi mumkin va shuning uchun flesh-texnologiya asosida qurilgan saytlarni qayta ishlay oladi. Biroq, flesh ob'ektlarning matnlari hali indekslanmagan.

Indekslashda faqat foydalanuvchi sahifada ko'rishi mumkin bo'lgan ma'lumotlar hisobga olinadi.

Indekslangan saytlar hisobga olinmagan holatlar bundan mustasno, yashirilgan va boshqa barcha maydonlar. Xuddi shu narsa saytning HTML kodidagi sharhlarga ham tegishli. Shift rangi fon rangiga mos keladigan ko'rinmas matnni ishlatmaslik kerak.

Qidiruv Pinterest ma'lumotlarini hisobga oladi Ramblerning maxsus roboti kuniga ikki marta Rambler reytingida ishtirok etadigan barcha saytlardan qidiruv tizimlari ma'lumotlar bazasiga yangi sahifalarni qo'shib qo'yadi va o'z sahifalarida hisoblagichlarni joylashtiradi. Rambler's Top100 reytingidagi ma'lumotlar o'zgartirilgandan so'ng, qidiruv tizimida yangilanish bir-ikki kun ichida amalga oshiriladi. Agar sayt Pinterest-da ro'yxatdan o'tgan bo'lsa, ma'lumot indeks bazasidan o'chirilgan bo'lsa ham, ba'zi so'rovlar bo'yicha bo'ladi.

Qidiruv, agar sayt unda ro'yxatdan o'tgan bo'lsa, Ramblerning Top100 reytingidan olingan ma'lumotni hisobga oladi. Rambler's Top100 haqidagi ma'lumotlar deyarli har kuni yangilanadi.

  Aport qidiruvi

Aport qidiruvi mexanizmi tarixi

Aport-ning rasmiy taqdimoti 1997 yil 11-noyabrda bo'lib o'tdi. O'sha paytga qadar, 10 ming serverda joylashgan birinchi million hujjatlar uning ma'lumotlar bazasida indekslangan. Aport qidiruv tizimining yaratuvchisi Windows platformalari uchun dasturiy ta'minot ishlab chiqaruvchisi Agama hisoblanadi. Ta'kidlash kerakki, Aport Windows-da yaratilgan (ko'pgina qidiruv tizimlaridan farqli o'laroq). Aport qidiruv tizimini yaratishda "Agama" ning lingvistik ishlanmalaridan foydalanilgan, bunda u yaratilgan paytda so'z morfologiyasi hisobga olingan va mijozning iltimosiga binoan so'rovlarning imlosi tekshirilgan.

Aport qidiruvi birinchi marta 1996 yil fevralda Agama rus klubining ochilishiga bag'ishlangan matbuot anjumanida namoyish etildi. Dastlab, Aport qidiruv tizimi faqat russia.agama.com saytini qidirdi.

Aport qidiruv tizimining rasmiy taqdimoti 1997 yil 11-noyabrda bo'lib o'tdi. Bu vaqtga kelib, 10 ming serverda joylashgan birinchi million hujjatlar Aport ma'lumotlar bazasida indekslangan.

Aport-ning birinchi versiyasining eng muhim xususiyatlari so'rov va qidiruv natijalarini ingliz tiliga tarjima qilish va aksincha, barcha o'z indekslangan sahifalarini o'z ma'lumotlar bazasidan qayta qurish edi.

1998 yil noyabr oyida Aport qidiruv tizimini Isroil fuqarosi Jozef Avchuk sotib oldi (Aport va Agama brendlarini saqlab qolish bilan). Bitimning haqiqiy summasi 55 ming dollarni tashkil etdi.

1999 yil oktyabr oyida okeanning ikkala tomonidagi kompyuter ko'rgazmalarida Aport 2000 butunlay yangi qidiruv tizimi AtRus bilan to'la integratsiyalashgan (hozirgi Katalog Aport).

Aport 2000 - bu alohida saytlar natijalari asosida yaratilgan birinchi rus qidiruv tizimi. Resurslarni saytlarga ajratish uchun Aport AtRus katalogiga taqdim etadigan ma'lumotlardan yoki manbalar egalari tomonidan Aport-ga kiritilgan ma'lumotlardan foydalaniladi.

  Aport 2000 Rossiyaning Google qidiruv tizimining ikkita asosiy texnologiyalarini joriy qilgan birinchi Rossiya qidiruv tizimiga aylandi. Uning mashhurligini tavsiflovchi "sahifalar darajasi" (Page Rank) uchun buxgalteriya hisobi. Tartib qiymati tashqi Internetdan manbaga bog'lanishlar soni bo'yicha hisoblanadi. Mashhur saytdagi havolaning og'irligi kamroq mashhur bo'lgan havolaning og'irligidan yuqori; so'rov so'zlarini o'z ichiga olgan havolalar, aytaylik, "bu erda" so'ziga qaraganda ko'proq og'irlikka ega. Tahlil bilan ishlashni so'rash HTML teglari  sahifalar. Masalan, h2 teglari orasidagi matn h6 teglar orasidagi matndan ustundir.

Aport 2000 shuningdek, URL manzilida so'rov so'zlarining paydo bo'lishini hisobga oldi. Hujjatsiz xususiyatlar orasida AtRus katalogida eng yuqori va elita ligasini qo'lga kiritgan saytlar uchun ustunlik mavjud.

Va nihoyat, yana bir "Aport" chempionati - qidiruv natijalarida to'langan nol chiziqdan foydalanish (Aytgancha, Aport bizning qidiruv tizimlarimiz ichida birinchi bo'lib AltaVista-dan bunday xizmatni sotib oldi, u ozgina pul evaziga o'z havolasini birinchi bo'lib "Russian Search" ga berganida). Ammo, "Aport" da siz nolni emas, balki qidiruv natijalarida o'zingizning saytingiz uchun yuqoriroq joyni sotib olishingiz mumkin.

Aport 2000 arxitekturasida miqyoslilikning tashkil etilishi shundan iboratki, Aport qidiruv bazasini bir nechta alohida bazalarga ajratish mumkin, har bir kichik Aport o'z kompyuterida ishlaydi. Aport 2000 butun Internet parchalarga bo'lingan deb hisoblaydi. Ushbu parchalar ichida qidiruvni amalga oshirgandan so'ng, foydalanuvchi birlashtiradi va umumiy javob beradi. Siz murakkab bo'lmagan protsedura yordamida yangi "aportiki" qo'shishingiz mumkin. Alohida mashinalarning avariyalari yuzaga kelganda, vaqti-vaqti bilan kuzatilishi mumkin bo'lgan standartlardan biroz farq qiladigan yaxlit natijalar chiqariladi.

2000 yil 31-iyulda Golden Telekom Agama oilasini Internet-loyihalarini, shu jumladan Aport va AtRus-larni Rossiya on-layn va yaqin tarkibli loyihalarga kiritish uchun sotib oldi.

2001 yil may oyida Aport of Golden Telekom egasini almashtirish bo'yicha bitim nihoyat tugadi, Alfa-Bank yangi egasiga aylandi. O'sha paytda NASDAQ juda tez retsessiya holatida edi va Internet-loyihalarni maqbul summaga qayta sotish imkoniyati yo'q edi. Bu yangi "Golden Telekom" egalarining qimmat Internet-loyihalarni qo'llab-quvvatlash xarajatlarini minimallashtirish to'g'risidagi qaroriga olib keldi.

Indekslash qidiruvi porti

Indekslash uchun server tarkibini ko'rishda Aport robots.txt faylini tekshiradi va Robots meta-teglarini qo'llab-quvvatlaydi. Indekslash uchun server tarkibini ko'rishda Aport robots.txt faylini tekshiradi. Shunday qilib, serverda Aportning "faolligi" ni cheklash mumkin. Aport qidiruv roboti Aport nomiga ega. Ushbu nom robots.txt orqali indekslashni cheklash uchun ishlatilishi mumkin.

Shuningdek, Aport qidiruv tizimi robotlarning meta-teglarini qo'llab-quvvatlaydi, bu sizga saytning individual sahifasida robotning xatti-harakati qoidalarini o'rnatishga imkon beradi va agar serverdagi robots.txt faylini o'zgartirish imkoni bo'lmasa.

Aport qidiruv tizimiga sahifalarni qo'shish

Aport-da saytni ro'yxatdan o'tkazish URL-ni qo'shish sahifasidan amalga oshiriladi. Faqat sayt ildizini qo'shish kerak. Aport-da saytni ro'yxatdan o'tkazish http://catalog.aport.ru/eng/reg/add.ple sahifasida amalga oshiriladi. Ushbu sahifaga deyarli har qanday Aport sahifasidan URL qo'shish havolasi orqali kirish mumkin. Faqatgina saytning ildizini qo'shish kerak, qolgan sahifalar Aport tomonidan havolalar orqali topiladi.

Aport - bu Rossiya Internetidagi qidiruv tizimi, shuning uchun unga rus tilidagi saytlarni, shuningdek, Rossiya Internetiga bevosita aloqador saytlarni qo'shishingiz mumkin. Agar saytni avtomatik ravishda qo'shishni rad etsa (masalan, agar qidiruv roboti o'zining asosiy sahifasida rus tilidagi matnni topmasa), saytni elektron pochta orqali qo'shishni so'rashingiz mumkin: [elektron pochta himoyalangan]

Aport Search Engine tomonidan resurslarni indekslash

Aport - bu to'liq matnli qidiruv tizimi. Bu shuni anglatadiki, u serverning ma'lum bir sahifasini ko'rayotganda odam ekranda ko'rgan barcha so'zlarni indekslaydi. Aport vaqti-vaqti bilan o'z ma'lumotlar bazasida mavjud bo'lgan saytlarni tekshiradi va ma'lumotlar bazasini u erda sodir bo'lgan o'zgarishlarga muvofiqlashtiradi. Tekshiruv muddati ko'p jihatdan aniq saytga bog'liq (uning mashhurligini, saytga avvalgi tashriflar paytida aport tomonidan to'plangan ma'lumotlarga ko'ra yangilanish dinamikasi va boshqa bir qator omillarni hisobga olgan holda).

Sayt Aport qidiruv tizimiga qo'shilgan paytdan boshlab, qidiruv ma'lumotlar bazasida paydo bo'lgunga qadar, ikki kundan uch kungacha ikki haftagacha davom etadi. Ba'zi hollarda (masalan, qo'shilgan sayt bilan beqaror aloqa mavjud bo'lsa), bu vaqt biroz uzoqroq bo'lishi mumkin.

Aport saytdagi havolalar orqali uning qidiruv roboti tomonidan topilgan barcha statik hujjatlarni (Urlda "?" Belgisi yo'q) indekslaydi. Ushbu qoida katta saytlar uchun, shuningdek, qidirish spamidan foydalanilgan saytlar uchun kuzatilmasligi mumkin.

Url-da "?" Yozuvi bo'lgan hujjatlar Aport qidiruv tizimi tomonidan tanlab indekslanadi. Bunday holda, har bir sayt uchun bunday hujjatlar soni uchun kvotalar qo'llaniladi. Kvota hajmi bir qator shartlarga, xususan saytning iqtibos indeksiga qarab avtomatik ravishda hisoblanadi va ba'zi saytlar uchun nol bo'lishi mumkin.

Shuni yodda tutish kerakki, saytni to'liq indeksatsiyalash bosqichma-bosqich sodir bo'lishi mumkin, shuningdek ma'lumotlar bazasi tarkibi qidiruv tizimining huquqi bo'lib, indekslash uchun hech qanday kafolatlar mavjud emas (shuningdek indekslangan hujjatlarni indeksda saqlash).

Aport - bu to'liq matnli qidiruv tizimi. Bu shuni anglatadiki, u serverning ma'lum bir sahifasini ko'rayotganda odam ekranda ko'rgan barcha so'zlarni indekslaydi. Natijada hujjatlar matnidagi har qanday so'z keyingi qidiruv uchun mezon bo'lib xizmat qilishi mumkin.

HTML hujjatlari uchun, hujjatning asosiy matniga qo'shimcha ravishda quyidagilar ham indekslanadi: hujjat nomi (TITLE), kalit so'zlar (META KEYWORDS), sahifa tavsifi (META DESCRIPTION) va tasvir sarlavhalari (ALT). Bundan tashqari, Aport indekslari, hujjatga tegishli bo'lganligi sababli, ushbu hujjatning sayt ichida va uning tashqarisida joylashgan boshqa sahifalardagi havolalar matnlari, shuningdek, Aport katalogidagi saytlarning tavsiflari tahrirchilar tomonidan tuzilgan (yoki tasdiqlangan).

  Google qidiruvi

Ushbu qidirish mexanizmi vaqt o'tishi bilan tobora yaxshilanmoqda va ommalashmoqda, ammo yuqoridagi qidiruv tizimlaridan pastroq. Izlanishlarga ko'ra, google ma'lumotlari  barcha Runet qidiruv so'rovlarining 10% ni ta'minlaydi. Google ro'yxatdan o'tish uchun har qanday domen saytlarini qabul qiladi, ya'ni u faqat ru zonasi bilan cheklanmaydi. Bu, albatta, raqobatchilarga (Rossiyada) nisbatan juda katta ustunlikdir. Ammo Google endi afzalliklarga ega emas va hatto so'rov bilan sinonim bo'lgan qidiruv natijalarida so'zlarni aks ettira olmaydi. Agar Google-dan so'rasak qidiruv so'rovi  "Latifalar", keyin Google saytda aynan shu so'zni qidiradi, Yandex, Rambler va Aport saytlardagi sinonimlarni, masalan "latifalar" ni ham hisobga oladi, ammo Google buni qila olmaydi.

Xorijiy qidiruv tizimlari

  • AOL qidirish
  • Achla
  • Altavista
  • AltaVista (Raqamli)
  • Avstriya NetGuide
  • Kosmonavt
  • Alltheweb
  • Piyodalarga qarshi kurash
  • Jeevesni so'rang
  • AskAlex
  • Anzwers
  • Ausindex
  • Avstriya-WWW
  • Baku sahifalari
  • Brit indeksi
  • Compnet
  • Kopernik
  • Kiber411
  • To'g'ri urish
  • Daypop.com
  • Hayajonlaning
  • Angliya onlayn
  • Erkinlik
  • FTP qidirish
  • GBP Buyuk Britaniya sahifalari
  • Hotbot
  • Aloqalar
  • Infoseek
  • InfoMarket
  • Infomin
  • InterSearch Austria
  • Suhbat
  • Inktomi
  • Ma'lumot
  • Google
  • Qo'llanma.at
  • Qarang
  • Likolar
  • Engil qidiruv
  • Libanis.com
  • Magellan
  • Maxisearch
  • Msn qidirish
  • Mixcat.com
  • Meta-ukraine.com
  • Metacrawler
  • Shimoliy yorug'lik
  • Netscape qidiruvi
  • Katalogni oching
  • Ochiq matn
  • Qango
  • Jahldor izlash
  • Qayta nomlar
  • Qidiruv.com
  • Seachuk
  • Search.lv
  • Search.iwon.com
  • Submitit.bcentral.com
  • Superpromo.com
  • Search.escapeartist.com
  • Surfgopher.com
  • Slider.com
  • Uk indeksi
  • Ukdirectory
  • Ukmax
  • Whatuseek.com
  • Veb-brauzer
  • Veb-botbat
  • Yahoo
  • 2kcity.com

Meta-qidiruv mexanizmi arxitekturasi

  Kirish

Ushbu maqolada meta-qidiruv tizimlarining arxitekturasi va ularning ishlashi va qurilishining asosiy tamoyillari MetaPing meta-qidiruv tizimi misolidan foydalanib ko'rib chiqiladi.

Metasearch mexanizmi nima?

Hech kimga sir emaski, tobora o'sib borayotgan ulkan hajmdagi ma'lumotlarga ega bo'lgan butun dunyo Internet misli ko'rilmagan darajada jadal rivojlanmoqda. Ushbu doimiy ma'lumot oqimini qandaydir soddalashtirish uchun va, eng muhimi, veb-foydalanuvchilarga kerakli ma'lumotlarni topishlari uchun maxsus qidiruv tizimlari yaratildi. Har bir bunday tizimda indekslangan hujjatlarning tarkibi haqidagi xizmat ma'lumotlarini o'z ichiga oladigan indeks mavjud, unda har bir matnning ishlatilish chastotasi va matndagi so'zning koordinatalari mos keladi.

Har bir qidiruv tizimida faqat o'z manbalari mavjud, qidirish uchun mavjud bo'lgan ko'plab hujjatlar mavjud. Ushbu tizimlarning hech biri Internetning barcha manbalarini qamrab ololmaydi, shuning uchun istalgan vaqtda foydalanuvchining axborot ehtiyojlarini qondira olmaydigan vaziyat bo'lishi mumkin. Odatda, bu holda foydalanuvchi boshqa qidiruv tizimiga o'tadi va u erda kerakli narsalarni qidirishga harakat qiladi.

Ushbu muammoni hal qilish va izlash imkoniyatlarini kengaytirish uchun metasearch deb nomlangan tizimlar yaratildi. Ularning o'zlari yo'q qidiruv bazalari  ma'lumotlar, indekslarni o'z ichiga olmaydi va qidirishda ko'plab qidirish mexanizmlarining resurslaridan foydalanadi. Shu sababli, bunday tizimlarda qidirishning to'liqligi va topish ehtimoli maksimaldir kerakli ma'lumotlar  juda yuqori.

  Metasearch tizimlarining ishlash tamoyillari

Metasayra tizimini loyihalashda bir qator muammolarni hal qilish kerak.

Birinchidan, qidiruv tizimlaridan olingan ko'plab hujjatlardan eng mos keladiganlarini, ya'ni foydalanuvchi so'roviga mos keladiganlarni tanlash kerak. Qoida tariqasida, meta-qidiruv tizimlarini yaratuvchilar ular foydalanadigan qidiruv tizimlari tegishli qidiruv natijalarini qaytaradilar va hujjat ushbu qidiruv tizimida joylashgan pozitsiyaga juda ko'p ishonadilar.

Ushbu standart yondashuv sek. 1. Bunday tizimlarda qabul qilingan hujjat tavsiflari tahlili o'tkazilmaydi, natijada ahamiyatsiz hujjatlarni bitta qidiruv tizimida boshqasiga qaraganda yuqoriroq bo'lgan qidiruvning sifati sezilarli darajada pasayishiga olib kelishi mumkin. Ushbu tamoyil muallif saytni qidiruv tizimlarida o'z pozitsiyasini yaratganda yaxshi bo'ldi, ammo umuman meta-qidiruv tizimlari uchun bu qoniqarli emas edi.




  1-rasm. Standart metas Izlash tizimi

Keyingi avlod metasearch tizimlarini ishlab chiqishda standart metasearch tizimlariga xos bo'lgan kamchiliklar hisobga olindi. Tizimlar, foydalanuvchilarning fikriga ko'ra, o'zi kerak bo'lgan narsalarni topishi mumkin bo'lgan qidiruv tizimlarini tanlash qobiliyatiga ega bo'lgan (2-rasm).





Shakl 2. Metasayıcı dvigatellarining keyingi avlodi

Bundan tashqari, ushbu yondashuv bizga ortiqcha ma'lumotni ortiqcha yuklamasdan metasearch serverining ishlatilgan hisoblash resurslarini kamaytirish va trafikni jiddiy tejashga imkon beradi. Shuni ta'kidlash kerakki, har qanday metasayyorlash tizimida, asosan, ma'lumotlarni uzatish kanalining o'tkazish qobiliyati eng katta, chunki qidiruv natijalari bilan sahifalarni qayta ishlash bir necha o'nlab odamlardan iborat. qidirish serverlari  Bu juda ko'p vaqtni talab etadigan ish emas, chunki ma'lumotni qayta ishlashga sarflangan vaqt qidiruv tizimlaridan talab qilingan sahifalar kelishiga qaraganda kamroq vaqt talab qiladi.

Bunday tashkilotga ega tizimlarga misol sifatida Profusion, Ixquick, SavvySearch, MetaPing nomlarini olamiz.

  Bularning barchasi qanday ishlaydi?

Ushbu maqolaning muallifi tomonidan ishlab chiqilgan MetaPing meta-qidirish tizimining ishlash printsipi quyida tavsiflanadi, ammo umumiy qoidalar ushbu sinfning boshqa tizimlari uchun to'g'ri bo'ladi (2-rasmga qarang).

Keling, ushbu qidiruv tizimining bosh sahifasidan boshlaylik. Odatda bunday tizimning interfeysi juda soddalashtirilgan va darhol bu erda nimani, qaerda va qanday qidirishni tushunishga imkon beradi. Bizning holatlarimizda (MetaPing) qidiruv uchta qidiruv sohasida amalga oshiriladi: Rossiya, Ukraina va butun dunyoda, Internetda qidirishni qayd etish orqali hamma narsani qidirish mumkin yoki qidirish maydonini toraytirish va maxsus reklama, yangiliklar, fayllar va referatlar uchun qarash ( 3-rasm).





3-rasm Bosh sahifa  Metaping
  Foydalanuvchi Rossiyada qidiruvni tanlaydi, masalan, bunday so'rovga kiradi: "eng yaxshi qidiruv tizimlari" (4-rasm).





Shakl 4 MetaPing qidiruv natijalari sahifasi

Shundan so'ng, so'rov ko'rsatilgan rus qidiruv tizimlariga yuboriladi (bizning holatlarimizda bu Rambler, Aport, Lycos va Google). Shuni ta'kidlash kerakki, Google, garchi Rossiya qidiruv tizimi bo'lmasa-da, hozirgi vaqtda ular ma'lumotlar bazalarining to'liqligi va izlash sifati bo'yicha raqobatlashmoqda va shuning uchun u shu erda tugadi. Aytgancha, diqqat bilan o'qigan kishi Rossiyada eng yirik Yandex qidiruv tizimining yo'qligini ta'kidlagan bo'lishi kerak. MetaPing ishga tushirilganda, bu erda Yandex ham mavjud edi, ammo mashhur janjaldan keyin uni olib tashlash kerak edi.

So'rovni qidiruv tizimiga yuborish uchun maxsus so'rov agenti ishlatiladi, u nafaqat so'rovni yuborish va sahifalarni qabul qilish jarayoni, balki so'rovni tanlangan qidiruv tizimlarining har birida qabul qilingan to'g'ri kodlash orqali yuborish uchun ham javob beradi, aks holda boshqa to'plam olinadi. hujjatlar tavsifi yoki umuman olinmaydi, bu qidiruv sifatiga salbiy ta'sir qiladi.

Qabul qilingan so'rovni ko'rib chiqqandan so'ng, har bir tizim metasearch agentiga ko'plab so'rovlar va ushbu so'rov uchun tegishli deb hisoblagan hujjatlarga havolalarni qaytaradi.

Qanday qilib ushbu to'plamda foydalanuvchi ehtiyojlarini aniq tanlash uchun?

Ushbu maqolaning boshida, ko'pgina meta-qidiruv tizimlari tomonidan qo'llaniladigan standart yondashuv allaqachon aytib o'tilgan va olingan havolalarni har bir qidiruv tizimining qidiruv natijalarida ketma-ketlikda tartibga solishdan iborat. Shu bilan birga, agar bitta sayt turli xil qidiruv tizimlarida topilgan bo'lsa, unda foydalanuvchi uchun uning qiymati, shubhasiz, sezilarli darajada oshadi.

Yondashuv, albatta, to'g'ri, lekin bitta tizim, masalan, dinamik ravishda yaratilgan sahifalarni indekslasa, boshqasi bo'lmasa nima bo'ladi? Ular har xil indekslangan hujjatlar to'plamiga, ma'lumotlar bazalarining har xil to'liqligiga ega, shuning uchun foydalanuvchi so'ragan ma'lumot bitta tizimda topilishi mumkin, boshqasida topilmasligi mumkin. Bunday holda, foydalanuvchi bir tizimdan bir-biridan mutlaqo ahamiyatsiz bo'lgan bir nechta muhim havolalarni olishi mumkin (masalan, butun ibora topilmaganda, qidiruv so'rov kalit so'zlaridan biri yordamida amalga oshiriladi). Natijada, foydalanuvchi tegishli havolalarni qo'lda tanlashi kerak va bunday "vinaigrette" ni qazib olgandan so'ng, u shunchaki chiqib ketadi va qaytib kelmaydi.

Ushbu muammoni hal qilishning biron bir usuli bormi? Albatta bor. Qidiruv tizimlaridan olingan hujjat tavsiflari to'plamiga ega bo'lgan ushbu hujjatlarni bajarishda bo'lgani kabi, xuddi shunday qilish kerak, ya'ni har bir sarlavha va tavsifda kalit so'zlarning chastotasini aniqlash va har birining reytingini mustaqil ravishda aniqlashga harakat qilish kerak.

Aynan shu printsip bo'yicha MetaPing meta-qidiruv tizimi qurilgan bo'lib, u erda ma'lumotlarga aralash ishlov berish algoritmi amalga oshiriladi. Muallif ishlab chiqdi maxsus dasturlar  olingan ma'lumotlarni tahlil qilish, buning natijasida birinchi bosqich qabul qilingan hujjatlarning ko'p tavsiflarini tartiblash, ikkinchi daraja keyinchalik hujjat joylashgan joyga va so'rov bo'yicha topilgan hujjatlarning umumiy soniga qarab tuzatiladi (bu ma'lum bir tizimning ma'lumotlar bazalarini qidirishning to'liqligini baholashga imkon beradi).

Bunday ishlov berish nafaqat so'rovga mutlaqo bog'liq bo'lmagan kalit so'zlari bo'lmagan hujjatlarni olib tashlash bilan birga, barcha kalit so'zlar hujjat tavsifida to'liq tavsiflangan bo'lsa, qidiruvning sifati va aniqligini muttasil yaxshilaydigan holatlarda qattiq yozishmalarni topishga imkon beradi.

Inforian Quest 98 va Kopernik 98 Metasearch tizimlari


  Inforian Quest 98 (IQ - bu yaxshi qisqartma, shunday emasmi?). Yaponiyalik, xitoy va amerikalik dasturchilarning birgalikdagi sa'y-harakatlari samarasi bo'lgan Inforiya mahsuloti.

Taxminan 3,5 Mb, 5 Mbgacha bepul disk maydoni. Narxi to'liq versiyasi  25 AQSh dollari, bepul foydalanish muddati - 1 oy.

U ikkita uslubdan foydalanadi: tajribali foydalanuvchilar uchun mohiyat va yangi boshlanuvchilar uchun sehrgar. Ikkala uslub ham juda soddaligi bilan ajralib turadi. Inforian Quest 98 sizga ettita eng mashhur serverlarda (Yahoo!, Altavista, InfoSeek, Excite, HotBot, OpenText, WebCrawler) tezkor meta-qidiruvlarni amalga oshirish, qo'shimcha ravishda Amerika, Evropa, Yaponiya va Xitoyda 200 ga yaqin qidiruv tizimlariga kirish va shu ma'lumotlar bazasida so'rovlar o'tkazish imkonini beradi. San'at va ko'ngil ochish (san'at va ko'ngil ochish), yangiliklar va biznes (yangiliklar va biznes), kompyuterlar va Internet (kompyuterlar va Internet), dasturiy ta'minot va fayllar (dasturiy ta'minot va FTP), yangiliklar guruhlari (Usenet (munozaralar guruhi)) ettita tematik bo'limlar bo'yicha ma'lumotlar. ), Ilmiy texnologiyalar (texnologiyalar), manzillar va telefonlar (sariq sahifalar). Yaqin kelajakda "qidirilgan" serverlar ro'yxatiga isroillik va rossiyalik mijozlarning kiritilishiga umid bor.

Sabr-toqatingiz darajasiga qarab, qidiruv natijalarini qaytarish uchun kutish vaqtini (kuting ...) belgilash tavsiya etiladi (minimal - 1 soniya, maksimal - deyarli 4 oy, tavsiya etilgan - 1-2 daqiqa) va topilgan har bir saytdan yuborilgan xabarlarning maksimal miqdorini ko'rsatish (havolalar) sayt boshiga) (standart, 10). Agar siz faqat so'nggi ma'lumotlarga ega bo'lishni istasangiz va buning uchun ozgina tezlikni qidirib topishga tayyor bo'lsangiz, proksi-serverdan foydalanishni rad eting. Agar xohlasangiz, interfeys tilini ingliz tilidan nemis, frantsuz yoki ispan tillariga osongina o'zgartirishingiz mumkin, agar sizning kompyuteringiz nafaqat yig'ilib, balki ishlay boshlagan bo'lsa. dasturiy ta'minot  Uzoq Sharq hunarmandlari - siz yapon yoki xitoy interfeysini sinab ko'rishingiz mumkin. Ajablanarlisi, bu "maslahat" bo'lib, unga klaviaturadagi F1 tugmachasini bosish yoki Help -\u003e Help Topics skriptidan foydalanish mumkin.


  Kopernik 98, ATC (Agents Technologies Corporation) tomonidan ishlab chiqarilgan qidiruv mexanizmi bugungi kunda kam mashhur emas. Dasturning asosiy afzalligi - asosiy versiya uchun pul to'lash zarurati yo'qligi, foydalanish vaqti cheklanmagan. Ushbu dastur Axborot makonini qidirishda ham yengil (2,5 Mb) va respondentning hajmi bo'yicha o'z raqibidan ustundir. NetFind, LookSmart, Lycos, Magellan raqobatchiga nisbatan asosiy qidiruv motorlar qafasiga qo'shildi, garchi juda istiqbolli OpenText unutilgan bo'lsa ham. Shunisi e'tiborga loyiqki, Internetda biron bir tanishlaringizni qidirishda Kopernik 98-dan foydalanib, siz nafaqat an'anaviy "Kim qaerda?", "BigFoot", "Four11" manbalaridan, balki "joriy mavsum qahramoni" Mirabilis ma'lumotlar bazasidan ham foydalanasiz. 20 ga yaqin bo'limlarni o'z ichiga olgan va 100 dan ortiq qidiruv tizimlarida ma'lumot to'plangan tematik katalogdan siz ortiqcha versiyani tanlagan bo'lsangiz foydalanish mumkin (30 kun bepul, sizga yoqadi, qo'shimcha $ 30 to'lang). Bugungi kunga kelib kanallarni rivojlantirish uchun to'plam deb nomlanuvchi dastur ishlab chiqilmoqda, bu sizga har qanday qidiruv tizimini ro'yxatga mustaqil ravishda qo'shish imkonini beradi. Agar bir vaqtning o'zida Kopernik rus yoki ibroniy tilidagi qidirish iborasini noto'g'ri deb hisoblamasa, mamlakatimizda bu yo'nalish juda mashhurlik bilan ta'minlangan.

Har bir qidiruv operatsiyalari uchun alohida qidiruv kanalidagi qidiruv natijalari va xabarlar sonining maksimal qiymatlarini o'zgartirishingiz mumkin (Qidiruv -\u003e Yangilar -\u003e Parametrlar -\u003e Shaxsiy qidiruv). Ishlash uchun siz proksi-serverni ulashingiz mumkin (Ko'rish -\u003e Variantlar -\u003e Ulanish -\u003e Proksi-serverlar).

Ming yildan ko'proq vaqt oldin, avliyolar Kiril va Metyus yunon harflarini rus alifbosining asosi sifatida qabul qilib, strategik xatoga yo'l qo'ydilar. Uning eng jiddiy oqibatlaridan biri - klaviatura korpusini almashtirishga vaqt sarflash zarurati - kompyuterlar ixtiro qilinganida bir necha o'n yillar oldin paydo bo'ldi. Yana bir ahamiyatsiz narsa, rus tilidagi hujjatlarni qidirish bo'yicha alohida bob yozish zarurati.

Bu safar Rambler qidiruv tizimidan foydalanib, rus yozuvining kelib chiqishi haqida ko'proq bilib olishga harakat qilaylik. 1-bobning "Reytinglar" qismida biz Rambler haqida rus saytlarining reytingi haqida gaplashdik. Ushbu bo'limda Rambler nafaqat avtomatik indeks, balki Aport bilan bir xil bo'lgan reyting emas, deyish o'rinli bo'ladi. Darhaqiqat, Rambler-ning bosh sahifasida eng yuqori qismida "Qidiruv" va "Topish" tugmachalari joylashgan! so'rov yuborish.

Rus yozuvining yaratilishini tavsiflovchi hujjatlarni topish uchun qidiruv maydoniga "tarix", "ruscha", "yozish" so'zlarini kiritish, iboralarni qidirishni belgilash uchun kiritilgan so'zlarni tirnoqcha bilan o'rash va "Top!" Tugmasini bosing. Qidiruv natijalarining parchasi.

Ko'rinib turibdiki, birinchi (topilgan 234 ta) sarlavha bo'yicha va Rambler tomonidan boshlangan oxirgi hujjat (2005 yil 18 may) va hajmi (150 Kb), bizning taxminlarimizga to'liq javob beradi. Ehtimol, qolgan 233 sahifada rus yozuvi haqida biror narsa deyilgan. Ammo hujjatlar og'irmi? Biror narsa etishmayaptimi? Ushbu savollarga to'g'ri javob berish uchun siz Rambler so'rovlari tilini bilishingiz kerak.

Hozircha biz bilamizki, Rambler qidiruv maydonidagi so'zlar qo'shtirnoq bilan o'ralgan holda jumlalarni qidiradi. Rambler iborasini tashkil etadigan so'zlar o'zgarishsiz qolishini tushunish muhimdir. Rambler "rus yozuvi tarixi" iborasini o'z ichiga olgan hujjatlarni topadi, ammo "rus yozuvi tarixi" iborasini topmaydi. So'zlarning barcha grammatik shakllarini qidirish uchun ularni qidiruv maydoniga "Kiril", "Metyus", "Ruscha" va "yozish" so'zlarini kiritib, tirnoq belgilaridan ozod qilish kerak.

Bunday iltimosga binoan Rambler allaqachon 4229 sayt va 34 mingdan ortiq hujjatlarni topadi. Qidiruv natijalarining parchasi. Ko'rinib turibdiki, Rambler "rus", "yozilgan" so'zlarini qalin qilib ta'kidladi, ya'ni "rus" va "rus" so'zlari o'rtasida farq yo'q, barcha grammatik shakllar bitta so'z sifatida qabul qilinadi. Ammo bu so'zni tirnoqlarga kiritishga to'g'ri keladi va Rambler aniq ko'rsatilgan narsani qidiradi. Keyingi so'rov bo'yicha, "rus", "yozish" so'zlari va "Kiril" (masalan, "Kiril") va "Metyus" so'zlarining har qanday grammatik shakllari bo'lgan hujjatlar topiladi:

Kiril Metyusiy "Ruscha" "yozuv"

Odatiy bo'lib, Rambler bo'sh joy bilan ajratilgan barcha so'zlarni o'z ichiga olgan hujjatlarni qidiradi. Ammo deyarli barcha zamonaviy qidiruv tizimlari qidiruvchini nimani taxmin qilishni bilishga harakat qilishadi, shuning uchun Ramblerga nima qilish kerakligini aniq aytib berish yaxshiroqdir. Agar siz barcha so'zlarni topishingiz kerak bo'lsa, ularning orasiga AND mantiqiy operatori qo'yiladi. Quyidagi so'rov bo'yicha hujjatlar ikkala so'z mavjud bo'lgan joyda topiladi (ularning o'zgaruvchanligini hisobga olgan holda):

Kiril va Metyus

Ammo agar siz bir nechta so'zlardan birini topishingiz kerak bo'lsa, masalan, OR operatoridan foydalaning.

(YOKI alifbo yoki alifbo yozish) va ruscha va "Kiril" va "Metyus"

Ushbu so'rov sahifalarni izlash kerak degan ma'noni anglatadi, albatta "Kiril", "Metyus" so'zlari, "rus" so'zining grammatik shakllaridan biri va "yozuv", "alifbo", "alifbo" so'zlaridan biri (ularning grammatik o'zgaruvchanligini hisobga olgan holda). ) So'nggi misolda "Kiril" va "Metyus" so'zlari yozilgan kichik harf, chunki Rambler baribir indeksiga murojaat qilishdan oldin o'giriladi katta harflar  kichik harfda.

AND va OR operatorlaridan tashqari, Rambler-da NOT (EMAZ) operatori mavjud bo'lib, u erda hech qanday so'z (ibora) bo'lmagan hujjatlarni topishga imkon beradi. Keyingi so'rov bo'yicha "tarix", "rus", "yozuv" (ularning grammatik o'zgaruvchanligini hisobga olgan holda) so'zlari bo'lgan sahifalar topiladi, ammo "Kiril" so'zi yo'q: rus va rus tilining tarixi va yozma tili Kirill EMAS

NOT operatoridan foydalanib, siz juda murakkab so'rovlarni yaratishingiz mumkin, masalan: rus tilida yozilgan va yozilmagan tarixi (Kiril OR Methodius)

Ushbu so'rov Rambler-ga AND operatori bilan bog'langan uchta so'z mavjud bo'lgan sahifalarni qidirishni buyuradi va unda na Kiril, na Metafiy so'zlari mavjud. Buni qidiruv tizimiga bunday so'rov yordamida tushunishingiz mumkin:

Kiril Yoki Methodius


Bunday holda, hujjatlarni "Kiril" yoki "Metyus" so'zlarini yoki ikkala so'zni ham topish mumkin. Shubhasiz, qidiruv mexanizmi tomonidan indekslangan barcha hujjatlarni ikkiga bo'lish mumkin: birinchisi Kiril OR Methodius so'roviga javob beradi, ikkinchisi esa yo'q. Shunday qilib, NOT operator shunchaki qidiruv tizimiga ushbu ikkinchi qismni ko'rsatishni buyuradi. Shubhasiz, bu qismda sahifalar to'plangan bo'lib, unda na Kiril, na Metyus so'zi mavjud.

Kengaytirilgan qidirish rejimi bilan tanishish biz uchun qoladi, bu esa qidiruv tugmasi ostida joylashgan Advanced Search sichqoncha havolasini tanlab sozlanishi mumkin. Bo'sh pacuiiipeHHoro talab.

Siz qidiruv maydoniga mantiqiy operatorlar bilan bog'liq so'zlarni kiritishingiz mumkin (bu holda so'rov so'zlarini qidirish guruhida kalit tanlanishi kerak), siz shunchaki tanlangan so'zlarning kamida bittasi qidirilganligini yoki aniqligini ko'rsatishingiz mumkin ([bosqich. Siz qayerga ketishini belgilashingiz mumkin). qidirish - hujjatlarning o'zlarida, sarlavhalarda (sarlavhada) yoki havolalar matnida. Siz so'zlar orasidagi masofani cheklab qo'yishingiz mumkin; bu, albatta, iboralarni qidirishni o'zgartira olmaydi, lekin ba'zida yordam berishi mumkin. Siz faqat ma'lum saytlarda qidirishingiz mumkin (Hujjatlarni faqat quyidagi saytlarda qidirishingiz mumkin) Siz dockni qidirishingiz mumkin Belgilangan vaqt ichida (Hujjat sanasi) yaratilgan Hujjatlar tili va hujjat formatini o'rnatish orqali ma'lum bir turdagi nusxalarni olish (Hujjat sanasi) Va nihoyat, sahifalarni nafaqat so'rovga (dolzarblik), balki sana bo'yicha bog'liqligi, shuningdek, o'z ichiga olmaydigan hujjatlarni qidirishingiz mumkin. so'zlar (quyidagi so'zlarni o'z ichiga olgan hujjatlar bundan mustasno).

  Rambler (sin. Rambler, rambler, inglizchadan aylanib yuruvchi, shpal deb tarjima qilingan)  Rambler Media Group internet-xolding qidiruvi.

Qidiruv mexanizmi rus, ukrain va boshqa tillarning morfologiyasini hisobga oladi ingliz tillari, qidirish bilan bir qatorda, so'rovlarning barcha shakllaridan o'tadi va so'rovga muvofiqlik darajasiga qarab natijalar beradi.

Rambler, Internet bozoridagi birinchi qidiruv tizimlaridan biri, Runetning rivojlanishida katta rol o'ynadi. Kichik raqam bilan (5% dan ko'p bo'lmagan) qidiruv tizimi Yandex va Google-dan keyin uchinchi o'rinda turadi.

Rambler tomoshabinlari asosan tizimni tashkil etilganidan beri deyarli foydalanib kelgan odamlardir.

Rambler-ning afzalliklari orasida saytlarning tematik reytingini, yangiliklar xizmati, Internet-messenjer, onlayn to'lov xizmati, bepul pochta  va Runner kontekstual reklama xizmati va boshqalar.

Voqealar yilnomasi

1991 yilda Rossiya Fanlar akademiyasining biokimyo va mikroorganizmlar fiziologiyasi institutidan Sergey Lisakov, Yuriy Ershov, Dmitriy Kryukov, Viktor Voronkov va Vladimir Samoyilov ilmiy guruhlar bilan ilmiy almashinuv uchun mahalliy tarmoqni yaratishga kirishdilar. texnik ma'lumotlar  Pushchinoda. Tez orada tarmoq Moskvaga, so'ngra Internetga ulandi. Loyiha tezda pul topdi va faol rivojlana boshladi.

Izlash tizimining rasmiy tug'ilgan yili 1996 yil, Dmitriy Kryukov Rambler deb nomlangan qidiruv xizmatini yaratgan. 1996 yilda boshqa qidiruv tizimlari allaqachon yaratilgan va ishlagan, ammo ular, Ramblerdan farqli o'laroq, mashhur bo'lmagan.

1997 yilda Dmitriy Kryukov ma'lum bir shkala - Ramblerning Top100 tasnifini taqdim etdi, u saytlarning tashriflar chastotasiga qarab ularning obro'sini aniqlash uchun javobgardir.

1999 yilda Igor Ashmanov, kompaniyani 2001 yilda tark etgan, ishlab chiqish va tadqiqotlar bo'yicha direktor, keyin esa ijrochi direktor lavozimini egallagan. U Ramblerdagi faoliyatini "Pufak ichidagi hayot" kitobida tasvirlab, unda kompaniyaning 1999-2001 yillardagi faoliyati va shuningdek, Rambler ichki Internet bozorida 1-o'rinni yo'qotganligi haqida batafsil ma'lumot bergan.

2004 yilda Rambler's Top 100 ISO 9001 sertifikatiga ega.

2007 yilda Bosh direktor Mark Opzumerni olib ketdi. 2009 yilda eXtended AGgregator texnologiyasi asosida vertikal qidiruv qo'shildi. 2009 yil 31 dekabrda Rambler bosh direktor Mark Opumer bilan birgalikda barcha rahbariyatni tark etdi va o'sha yili qidiruv tizimi "Madaniyat va ommaviy kommunikatsiyalar" nominatsiyasida Runet mukofotiga sazovor bo'ldi.

2009 yil aprel oyidan beri "Vympel" da venchur biznesni rivojlantirish bo'yicha direktor sifatida ishlagan Olga Turishcheva Ramblerga rahbarlik qiladi.

2011 yil iyun oyining oxirida Rambler Yandex qidirish texnologiyasiga o'tdi. Qidiruv mexanizmining afzalliklari bilan bir qatorda, ayniqsa Yandex yoki Google bilan taqqoslaganda kamchiliklar ham mavjud. Rambler-da algoritmlar kamdan-kam yangilanadi, past chastotali yoki o'rta chastotali so'rovlar uchun Internet manbalarining sifatini nazorat qiladigan filtrlar deyarli yo'q, bu spam-saytlar sonini ko'paytiradi va saytlarning ahamiyatini aniqlash algoritmi ham arzon. Shu munosabat bilan qidiruv tizimlari orasida Rambler ulushi 20 foizdan 5 foizga tushdi.

Rambler nimani taklif qilishi mumkin?

Rambler nafaqat ko'ngilochar tabiatning ko'plab loyihalarini taqdim etadi, balki quyidagi qismlarni ham taqdim etadi:

1) "Kartalar" - o'z ichiga oladi batafsil xaritalar  yirik shaharlar. Foydalanuvchilar o'zlarini qiziqtirgan manzillarni bilib olishlari, istalgan yo'nalishlarni ochishlari va tirbandliklar haqida xabardor bo'lishlari mumkin.

2) "Price.ru" da siz har qanday mahsulot kataloglarini, chegirmalar haqidagi ma'lumotni, mahsulot sharhlarini, bo'lajak tadbirlarni va boshqalarni topishingiz mumkin.

3) "Finans" har doim valyuta kotirovkalari, zamonaviy bozordagi vaziyat, aktsiyalarning narxi va boshqalar haqida kerakli ma'lumotlarni taqdim etadi.

4) "Ferra.ru" da siz so'nggi raqamli texnologiyalarning sharhlarini topishingiz mumkin: kameralar, telefonlar, kompyuterlar va boshqalar.

Sizga maqola yoqdimi? Do'stlar bilan baham ko'ring: