Yangi Yandex algoritmi nima? Yandex "Korolev". Yangi Yandex algoritmidan nimani kutish va unga qanday moslashish kerak. Korolev algoritmi qanday ishlaydi

22 avgust kuni yangi Yandex algoritmi "Korolev" taqdim etilganidan so'ng, ko'plab SEO mutaxassislari sayt trafigining pasayishi mumkinligidan xavotirda edilar. Boshqa tomondan, agar ba'zi saytlar uchun qidiruv trafigi pasaysa, boshqalari o'sishni ko'radi.

Ammo keling, hamma narsa juda qo'rqinchli yoki yo'qligini birgalikda aniqlaylik.

Aytgancha, Yandex Metrica ma'lumotlariga asoslanib, biz ko'p foydalanuvchilar "Yandex Korolevni qanday yoqish mumkin?" Degan so'rovni kiritishlarini ko'ramiz. va bizning maqolamizga tashrif buyuring. Aslida hech narsani yoqish shart emas, bu yangi reyting tizimi allaqachon hamma uchun avtomatik ishlaydi.

Yandex Korolev algoritmi nima?

Aslida, "Korolyov" - bu pompalangan versiya Palexa, uning ishi neyron tarmoq yordamida ma'noni tan olishga asoslangan. Agar Palex faqat sarlavhalarni taniy olsa va 150 tagacha hujjatlarni qayta ishlagan bo'lsa, Korolev sahifadagi barcha matnni baholaydi va 200 mingdan ortiq sahifalarni qayta ishlay oladi.

Rasmiy blogda, shuningdek, o'zgarishlar nafaqat ilovaga tegishli ekanligini ta'kidlaydi Qidiruv uchun neyron tarmoqlar so'zlarda emas, balki ma'noda, balki qidiruv natijalari indeksining arxitekturasida ham.

Korolev algoritmi qanday ishlaydi

Algoritm yaratuvchilarning fikriga ko'ra, bu bizga foydalanuvchi so'rovlarining ma'nosini tushunishning mutlaqo boshqa darajasiga o'tish imkonini beradi. Endi butun sayt sahifasi bilan baholanadi semantik vektor qidiruv so'rovlari.

Foydalanuvchi so'rovni kiritganda, qidiruv tizimi qaysi sahifa va qaysi sarlavha unga ko'proq mos kelishini tushunishi kerak. Buning uchun so'rov va sarlavha vektorlar ko'paytmasiga aylantiriladi va natija qanchalik katta bo'lsa, sahifaning so'rovga mosligi shunchalik yuqori bo'ladi. So'rovga javob yaratish vaqtida sarlavhalar va so'rovlar matni bir zumda vektorlarga aylantiriladi va taqqoslanadi. Bu ma'nodagi mumkin bo'lgan ulanishlarni aniqlash imkonini beradi, lekin ayni paytda juda katta hisoblash quvvatini talab qiladi. Palex shunday ishlaydi.

Uning ish faoliyatini yaxshilash uchun nima qilindi? Korolev algoritmi vektorlarni dastlabki hisoblashni amalga oshiradi, bu so'rovning o'zi davomida serverni yuklamaslik, balki tayyor natijani olish imkonini beradi. Bundan tashqari, yuqorida aytib o'tilganidek, Korolev nafaqat sahifa sarlavhasini, balki uning butun mazmunini ham semantik vektorga aylantiradi.

Ammo shuni tushunishingiz kerakki, "Korolev" Yandex qidiruv natijalarini teskarisiga aylantiradigan inqilobiy veb-saytlar reytingi algoritmi emas. Bu neyron tarmoqlar va foydalanuvchi tajribasi yordamida takomillashtirilgan allaqachon amalga oshirilgan yechimlar majmuasidir.

"Korolev" chiqqandan keyin sanoatni nima kutmoqda?

Ayni paytda qidiruv natijalarida global o'zgarishlar yo'q va ular yaqin kelajakda ro'y berishi dargumon. Misol uchun, qidiruvda hali ham kalitning to'g'ridan-to'g'ri paydo bo'lgan turli sahifalardan foydalangan holda "oshxonaning ichki qismi" va "oshxona dizayni" sinonim so'rovlariga javob beradigan ko'plab sahifalar mavjud.

Haqiqiy o'zgarishlar bitta "katta" so'rov uchun ma'lumotlar bazasini to'plashning hojati yo'q bo'lganda amalga oshiriladi past chastotali so'rovlar, ularning ostiga 10 000 belgidan iborat matn yozing.

1. Foydalanuvchilar

Foydalanuvchilar nuqtai nazaridan, ma'no jihatidan bir xil, ammo imlo jihatidan farq qiluvchi so'rovlar turli xil natijalar berishi g'alati bo'lishi mumkin. Ko'pgina foydalanuvchilar qidiruv tizimiga xuddi do'stlaridan so'ragandek so'rovlar yuborishadi. Yangi algoritm ushbu so'rovlarga javob berishni osonlashtiradi.

2. Veb-ustalar

Ideal dunyoda veb-ustalar yaxshi mahsulotlar ishlab chiqaradilar, sifatli kontent yaratadilar va qidiruv tizimlarida o'z saytlarini maxsus targ'ib qilish haqida o'ylamaydilar. Aslida, ular ko'pincha matnlarni va saytni qidirish mexanizmlari uchun moslashtirishlari kerak.

3. SEO mutaxassislari

Ilgari veb-saytlarni targ'ib qilishga yordam bergan ba'zi usullar (masalan, SEO kopirayteri) endi bunday ta'sir ko'rsatmaydi. Albatta, yangi algoritmdan o‘zib ketishga urinishlar bo‘ladi, biroq sa’y-harakatlarning bir qismi sifatli kontent yaratishga qaratilgan bo‘ladi.


Yangi algoritm sifatini baholashga hali erta, lekin u qanchalik ko'p javob bersa, u shunchalik yaxshi bo'ladi. Shuning uchun, uzoq muddatda foydalanuvchilar farqni his qilishlari kerak.

Bu qanday mashina?

Qidiruv tizimlarida neyron tarmoqlarning IQ darajasining kiritilishi va o'sishi bilan qaytarilgan kontentning sifati va dolzarbligi eksponent ravishda oshadi. Mashina vizual tarkibni tahlil qilishi va so'zlar va iboralarning ma'nosini tushunishi mumkin.


Resurs o'rni mavzusiga to'g'ridan-to'g'ri semantik aloqasi bo'lmagan har qanday mashhur yangiliklarni sahifalarga to'qishga urinish qidiruv natijalaridan chiqarib tashlashga olib keladi.

Afzalliklar

Neyron tarmoqning asosiy afzalligi uning tahlil qila olishida emas, balki o'rganish va eslab qolishidadir. Ya'ni, foydalanuvchilarning tanloviga ko'ra, qidiruv natijalari kutganiga mos kelmaydigan resurslar ham asta-sekin qidiruv natijalaridan chiqib ketadi.

Ya'ni, mashina A so'rovi uchun tegishli foydalanuvchilar soni har doim B resursini bosishini va hech qachon D resursini bosmasligini qayd etadi. D resursi A so'roviga mos keladigan joydan chiqarib tashlanadi.


Keling, bir necha hafta kutamiz va ko'ramiz

Bir tomondan, ism "Palekh" kabi yomon emas. Va bu allaqachon yaxshi. Boshqa tomondan, hammaning "Palekh" ga mukammal moslashishga hali vaqtlari yo'q, bu erda tarkibga ko'proq e'tibor qaratadigan yangi, yanada o'ralgan algoritm keladi.

Kontent shoh - har bir yangilanishdan keyin tasdiqlanadi

Afzalliklardan ko'rinib turibdiki, bu ilg'or, aqlli va yangi saytlar uchun qidiruv natijalarining uzoq vaqtdan beri mavjud bo'lgan etakchilari bilan to'yingan bo'shliqlarda raqobatlashish imkoniyatini oshiradi, shuningdek, hamma narsani o'ylamasdan SEO kopirayterlarining uzoqroq astral tekisligiga jo'natadi. matnlardagi langarlarni sanab, saytlardagi axlatxona.

Algoritm boshli kopirayterlar uchun yangi professional o'sish imkoniyatini beradi, ular ijtimoiy tarmoqlar uchun postlar yozishdan ko'ra foydaliroq ish qilishlari mumkin.

Biroq, skeptik nuqtai nazardan, Yandex o'zining tijorat imkoniyatlarini va ularning zarurligini, xususan, kontekstni targ'ib qilish vaqtini o'tkazib yuborishi dargumon.


Men har doim bunday yangiliklarni juda ijobiy qabul qilaman. Chunki SEO optimallashtirishga qo'shimcha ravishda sizda kontentning strategik harakatlari uchun katta maydon mavjud va bu SEOni yangi darajaga olib chiqadi. Ular unga g'alati va tushunarsiz narsa sifatida munosabatda bo'lishni to'xtatadilar. Odamlarga tanish bo'lgan shaklda SEO buzilib ketgan, ilgari shunday edi, lekin vaqt o'tadi va eskirgan idrok saqlanib qoladi.

Mantiq shunday: Ilgari, bozorda SEO bilan shug'ullanadigan ko'plab veb-studiyalar mavjud edi va ba'zilari buni shunchaki qilib ko'rsatdilar, lekin buning uchun byudjet oldilar. Ikkinchisi soni bo'yicha ustunlik qildi. Shuning uchun SEO firibgarlik degan fikr mavjud. Vaqt o'tadi, algoritmning har bir yangilanishi "go'yo" qilganlarni siqib chiqaradi va odamlarning eskirgan idroki hali ham saqlanib qoladi.



Yangi Qirolicha algoritmi so'nggi yillarda Yandex qidiruvidagi o'zgarishlarni mantiqiy ravishda davom ettiradi. Neyron tarmoqlarga ko'proq e'tibor berish, faqat sarlavhalarni emas, balki sahifaning butun mazmunini tahlil qilish.


Juda muhim nuqta - foydalanuvchilarni joriy sahifaga olib keladigan boshqa qidiruv so'rovlarini tahlil qilish, bu sizga kontentning dolzarbligini va qidiruv so'rovlari o'rtasidagi munosabatni aniqroq aniqlash imkonini beradi.

Xulosa qilish uchun: qidiruv sifati yaxshilanadi. Va bu ajoyib.

Salom SEO matnlari

Yangi algoritm real hayotda qanday ishlashini ko'rish qiziq bo'ladi. Semantik chiqishning adekvatligini va reyting ustuvorligini baholash uchun vaqt kerak.


Shubhasiz, agar tarmoq haqiqatan ham kalit so'zlar ortida ko'proq ma'no ko'rsa, qidiruv nostandart va kamdan-kam so'rovlarni boshqarish uchun yaxshiroq ishni bajarishi kerak bo'ladi. Men shunday umid qilaman, chunki bu "Xayr, SEO matnlari" sari yana bir qadamdir. Biroq, tarmoqni o'qitish kerak bo'ladi. Bu hazil emasga o'xshaydi.

Men hozirgina “Peshonasiga chandiq bo‘lgan kino bola” deb qidirib ko‘rdim va qidiruv natijalarida “Dar yuz” filmiga juda ko‘p havolalar oldim. Ya'ni, kalit so'zlar hali ham ma'no ustidan g'alaba qozonadi.

Va agar men qidiruv natijalarida menga kerak bo'lgan Garri Potter sahifalarini topsam va ularga ko'p vaqt sarflasam, mashina so'rovga qanday ma'no qo'yganimni tushunadi va keyingi safar qidiruv natijalarini aniqlaydi. Hech bo'lmaganda shunday bo'lishi kerak. O'quv jarayoni tez bo'lmaydi, lekin har qanday holatda ham bu kelajakka yaxshi qadamdir.

Biznesga biroz yaqinroq...

Bugun, "Toymasin eshikli shkaf sotib oling" so'roviga javoban, men doimiy ravishda pechlar va bir nechta keraksiz narsalarni (pardali, ilmoqli va boshqalar) olaman.



Algoritmning mohiyati sahifa matnining ilgari ma'lum bo'lgan va tez-tez ishlatiladigan iboralarga muvofiqligini raqamli shaklda ifodalovchi URL-manzilni indekslash bosqichida hujjatning qo'shimcha xususiyatlarini aniqlashdan iborat. Taʼkidlanishicha, yangilik qidiruv natijalarining uchdan bir qismini tashkil etuvchi past chastotali soʻrovlarga taʼsir qiladi.


Bunday "kamdan-kam" so'rovlar bo'yicha statistik ma'lumotlar yo'qligi sababli ularni qidirish sifati yomonlashadi. Aslida, ushbu algoritm to'g'ridan-to'g'ri uzoq so'rovni o'z ichiga olmaydigan, lekin foydalanuvchi so'roviga yaqin bo'lgan hujjatlarni unutib qo'yadi.

Marketologlar va SEO mutaxassislari uchun ularning optimallashtirilgan saytlari nafaqat bir-biri bilan, balki ular bilan ham raqobatlasha olishi muhim optimallashtiruvchi umuman tegmagan saytlar bilan.

Albatta, bu faqat past chastotali so'rovlar uchun amal qiladi va so'rovlar ulushini oqimning 1/3 qismi sifatida baholash yuqori baho hisoblanadi. Ammo yaqin kelajakda ba'zi saytlar past chastotali trafikning chiqib ketishiga duch kelishi mumkin. Shu bilan birga, har qanday raqamli prognozlar qilish befoyda.


Menimcha, yorliqli n-grammalardan tashkil topgan turli xil indekslarni yaratish g'oyasi (va Yandex buni da'vo qilmoqda) sirtda yotadi. Masalan, statoperator brauzerining asosiy xususiyatlaridan biri n-gramm indeksini qurishdir.


N-grammalar alohida so'zlarga qaraganda ko'proq ma'lumotga ega, ular tasniflash uchun mos keladi va ma'no bo'yicha qidiruvni yaratish uchun omillar sonini sezilarli darajada kengaytirishga imkon beradi. Yandex to'g'ri yo'nalishda harakat qilayotganidan va qidiruv tezligi va sifatini oshirish uchun joriy usullarni yuqori darajada amalga oshirayotganidan xursandman.

SEO va reklama bo'limi boshlig'i Dmitriy Sevalnevning fikri "

Yandex yangi reyting algoritmini - "Korolev" ni ishga tushirdi. Endi qidiruv tizimi qidiruv so'rovi va sahifaning ma'nosiga mos keladi. Bu foydalanuvchilar uchun juda qulay. Biroq, yangi algoritm optimallashtiruvchilar va veb-sayt egalari uchun nimani anglatadi, reklama qanday o'zgaradi va biz trafikdagi o'zgarishlarni kutishimiz kerakmi.

Butun SEO dunyosi har doimgidan ham ko'proq 2017 yil 22 avgustda e'lon qilingan yangi reyting algoritmining ishga tushirilishini kutayotgan edi. Albatta, bunday e'lonlar Yandex uchun mutlaqo atipik narsadir, odatda ular o'z rejalari haqida gapirmaslikni afzal ko'radilar va bundan keyin reyting algoritmining navbatdagi chiqarilishini e'lon qiladilar.

2017 yil 22 avgustda Yandex qidiruvning yangi versiyasini ishga tushirdi. U Korolev qidiruv algoritmiga asoslangan (2008 yildan beri Yandex-dagi yangi reyting algoritmlari shaharlar nomi bilan atalgan). Neyron tarmoqdan foydalanib, algoritm so'rovlar va veb-sahifalarning ma'nosini taqqoslaydi - bu Yandex-ga murakkab so'rovlarga aniqroq javob berishga imkon beradi. Qidiruv statistikasi va millionlab odamlarning reytinglari qidiruvning yangi versiyasini o'rgatish uchun ishlatiladi. Shunday qilib, nafaqat ishlab chiquvchilar, balki barcha Yandex foydalanuvchilari ham qidiruvni rivojlantirishga hissa qo'shadilar.

Yangi algoritmni qo'llash doirasi, birinchi navbatda, tijorat qidiruv natijalarini o'z ichiga olgan an'anaviy SEO sohalariga deyarli ta'sir qilmaydi. "Korolev" "Palekh" algoritmining mantiqiy davomi bo'lib chiqdi va odatda tabiiy tilda so'raladigan mikro chastotali so'rovlarning uzun dumiga xizmat qilish uchun mo'ljallangan. Bunday so'rovlarning o'ziga xos xususiyati shundaki, ularga tegishli hujjatlarda so'rovga kiritilgan so'zlarning ko'pi bo'lmasligi mumkin. Bu matn ahamiyatiga asoslangan an'anaviy tartiblash algoritmlarini chalkashtirib yuboradi.

Boshqa narsalar qatori foydalanuvchi xatti-harakatlariga o'rgatilgan neyron tarmoqlardan foydalanish shaklida yechim topildi. Shuning uchun yangi Yandex algoritmi neyron tarmoq asosida ishlaydi. U foydalanuvchi so'rovlari misollaridan o'rganadi va sahifadagi matnning ma'nosiga qarab javoblarni tanlaydi. Bu, xususan, foydalanuvchilarning o'zlari topmoqchi bo'lgan narsaning nomi nima deb atalishini bilmasa, nostandart so'rovlar bilan ishlash ancha samarali bo'lishini anglatadi. Bu erda ko'p narsa hisoblash kuchiga bog'liq.

Umuman olganda, so'rovlarning uzun mikrochastotali dumini tartiblash muammosini hal qilishning bunday yondashuvi yangi emas. 2015-yilda Google qidiruv tizimi tabiiy tilda so‘ralgan ko‘p so‘zli so‘rovlarga javob topish uchun qo‘llanilgan texnologiya – RankBrain haqida ma’lum bo‘lgan edi. Mashinani o'rganishga asoslangan ushbu texnologiya so'rovlardagi eng muhim so'zlarni tanib olish va qidiruv o'tkazilayotgan kontekstni tahlil qilish imkonini beradi. Bu sizga barcha so'rov so'zlarini o'z ichiga olmaydigan tegishli hujjatlarni topish imkonini beradi.

Bundan tashqari, algoritm rasmlar bilan ham ishlaydi. U tasvir mazmunini tahlil qiladi va faqat teglardagi tavsif yoki uning atrofidagi matndan emas, balki uning asosida kerakli variantni tanlaydi.

Biroq, tabiiy tildagi mikro-chastotali ko'p so'zli so'rovlarning uzun dumi axborot semantikasining "yondiruvchilari" - "barcha holatlar uchun" deb ataladigan ma'lumot saytlarini yaratuvchilarni qiziqtirishi mumkin. Umuman olganda, ular allaqachon o'zlari bilganicha so'rovlar uchun o'z matnlariga aniq kirishni tashkil etishga harakat qilmoqdalar, ular semantikani to'plashning turli usullaridan foydalangan holda olishga muvaffaq bo'lishadi. Hech qanday aniq hodisalar bo'lmaydigan joyda, ya'ni. Axborot saytlarini yaratuvchilarning "semantik changyutgichi" tomonidan so'rilmagan yoki ular mazmunida aniq hodisalarni ta'minlay olmagan so'rovlar uchun "Korolev" domeni boshlanadi, u o'rtasidagi yozishmalarni qidirish uchun mo'ljallangan. kalit so'zlar bo'yicha ular o'rtasida bir nechta kesishmalar mavjud bo'lganda so'rovlar va javoblar. Bunday hollarda Korolev, shubhasiz, kontent sifatiga qo'yiladigan talablarni oshiradi va haqiqatan ham qiziqarli o'qilishi mumkin bo'lgan maqolalar suv bilan suyultirilgan kalit iboralar to'plamidan ko'proq foyda keltiradi, chunki Aynan shunday maqolalar yangi algoritm uchun foydali signallarni o'z ichiga olishi mumkin. Xo'sh, boshqa barcha SEOlar haqiqatan ham dam olishlari mumkin - keyingi urish qoldirildi. Qurbonlar va vayronagarchiliklar yo‘q.

Palexni ishga tushirish orqali Yandex neyron tarmog'ini qidiruv so'rovlari va veb-sahifalar sarlavhalarini raqamlar guruhlariga - semantik vektorlarga aylantirishni o'rgatdi.

Bunday vektorlarning muhim xususiyati shundaki, ularni bir-biri bilan solishtirish mumkin: o'xshashlik qanchalik kuchli bo'lsa, so'rov va sarlavha ma'no jihatidan bir-biriga yaqinroq bo'ladi.

U Palexdan nimasi bilan farq qiladi?

Yangi algoritmning asosiy farqi, texnik amalga oshirishni takomillashtirishdan tashqari, Hujjatdagi o'xshash "ma'nolarni" nafaqat nom (sarlavha) bo'yicha tanib olish qobiliyati; brauzer oynasida paydo bo'ladi.

Korolev algoritmi qanday ishlaydi

"Korolev" qidiruv algoritmi semantik vektorlarni solishtiradi qidiruv tizimlari so'rovlar va butun veb-sahifalar- va nafaqat ularning sarlavhalari. Bu bizga ma'noni tushunishning yangi darajasiga ko'tarilish imkonini beradi.

Palex misolida bo'lgani kabi, veb-sahifalar matnlari neyron tarmoq orqali semantik vektorlarga aylantiriladi. Ushbu operatsiya juda ko'p hisoblash resurslarini talab qiladi. Shuning uchun Korolev sahifa vektorlarini real vaqtda emas, balki oldindan hisoblab chiqadi, indekslash bosqichida.

Biror kishi so'rovni so'raganda, algoritm so'rov vektorini unga ma'lum bo'lgan sahifa vektorlari bilan solishtiradi.

"Qirolicha" effekti

Ma'noni tushunish qobiliyati, ayniqsa, noyob va g'ayrioddiy so'rovlarni qayta ishlashda foydalidir - odamlar ob'ektning xususiyatlarini o'z so'zlari bilan tasvirlashga harakat qilganda va qidiruv uning nomini taklif qilishini kutishganda.


Ushbu sxema reytingning dastlabki bosqichida qidiruv so'rovingizga mos keladigan veb-sahifalarni tanlashni boshlash imkonini beradi. "Palekh" da semantik tahlil- yakuniy bosqichlardan biri: undan atigi 150 ta hujjat o'tadi. Korolevda u ishlab chiqariladi 200 000 hujjat.

Bundan tashqari, yangi algoritm nafaqat veb-sahifa matnini qidiruv so‘rovi bilan solishtiradi, balki odamlarni ushbu sahifaga olib keladigan boshqa so‘rovlarga ham e’tibor beradi.

Shu tarzda siz qo'shimcha semantik aloqalarni o'rnatishingiz mumkin.

Odamlar mashinalarni o'rgatishadi

Mashinani o'rganish va ayniqsa neyron tarmoqlardan foydalanish ertami-kechmi qidiruvni inson darajasida ma'no bilan ishlashga o'rgatish imkonini beradi. Mashina muayyan muammoni qanday hal qilishni tushunishi uchun unga juda ko'p misollarni ko'rsatish kerak: ijobiy va salbiy. Bunday misollar Yandex foydalanuvchilari tomonidan keltirilgan.

Korolev algoritmi tomonidan ishlatiladigan neyron tarmoq anonim qidiruv statistikasi bo'yicha o'qitiladi. Statistikani yig'ish tizimlari foydalanuvchilarning ma'lum so'rovlar uchun qaysi sahifalarga borishini va u erda qancha vaqt sarflashini hisobga oladi.

Agar biror kishi veb-sahifani ochsa va u erda uzoq vaqt osilgan bo'lsa, ehtimol u qidirgan narsasini topdi - ya'ni sahifa uning so'roviga yaxshi javob beradi. Bu ijobiy misol.

Salbiy misollarni topish ancha oson: shunchaki so'rov va istalgan tasodifiy veb-sahifani oling.Algoritmni o'rgatish uchun ishlatiladigan statistik ma'lumotlar anonimlashtiriladi.

Reyting formulasini yaratayotgan Matrixnet ham odamlarning yordamiga muhtoj.

Tozalash

Qidiruv o'sishi uchun odamlar uning samaradorligini doimiy ravishda baholashlari kerak. Bir vaqtlar faqat Yandex xodimlari, deb ataladigan baholovchilar. Ammo qancha ko'p reytinglar bo'lsa, shuncha yaxshi - shuning uchun Yandex barchani bunga jalb qildi va Yandex.Toloka xizmatini ishga tushirdi. Hozir u yerda milliondan ortiq foydalanuvchilar ro‘yxatdan o‘tgan: ular qidiruv sifatini tahlil qiladi va boshqa Yandex xizmatlarini yaxshilashda ishtirok etadi. Toloka vazifalari to'lanadi - topish mumkin bo'lgan miqdor vazifaning yonida ko'rsatilgan. Xizmat mavjud bo'lgan ikki yildan ortiq yil davomida suhbatdoshlar ikki milliardga yaqin reytinglarni berishdi.

Zamonaviy qidiruv murakkab algoritmlarga asoslangan. Algoritmlar ishlab chiquvchilar tomonidan ixtiro qilinadi va millionlab Yandex foydalanuvchilari tomonidan o'rgatiladi. Har qanday so'rov anonim signal bo'lib, mashinaga odamlarni yaxshiroq tushunishga yordam beradi. Yangi qidiruv - bu biz birgalikda olib boradigan qidiruv.

Kecha kechqurun bir necha ming veb-ustalar va ikkita astronavt ishtirokida Yandex "Korolev" deb nomlangan yangi algoritmni ishga tushirganini e'lon qildi. Hech qachon kompaniya algoritmni bunday keng miqyosda o'zgartirishni e'lon qilmagan: Apple uslubidagi taqdimot, kosmos bilan to'g'ridan-to'g'ri aloqa, Moskva Planetariumining ulkan zali, onlayn translyatsiya va yirik Runet nashrlarida post-relizlar. Bunday kuchli PR SEO hamjamiyatida kuchli reaktsiyaga sabab bo'lgan va "hammani Direct-ga ehtiros bilan jalb qilmoqchi bo'lgan qonxo'r Yandex" ga nisbatan hissiyotlarning yana bir portlashiga sabab bo'lganligi ajablanarli emas.

Keling, haqiqatda nima bo'lganini va keyingi yangiliklardan nimani kutish mumkinligini aniqlaylik.

Yaqin kelajakda Korolevdan nima kutish mumkin?

Korolevning oldingi algoritmlardan asosiy farqi shundaki, tartiblangan hujjat so‘rovning o‘zi hech qachon hujjat matnida bo‘lmasa ham so‘rovga tegishli deb hisoblanishi mumkin (xuddi shunday qilgan Palexning mantiqiy davomi, faqat Sarlavha uchun. ).

Neyron tarmoq turli so'zlar va iboralar o'rtasidagi semantik aloqalarni aniqlaydi va ularni alohida ma'lumotlar bazasida saqlaydi. Algoritm ma'lum bir so'rovga javob yaratishda ushbu munosabatlarga tayanadi. Natijada, TOP sahifalar foydalanuvchining savoliga aniq javob berishi mumkin, lekin ayni paytda so'rovning o'zidan so'zni o'z ichiga olmaydi.

Bu fakt veb-ustalar tomonidan ko'plab savollar va taxminlarni keltirib chiqaradi. Endi matnlarni qanday optimallashtirish mumkin? So'rovlarni sahifalar bo'ylab qanday tarqatish mumkin? Yaqin kelajakda pozitsiyalar va transportning pasayishini kutishimiz kerakmi?

Xulosa chiqarishga hali erta, lekin men yaqin kelajakda ko'pchilik mutaxassislar hech qanday farqni ko'rmasligiga ishonishga moyilman, chunki:

1) Tijorat mavzulari uchun juda oz narsa o'zgaradi

Taqdimot va press-relizlarda keltirilgan misollardan ko'rinib turibdiki, algoritm birinchi navbatda sizning boshingizdan chiqqan nomlar va atamalarning ma'nosini aks ettiruvchi ma'lumotli NPlar bilan ishlaydi:

- osmon aylanayotgan rasm(Van Gog)

- Mongoliyadan kelgan dangasa mushuk(Pallas mushuk)

- boshqa sayyorada kartoshka yetishtirgan odam haqida film("Marslik")

Masalan, foydalanuvchi bunday so'rov yordamida ba'zi mahsulotni qidirishini tasavvur qilish qiyin "Tishlangan olma logotipli smartfon" yoki "Yon tomonida ikkita g'ildirakli taxta ko'rinishidagi transport vositasi".

2) O'zgarishlar birinchi navbatda ko'p so'zli so'rovlarga ta'sir qiladi

Taqdimotga ko'ra, algoritmning asosiy vazifasi so'rovlarni aniqlashtirishning ma'nosini yaxshiroq tushunishdir. Qoida tariqasida, bu 5 yoki undan ortiq so'zdan iborat so'rovlardir. "Shu kabi so'rovlarning ma'nosini tushunish uchun neyron tarmoqlardan foydalanishimiz kerakmi? Moskvada kvartirani ijaraga olish», « yotoqxona uchun rolikli pardalar"yoki" aeroportga taksi"? Menimcha, savol ritorik.

Korolev mening saytlarimga ta'sir qilganligini qanday aniqlash mumkin?

SEOlib-dagi pozitsiyalarni tekshirish bo'yicha vazifalar soniga ko'ra, bugungi kunda barcha veb-ustalar yangi algoritm ularning saytlari reytingiga qanday ta'sir qilganini tekshirishga shoshilishdi.

Taqdimotga ko'ra, algoritm avvalroq ishga tushirilgan va bir muncha vaqtdan beri asosiy qidiruvda ishlamoqda. Shuning uchun dinamikani oxirgi 24 soat ichida emas, balki so'nggi bir necha hafta ichida baholash kerak.

Bundan tashqari, yangi algoritmning ta'sirini faqat pozitsiyalar bo'yicha tashxislash noto'g'ri. Agar so'nggi bir necha oy ichida sizning o'rta/bas pozitsiyalaringiz pasaygan yoki sakrab ketgan bo'lsa, muammo "Qirollik"da emasligiga 99% aminman (agar sizga sabablarni topishda yordam kerak bo'lsa, bizga so'rov yuboring - biz yordam berishga harakat qiling).

Qanday tekshirish kerak? Yandeksdan past chastotali dum bo'ylab trafikingiz o'zgarganligini tekshiring (Y.Metrikada "Kalit so'zlar" - "Boshqalar" hisobotiga qarang). Agar u tushib ketgan yoki sezilarli darajada oshgan bo'lsa, unda siz "Qirollik" oqibatlarining baxtli egasisiz.

Korolev uchun matnlarni qanday optimallashtirish mumkin?

Past chastotali so'rovlar asosida trafikni yig'adigan ma'lumot mutaxassislari uchun bu savol har qachongidan ham dolzarbdir. Ammo matnlar bo'yicha aniq ko'rsatmalar ishlab chiqish yoki maqsadli tavsiyalar berish uchun juda oz vaqt o'tdi.

Hozircha faqat bitta maslahat bera olaman. Agar siz kopirayterlarning ishini bir necha oy oldin rejalashtirgan bo'lsangiz, 2-4 hafta davomida tanaffus qiling va texnik xususiyatlarni qayta ko'rib chiqishni boshlang. Konveyerni to'xtata olmaysizmi? Keyin baxtga erishish ehtimolini oshirish uchun semantikaga boy matnlarni yozing:

"Korolevning yana bir muhim xususiyati shundaki, u so'rov va sahifaning ma'nosini taqqoslashdan tashqari, sahifa tegishli bo'lgan boshqa so'rovlarning ma'nosini ham hisobga oladi." Pruflink

O'ylaymanki, yaqin kelajakda jarayonni avtomatlashtirish xizmatlari paydo bo'ladi va klasterlar davri LSI analizatorlari davri bilan almashtiriladi.

Vaqt o'tishi bilan Yandex "Malika" ning tijorat va qisqa so'rovlarga ta'sirini kengaytiradi, deb ishonishga asos bor. Ehtimol, bu xursand bo'ladigan narsadir. Axir, keyin matnni hodisalar bilan optimallashtirish zarurati va Baden-Badenni olish xavfi o'rtasida muvozanatga ehtiyoj qolmaydi. Nima bo'lishidan qat'iy nazar, hamma narsa yaxshi tomonga.

Agar sizning saytingiz Yandex yoki Google-da ishlamay qolsa va sababini aniqlay olmasangiz, biz bilan bog'laning, biz yordam berishga harakat qilamiz.

Salom, aziz blog o'quvchilari. Uzr so'raymanki, ba'zi postlar uzoq vaqt davomida nashr etiladi, lekin men bloggerlik sohasidagi bilimlarimdan foydalanib, 1,5 oy ichida birdaniga TOPga ko'tarilgan yana bir nechta loyihalarni ishga tushirdim (kimga maslahat kerak bo'lsa, shaxsiy xabarda yozing) . Men loyihalar va oilam uchun uy qurish o'rtasida yirtilgan bo'lishim kerak.

Bugun biz Yandex-dan yangi Korolev algoritmiga to'xtalib, uni avvalgilari bilan solishtirishga harakat qilamiz. Shaxsan bu mening blogimga unchalik ta'sir ko'rsatmadi, faqat foydali va hajmli maqolalar TOPda yanada yuqoriroq bo'ldi. Keling, maqoladagi hamma narsani batafsil ko'rib chiqaylik va ushbu algoritmni kuzatgandan so'ng kerakli xulosalar chiqaramiz.

Korolev Yandex algoritmi - bu nima va u qanday ishlaydi

2017-yil avgust oyi oxirida Yandex Queen-ning yangi algoritmi chiqdi. Qidiruv tizimidagi yangilanish haqidagi xabar darhol SEO mutaxassislari va ommaviy axborot vositalarida qiziqish uyg'otdi.

Korolevning asosiy xususiyati axborotni qayta ishlash tezligini oshirish va matnni semantik tahlil qilish sifatini oshirishdir.

Ma'lumotlarni qayta ishlash tezligi bir necha ming marta oshdi. Palex TOPni shakllantirish uchun 150 ta hujjatdan foydalangan. Hozir 200 000 dan ortiq maqolalar bir-biri bilan taqqoslanadi. Ushbu natijaga reyting protokolini optimallashtirish orqali erishildi.

Yangi algoritmni tushunish uchun Palexga bir qadam orqaga qaytishimiz kerak. Uning taqdimoti 2016 yil 2 noyabrda bo‘lib o‘tdi. Statistik ma'lumotlar shuni ko'rsatdiki, qidiruv iboralarining eng katta qismi yagona to'g'ri javobga moslashtirilgan past chastotali iboralar edi. Bu qism qushning uzun dumiga tushadi.

Istalgan javobni berish uchun mijoz odam kabi assotsiativ fikrlash va o'z-o'zini o'rganish qobiliyatiga ega bo'lishi kerak. Neyron tarmoqlar bunday vazifalar uchun eng mos keladi, shuning uchun ular yangi algoritmning asosiga aylandi.

"Korolev" ning asosiy maqsadi

Agar biror kishi ma'lum bir ob'ektni topmoqchi bo'lsa, u uning xususiyatlarini tasvirlashni boshlaydi, bu assotsiativ fikrlashning xususiyatlari. Agar biz videoning nomini unutgan bo'lsak, unda nima borligini aytishni boshlaymiz: "urush davridagi qizlar haqidagi film" yoki "dumi va qanotli mavjudot haqidagi film". Birinchi holda, Yandex "Va bu erda shafaqlar tinch", ikkinchi variantda biz "chimera" ni olamiz.

Yandex ko'p so'zli iboralarni taqqoslash sifatini yaxshilaydi. Dastur jumladagi har bir so'z orasidagi bog'lanishni tahlil qiladi va bir nechta javob variantlari bilan o'ziga xos assotsiatsiyani yaratadi. Xuddi inson miyasi kabi.

Nima yangiliklar?

Innovatsiyalar:

  • faqat sarlavha uchun emas, balki barcha kontent uchun semantik vektor;
  • qidiruv natijalarini yaratishda 200 000 dan ortiq maqolalarni taqqoslash;
  • sahifadagi foydalanuvchi xatti-harakatlari hisobga olinadi;
  • odamlar tizimni o'qitishga yordam beradi.

Korolev nafaqat sarlavhani, balki butun tarkibni (jumladan, fotosuratlar, videolar, jadvallar va boshqalar) tahlil qiladi va uning asosida semantik vektor tuzadi.

Asosiy yangilik qidiruv usullarini bir necha marta tezlashtirish edi. Ilgari, semantik vektor ibora qidiruv satriga kiritilgan paytda qurilgan. Ushbu usul serverlarni og'ir yukladi va javob tezligini kechiktirdi.

Qidiruv iborasini yuborganingizda, uning semantik vektori allaqachon ma'lumotlar bazasida yozilgan massiv bilan taqqoslanadi. Palex 150 ga yaqin variantni taqqosladi, ammo yangi versiyada bir vaqtning o'zida 200 000 dan ortiq maqola tahlil qilinadi. Bu kerakli javobni topish imkoniyatini oshiradi.

Yandex neyron tarmog'i: Korolev neyron tarmog'ining ishlash printsipi + misollar

Neyron tarmog'ining asosiy xususiyati o'z-o'zini o'rganish qobiliyatidir. Ish nafaqat ataylab tuzilgan formulalar bo'yicha, balki oldingi tajriba va xatolar asosida ham amalga oshiriladi.

Inson miyasi assotsiativ fikrlash qobiliyatiga ega ulkan neyron tarmoqdir va kompyuterlar neyron tarmoqlar arxitekturasini qayta yaratish orqali inson xatti-harakatlariga taqlid qilishga harakat qiladi.

Neyron tarmoq strukturasining xususiyatlari

Neyron tarmoq - bu har biri ma'lumotni saqlaydigan yoki qayta ishlaydigan yagona neyronlar to'plami. Neyronlarning har biri signallarni qabul qilish, qayta ishlash va uzatish qobiliyatiga ega. Kirish ma'lumotlar oqimi asta-sekin bir neyrondan ikkinchisiga qayta ishlanadi va oxirida kerakli natijaga erishiladi.

Sun'iy neyron tarmoqlar kiruvchi ma'lumotlarning u yoki bu versiyasi kerakli ma'lumotlarga qanchalik mos kelishini aniqlash uchun shartli og'irliklarni - 0 dan 1 gacha raqamlarni bir-biriga uzatadi. Tahlil tugagandan so'ng, eng yuqori vaznga ega bo'lgan neyron savolga javob berish uchun eng mos deb hisoblanadi.

Diagrammada neyron tarmoq tasvirlangan. Birinchi ikki qatlam ishlov berishni amalga oshiradi. Neyronlarning har biri kirish ma'lumotlarini qabul qiladigan va ishlov berilgandan so'ng kerakli javobni ishlab chiqaradigan o'ziga xos funktsiyani o'z ichiga oladi. Semantik vektorlar shunday taqqoslanadi.

Semantik vektorlar

Kompyuterlar so'zlar yoki rasmlar bilan ishlay olmaydi, shuning uchun ular ma'lumotlarni bir-biri bilan solishtirish uchun raqamlar massivlaridan foydalanadilar. Qidiruv tizimlari foydalanuvchiga kerakli narsani berish uchun matnning asosiy mavzusi va g'oyasini mustaqil ravishda aniqlashi kerak.

Savolning vektori va matni qanchalik o'xshash bo'lsa, maqola qidiruv ustuvorligida shunchalik yuqori bo'ladi. Korolev barcha tarkibni tahlil qiladi:

  • jadvallar;
  • matn;
  • fotosurat;
  • video;
  • sarlavhalar;
  • tirnoq;
  • ro'yxatlar;
  • urg'u (kursiv, qalin va boshqalar).

Ko'proq ma'lumotni konvertatsiya qilish hisobiga vektor qurilishining sifati bir necha bor ortadi.

Vektorlarni yaratish uchun neyron tarmoqdan foydalaniladi, matn neyronlar ketma-ketligidan o'tkaziladi va natijada uch yuz o'lchovli raqamlar qatori olinadi. Keyinchalik, u yagona ma'lumotlar bazasiga kiritiladi va taqqoslash uchun ishlatiladi.

Ta'lim

Neyron tarmoqlarning asosiy xususiyati o'rganish qobiliyatidir. Standart algoritmlardan farqli o'laroq, neyronlar o'zlarining oldingi tajribasini eslab qolishlari va undan o'zlari o'rganishlari mumkin. Kompyuter har safar ma'lumotni farqlashda yaxshilanmoqda.

Ilgari treninglar kompaniya xodimlari tomonidan amalga oshirilgan, ularning vazifasi millionlab so'rovlar bo'yicha harakat qilish va emissiya ustuvorliklarini o'z xohishiga ko'ra o'zgartirish edi. Keyin ishlab chiquvchilar Yandex.Toloka dasturini yaratdilar, bu oddiy vazifalar ro'yxati. Siz so'rovlardan o'tishingiz va qidiruv natijalari sifatini baholashingiz kerak. Har bir vazifa uchun ular taxminan 0,1-1 dollar to'lashadi

Yangi qidiruv algoritmi qaysi kontentni yaxshi deb hisoblaydi?

TOP qidiruv natijalari uchun eng mos maqola foydalanuvchi uchun maksimal foydali ma'lumotlarni o'z ichiga olgan va so'rovga mos keladigan maqola bo'ladi. Shuning uchun u mijozning barcha savollarini bo'lim bo'yicha qamrab olishi kerak.

Korolevda sahifadagi foydalanuvchi xatti-harakatlari ustuvorlik sifatida hisobga olinadi. Shuning uchun ma'murlarning vazifasi foydalanuvchini saqlab qolish va uni qiziqtirishga harakat qilishdir. Buning uchun tuzilgan sarlavhalar, jadvallar, ro'yxatlar, diqqatga sazovor joylar, fotosuratlar va videolardan foydalaning.

Yangi qidiruv ustuvorliklari

SEO mutaxassislari, chiqarilgandan so'ng, reyting ustuvorliklaridagi o'zgarishlarni baholash uchun tadqiqot o'tkazdilar. Muhim o'zgarishlar kuzatilmadi, ustuvorliklar saqlanib qolmoqda:

  • matn tuzilishi;
  • mavzuning to'liqligi;
  • prostata tarkibini o'qish;
  • sarlavhalarning matnning semantik mazmuniga mos kelishi;
  • semantik yadroni to'g'ri shakllantirish.

Asosiysi, tirik odamlar uchun yozish, bu ustuvorlik eng muhim bo'lib qolmoqda.

Nima uchun Yandex yangi qidiruv algoritmini ishga tushirdi va u saytlarga qanday tahdid soladi

Har qanday kompaniya o'z mahsulotlarini xizmat bozorida eng yaxshisiga aylantirishga intiladi. Bu holatda Yandexning eng katta raqibi Google hisoblanadi. Innovatsiyalar quyidagi maqsadlarda yaratilgan:

  • nostandart masalalar bo'yicha qidiruv sifatini oshirish;
  • yangi investorlarni jalb qilish;
  • reyting samaradorligini oshirish (natijalarni yaratishda 200 000 dan ortiq maqola).

Asosiy maqsad yetkazib berish sifatini oshirish edi. Bundan tashqari, investorlarga kompaniya ishi qizg‘in ketayotganini va ularning pullari o‘z maqsadiga sarflanayotganini ko‘rsatish kerak edi.Keyinchalik yangiliklar Alice ovozli yordamchisini yaratishda foydalanilgan.

Oldingi algoritmlar qatori

Yangi texnologiyalarni yaxshiroq tushunish uchun biz o'tmishga qaytishimiz kerak. Bunday holda, biz qidiruv tizimi tomonidan reyting uchun ishlatilgan oldingi algoritmlar qatorini ko'rib chiqamiz.

Avvaliga Internetda atigi bir necha ming sayt mavjud edi, ular bo'yicha kerakli maqolani topish uchun qidiruv iborasining kalit so'zlarini solishtirish kifoya edi. Keyinchalik, global tarmoq eksponent ravishda o'sdi; endi bitta mavzuda siz millionlab maqolalar bilan yuz minglab shunga o'xshash saytlarni topishingiz mumkin.

Shuning uchun reyting tizimlarini murakkablashtirish kerak edi va quyidagi qo'shimcha parametrlarni hisobga olishni boshladi:

  • havola qilingan materiallar soni;
  • tarkibning o'ziga xosligi;
  • sahifadagi mijozning xatti-harakati.

Matrixnet

2009 yilda Yandex muammoga duch keldi, chunki maqolalar foydalanuvchilarning savollariga javob bermadi. Ushbu xatoni tuzatish uchun serverni mustaqil ravishda qaror qabul qilishga va mustaqil ravishda o'rganishga o'rgatish kerak edi.

Matn qidiruv iborasiga mos kelishini aniqlash uchun ko'p parametrlarga ega murakkab matematik formula ixtiro qilindi.

Ammo quyidagi muammolar saqlanib qoldi:

  • qidiruv so'zlarga bog'liq;
  • yordamchi materiallar (fotosuratlar, videolar, tirnoq va boshqalar) hisobga olinmaydi.

Asosiy muammo shundaki, bitta sarlavhada maqolaning ma'nosini to'liq tavsiflash har doim ham mumkin emas edi. Ko'pincha maqolada aniq kalit so'zlar mavjud emas, lekin shu bilan birga u mavzuni to'liq ochib beradi va foydalanuvchining savoliga batafsil javob beradi.

Palex algoritmi

2016 yilda reyting tizimida neyron tarmoq kompyuter modelidan foydalanilgan. Ushbu yondashuvning asosiy xususiyati shundaki, kompyuter endi xatolarini eslay oladi va o'z tajribasidan o'rganadi.

Xuddi shu yili semantik vektorlar kiritildi. Maqolaning sarlavhasi neyron tarmoq orqali o'tkazildi va ko'plab vektorlarga parchalandi. Endi kompyuterlar qidiruvdagi so'zlarni emas, balki raqamlar va vektorlarning ko'p o'lchovli massivlarini solishtirdilar. Biz iboradagi ma'lum so'zlar soniga to'g'ridan-to'g'ri bog'liqlikdan voz kechib, semantik tarkibga ustunlik berishga muvaffaq bo'ldik.

Kamchiliklardan biri past tezlik muammosi bo'lib qolmoqda. Qidiruv natijalarini yaratish uchun faqat 200 ta eng mos maqola solishtirildi. Shu sababli, tizim uchun "qiz haqida film, qochib, maktabga ketadigan josus" kabi ko'p so'zli semantik iboralarni topish qiyin edi.

Yandex Korolev algoritm

Eng so'nggi innovatsiyada biz birinchi navbatda neyron tarmoqni optimallashtirdik va matnni qayta ishlash samaradorligini oshirdik. Endi vektorlar oflayn rejimda oldindan taqqoslanadi, buning natijasida qidiruv samaradorligini oshirish mumkin bo'ldi.

Yandex mustaqil ravishda foydalanuvchi qiziqishlari bo'yicha statistik ma'lumotlarni to'playdi va ulardan oldindan tayyorlangan qidiruv natijalarini yaratish uchun foydalanadi.

Optimallashtirish tufayli semantik vektor nafaqat sarlavhalar uchun, balki butun tarkib uchun tuziladi. So'zlar orasidagi maksimal semantik aloqalarni topish mumkin.

Veb-saytlarga tahdidlar

Umuman olganda, saytlar uchun hech qanday xavf yaratilmagan va konvertatsiya statistikasi unchalik o'zgarmaydi. Birinchi navbatda, yangiliklar axborot bloglari, forumlar va filmlar joylashgan saytlarga ta'sir qiladi.

Foydalanuvchining manfaatlariga javob bermaydigan veb-saytlar o'zlarining etakchi o'rinlaridan tushib ketishi mumkin. Misol uchun, sarlavha "uy qurilishi olma sharbati" dir, ammo maqolada daraxtlarni o'stirish usullari, murabbo bilan pancakes va butunlay boshqa matn muhokama qilinadi.

Repost qilishni va blog yangiliklariga obuna bo'lishni unutmang. Barcha ezgu tilaklarni tilayman.

Assalomu alaykum, Galiuin Ruslan.

Sizga maqola yoqdimi? Do'stlaringizga ulashing: