Qidiruv tizimiga ega foydalanuvchining asosiy vositasi bu. Axborot olish tizimlari

Axborot-qidiruv tizimlari bilan ishlash ( umumiy ma'lumot, ish tartibi, topilgan ma'lumotni saqlash va tahrirlash)

Axborot-qidiruv tizimi - ma'lumotni izlash va teskari tarjima qilish uchun tabiiy tildan tarjima qilish uchun ma'lumot olish qoidalarining to'plami, shuningdek, ma'lumot qidirishni amalga oshirish uchun mo'ljallangan mos keladigan mezon. Sifatida tarkibiy qismlar  ma'lum bir ma'lumot qidirish tizimi (IPS), ma'lumot olish tili, tarjima qoidalari va muvofiqlik mezonlariga qo'shimcha ravishda, uni texnik amalga oshirish vositalarini, matnlar (hujjatlar) to'plamini o'z ichiga oladi. ma'lumot qidirish, va ushbu qidiruvda bevosita ishtirok etgan odamlar.

Axborot izlash - bu so'rovda ko'rsatilgan mavzularga (mavzularga) bag'ishlangan yoki iste'molchi uchun zarur bo'lgan faktlar va ma'lumotlarni o'z ichiga olgan matnlarning (hujjatlarning) muayyan to'plamini topish jarayoni. IP axborot-qidiruv tizimi orqali amalga oshiriladi va qo'lda yoki mexanizatsiyalash yoki avtomatlashtirish yordamida amalga oshiriladi. IPning ajralmas ishtirokchisi bu shaxsdir. Berilgan ma'lumotlarning tarkibiga qarab - qidiruv tizimi (IPS) matnlari, IP hujjatli bo'lishi mumkin, bibliografik va faktik. IP ma'lumotni mantiqiy qayta ishlashdan ajralib turishi kerak, ularsiz odamga berilgan savollarga to'g'ridan-to'g'ri javob berishning iloji yo'q. IPlar topilganda - va topilishi mumkin - IPS-ga kiritilgan bunday va faqat shunday faktlar yoki ma'lumotlar. IPS-ga matnni (hujjatni) kiritishdan oldin uning asosiy semantik tarkibi aniqlanadi (mavzu yoki mavzu), u keyinchalik ma'lumot olish tillaridan biriga tarjima qilinadi va yozib qo'yiladi. Ushbu yozuv matn qidirish tasviri deb nomlanadi. Xuddi shu narsa qayd qilingan faktlar, ma'lumotlar ma'lum bir tarzda IPSga kiritilganda. Qabul qilingan so'rov, shuningdek, qidirish buyurtmasini shakllantiruvchi ma'lumot olish tiliga tarjima qilinadi. Matnlarning qidirish rasmlari va qidirish yo'riqnomalari bitta tilda yozilganligi sababli iboralar faqat bitta talqinni amalga oshirishga imkon beradi, shuning uchun ularni mazmunan sinchkovlik bilan qiyoslash mumkin emas. Buning uchun qidiruv tasvirining rasmiy qidiruv retsepti bilan rasmiy so'rovi ma'lumot so'roviga javob sifatida ko'rib chiqilishi va berilishi kerakligi aniqlanadigan muayyan qoidalar (mos keladigan mezonlar) o'rnatiladi.

IP ning texnik samaradorligi ikkita nisbiy ko'rsatkich bilan tavsiflanadi - aniqlik koeffitsienti (ma'lumot so'roviga javob beradigan matnlar sonining ushbu nashrdagi matnlarning umumiy soniga nisbati) va to'liqlik koeffitsienti (ma'lumot so'roviga javob beradigan matnlar sonining nisbati, ushbu tarkibdagi bunday matnlarning umumiy soniga nisbati). IPS). Ushbu ko'rsatkichlarning talab qilinadigan qiymatlari axborotga bo'lgan ehtiyojning o'ziga xos xususiyatlariga bog'liq. Masalan, patentga berilgan talabnomani yangilik uchun ko'rib chiqish uchun patent tavsiflarini qidirishda 100% to'liqlik talab etiladi; oddiy tadqiqotchi yoki muhandisni qidirishda, taxminan 80% aniqlik juda yaxshi, to'liqligi 50% ga teng.

1-rasm - Qidiruv jarayoni

IP ikki xil bo'lishi mumkin - ma'lumotni tanlab (yoki maqsadli) tarqatish va retrospektiv qidiruv. Ma'lumotni tanlab tarqatishda IP ma'lum miqdordagi iste'molchilarning (obunachilarning) doimiy iltimosiga binoan amalga oshiriladi, vaqti-vaqti bilan (odatda haftada bir marta yoki ikki haftada) amalga oshiriladi va faqat shu vaqt oralig'ida IPS tomonidan qabul qilingan matnlar qatorida amalga oshiriladi.

IPS va iste'molchilar (obunachilar) o'rtasida samarali aloqa o'rnatiladi (abonent ushbu matn so'rovga qanchalik mos kelishini va uning to'liq matni nusxasini olish kerakligini, ushbu matn uning ma'lumot ehtiyojlariga qanchalik mos kelishini ma'lum qiladi), bu bizga abonentlarning ehtiyojlarini aniqlashtirishga va o'z vaqtida javob berishga imkon beradi. ushbu ehtiyojlarni o'zgartiring va tizim ishini optimallashtiring.

Retrospektiv qidiruvda IPS bir martalik so'rovlar uchun barcha to'plangan to'plamdagi kerakli ma'lumotlarni o'z ichiga olgan matnlarni qidiradi.

Zamonaviy WWW ma'lumotlarini qidirish tizimlarining arxitekturasi.

Bunday tizimning odatiy sxemasini ko'rib chiqing. Muayyan tizimlarga bag'ishlangan turli xil nashrlarda bir-biridan farq qiluvchi sxemalar faqat o'ziga xoslikni qo'llashda berilgan dasturiy echimlar, lekin tizimning turli qismlarini tashkil etish printsipi emas. Shuning uchun biz ushbu sxemani keltirilgan misoldan foydalanib ko'rib chiqamiz:

2-rasm - Internet uchun IPS tuzilishi

Ushbu diagrammada quyidagilar ko'rsatilgan:

mijoz - bu ma'lum bir ma'lumot manbasini ko'rish uchun mo'ljallangan dastur. Hozirgi kunda Netscape Navigator kabi eng mashhur multiprotokol dasturlari. Ushbu dastur World Wide Web, Gopher, Wais hujjatlarini, FTP arxivlarini, elektron pochta ro'yxatlarini va Usenet yangiliklar guruhlarini ko'rishni ta'minlaydi. O'z navbatida bularning barchasi axborot manbalari  axborot qidirish tizimini qidirish mavzusi.

foydalanuvchi interfeysi - foydalanuvchi interfeysi shunchaki tomoshabin emas. Axborot olish tizimida bu ibora, shuningdek, foydalanuvchi tizimning qidirish mexanizmi bilan qanday aloqa qilishini anglatadi. so'rovlarni yaratish va qidiruv natijalarini ko'rish uchun tizim bilan. Qidiruv natijalarini va tarmoqdagi axborot manbalarini ko'rish butunlay boshqa narsalar bo'lib, ular haqida biroz keyinroq to'xtalamiz.

qidirish mexanizmi - qidirish mexanizmi foydalanuvchining so'rovini ma'lumot olish tilida (IPN) tizimning rasmiy so'roviga tarjima qilish, veb-ma'lumot manbalariga havolalarni qidirish va ushbu qidiruv natijalarini foydalanuvchiga qaytarish uchun ishlatiladi.

indeksli ma'lumotlar bazasi - indeks bu ma'lumot olish tizimining asosiy ma'lumotlar to'plami. Bu axborot manzili manzilini qidirishga xizmat qiladi. Indeksning arxitekturasi shunday izlashadiki, izlash imkon qadar tez amalga oshiriladi va shu bilan har bir topilgan tarmoq resurslarining qiymatini baholash mumkin bo'ladi.

so'rovlar - foydalanuvchining so'rovlari uning shaxsiy ma'lumotlar bazasida saqlanadi. Har bir so'rovni tuzatish ko'p vaqt talab etadi va shuning uchun tizim yaxshi javob beradigan so'rovlarni saqlash juda muhimdir.

indeksli robot - indeksli robot Internetni skanerlash va indekslar bazasini yangilash uchun ishlatiladi. Ushbu dastur tarmoqdagi axborot resurslarining holati to'g'risida asosiy ma'lumot manbai hisoblanadi.

www saytlari - bu butun Internet. Va aniqroq, bu dasturlarni ko'rish orqali ko'rish uchun taqdim etiladigan axborot manbalari.

Qidiruv motorlar odatda uchta tarkibiy qismdan iborat:

1. Internet bo'ylab harakatlanadigan va ma'lumot to'playdigan agent (o'rgimchak yoki o'rgimchak);

2. o'rgimchaklar tomonidan to'plangan barcha ma'lumotlarni o'z ichiga olgan ma'lumotlar bazasi;

3. Ma'lumotlar bazasi bilan o'zaro ishlash uchun odamlar interfeys sifatida foydalanadigan qidiruv tizimi.

Rossiya Federatsiyasi Ta'lim vazirligi.

Adygea davlat universiteti

Kurs.

"Avtomatlashtirilgan axborot-qidiruv tizimlari" mavzusida.

Bajarildi

guruh talabasi

Tekshirildi

  Kirish ……………………………………

1. Axborot tizimlari

Tushunchasi axborot tizimlari………………………………………4

Axborot tizimlarining tarkibi ................. 4

Axborot tizimlarini tasniflash ………………………………………………………………………………………………………………………………………………………… .6

2. Axborot qidirish tizimlari ................. 7

Qidiruv tizimlarini rivojlantirishning tarixiy shartlari ... 7

Qidiruv motorlar tushunchasi ……………………………………………………………………………… ...…

Qidiruv tizimlarining xususiyatlari ............... 10

· tarmoqning tuzilishi …………………………………………………………………………………………………………………………………………… .. 11

· qidiruv tizimlarining tuzilishi ................. 13

3. Qidiruv tizimlarining xususiyatlari ................. 17

4. qidiruv tizimlarining muammolari va imkoniyatlari ......... 24

Xulosa ………………………………………………………………………… .25

Foydalanilgan adabiyotlar …………………………………………………………………………………………………… 26

KIRISh

Sivilizatsiya rivojlanishining hozirgi bosqichi insoniyatning eng rivojlangan qismining undan o'tish davri bilan tavsiflanadi sanoat jamiyati  axborotga. Ushbu jarayonning eng yorqin hodisalaridan biri global axborot kompyuter tarmog'ining paydo bo'lishi va rivojlanishi.

Bunda kurs ishi  deb hisoblanadi nazariy asoslari  axborot izlash tizimlari turlari, tasnifi va turlari. Hozirda foydalanilgan ma'lumotlar bo'yicha materiallar - qidirish katalogi  to'liq matnli va gipermatnli qidiruv tizimlari.

Internet paydo bo'lishi bilan qidirish muammosi yanada dolzarb bo'lib qoldi. Internet - butun dunyo bo'ylab kompyuter tarmog'i, bu yagona axborot muhiti bo'lib, har qanday vaqtda ma'lumot olish imkoniyatini beradi. Ammo boshqa tomondan, Internetda juda ko'p foydali ma'lumotlar saqlanadi, ammo uni topish uchun ko'p vaqt kerak bo'ladi. Bu muammo o'z-o'zidan paydo bo'ldi qidiruv tizimlari. Ushbu kursda ishlash Internetda qidirish mexanizmlari ko'rib chiqiladi.

AXBOROT TIZIMLARI

Axborot tizimlari haqida tushuncha

Axborot tizimi deganda dasturiy, apparat va boshqa yordamchi vositalarning uyushgan to'plami tushuniladi, texnologik jarayonlar  ma'lum bir sohada axborot manbalarini to'plash, taqdim etish va to'plashni, foydalanuvchilarning axborot ehtiyojlarini qondirish uchun zarur bo'lgan ma'lumotlarni qidirish va etkazib berishni ta'minlaydigan va funktsional ravishda aniqlangan ishchilar guruhlari. Axborot tizimlari muammolarni hal qilishning asosiy vositalari, vositalaridir axborot ta'minoti  turli xil tadbirlar va axborot texnologiyalari sanoatida eng tez rivojlanayotgan sanoat.

Axborot tizimining tuzilishi

Axborot tizimini uchta quyi tizimga bo'lish mumkin:

1. Axborot yig'ishning tashkiliy va texnologik quyi tizimi axborot tizimini ta'minlaydi va axborot manbalari to'plamini, tizimda to'planish uchun ma'lumotlarni tanlashning tashkiliy va texnologik zanjirini o'z ichiga oladi. Axborot yig'ishning to'g'ri tashkil etilgan quyi tizimisiz, umuman, butun axborot tizimining samarali ishlashini tashkil etish mumkin emas.

2. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimining yadrosi bo'lib, ishlab chiquvchilar va obunachilar tomonidan tizimning tuzilishi va rasmlari, ular to'g'risida axborot tizimida aks ettirilishi kerak bo'lgan taqdimotning aksidir. Axborotni taqdim etish va qayta ishlashning quyi tizimi - bu axborot tizimini rivojlantirishning eng murakkab tarkibiy qismlaridan biri.

3. Normativ - funktsional quyi tizim  axborot berish foydalanuvchilarni yoki boshqa tarzda tizimning abonentlarini aniqlaydi, axborot tizimining vazifalarini belgilash va bajarish maqsadli yo'nalishini amalga oshiradi.

Barcha qidiruv tizimlarining asosini ma'lumotlar bazalari tashkil etadi - amaliy dasturlardan qat'i nazar ma'lumotlarni tavsiflash, saqlash va boshqarishning umumiy tamoyillarini ta'minlaydigan cheklangan qoidalarga muvofiq tashkil etilgan ma'lumotlar to'plami.

Axborot tizimlari faoliyatining quyidagi elementlarini ajratib ko'rsatish mumkin:

* Axborot to'plash - bu maxsus tartibda tashkil etilgan ma'lumotlarni to'plash va namoyish qilish jarayoni:

ma'lumot olish

ma'lumotlarning ahamiyatini baholash

ma'lumotlarni tanlash va yozib olish tartibi.

* Sotib olish - ko'p qismlardan ma'lumotlarni bir butunga qo'shish va foydalanuvchiga etkazish jarayoni.

* Axborotni qidirish va etkazib berish - axborot tizimi abonentlarining boshqaruv faoliyati va texnologik jarayonlarga bo'lgan axborot ehtiyojlarini qondirish uchun maxsus texnologik buyurtmani o'rnatish.

* Axborotning yaxlitligini va saqlanishini ta'minlash - endi ahamiyatsiz bo'lgan axborotni qayta ko'rib chiqish, qayta ko'rib chiqish va skrining qilish ajralmas vazifadir axborot birliklari. Axborotning xavfsizligi normativ va yo'riqnomaviy hujjatlar yordamida amalga oshiriladi.

Axborot tizimlarining tasnifi

Ta'minot tabiati bo'yicha mantiqiy tashkilot  Saqlanadigan ma'lumotlar faktik, hujjatli va geografik ma'lumotlarga bo'linadi.

Faktografik ma'lumotlar bir yoki bir nechta turlarning ko'p nusxalari sifatida yig'iladi va saqlanadi. tarkibiy elementlar. Ushbu tarkibiy elementlarning har bir misoli yoki ularning kombinatsiyasi voqea yoki hodisa to'g'risidagi ma'lumotlarni aks ettiradi. Har bir turdagi axborot ob'ektining tuzilishi ushbu ob'ekt sohasi ob'ektlari uchun ma'lumotlarning asosiy jihatlari va xususiyatlarini aks ettiruvchi cheklangan tafsilotlardan iborat.

Hujjatli filmda ma'lumotlarning yagona elementi kichikroq elementlarga bo'linmaydigan hujjat bo'lib, qoida tariqasida kiritilgan ma'lumotlar tuzilmaydi yoki cheklangan shaklda tuzilmaydi. Kirish hujjati uchun ba'zi rasmiylashtirilgan pozitsiyalar belgilanishi mumkin - ishlab chiqarilgan sana, rassom, mavzu. Hujjatli axborot tizimlarining ayrim turlari kirish hujjatlarining mantiqiy aloqasini - semantik tarkibni bo'ysunishini ta'minlaydi.

Geografik ma'lumotlarda ma'lumotlar umumiy elektron topografik bazaga bog'langan alohida ma'lumot ob'ektlari shaklida tashkil etiladi. Geografik axborot tizimlari ulardan axborot ta'minoti uchun foydalaniladi mavzu sohalari, geografik tarkibiy qism mavjud bo'lgan axborot ob'ektlari va jarayonlarining tuzilishi.

Qidiruv tizimlarini tasniflashning yana bir mezoni bu bajarilishi kerak bo'lgan vazifalar yoki vazifalardir.

Ma'lumotlar ma'lumot tizimlari funktsiyalarining eng keng tarqalgan turidir va tizim obunachilariga ob'ektlarning ayrim sinflariga o'rnatish ma'lumotlarini olish imkoniyatini beradi.

Qidiruv motorlar axborot tizimlarining eng keng tarqalgan sinfidir. Umuman olganda, ko'rinish ma'lumot nuqtai nazaridan aniqlanadigan axborot maydonining bir turi sifatida ko'rib chiqilishi mumkin - mavzu sohasining mantiqiy tavsifi.

Hisoblash turli xil maqsadlar uchun ma'lum hisoblash algoritmlari bo'yicha tizimdagi ma'lumotlarni qayta ishlashdan iborat.

Axborot tizimlarining texnologik funktsiyalari butun texnologik tsiklni yoki uning alohida tarkibiy qismlarini, ishlab chiqarish yoki tashkiliy tuzilishini avtomatlashtirishdan iborat.

Axborot izlash tizimlari

Qidiruv tizimlarini rivojlantirishning tarixiy asoslari.

Keling, Internetning paydo bo'lishi tarixiga murojaat qilaylik, bu turli xil kompyuter tizimlari o'rtasida taqsimlangan axborot manbalarini almashish zarurati bilan bog'liq edi. FTP va elektron pochtani o'z ichiga olgan dastlabki dasturlarning aksariyati faqat Internet-xost kompyuterlari o'rtasida ma'lumot almashish uchun ishlab chiqilgan.

Telnet kabi boshqa dasturlar foydalanuvchi nafaqat ma'lumotlarga, balki masofadan tizimning ishchi resurslariga ham kira oladigan qilib yaratilgan. Internet rivojlanishi bilan (foydalanuvchilar soni va kompyuterlarning ko'payishi) ma'lumotlar almashishning oldingi usullari foydalanuvchilarning ortib borayotgan ehtiyojlarini qondirishni to'xtatdi. Tarmoq manbalarini qidirish va ularga kirishning yangi usullarini ishlab chiqish zarurati paydo bo'ldi, bu esa ularning formati va joylashuvidan qat'iy nazar ma'lumotlardan foydalanishga imkon beradi.

Ushbu ehtiyojlarni qondirish uchun birinchi marta Archie qidiruvi yaratildi, muammoni hal qilish  FTP serverida va Gopher tizimida resurslarni lokalizatsiya qilish, bu turli xillarga kirishni soddalashtiradi tarmoq manbalari. Keyin tarmoq haqida ma'lumot wWW tizimlari  ma'lumot olishning mutlaqo yangi usullarini taklif etuvchi WAIS. Ushbu tizimlarning ishlash printsiplari Internetning o'zi ishlash mexanizmlarini ta'minlamasdan juda katta miqdordagi axborot resurslaridan foydalanishni osonlashtiradi. Ushbu yondashuv nafaqat o'zaro bog'liq manbalar haqida gapirishga imkon beradi kompyuter tizimlari, lekin tarmoqning maxsus axborot joylari haqida.

Tizim Archie  murakkab hisoblanadi dasturiy vositalarmaxsus ma'lumotlar bazalari bilan ishlash. Ushbu ma'lumotlar bazalarida FTP xizmati orqali kirish mumkin bo'lgan fayllar haqidagi doimiy ravishda yangilanadigan ma'lumotlar mavjud. Archie tizimining xizmatlaridan foydalanib, siz fayl nomini shablon bo'yicha qidirishingiz mumkin. Bunday holda, foydalanuvchi tarmoqda qaerda saqlanganligi aniq ko'rsatilgan fayllar ro'yxatini, shuningdek, turi, yaratilish vaqti va fayl hajmi haqida ma'lumot oladi. Archie ma'lumotlarini qidirish tizimiga kirish turli xil usullarda, elektron pochta orqali yuborilgan so'rovlardan tortib, Telnet xizmatidan foydalanib, grafik Archie mijozlaridan foydalanishgacha amalga oshiriladi.

Tizim Gopher   FTP Internet-resurslarini lokalizatsiya qilish jarayonini soddalashtirish va FTP serverlarida saqlanadigan fayllar tarkibi to'g'risidagi ma'lumotlarni yanada qulayroq taqdim etish uchun ishlab chiqilgan. Gopher tizimi qulay shaklda (menyu shaklida) foydalanuvchilarga mavjud fayllar va ularning tarkiblari haqida ma'lumot berish imkoniyatini beradi. Gopher-server menyularida boshqa Gopher va FTP-serverlarga havolalar bo'lishi mumkin. Shunday qilib, foydalanuvchi Internetda "sayohat qilish" imkoniyatiga ega bo'ladi, unga qiziqqan manbalarning joylashishiga e'tibor bermaydi va ushbu manbalarga kirish huquqiga ega bo'ladi.

Tizim Veronika   Gopher maydonida menyu elementlari sarlavhalari bo'yicha ma'lumot qidirishda foydalaniladi. Kalit so'zni kiritgandan so'ng, Veronika tizimi uning biron bir Gopher serveridagi menyuda paydo bo'lganligini aniqlaydi va qidiruv natijasi sifatida kalit so'zni o'z ichiga olgan menyu elementlarining sarlavhalari ro'yxatini ko'rsatadi. Veronika mustaqil tizim emasligi sababli qidirish dasturi, lekin Gopher tizimi bilan chambarchas bog'liq, u Gopher tizimi bilan bir xil kamchilikka ega: ma'lum bir ma'lumot manbasi nima degani har doim ham noma'lum. Tizimning afzalliklari shundaki, ma'lumot qaerda joylashganligini aniqlashning hojati yo'q, shunchaki ro'yxatdan kerakli yozuvni tanlang.

Axborot izlash mexanizmlari haqida tushuncha.

Avtomatlashtirilgan qidirish tizimi - bu belgilangan funktsiyalarni bajarish uchun axborot texnologiyalarini amalga oshiradigan xodimlardan va uning faoliyatidagi avtomatlashtirish vositalaridan iborat tizim.

Faoliyatning turli sohalarida tizimlarni yaratish tajribasi va amaliyoti bizga ularning mohiyatining barcha tomonlarini to'liq aks ettiradigan kengroq va universal ta'rif berishga imkon beradi.

Kelgusida axborot tizimi deganda ma'lum bir sohada axborot resurslarini to'plash, taqdim etish va to'plashni, kerakli ma'lumotlarni qidirish va etkazib berishni ta'minlaydigan dasturiy, texnikaviy va boshqa yordamchi vositalarning, texnologik jarayonlarning va funktsional jihatdan aniqlangan ishchilar guruhlarining tushunarli tashkil etilishi tushuniladi. foydalanuvchilar - tizim abonentlari kontingenti.

Qidiruv tizimlarining xususiyatlari.

Ishda qidirish jarayoni to'rt bosqichda taqdim etiladi: so'zlar (qidirish boshlanishidan oldin sodir bo'ladi); harakat (qidirishni boshlash); natijalarni ko'rib chiqish (foydalanuvchi qidiruvdan keyin ko'rgan natija); va takomillashtirish (natijalarni ko'rib chiqqandan keyin va xuddi shu ehtiyojni boshqa shakllantirish bilan qidiruvga qaytishdan oldin). Ma'lumotni izlashning qulayroq sxemasi quyidagi bosqichlardan iborat:

1. Axborotga bo'lgan ehtiyojni tabiiy tilda hal qilish;

2. Tanlash qidirish xizmatlari  ma'lum bir ma'lumot olish tillarida (IPN) yozuvlarga bo'lgan ehtiyojni rasmiylashtirish tarmoqlari va rasmiylashtirish;

3. Yaratilgan so'rovlarni bajarish;

4. Hujjatlarga havolalar ro'yxatini oldindan qayta ishlash;

5. Talab qilingan hujjatlar uchun tanlangan manzillarga murojaat qilish;

6. Topilgan hujjatlar tarkibini oldindan ko'rib chiqish;

7. Keyingi o'qish uchun tegishli hujjatlarni saqlash;

8. So'rovni kengaytirish uchun tegishli hujjatlardan havolalarni olish;

9. Saqlangan hujjatlarning butun qatorini o'rganish;

10. Agar ma'lumotga bo'lgan ehtiyoj to'liq qondirilmasa, unda birinchi bosqichga qayting.

Qidiruv jarayoni juda chuqur didaktik tomonga ega - aniqlanganki, interfaol axborot tizimlaridan foydalanish, odatda, eng taniqli olimlarga xos bo'lgan axborot-qidiruv faoliyati uslubining oddiy foydalanuvchilarini shakllantirishga olib keladi.

Aksariyat hollarda ma'lumotlarga ehtiyoj har qanday narsani o'rgangandan so'ng paydo bo'ladi yangi ma'lumotlarfoydalanuvchi tomonidan qabul qilingan. Ko'pincha, foydalanuvchi kerakli mavzudagi hujjatlar to'plamiga ega bo'lgan holatlar mavjud. Ushbu hujjatlarni avtomatlashtirilgan kompilyatsiya qilish uchun ishlatish taklif etiladi. qidiruv so'rovi  yordamida ixtisoslashtirilgan tizim  hujjat aylanishi (COD) (tizim ishlab chiqilmoqda).

Tizim barcha foydalanuvchilar hujjatlarini indekslashi kerak. Indekslash jarayonida hujjatlar tarkibidagi barcha so'zlar quyidagi semantik sinflarga bo'linadi: to'xtatish so'zlari; kundalik (og'zaki) tilning eng tez-tez uchraydigan so'zlari; umumiy madaniy terminologiya; umumiy ilmiy terminologiya; tizimga ma'lum bo'lgan domen atamalari; noma'lum so'zlar. Bo'lim tegishli lug'atlarga asoslangan bo'lib, ular bo'lishi kerak ajralmas qismi  tizimi. Noma'lum so'zlar, asosan, mavzu sohasidagi maxsus so'zlarga tegishli bo'ladi. Xatolarni o'z ichiga olgan yangi shakllangan atamalar va so'zlar ham u erga etib boradi.

Indeks asosida hujjatlarning vektorli ko'rinishi tuziladi, shundan so'ng COURT ko'p hujjatlarni ierarxik ravishda taqsimlaydi va natijada ushbu to'plamlar tematik guruhlarga bo'linadi. Foydalanuvchi bilan muloqot paytida bir yoki bir nechta tegishli hujjatlar to'plami tanlanadi va qidiruv jarayonining xususiyatlari belgilanadi.

Qidiruv so'rovi tanlangan klasterning centroid vektoriga asoslanishi kerak. Optimal so'rov hajmi 8-12 dan 25-30 gacha. COURT tomonidan amalga oshirilgan oxirgi tayyorgarlik ishi - IPN uchun so'rovni yozib olish.

Tarmoq tuzilishi.

Ma'lumki, Internetda ma'lumot qidirishni kengaytirishning eng oson usuli metasayzer tizimlarida qo'llaniladi va ishlatilgan birlamchi IPS sonini ko'paytirishdan iborat. Ushbu mexanizm har qanday rivojlangan tizimda amalga oshirilishi kerak. Qidiruv mexanizmi resurslarini global tarmoqning turli xil IPS-larida tarqatish vazifasi, avvalgi qidiruv seanslari davomida tegishli deb tan olingan ulanishlar foiziga qarab, moslashuvchan ravishda hal qilinishi kerak.

Avtomatlashtirilgan qidirish tizimining ikkinchi bloki yaratilgan so'rovni yuboradi va olingan havolalarni saralaydi va saralaydi, shundan so'ng tanlangan manzillar bilan aloqa qiladi va tarmoqdan giperhavola berilgan hujjatlarni to'plamini oladi.

Tadqiqot global tarmoq tarkibidagi tartibsizlik va ulanishlarning tuzilmasi yo'qligi haqidagi keng tarqalgan fikr xato ekanligini ko'rsatdi. "Hamjamiyatlar" ning mavjudligi aniqlandi - o'xshash mavzularga ega materiallarni o'z ichiga olgan saytlar yaxshi bog'langan guruhlar. "Markaziy" sahifalar yoritilgan bo'lib, unda ulanishlarning katta ro'yxati va ko'plab havolalar olib boradigan sahifalar - "vakolatli" sahifalar mavjud. Shunday qilib, qidiruvning 8-bosqichining maqsadi bunday guruhlarni aniqlash va ularning a'zolari orasida eng "vakolatli" guruhlarni aniqlashdir. Ko'rsatilganidek, ushbu muammoni hal qilish algoritmi juda oddiy.

Qidiruv natijalarini qayta ishlash.

Tarmoqda qidirish natijasida ma'lum hujjatlar to'plamini olgandan so'ng, ular orasida eng muhimlarini ajratib ko'rsatish kerak. "Hamjamiyatlar" ning mavjudligi bu vazifani osonlashtirmaydi. Eng keng tarqalgan vaziyatlarning quyidagi bir nechta sinflarini ajratish mumkin.

1. O'rganilayotgan tarmoq segmentida kerakli ma'lumotlarning etishmasligi. Shunga o'xshash vaziyat tasvirlangan. Bunday holda, biz boshqa segmentga o'tishimiz kerak, ya'ni odatda boshqa tillarda yaratilgan manbalarni o'rganishimiz kerak.

2. Topilgan "hamjamiyatlar" kerakli mavzu bo'yicha ma'lumotlarni o'z ichiga olmaydi, lekin asosan kerakli mavzusiga yaqin bo'lgan boshqa odamlar to'g'risida.

3. Juda ko'p ma'lumot manbalari aniqlandi.

So'nggi ikki holatda, topilgan barcha hujjatlarni avtomatik ravishda qidirish va dastlabki so'rovga yaqinlik darajasini aniqlash kerak. Hujjatlarni vektor ko'rinishida taqqoslash uchun mos bo'lgan 20 dan ortiq metrik yaqinlik o'lchovlari ko'rib chiqilgan. Tartibga solish muammosining maqbul echimiga agentlarga asoslangan yondashuv asosida tizimni qo'llash orqali erishiladi.

Yangi sohada izlashning ko'p holatlarida, foydalanuvchining umumiy darajasi etarlicha yuqori bo'lmaganda, material bilan dastlabki tanishish ommabop va ommabop ilmiy matnlardan foydalangan holda paydo bo'lishi uchun matnning uslubi bilan ko'rsatilgan ma'lumotlarni filtrlash maqsadga muvofiqdir.

Ko'rib chiqilayotgan materiallar hajmini kamaytirish uchun qidiruv natijalarini manbalar turlari bo'yicha filtrlash kerak. Shunday qilib, ilmiy saytlarda, tijorat yoki media-serverlarda joylashgan hujjatlar tabiatda sezilarli darajada farq qilishi aniq.

Qidiruv tizimlarining tuzilishi.

Qidiruv ko'rsatgichi uch bosqichda ishlaydi, ulardan dastlabki ikkitasi tayyor va foydalanuvchiga ko'rinmas. Avval qidiruv indeksi ma'lumotni yig'adi Dunyo Keng Internet .   Ushbu foydalanish uchun maxsus dasturlar, o'xshash brauzerlar. Ular ushbu veb-sahifani qidiruv tizimining serveriga nusxalashlari, ko'rib chiqishlari, ulardagi resurslarga ega bo'lgan barcha giperhavolalarni topishlari, ulardagi giperhavola va boshqalarni topishlari mumkin. Bunday dasturlar deyiladi qurtlar, o'rgimchaklar, tırtıllar, o'rmalagichlar, o'rgimchaklar  va shunga o'xshash boshqa nomlar. "Buning uchun har bir qidiruv indekslari o'zining o'ziga xos dasturidan foydalanadi, uni ko'pincha o'zi ishlab chiqadi. Ko'pgina zamonaviy qidiruv tizimlari Internetni kuzatadigan avtomatik dasturlarni ishlab chiqish va amalga oshirish bilan bog'liq eksperimental loyihalardan kelib chiqqan. Nazariy jihatdan, muvaffaqiyatli login bilan. o'rgimchak  u butun veb-makonni bitta sho'ng'in ichida bosib o'tishga qodir, ammo ko'p vaqt talab etiladi va u erda sodir bo'lgan o'zgarishlarni kuzatib borish va "o'lik" aloqalarni aniqlash uchun vaqti-vaqti bilan avval tashrif buyurilgan manbalarga qaytishi kerak, ya'ni ular o'z ahamiyatini yo'qotdi.

Izlangan veb-resurslarni qidiruv tizimining serveriga nusxalashdan so'ng, ishning ikkinchi bosqichi boshlanadi - indekslash. Indekslash paytida maxsus ma'lumotlar bazalari yaratiladi, ularning yordami bilan Internetda ma'lum bir so'zni qaerda va qachon topilganligini aniqlash mumkin. Indekslangan ma'lumotlar bazasini lug'atning bir turini ko'rib chiqing. Bu qidiruv tizimi foydalanuvchi so'rovlariga juda tez javob berishi uchun zarur. Zamonaviy tizimlar bir soniya kasrlarida javob berishga qodir, ammo agar siz indekslarni oldindan tayyorlamasangiz, bitta so'rovni qayta ishlash soatlab davom etadi.

Uchinchi bosqichda mijozning so'rovi ko'rib chiqiladi va qidiruv natijalari unga havolalar ro'yxati shaklida qaytariladi. Aytaylik, mijoz Internetda mashhur gollandiyalik mexanik, optik va matematik Kristian Gyuygensni eslaydigan veb-sahifalar mavjudligini bilishni xohlaydi. U Gyuygens so'zini terish maydoniga kiritadi. kalit so'zlar  va tugmachani bosadi. Toping Indeksli ma'lumotlar bazasiga asoslanib, qidiruv mexanizmi qisqa vaqt ichida mos veb-resurslarni qidiradi va natijalar sahifasini yaratadi, ularga tavsiyalar giperhavolalar ko'rinishida taqdim etiladi. Bundan tashqari, mijoz ushbu havolalarni unga qiziqqan manbalarga murojaat qilish uchun ishlatishi mumkin.

Bularning barchasi juda oddiy ko'rinadi, ammo aslida muammolar mavjud. Asosiy muammo zamonaviy internet veb-sahifalarning ko'pligi bilan bog'liq. Qidiruv maydoniga bunday oddiy so'zni kiritish kifoya qiladi, masalan, futbol va rus qidiruv tizimi ko'rsatilgan sahifada ularni 10-20 qismga guruhlab, bir necha ming havolalarni beradi.

Bir necha ming - bu unchalik ko'p emas, chunki shunga o'xshash vaziyatda xorijiy qidiruv tizimi yuz minglab havolalarni beradi. Ularning orasidan to'g'ri topishga harakat qiling! Biroq, o'rtacha iste'molchi uchun barchasi bir xil, ular unga minglab qidiruv natijalarini yoki millionlarni berishadi. Odatda, mijozlar 50 tadan ortiq bo'lmagan havolalarni ko'rib chiqadilar, ular birinchisidir va bundan keyin nima sodir bo'ladi, kam odamlar tashvishlanadilar. Biroq, mijozlar sifatdan juda tashvishlanmoqdalar eng birinchi  havolalar. Mijozlar birinchi o'ntalikka aloqadorligini yo'qotgan havolalar yoqmaydilar va ketma-ket bitta serverning qo'shni fayllariga havolalar mavjud bo'lganda bezovta bo'ladilar. Eng yomon variant, bitta manbaga olib keladigan, ammo turli xil serverlarda joylashgan qatorlarda bir nechta havolalar mavjud bo'lganda.

Mijoz eng foydali havolalar birinchi bo'lishini kutish huquqiga ega. Muammo shu erda paydo bo'ladi. Bir kishi foydali manbani befoyda manbadan osongina ajratib turadi, ammo buni dasturga qanday tushuntirish kerak ?! Shuning uchun, eng yaxshi qidiruv tizimlari o'zlarining manbalari sifati bo'yicha topilgan havolalarni saralash uchun sun'iy intellektning mo''jizalarini namoyish etadilar. Va ular buni tezda qilishlari kerak - mijoz kutishni yoqtirmaydi.

Qat'iy aytganda, barcha qidirish mexanizmlari bir xil veb-makondan manba ma'lumotlarini jalb qiladilar, shuning uchun ularning manbalari ma'lumotlar bazalari nisbatan o'xshash bo'lishi mumkin. Va faqat uchinchi bosqichda, qidiruv natijalarini chiqarishda, har bir qidiruv tizimi o'zining eng yaxshi (yoki yomon) xususiyatlarini ko'rsatishni boshlaydi. Natijalarni saralash operatsiyasi tartib deb nomlanadi.  Tizim har bir topilgan veb-sahifaga materialning sifatini aks ettirishi kerak bo'lgan reytingni tayinlaydi. Ammo sifat sub'ektiv tushunchadir va dastur taqqoslash uchun mos keladigan raqamlar bilan ifodalanishi mumkin bo'lgan ob'ektiv mezonlarga muhtoj.

So'rovda ishlatiladigan kalit so'z sarlavhaga kiritilgan veb-sahifalarga yuqori reyting beriladi. Agar ushbu so'z veb-sahifada bir necha bor paydo bo'lsa, lekin unchalik emas bo'lsa, reyting darajasi oshadi. Kirish tartibiga ijobiy ta'sir qiladi to'g'ri so'z matnning birinchi 5-6 xatboshilarida - ular indekslashda eng muhim hisoblanadi. Shu sababli, tajribali veb-ustalar o'z sahifalarining yuqori qismida jadvallar berishdan qochishadi. Qidiruv mexanizmi uchun jadvaldagi har bir katak paragrafga o'xshaydi va shuning uchun informatsion tana matni uzoqroqqa siljiydi (garchi bu ekranda sezilmaydi) va qidiruv tizimi uchun hal qiluvchi rol o'ynashni to'xtatadi.

Agar so'rovda ishlatiladigan kalit so'zlar rasmlarga ilova qilingan muqobil matnga kiritilgan bo'lsa, bu juda yaxshi. Qidiruv mexanizmi uchun bu sahifa ushbu so'rovga to'liq mos kelishini aniq belgisi. Veb-sahifa sifatining yana bir belgisi shundaki, u boshqa veb-sahifadan unga havolalar mavjud. Ularning soni qancha ko'p bo'lsa, shuncha yaxshi. Shunday qilib, ushbu veb-sahifa mashhur va yuqori ko'rsatkichga ega iqtibos indeksi.  Eng ilg'or qidiruv tizimlari ro'yxatga olingan veb-sahifalarning iqtibos darajasini kuzatadilar va reytingda hisobga oladilar.

Veb-sahifa yaratuvchilari doimo ko'proq odamlarni ko'rishga qiziqishadi, shuning uchun qidiruv tizimlari ularga yuqori reyting berishlari uchun sahifalarni maxsus tayyorlaydilar. Veb-masterning yaxshi, malakali ishi veb-sahifaga tashrif buyuruvchilar sonini sezilarli darajada oshirishi mumkin, ammo qidiruv tizimlarini aldashga harakat qiladigan va o'zlarining veb-sahifalariga aslida mavjud bo'lmagan ahamiyatga ega bo'lgan bunday "ustalar" ham mavjud. Veb-sahifada ular ba'zi so'zlarni yoki so'zlar guruhini bir necha bor takrorlaydilar va o'quvchining e'tiborini jalb qilmaslik uchun ularni juda kichik hajmda bosib chiqarishadi yoki fon rangiga mos keladigan matn rangini qo'llashadi. Bunday "fokuslar" uchun qidiruv tizimi veb-sahifani salbiy jazo tayinlab, jazolashi mumkin.

So'nggi yillarda tijorat reytingi amaliyoti rivojlandi. Texnik jihatdan ular 2000 yil darajasiga mos keladigan eng zamonaviy uskunalar bilan jihozlangan va bugungi kunda Runetning umumiy hajmi (rus Internet tarmog'i) 1994-1995 yillardagi g'arbiy sektor bilan bir xil. Shuning uchun, bugungi kunda Rossiyada ma'lumot izlashda maxsus muammolar mavjud emas va yaqin kelajakda ular kutilmaydi. Va g'arbiy sektorda qidirish muammolari juda katta va turli xil qidiruv tizimlari ularni turli yo'llar bilan engishga harakat qilishadi. Bu qanday sodir bo'lishi haqida biz aytib beramiz.

Bugungi kunda Rossiyada qidiruv indekslaridan uchta "kit" mavjud (kichik tizimlar mavjud, ammo biz ular haqida to'xtalmaymiz). Bular "Rambler" (www.rambler. Ru), "Yandeks" (www.yandex. Ru) va "Aport2000" (www.aport. Ru).

Tarixiy jihatdan eng mashhur qidiruv tizimi bu Rambler. U boshqalarga qaraganda ancha oldinroq ish boshlagan va uzoq vaqt davomida qidiruv indekslari va qidiruv xizmatlarining sifati bo'yicha etakchi bo'lgan. Afsuski, bugungi kunda bu yutuqlar o'tmishdadir. "Rambler" qidiruv indeksining hajmi taxminan 12 million veb-sahifaga teng bo'lishiga qaramay, u haqiqatan ham uzoq vaqt davomida yangilanmagan va eskirgan natijalarni beradi. Bugungi kunda Rambler - bu ommabop portal, Rossiyadagi eng yaxshi tasniflash va reyting tizimi (quyida nimani tasvirlaymiz) va reklama platformasi. An'anaga ko'ra, ushbu tizim tashrif buyurish darajasi bo'yicha Rossiyada birinchi o'rinda turadi va yaxshi reklama daromadiga ega. Ammo, quyida ko'rsatganimizdek, mablag'lar qidiruv vositalarini ishlab chiqishga sarflanmaydi.

Eng katta indeks Yandex tizimining markazida joylashgan - taxminan 27 million veb-sahifa, ammo bu nafaqat o'lchamga bog'liq. Bu nafaqat manbalar uchun ko'rsatgich, balki eng kerakli manbalarga yo'naltiruvchi. Bugungi kunda Yandex muhimligi jihatidan shubhasiz etakchi hisoblanadi (7.3-rasm).

Aport tizimi uchinchi bosqichda yutadi: mijozga ma'lumotni taqdim etish paytida. U avtomatik ravishda eng katta indeksni yaratishga intilmaydi, aksincha qo'lda ishlov berilgan @Rus katalogidan keng foydalanadi. Shuning uchun tizim eng yaqin raqobatchilari kabi ko'p natijalarni bermaydi, ammo bu natijalar, qoida tariqasida, aniq va aniq taqdim etiladi.

Qidiruv tizimlarining xususiyatlari.

Internetda biron bir narsani qidirishni boshlash va minimal ma'lumotga ega bo'lish, shuningdek vaqtni tejashga harakat qilish, undan maksimal darajada foydalanish umumiy ma'lumotlar  quyidagi ma'lumotlar bazasiga kirish mumkin.

Ma'lumotlar bazasi: Mavzu kutubxonachilar tomonidan qurilgan tarmoq ichidagi manbalarga olib keladi.

Qidiruv: Qidiruvlar manbaning nomi, uning tavsifi yoki ko'rsatilgan sarlavha bilan cheklanishi mumkin.

Natijalar: Resurs nomlari alifbo tartibida ko'rsatiladi.

Manzil: http://sunsite.berkeley.edu/InternetInd ex /

Yahoo! - eng mashhur qidiruv tizimi. Uning saytlari toifalar va kalit so'zlarga bo'lingan. U o'z ichiga oladi foydali ma'lumotlar  uning ustida bosh sahifa. Boshqa qidiruv tizimlariga ulanishi mumkin

Ma'lumotlar bazalari: Internet-manbalar, yangiliklar, xaritalar, reklama ma'lumotlari, sport ma'lumotlari, biznes, telefon raqamlari, shaxsiy WWW sahifalari va elektron pochta manzillarini (alohida ma'lumotlar bazasi) qidirish xizmatini boshqaradi.

Qidiruv: Yahoo-ning barcha sahifalari nafaqat oddiy qidiruv maydonchasini, balki ushbu qidiruv variantlarini, shuningdek, Usenet yoki elektron pochta manzillarini qidirishni taklif qiladi. Qidiruv ma'lum bir vaqtni bildirish bilan cheklanishi mumkin. Boolean operatorlari (va, yoki) va ketma-ket qidirish ham qo'llab-quvvatlanadi. Eslatma: agar Yahoo-da qidiruv bo'lsa! agar bu ijobiy natijaga olib kelmasa, qidiruv jarayoni avtomatik ravishda Alta Vista-ga o'tadi, qidiruvni davom ettiradi va ijobiy natijalar bo'lsa, avtomatik ravishda Yahoo!

Agar Yahoo! Alta Vista bilan etarlicha tez ulanishni o'rnatolmaysiz, bu holda Yahoo! qidiruv vositalari to'plami bilan bog'lanish sahifasini taqdim etadi. Ushbu havolalardan biri tanlanganidan so'ng, kalit so'zlar sizning qidiruv tizimingizga o'tkaziladi.

Qidiruvni engillashtirish uchun vosita bu "maslahat izlash" (TS) mavjudligi - "ishora" yordamida izlash: Yahoo! Bu bo'ysunuvchi katalog bo'lib, tizimda qidiruv tizimlari kabi sahifalar yo'qligini anglatadi, ammo eng keng tarqalgan kalit so'zlarni o'rnatish sizga sahifada kerakli mavzuni topishga imkon beradi yuqori darajadagi  tashkilot yoki kompaniya uchun (saytga tashrif buyurganda foydalanuvchi oldida paydo bo'lgan birinchi sahifa).

Natijalar: Havolalar qidirish ketma-ketligi bo'yicha berilgan tavsiflangan matnlar va ularga bo'ysunuvchi ierarxiya bo'yicha berilgan so'zlarning tartibiga muvofiq ko'rsatiladi.

Manzil: http://www.yahoo.com/

Yangilanish chastotasi: har kuni

Alta Vista kalit so'z izlashni qo'llab-quvvatlaydi va ma'lum bir sahifaning tilini aniqlash uchun sun'iy intellekt usullaridan foydalanadi. Foydalanuvchilar qidiruv parametrlarini sozlashi va qidirish turini tanlashi mumkin - murakkab yoki soddalashtirilgan, shuningdek foydalanish turli yo'llar bilan  ma'lumotlar bilan ta'minlash. Faqat kalit so'zlarni indekslaydigan mashinalardan farqli o'laroq, u butun matnni indekslaydi, bu esa imkon beradi to'liq qidiruv. Ammo, shuning uchun foydalanuvchi shunchaki ma'lumotlarga g'arq bo'lishi mumkin.

Ma'lumotlar bazalari: WWW-ning dunyo bo'ylab sahifalari va Usenet News (yangiliklar).

Qidirish: Oddiy (oddiy (S)) qidiruv yoki (ancha rivojlangan (MMS)), ya'ni, taklif qiladi. yanada rivojlangan usul. S - qidiruv asosan foydalanilishi kerak umumiy masalalar, MMS - Qidiruv aniq qidirish sintaksisidan foydalanadi. Jarayonni osonlashtirish uchun ko'rsatma mavjud (oddiy qidirish yordami). MMS - boolean yordamida qidirish, ya'ni. kalit birlashmalar yordamida (va, yoki emas - (va, yoki emas)) va oddiy qo'shilish (yaqin - (haqida)) yordamida qidirishni amalga oshirish uchun kalit so'zlar sifatida bir nechta so'zlarni, alternativ so'zlarni, iboralarni ishlatishga imkon beradi.

TS - qidirish: Birinchi qidiruv yo'nalishi sifatida "Sizning iboralaringiz" turini kiritib, "Sizning iborangiz" turidagi sarlavhalar bilan topilgan WWW hujjatlar sonini cheklaydi.

Natijalar: Uch xil tanlov natijalarini taklif qiladi (lekin ikkitasi bir xil natijani beradi):

1) "Standart" - dastgoh tomonidan URL-manzil, fayl hajmi va manzili bo'lgan paragraflar ro'yxati shaklida olingan natijalar. oxirgi sana  modernizatsiya. Natijalar ekranda o'n ochko sifatida qaytariladi,

2) "ixcham" ("ixcham") har bir elementni fayl kabinetini modernizatsiya qilishning so'nggi sanasi bilan bir qatorga joylashtiring,

3) "Standart" bilan bir xil bo'lgan "batafsil".

Manzil: http://altavista.digital.com

Modernizatsiya chastotasi: doimiy ravishda WWW-robot.

Excite foydalanadi qidirish texnologiyasi  Namunada so'rovlarni amalga oshirishga imkon beradigan IntelligentConceptExtraction. Bu Amerikadagi eng mashhur qidiruv tizimi. Topilgan har bir sahifa uchun so'rovga muvofiqlik darajasi baholanadi.

Ma'lumotlar bazalari: dunyo bo'ylab WWW-sahifalar, yangiliklar, xaritalar, "sariq sahifalar", bepul dasturiy ta'minot, asosiy tirnoq, televizion dasturlar, ob-havo, elektron pochta manzillari, aviakompaniyalar reyslari.

Qidiruv: Faqat S - qidirishni taklif etadi, ba'zi MMS qidirish imkoniyatlarini qo'llab-quvvatlaydi.

TS - qidirish: barcha hujjatlar berilgan so'zni aniqlash uchun plyus (+) dan foydalaning yoki biron bir hujjatda bu so'z yo'qligini aniqlash uchun minus (-) dan foydalaning. Ehtimol, shuningdek, byoolean operatorlari tomonidan qo'llab-quvvatlanishi mumkin.

Siz guruhlarga "va", "OR" va "VA YO'Q" (AND, OR, va. Va NOT) operatorlari va qavslaridan foydalanishingiz mumkin. Masalan: (raqamli yoki   virtual yoki   elektron) VA kutubxona.

(raqamli yoki   virtual yoki   elektron) Va   kutubxonasi.

Natijalar: natijalar hujjat sarlavhasi, foiz darajasi, URL manzili, xulosa ko'rsatilgan dasturiy ta'minot  hujjat va hujjatni o'zingizning savolingiz sifatida ishlatishga imkon beradigan "Yana shunga o'xshash" ni tiklash.

Manzil: http://www.excite.com/

Yangilanish chastotasi: doimiy ravishda - WWW-robot.

Internetda qidirish uchun har kuni 10. million sahifaga parallel ishlov berishdan foydalaniladi. Hot Botning foydali tomoni tugmalarni tanlash orqali sahifalar turini cheklashdir.

Ma'lumotlar bazasi: WWW-ning dunyo bo'ylab sahifalari.

Qidiruv: S - qidirish va ekspert (E) - qidirishni taklif qiladi, mantiqiy operatorlarni (AND va OR), iboralarni qidirishni va "odam" yoki "URL" ni tanlashni qo'llab-quvvatlaydi. Elektron qidiruv shuningdek sana, manzil (mamlakat va boshqalarni) belgilashni qo'llab-quvvatlaydi

TS - qidirish: qo'shtirnoq ichidan foydalanadi (masalan, "iborali so'zlar").

Natijalar: natijalar hujjat sarlavhasi, foizning tegishli darajasi, URL, hujjat hajmi ko'rsatilgan.

Manzil: http://www.hotbot.com/

Modernizatsiya chastotasi: doimiy ravishda WWW-robot ("Slurp").

Infoseek - kompyuter sanoatidagi eng mashhur qidiruv vositasi. 1996 yil may oyida u ma'lumotlarni taqdim etadigan eng ishonchli mashina deb tan olindi. Mashinaning jozibadorligi shundaki, ma'lumotni filtrdan o'tkazgandan so'ng siz yana topilgan ma'lumotni tekshirishingiz mumkin.

Ma'lumotlar bazalari: dunyo bo'ylab WWW sahifalari, yangiliklar, do'konlarda tirnoq, xaritalar, sariq sahifalar ("sariq sahifalar"), elektron pochta manzillari va boshqalar.

Qidiruv: bu faqat sodda qidiruvni taklif etadi, ammo qidirish kalit so'zlari ma'lum bir maydonlar bilan chegaralanishi mumkin (masalan, hujjat sarlavhalari ichida), ma'lum bir so'z bundan mustasno (ushbu so'z oldingi "-" belgisidan tashqari) parametrlardan foydalanib qidirish mumkin ( oldin bu so'z "+" dan oldin). Uchun qo'shimcha ma'lumotlar  ishlatiladigan qidirishni tanlash bilan bog'liq. Infoseek yordami

Natijalar: hujjatning sarlavhasi, fayl hajmi, URL manzili, hujjatdan olingan qisqacha xulosa va qiziqish darajasi.

Manzil: http://www.infoseek.com/

Chastotani yangilash: doimiy ravishda WWW-robot.

Qo'shimcha ma'lumotlar: agar ma'lumot juda katta bo'lsa, http://info.infoseek.com/ ga qarang.

Lycos birinchi qidiruv tizimlaridan biridir. Mashina qidirish bilan ishlash va saytlarni bir vaqtning o'zida ko'rish uchun qulay. Ma'lumotni chiqarishda ko'rsatiladi qisqa sharh, va manzillarni topdi.

Ma'lumotlar bazalari: WWWning butun dunyo bo'ylab sahifalari, tovushlari, rasmlari, "eng yaxshi 5% saytlar"

Qidiruv: S - qidirish va mijozni (Custom (C)) izlashni taklif qiladi. S-qidiruv AND va OR (va and OR) mantiqiy operatorlarini, shuningdek, boshqa topshiriqlarni qo'llab-quvvatlaydi.

Natijalar: natijalar buyurtma qilingan ro'yxatda keltirilgan; Ma'lumotga hujjatlar manzili (URL), ism, fayl hajmi va fayldan parchalar kiradi.

Manzil: http://www.lycos.com/

Modernizatsiya chastotasi: doimiy WWW-robot.

Qidiruv tizimlarining muammolari va imkoniyatlari.

Ko'p qidiruv tizimlarining ishi juda muvaffaqiyatli deb hisoblanadi. Biroq, barcha zamonaviy qidiruv tizimlari ba'zi jiddiy kamchiliklardan aziyat chekmoqda:

1. Kalit so'zlarni qidirish juda ko'p havolalarni beradi va ularning ko'plari foydasiz.

2. Turli xil foydalanuvchi interfeyslariga ega bo'lgan qidiruv tizimlarining ko'pligi kognitiv haddan tashqari yuklanish muammosini ko'taradi.

3. Ma'lumotlar bazasini indeksatsiya qilish usullari, odatda, ma'lumot tarkibiga bog'liq emas.

5. Mashinalar hali tabiiy tilni tushunish uchun etarlicha mukammal emas

ichida yaqinda  intellektual yordamga bo'lgan ehtiyoj tez o'sib bormoqda. Bu aqlli agentlarning paydo bo'lishiga olib keldi.

Odatda, aqlli agentlar qidirish uchun sun'iy intellektdan foydalangan holda qidiruv tizimining asosiy qismidir. Foydalanuvchi agentga dars beradi, keyin u qidiruv uchun onlayn rejimga o'tadi.

Aqlli agentlar foydalanuvchi nomidan ko'rsatmalarni bajaradilar, ba'zi mustaqilliklarga ega. Qidiruvdan so'ng ular natijalar haqida foydalanuvchini xabardor qiladilar. Vakillar o'z faoliyatlaridan saboq olishadi.

Aql-idrok - o'rganishga asoslangan fikrlar  xatolar misolida va boshqa agentlar bilan o'zaro ishlashda.

Foydalanish qulayligi - siz agentni tabiiy tildan foydalangan holda o'qitishingiz mumkin.

Shaxsiy yondashuv - foydalanuvchi imtiyozlariga moslashish.

Integratsiya - mavjud bilimlarni yangi vaziyatlarda qo'llashni butun umr davomida o'rganish.

Avtonomiya - atrof-muhit hissi va xulosalarni tahlil qilish.

Xulosa

Men ko'rib chiqqan qidiruv tizimlari mukammal emas. Ideal qidiruv tizimi quyidagi talablarga javob berishi kerak deb hisoblanadi.

1. foydalanish qulayligi

2. Aniq tashkil etilgan va yangilangan indeks.

3. ma'lumotlar bazasini tezkor qidiruv va tezkor javob.

4. qidiruv natijalarining ishonchliligi va aniqligi.

Axborot resurslari ko'lami va ularning soni doimiy ravishda kengayib bormoqda. Ma'lumotlar bazasi mukammal emasligi ayon bo'ladi. Aqlli agentlar - ma'lumotni filtrlashi va aniqroq natijalarni olishlari mumkin bo'lgan yangi avlod qidiruv tizimlari asosidagi yangi yo'nalish. Internet doimiy ravishda jadal rivojlanib, dunyoda ma'lumot tarqatish va olishni cheklashni bekor qiladi. Biroq, ushbu ma'lumot okeanida kerakli hujjatni topish juda oson emas, shuningdek, tarmoqdagi uzoq vaqt ishlaydigan serverlar bilan bir qatorda yangi tarmoqlar paydo bo'lishini yodda tutish kerak.

Axborotni saqlash va qayta ishlash kompyuter texnologiyalari yordamida amalga oshiriladigan axborot tizimlari avtomatlashtirilgan, har xil turdagi faoliyatlar va axborot texnologiyalari sanoatida eng tez rivojlanayotgan tarmoq deb ataladi.

Adabiyotlar ro'yxati.

1. E.A. Jakubait "Kompyutershunoslik-elektronika-tarmoqlar". M., "Moliya va statistika", 1989 yil.

2. .. A. V. Gavrilov " Mahalliy tarmoqlar  Kompyuter ", Moskva," Mir "nashriyot uyi, 1990 yil.

3. N.A. Gaydamakin "Avtomatlashtirilgan axborot tizimlari, ma'lumotlar bazalari va ma'lumotlar banki", M .: "Helios", 2002 yil.

Ishdan parcha

KIRISh

Sivilizatsiya rivojlanishining zamonaviy bosqichi insoniyatning eng rivojlangan qismining sanoat jamiyatidan axborot jamiyatiga o'tishi bilan tavsiflanadi. Ushbu jarayonning eng yorqin hodisalaridan biri global axborot kompyuter tarmog'ining paydo bo'lishi va rivojlanishi.

Axborot qidirish va to'plash muammosi axborot izlash tizimlarining muhim muammolaridan biridir. Albatta, bu borada, masalan, O'rta asrlarda taqqoslash mumkin emas, chunki ma'lumot izlash qiyin bo'lgan, chunki bu ma'lumotlar juda kam edi va hech bo'lmaganda qiziqish uyg'otadigan biron bir masalani topishga harakat qilish kerak edi. Shunday qilib, dastlab kutubxonaga borishga va u erda vaqtni katalogdan to'g'ri kitobni tanlashga, kerakli ma'lumotlarni topishga sarflash imkoniyati tug'ildi. Ammo kataloglar bitta ma'lumot kutubxonasi doirasida ma'lumotlarni qidirish muammolarini to'liq hal qila olmaydi, chunki katalogga juda kam ma'lumotlar kiritilgan: sarlavha, muallif, nashr qilingan joy. Axborot izlash muammosi 20-asrda, axborot texnologiyalari asrining rivojlanishi bilan yangi tus oldi. Endi bu ma'lumot juda oz bo'lganligidan iborat emas va shuning uchun uni topish qiyin, aksincha, u tobora tobora ko'payib bormoqda va shu bilan qiziqish savoliga javob topish ham juda qiyin ish bo'lishi mumkin. Axborotni topish muammosi virtual manbalardan foydalanishda ancha murakkab. U onlayn kataloglar texnologiyasidan foydalanadi, natijada foydalanuvchi bir vaqtning o'zida bir nechta kutubxonalarning kataloglarini qidirish imkoniyatiga ega bo'ladi, bu esa vazifani yanada qiyinlashtiradi, lekin boshqa tomondan, uni hal qilish imkoniyatini oshiradi.

1. Axborot va qidirish tizimlari

Axborot tizimi deganda ma'lum bir sohada axborot resurslarini to'plash, taqdim etish va to'plashni, foydalanuvchilarning axborot ehtiyojlarini qondirish uchun zarur bo'lgan ma'lumotlarni qidirish va etkazib berishni ta'minlaydigan dasturiy-texnik vositalar va boshqa yordamchi vositalar, texnologik jarayonlar va funktsional jihatdan aniqlangan ishchilar guruhining tushunchasi tushuniladi. Axborot tizimlari har xil turdagi faoliyatni va axborot texnologiyalari sanoatida eng tez rivojlanayotgan sohani axborot bilan ta'minlash muammolarini hal qilishning asosiy vositasi, vositasidir.

Axborot-qidiruv tizimi - bu ma'lumotlarni izlash tiliga va tegishli qidirish qoidalariga asoslanib, ma'lumot manbalari (indeks) tavsiflari bilan maxsus ma'lumotlar bazasida kerakli ma'lumotlarni qidirish va tanlashni ta'minlaydigan tizim.

Hozirgi vaqtda tobora kengayib borayotgan axborot makonida ma'lumotlarni qidirish uchun ikkita tubdan farq qiluvchi ma'lumot olish tizimlari (IPS) ishlatilishi mumkin: global tarmoq uchun ma'lumot olish tizimlari va ma'lumotnoma-huquqiy tizimlar (SPS). Ikkala tizim ham bir-biridan mustaqil ravishda rivojlanadi va ishlaydi. Ushbu tizimlardan birgalikda foydalanish sizga turli xil muhandislik muammolarini hal qilishda ma'lumot izlash muammosini tez va samarali hal qilishga imkon beradi.

Har qanday IPSning asosiy vazifasi foydalanuvchining axborot ehtiyojlariga mos keladigan ma'lumotlarni qidirishdir. Qidiruv natijasida hech narsa yo'qotmaslik, ya'ni so'rov bilan bog'liq barcha hujjatlarni topib, ortiqcha narsalarni topmaslik juda muhimdir. Shuning uchun qidirish tartibining sifatli tavsifi - dolzarbligi kiritiladi.

1.1 Axborot qidirish tili va ma'lumot qidirish lug'ati

Axborot olish tizimlari haqida gapirganda, ular indeksdan foydalanadi degan ma'noni anglatadi. Indeks "mavzu" ga tegishli hujjatlarni qidirishga imkon beradi. Mavzu indeksini tuzish uchun hujjatning mazmuni tahlil qilinadi va hujjatda ko'rsatilgan «mavzu» yoki «sub'ektlar» aniqlanadi. Keyin ushbu elementlarning nomlari ma'lumot olish tiliga (IPN) tarjima qilinadi. Shunday qilib, biz hujjatning qidirish rasmini olamiz (AML). Barcha axborot resurslarini indekslash (qidirish rasmlarini yaratish), biz indeks (indeksli ma'lumotlar bazasi) - IPS asosiy ma'lumotlar to'plami deb nomlanadigan narsani olamiz.

Qidiruv jarayoni foydalanuvchi so'rovini mavjud ma'lumotlar bilan taqqoslashdan iborat bo'lganligi sababli, olingan so'rov IPNga ham tarjima qilinishi kerak. IPJ-ga tarjima qilingan so'rovni va hujjatlarni qidirish rasmlarini taqqoslagandan so'ng, foydalanuvchi tizimning fikriga ko'ra uning iltimosiga mos keladigan hujjatlarga havolalar ro'yxatini oladi.

Qidiruv hujjatlar matni bo'yicha emas, balki IPN-da tuzilgan qidiruv rasmlariga ko'ra amalga oshiriladi. Shu sababli, IPA - bu ma'lumot olish tizimining asosiy qismi, bu tizimning sifati birinchi navbatda bog'liqdir. Axborot izlash tiliga quyidagilar kiradi:

1. Indekslangan atamalar lug'ati - ko'plab indekslash atamalari.

2. Kod lug'ati - ko'plab kod atamalari.

3. Kirish so'zlarining lug'ati - ko'plab kirish so'zlari.

4. Yordam vositalari  indekslash tili - indekslash terminlari bilan birgalikda ma'lum tushunchalarni kengaytirish yoki toraytirish uchun ishlatiladigan vositalar.

5. Indekslash tilidan foydalanish qoidalari.

Oddiy tutashuv Mavzularni indeksatsiyadan foydalangan holda IPS sek. 1.1.

Rasm 1.1 - IPSning tipik sxemasi

Qidiruv samaradorligini oshirish uchun tizim tomonidan ishlatiladigan lug'atni boshqarish kerak, ya'ni qidiruvning to'liqligi va aniqligi maqbul bo'lgan tarzda tashkil etilishi kerak. Shubhasiz, lug'atni tashkil etish ko'plab omillarga bog'liq - IPS ishlatiladigan mavzu, foydalanuvchilarning qiziqishlarining tabiati, ularni tayyorlash darajasi va boshqalar.

Umuman olganda, qidirish protsedurasi iterativdir, ya'ni so'rovni tuzatish so'ng qidiruv natijalari, ushbu so'rovni qidirish va hokazo. Sxematik ravishda bunday tartib sek. 1.2.

Rasm 1.2 - Qidiruv jarayoni

So'rov qabul qilingan hujjatlar soni va ularning muhimligi asosida tuzatiladi va uni foydalanuvchi ham, axborot izlash tizimi ham amalga oshirishi mumkin.

1. 2 Axborot tizimlari quyi tizimlari

Axborot tizimini uchta quyi tizimga bo'lish mumkin:

1. Axborot yig'ishning tashkiliy va texnologik quyi tizimi axborot tizimini ta'minlaydi va axborot manbalari to'plamini, tizimda to'planish uchun ma'lumotlarni tanlashning tashkiliy va texnologik zanjirini o'z ichiga oladi. Axborot yig'ishning to'g'ri tashkil etilgan quyi tizimisiz, umuman, butun axborot tizimining samarali ishlashini tashkil etish mumkin emas.

2. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimining yadrosi bo'lib, ishlab chiquvchilar va obunachilar tomonidan tizimning tuzilishi va rasmlari, ular to'g'risida axborot tizimida aks ettirilishi kerak bo'lgan taqdimotning aksidir. Axborotni taqdim etish va qayta ishlashning quyi tizimi - bu axborot tizimini rivojlantirishning eng murakkab tarkibiy qismlaridan biri.

3. Axborot berishning me'yoriy-funktsional quyi tizimi foydalanuvchilarni yoki boshqa tarzda tizim abonentlarini belgilaydi, axborot tizimining maqsadi va vazifalarini bajarishning maqsadli tomonlarini amalga oshiradi.

2. AXBOROT VA Qidiruv tizimlari funktsiyalari

Barcha qidiruv tizimlarining asosini ma'lumotlar bazalari tashkil etadi - amaliy dasturlardan qat'i nazar ma'lumotlarni tavsiflash, saqlash va boshqarishning umumiy tamoyillarini ta'minlaydigan cheklangan qoidalarga muvofiq tashkil etilgan ma'lumotlar to'plami.

Axborot tizimlari faoliyatining quyidagi elementlarini ajratib ko'rsatish mumkin:

Axborot to'plash - bu ma'lumotlarni to'plash va namoyish qilish uchun maxsus tashkil etilgan jarayon:

Ma'lumot olish;

Axborotning dolzarbligini baholash;

Ma'lumotni tanlash va o'rnatish tartibi.

Sotib olish - bu ko'p qismlardan ma'lumotlarni bir butunga qo'shish va foydalanuvchiga etkazish jarayoni.

Axborotni qidirish va etkazib berish - boshqaruv faoliyati va texnologik jarayonlarda axborot tizimi abonentlarining axborot ehtiyojlarini qondirish uchun maxsus texnologik buyurtmani o'rnatish.

Axborotning yaxlitligi va saqlanishini ta'minlash - ahamiyatini yo'qotgan ma'lumotlarni ko'rib chiqish, qayta ko'rib chiqish va skrining qilish axborot bo'limlarining ajralmas vazifasi hisoblanadi. Axborotning xavfsizligi normativ va yo'riqnomaviy hujjatlar yordamida amalga oshiriladi.

Saqlanadigan ma'lumotlarning mantiqiy tashkil etilishini ta'minlash xarakteriga ko'ra, axborot tizimlari faktografik, hujjatli va geografik axborot tizimlariga bo'linadi.

Faktografik axborot tizimlari ma'lumotlarni bir yoki bir nechta tarkibiy elementlarning bir nechta namunalari ko'rinishida to'playdi va saqlaydi. Ushbu tarkibiy elementlarning har bir misoli yoki ularning kombinatsiyasi voqea yoki hodisa to'g'risidagi ma'lumotlarni aks ettiradi. Har bir turdagi axborot ob'ektining tuzilishi ushbu ob'ekt sohasi ob'ektlari uchun ma'lumotlarning asosiy jihatlari va xususiyatlarini aks ettiruvchi cheklangan tafsilotlardan iborat.

Hujjatli axborot tizimlarida ma'lumotlarning yagona elementi kichikroq elementlarga bo'linmaydigan hujjat bo'lib, kiritilgan ma'lumotlar, qoida tariqasida, cheklanmagan tarzda tuzilmagan yoki tuzilmagan. Kirish hujjati uchun ba'zi rasmiylashtirilgan pozitsiyalar belgilanishi mumkin - ishlab chiqarilgan sana, rassom, mavzu. Hujjatli axborot tizimlarining ayrim turlari kirish hujjatlarining mantiqiy aloqasini - semantik tarkibni bo'ysunishini ta'minlaydi.

Geografik axborot tizimlarida ma'lumotlar umumiy elektron topografik bazaga bog'langan alohida ma'lumot ob'ektlari shaklida tashkil etiladi. Geografik axborot tizimlari ushbu sohalarda axborot bilan ta'minlash uchun, geografik tarkibiy qism mavjud bo'lgan axborot ob'ektlari va jarayonlarining tuzilishidan foydalaniladi.

Qidiruv tizimlarini tasniflashning yana bir mezoni bu bajarilishi kerak bo'lgan vazifalar yoki vazifalardir. Ushbu asosda ma'lumotnoma, qidirish va hisob-kitob tizimlari ajralib turadi.

Ma'lumotlar ma'lumot tizimlari funktsiyalarining eng keng tarqalgan turidir va tizim obunachilariga ob'ektlarning ayrim sinflariga o'rnatish ma'lumotlarini olish imkoniyatini beradi.

Qidiruv motorlar axborot tizimlarining eng keng tarqalgan sinfidir. Umuman olganda, ko'rinish ma'lumot nuqtai nazaridan aniqlanadigan axborot maydonining bir turi sifatida ko'rib chiqilishi mumkin - mavzu sohasining mantiqiy tavsifi.

Hisoblash turli xil maqsadlar uchun ma'lum hisoblash algoritmlari bo'yicha tizimdagi ma'lumotlarni qayta ishlashdan iborat.

Axborot tizimlarining texnologik funktsiyalari butun texnologik tsiklni yoki uning alohida tarkibiy qismlarini, ishlab chiqarish yoki tashkiliy tuzilishini avtomatlashtirishdan iborat.

Shunday qilib, IPS asosiy funktsiyalari quyidagilardan iborat:

- katta hajmdagi ma'lumotlarni saqlash;

tezkor qidiruv  zarur ma'lumotlar;

- saqlangan ma'lumotni qo'shish, yo'q qilish va o'zgartirish;

- axborotni odam uchun qulay bo'lgan shaklda chiqarish.

Ajratish: - avtomatlashtirilgan (nusxa ko'chirilgan);

- bibliografik (ma'lumotnoma);

- muloqot (onlayn);

- hujjatli va faktografik ma'lumotlarni olish tizimlari.

So'nggi paytlarda ma'lumot olish tizimlari tez sur'atlar bilan rivojlana boshladi, yangi tizimlar paydo bo'ldi, ular keng reklama qilinmoqda va sotilmoqda. Bu jamiyatning huquqiy va me'yoriy-texnik axborot bilan samarali ishlashga va kompyuter ma'lumotlarini olish tizimlaridan foydalanishga bo'lgan talabining sezilarli darajada oshganligi bilan bog'liq. Qidiruv tizimlaridan keng foydalanish Rossiyada axborotlashtirish sohasidagi haqiqiy yutuq bo'lib, korxonalarning texnik mutaxassislariga qonuniy va me'yoriy hujjatlarga bemalol kirish imkoniyatini yaratdi.

Mutaxassis tomonidan qabul qilinadigan qarorlarning sifati qayta ishlangan ma'lumotlarning hajmiga bog'liq. Zamonaviy sharoitda ma'lumotlarni qidirish va qayta ishlashda yordam beradigan kuchli va qulay vositasiz buni amalga oshirish mumkin emas. Qidiruv tizimlaridan samarali foydalanish texnik mutaxassis ushbu yangi axborot tizimlarining xususiyatlari, imkoniyatlari va ko'lamini qanchalik bilishiga bog'liq.

Yaratilish zamonaviy tizimlar  Axborotni saqlash ikki asosiy usulda amalga oshiriladi: ierarxik va gipermatnli modellardan foydalanish. Ierarxik modelda axborotni tasniflashda ko'p darajali ishqalanish qo'llaniladi. Hujjatni qidirish uchun undan foydalaning. qisqacha tavsiftizimga ma'lumot kiritish orqali tuziladi. Zamonaviy gipermatnli model elektron hujjatlardagi boshqa hujjatlarga havolalarni ishlatishga imkon beradi.

Operatsion tajribasi turli xil tizimlar  Bunday modellar asosida ma'lumotlarni qayta ishlash va izlash ularning kamchiliklari bo'lmaganligidan dalolat beradi. Ikkala tizim ham ishlab chiqish va shakllantirish uchun katta moddiy xarajatlarni talab qiladi va shuning uchun saqlanadigan ma'lumotlar miqdori cheklangan. Kategoriyalar va aloqalarni shakllantirish mutaxassislar tomonidan amalga oshiriladi, ularning ma'lumotni tushunishi va foydalanuvchining taqdimoti har xil bo'lishi mumkin.

3. Zamonaviy ma'lumotlar va qidirish tizimlari

Etarli huquqiy ma'lumotga ega bo'lmasdan, ham iqtisodiy, ham siyosiy sohada xabardor qaror qabul qilish mumkin emas. Bu ehtiyoj, ayniqsa, iqtisodiy va siyosiy tuzilmalarni isloh qilish davrida juda muhimdir. Kerakli miqdordagi huquqiy ma'lumotni o'z vaqtida taqdim etish ehtiyojini qondirish vazifasi turli xil ommaviy axborot vositalari tomonidan hal qilinmoqda.

Ushbu sohada an'anaviy ommaviy axborot vositalari va ma'lumotnoma-huquqiy tizimlar (CPS) raqobatlashadi. Haqiqatan ham samarali PCA faqat zamonaviy axborot texnologiyalari yordamida yaratilishi mumkin. Shu tarzda yaratilgan ATP kompyuter deb ataladi.

EHM uchun ma'lumotnoma va yuridik tizim - bu ko'plab huquqiy ma'lumotlar va ular bilan ishlash uchun vositalarni o'z ichiga olgan dasturiy ta'minot to'plami. Ushbu vositalar sizga hujjatlarni qidirish, hujjatlar to'plamini shakllantirish, hujjatlar yoki ularning parchalarini chop etish imkonini beradi. Kompyuter ATP-ning afzalliklari shubhasizdir. Bu ma'lumotlarning mavjudligi va u bilan ishlash qulayligi. Bunday tizimlarga xos bo'lgan muammo - samaradorlik etishmasligi - global Internet yordamida hal qilinishi mumkin.

Rossiyadagi yuridik ma'lumot tizimlari bozorida ko'plab firmalar o'zlarining dasturiy ta'minotlarini ishlab chiqish bilan bir qatorda, mavjudlariga ham xizmat ko'rsatadilar. Ushbu firmalarning quyidagi mahsulotlari eng taniqli ("Konsultant Plyus" OAJ tomonidan taqdim etilgan):

“Konsultant Plyus” (OAJ “Konsultant Plyus”);

GARANT (AES kafolat-xizmati);

"Kod" (Kompyuterni rivojlantirish markazi).

Davlat idoralarining huquqiy axborotga bo'lgan ehtiyojlarini qondirish uchun davlat korxonalari tomonidan yaratilgan tizimlar:

"Etalon" (Rossiya Federatsiyasi Adliya vazirligi qoshidagi NTSPI);

"Tizim" (FAPSI-dagi "Tizim" STC).

Shuningdek yoqilgan rossiya bozori  kabi tizimlar:

USIS (Intaleks kompaniyasi);

"Referent" ("Referent-Servis" YoAJ);

"Huquqiy dunyo" ("Ish va qonun" nashriyot uyi);

"Sizning huquqingiz" va "Yurist maslahatchisi" ("Axborot tizimlari va texnologiyalari" kompaniyasi);

"Rossiya qonunchiligi" (Bank texnologiyalarini rivojlantirish assotsiatsiyasi) va boshqalar.

Turli xil mahsulotlar nafaqat ularning yordami bilan hal qilingan vazifalar, balki sifat jihatidan ham sezilarli darajada farq qilishi mumkin.

ATPning sifati taqdim etilgan ma'lumotlarning sifatiga va u bilan ishlashda ishlatiladigan vositalarning sifatiga ham bog'liq. Eng yangi dastur kompyuter texnologiyalari  Agar PCA to'liq huquqiy ma'lumotlarni o'z ichiga olmasa yoki ma'lumot etarli chastota bilan yangilanmasa, bu yordam bermaydi. Aksincha, hatto eng to'liq va tez yangilanadigan ma'lumotlarni o'z ichiga olgan ATP, agar ushbu ma'lumotni qayta ishlash uchun yuqori sifatli vositalar ta'minlanmasa, etarli darajada samarali bo'lmaydi. Shunday qilib, axborot bazasi tarkibining sifatini aniqlashning asosiy parametrlari quyidagilardan iborat:

ma'lumotlarning to'liqligi;

ma'lumotlarning aniqligi;

axborotni yangilashning samaradorligi.

Dasturiy ta'minot qobig'ining sifatini tavsiflovchi parametrlar:

tizimning qidirish qobiliyati;

axborotni yangilash vositalari;

qo'shimcha xizmat vazifalari.

Asosiy yordam tizimlarini ko'rib chiqing.

3.1 "Consultant Plus" huquqiy-huquqiy tizimi

"Konsultant Plus" ma'lumotnoma-huquqiy tizimi "Konsultant Plus" OAJ tomonidan yaratilgan va 1992 yildan beri tarqatilgan. Tizim yaxshi ma'lum va 2005 yil boshida Rossiyada etakchi o'rinlardan birini egallaydi. Consultant Plus kompaniyasining tarmog'i ATP, xizmat ko'rsatuvchi va foydalanuvchilarga ma'lumot uzatuvchi 300 dan ortiq mintaqaviy axborot markazlarini birlashtirgan. "Consultant Plus" ma'lumotnoma-huquqiy tizimida eng ko'p ma'lumotlar mavjud har xil turlari  huquqiy ma'lumotlar: nizomlardan, sud amaliyoti materiallaridan, sharhlar, veksellar, moliyaviy maslahatlardan, buxgalteriya hisobida operatsiyalarni aks ettirish sxemalaridan hisobot shakllari va yuqori ixtisoslashtirilgan hujjatlargacha, hujjatlar yagona axborot maslahatchisi plyusida mavjud. Har bir turdagi hujjatlar o'ziga xos xususiyatlarga ega bo'lganligi sababli ular ma'lumotlar qatorining tegishli bo'limlariga kiritilgan: qonun hujjatlari, sud amaliyoti, moliyaviy maslahatlar, qonunchilik sharhlari, hujjatlar shakllari, qonun loyihalari, xalqaro-huquqiy hujjatlar, sog'liqni saqlash sohasidagi huquqiy hujjatlar.

Hujjatlarni ATP "Consultant Plus" da qidirish uchun siz bir nechta vositalardan foydalanishingiz mumkin, ularning asosiy vositasi qidiruv kartasi hisoblanadi.

Qidiruv kartasi - bu bir qator qidiruv maydonlariga ega jadval. Har bir qidiruv maydonchasi uchun tizimda lug'at ta'minlanadi, u avtomatik ravishda to'ldiriladi va ma'lumot bazasiga (IS) kirishi bilan moslashtiriladi. Tizimga har bir hujjat kiritilganda, uning ma'lumotlari tegishli lug'atga kiritiladi.

ATP "Consultant Plus" da topilgan hujjatni yoki uning qismini unga o'tkazish mumkin matn muharriri  O'zingizning materialingizga qo'shtirnoq kiritish uchun so'z.

Consultant Plus dasturida yuridik navigator mavjud. Bu alifbo tartibidagi asosiy indeks bo'lib, u asosiy tushunchalardan iborat. Yaqin asosiy tushunchalar guruhlangan. Ushbu ikki bosqichli struktura asosiy hujjatlarni qidirish uchun ajratganingizda ularni tanlashni osonlashtiradi.

"Consultant Plus" ATP-ning barcha ma'lumotlar bazalari gipermatnli havolalar orqali bir-biri bilan bog'langan bo'lib, ular bir zumda, masalan, maslahat matnidan normativ hujjat matniga javobni yozuvchisi tugmachani bosib murojaat qilgan matnga o'tishga imkon beradi. Foydalanuvchilarga gipermatn beradigan eng muhim narsa bu qo'shimcha masalada muallifning mulohazalariga amal qilish, muayyan masala bo'yicha o'z pozitsiyasini isbotlash uchun ishlatadigan konsultatsiyani o'qish paytida normativ hujjatlarni tezda ko'rib chiqishdir.

3.2 "Kafolat" huquqiy-ma'lumotnoma tizimi

Garant ma'lumotnomasi huquqiy tizimi 1990 yildan beri tarqatilgan va ATP bozorida juda ko'p foydalanuvchilar orasida juda mashhur. U "Kafolat-Servis" ilmiy-ishlab chiqarish korxonasi (NPO) - huquqiy tizimlarni ishlab chiqaruvchi kompyuter kompaniyasi tomonidan ishlab chiqilgan va tarqatilgan.

Kompaniya Davlat Dumasining yuridik bo'limi va boshqa bir qator davlat muassasalari va tashkilotlari bilan faol hamkorlik qiladi. U yuqori texnologiyali va yuqori texnologiyali ishlab chiqarishga ega bo'lib, Moskvada katta xodimlarga ega va Rossiyada va chet elda keng vakolatxonalarga ega.

"Kafillik" tizimi bu turli xil huquqiy hujjatlarni izlash va ishlashni ta'minlaydigan ma'lumotnoma tizimi. Tizimda normativ hujjatlar, sharhlar va tushuntirishlar, sud va hakamlik amaliyoti, shuningdek tushuntirish lug'atlari mavjud.

Tizimda davriy yangilanish mexanizmi mavjud infobazalarShu sababli, siz har doim qonunchilikdagi so'nggi o'zgarishlardan xabardor bo'lib turasiz.

"Garov" tizimi kichik va katta ma'lumot va yuridik bloklarning butun guruhiga ega, ulardan foydalanuvchi o'zi xohlagan faoliyat turiga ko'ra nimani tanlashi va hujjat tekshirilishi mumkin bo'lgan shaxsiy to'plamni tuzishi mumkin.

Garant-Maksimal paketga barcha federal bloklar va bitta mintaqaviy qonunchilik bloki kiradi. Ushbu to'plamda qonunning barcha bo'limlari: jinoiy, ma'muriy va xalqaro huquq, shuningdek sud va arbitraj amaliyotiga oid hujjatlar mavjud.

Ba'zi bir maxsus ma'lumot bloklari bugungi kunda boshqa ATPda o'xshashliklarga ega emas. Bularga "Sxemalardagi qonunlar", "qonunlar loyihalari", "qonun hujjatlariga sharhlar", "rus tilidagi qonun hujjatlari" kiradi.

Odatda, ma'lum bir ATP-ga kirishda foydalanuvchi faqat ushbu muammoni biladi va hujjatning rasmiy tafsilotlari to'g'risida ma'lumot bo'lmaganda vaziyat paydo bo'ladi. Bunday hollarda, vaziyatni kuchli qidiruv tizimisiz, qonun ustuvorligini topish deyarli mumkin emas. "Garant" SPSda bu muammo kalit so'zlarning ikki darajali lug'ati ("Vaziyatlar entsiklopediyasi") orqali hal qilinadi.

3. 3 Kodeks huquqiy axborot tizimlari

Kodeksning axborot-huquqiy tizimini (IPS) ishlab chiqaruvchisi 1991 yil boshida tashkil etilgan Kompyuterni rivojlantirish bo'yicha davlat korxonasi (GP TsKR, Sankt-Peterburg).

Sankt-Peterburg va Rossiyaning me'yoriy hujjatlarini o'z ichiga olgan tizimning birinchi versiyasini sotish 1992 yil mayda boshlandi.

"Kodeks" IPS - bu barcha asosiy parametrlar (to'liqligi, samaradorligi, qonuniy ishlashi va boshqalar) bo'yicha ijobiy xususiyatlarga ega, yaxshi professional darajada tayyorlangan dasturiy mahsulotlarga tegishlidir.

Kodeks ma'lumotlari mahsulotlariga quyidagilar kiradi: professional yuridik tizimlar, sud va arbitraj amaliyoti tizimlari, ixtisoslashtirilgan ma'lumot tizimlari, elektron yuridik kataloglar.

Bog'langan infobazalar sonidan qat'iy nazar, ish giperhavola orqali ulangan yagona axborot makonida olib boriladi.

Dasturiy ta'minot mahsulotlarining bitta qatori bir qator ishlanmalarni, jumladan Codex-Master dasturiy paketini o'z ichiga oladi, bu turli yo'nalishdagi to'liq matnli ma'lumot olish tizimlarini yaratish va boshqarish uchun vositalar to'plamidir.

Kodeks axborot tizimining ochiqligi printsipi Codex-Master kompleksi yordamida yangi loyihalarni yaratishga imkon berdi, shu bilan birga Codex ma'lumotlarini, masalan: Rossiya Federatsiyasining uy-joy kommunal xizmati, sanoat xavfsizligi bo'yicha auditor yordamchisi. , bu texnologik halokatlar davrida juda muhimdir.

Kodeks Konsortsiumi faoliyatining muhim yo'nalishi Internet orqali huquqiy ma'lumotlarga kirishni ta'minlash, Kodeks tizimining tijorat va huquqiy manbalariga bepul kirishni ta'minlaydi.

3. 4 Referent seriyasining tizimlari

kafolatli axborot izlash tizimi

"Referent-Servis" YoAJ 1995 yil oxirida integratsiyalashgan "Referent" axborot tizimini (IIS) ro'yxatdan o'tkazdi, tarqatilishi 1996 yilda boshlangan. Shu vaqtga qadar ATP "Maslahatchi Plyus", "Garant" va "Codex" allaqachon taniqli bozor rahbarlari bo'lgan. , va "Referent-servis" ushbu kompaniyalar erishgan eng yaxshi narsalarni hisobga olish imkoniyatiga ega bo'ldi.

"Referent" turkumi tizimlari qobiq va ma'lumot modullaridan iborat. Hozirgi vaqtda Referent-2000 qobig'i eng mashhur hisoblanadi. Bu sizga bir vaqtning o'zida mahalliy ma'lumotlar bazalari va huquqiy ma'lumotlarning Internet-serverlari bilan ishlash, shuningdek kuchli muharrir va ma'muriyat vositalari yordamida qobiq ichida o'z ma'lumotlar bazangizni yaratishga imkon beradi.

"Referent" turkumining ma'lumotnoma-huquqiy tizimlari foydalanuvchilarga qulay interfeysga ega va hujjatlarni qidirish, shuningdek hujjatlar ro'yxati va matni bilan ishlash uchun an'anaviy huquqiy bazalarning barcha asosiy funktsiyalarini bajaradi.

"Referent" interfeysi Windows-ga imkon qadar yaqin, shuning uchun dasturni ishlab chiqishda ko'p vaqt sarflash kerak emas. "Referent" hujjatlarni qidirish uchun so'rovni yaratishda sichqonchani yordamida ekran atrofidagi ma'lumotlarni ko'chirishga imkon beradigan "Drag and Drop" funktsiyasini qo'llab-quvvatlaydi. Qidiruvning o'zi bir vaqtning o'zida birlashtirilgan modullarda ham amalga oshirilishi mumkin va bir qator hujjatlar ichiga o'rnatilgan rangli grafik ob'ektlar, masalan, Rossiya yoki Moskva gerblari kiritilgan.

O'rnatilgan hujjat muharriri nafaqat matnlarni tahrirlash, balki hujjatlar xaritasini yaratish, izohlar berish, shuningdek grafik tasvirlarni, shu jumladan animatsion (ko'chirilgan) rasmlarni kiritish va gipermatnli havolalarni tartibga solish imkonini beradi.

Referent qobig'ining yana bir o'ziga xos xususiyati - 200 tagacha hujjatlarni, shu jumladan grafika va videoni o'z ichiga olgan hujjatlar ma'lumotlar bazasini yaratish va saqlash. Bu xususiyat, ayniqsa kichik ish oqimi va soni bo'lgan kompaniyalar uchun juda qiziq. Yirik firmalarga 65000 tagacha hujjatlarni saqlash tizimi taklif etiladi.

Xulosa

Internetning tobora kengayib borayotgan axborot makonida ma'lumot olishning eng oson usuli - turli xil qidirish mexanizmlaridan foydalanish. Bunday mashinaning asosiy vazifasi tarmoq tugunlarini avtomatik ravishda ko'rib chiqish va yig'ishdir kerakli ma'lumotlar. Yig'ilgan ma'lumotlar indekslanadi, ya'ni ma'lum tartibda tuziladi va ma'lum bir mezon bo'yicha tasniflanadi. Kelgusida ushbu ma'lumot mijozlar so'rovlariga xizmat ko'rsatish uchun ishlatiladi.

Ixtisoslashgan kataloglar yoki kataloglar alohida sohalar va yangiliklar, yangiliklar, shaharlar, manzillar uchun yaratiladi elektron pochta  va h.k.

Foydalanuvchiga xizmat ko'rsatishda ikkita asosiy yondashuv amalga oshiriladi: ma'lumotni ierarxik katalogning daraxtidan o'tish orqali qidirish yoki tizim tomonidan qo'llab-quvvatlanadigan qidiruv tili doirasida so'rovni shakllantirish.

Zamonaviy Internet foydalanuvchisi uchun asosiy muammo bu tashkilotdir samarali qidiruv  ma'lumotlar. Ushbu muammoni hal qilish bilan bog'liq qiyinchiliklar vaqt o'tishi bilan ortib boradi, chunki har to'rt oyda tarmoqdagi ma'lumotlar miqdori ikki baravar ko'payadi.

FOYDALANILGAN ADABIYOTLAR RO'YXATI

1. Alekseev E. G., Bogatyrev S. D. Informatika. Multimedia elektron darsligi.

2. Ashmanov I. S. Veb-saytni qidiruv tizimlarida reklama qilish / I. S. Ashmanov. - M.: "Uilyams", 2007. - 304 b.

3. Ivasenko A. G. Axborot texnologiyalari  iqtisodiyot va menejment bo'yicha: qo'llanma  / A.G. I. Vasenko, A. Yu. Gridasov, V.A. Pavlenko.- 2-chi nashr, O'chirilgan.- M.: KNORUS, 2007.- 160s.

4. Informatika. Asosiy kurs: darslik / tahrir. S.V.Simonovich. - SPb .: "Piter", 2007.- 110 b.

5. Kadeev D. N. Axborot texnologiyalari va elektron aloqa / D. N. Kadeev.- M .: "Elektro", 2005.- 250 b.

6. Kolisnichenko D. N. Internetda qidiruv tizimlari va veb-saytlarni reklama qilish / D. N. Kolisnichenko. - M .: "Dialektika", 2007. - 272 b.

7. Lande D.V. Internetda ma'lumot qidirish / D.V. Lande. - M .: "Dialektika", 2005. - 272 b.

8. Manning K. ma'lumot qidirishga kirish / K. Manning. - M .: "Uilyams", 2011.- 200 b.

9. Mixeeva E. V. Kasbiy faoliyatda axborot texnologiyalari: o'quv qo'llanma. - M: TK VELBI, "Prospect" nashriyoti, 2007.- 448s.

10. Hujjatlar bilan ishlashni tashkil etish: Darslik / Ed. prof. V.A. Kudryaeva - 2-nashr, Rev. va qo'shimcha.- M .: INFRA-M, 2001.- 592s.

11. Saxarova E. V. Informatika. Ko'rsatmalar / E.V. Saxarova.- Stavropol: STIS, 2006.- 200 b.

12. Chursin N. A. Ommabop informatika / N. A. Chursin.- M .: "Uilyams", 2007.- 300 b.

Sizga maqola yoqdimi? Do'stlar bilan baham ko'ring: