Ma'lumot xizmatlarida ma'lumot olish tizimi. Axborot qidirish tizimlari

\u003e Axborot-qidirish tizimlari bilan ishlash ( umumiy ma'lumot, ish tartibi, topilgan ma'lumotlarni saqlash va tahrirlash)

Axborot qidiruv tizimi - tabiiy tildan axborot qidirish va teskari tarjimaga tarjima qilish uchun axborot qidirish qoidalarining to'plami, shuningdek, ma'lumot olish uchun mo'ljallangan mos mezon. Ma'lumotni qidirish tizimining (ISS) tarkibiy qismlari tarkibiga axborot olish tili, tarjima qoidalari va mos keladigan mezondan tashqari, uni texnik amalga oshirish vositalari, axborot qidirish amalga oshiriladigan bir qator matnlar (hujjatlar) va to'g'ridan-to'g'ri aloqador odamlar kiradi. ushbu qidiruv.

Axborot qidirish - bu so'rovda ko'rsatilgan mavzuga (mavzuga) bag'ishlangan yoki iste'molchiga kerak bo'lgan faktlar va ma'lumotlarni o'z ichiga olgan barcha matnlarni (hujjatlarni) topish jarayoni. IP axborot qidirish tizimi yordamida amalga oshiriladi va qo'lda yoki mexanizatsiyalash yoki avtomatlashtirish vositalaridan foydalangan holda amalga oshiriladi. Inson IP-ning ajralmas ishtirokchisi hisoblanadi. Axborot-qidirish tizimi (ISS) tomonidan chiqarilgan matnlarda mavjud bo'lgan ma'lumotlarning xususiyatiga qarab, IP hujjatli, shu jumladan bibliografik va daliliy bo'lishi mumkin. SP ma'lumotni mantiqiy qayta ishlashidan ajralib turishi kerak, bu holda odam o'zi tomonidan berilgan savollarga bevosita javob berish mumkin emas. IP holatida IPSga kiritilgan bunday va faqat shu kabi faktlar yoki ma'lumotlar qidiriladi va ularni topish mumkin. Matnni (hujjatni) XKSga kiritishdan oldin uning asosiy semantik mazmuni (mavzusi yoki mavzusi) aniqlanadi, keyinchalik tarjima qilinadi va axborot olish tillaridan birida yozib olinadi. Ushbu yozuv matnli qidiruv tasviri deb nomlanadi. Yozilgan faktlar va ma'lumotlar IPSga ma'lum bir tarzda kiritilganda ham xuddi shunday bo'ladi. Qabul qilingan so'rov, shuningdek, qidiruv retseptini shakllantirgan holda, ma'lumot olish tiliga tarjima qilingan. Matnlarning qidiruv rasmlari va izlash ko'rsatmalari bir xil tilda yozilganligi sababli, ularni faqat bitta shaklda izohlash mumkin bo'lgan iboralar, ularni ma'nosiga chuqur kirib bormasdan, rasmiy ravishda taqqoslash mumkin. Buning uchun qidiruv tasvirining qidiruv retsepti bilan rasmiy ravishda bir xil darajada qaysi darajasida mos kelishini belgilaydigan ba'zi qoidalar (mos keladigan mezon) belgilanadi, matn axborot so'roviga javob beradigan va berilishi shart bo'lgan deb hisoblanishi kerak.

IP-ning texnik samaradorligi ikkita nisbiy ko'rsatkich bilan tavsiflanadi - aniqlik koeffitsienti (axborot so'roviga javob beradigan matnlar sonining berilgan sondagi matnlarning umumiy soniga nisbati) va to'liqlik koeffitsienti (axborot so'roviga javob beradigan matnlar sonining ushbu nashrdagi ushbu matnlarning umumiy soniga nisbati). IPS). Ushbu ko'rsatkichlarning talab qilinadigan qiymatlari axborot ehtiyojlarining o'ziga xos xususiyatlariga bog'liq. Masalan, patentga bo'lgan talabnomani yangilik uchun o'rganish uchun patent tavsiflarini qidirishda, masalaning 100% to'liqligi talab qilinadi; oddiy tadqiqotchi yoki muhandisga yo'naltirilgan qidiruvda taxminan 80% chiqish aniqligi juda yaxshi, to'liqligi taxminan 50% deb hisoblanadi.

1-rasm - qidirish jarayoni

IP ikki xil bo'lishi mumkin - ma'lumotni tanlab (yoki maqsadli) tarqatish va retrospektiv qidirish. Axborotni tanlab tarqatish bilan IP ma'lum bir sonli iste'molchilar (abonentlar) ning doimiy talablariga binoan amalga oshiriladi, vaqti-vaqti bilan (odatda haftada bir yoki har ikki haftada bir marta) amalga oshiriladi va faqat shu vaqt oralig'ida IPS tomonidan qabul qilingan matnlar qatorida bajariladi.

IPS va iste'molchilar (abonentlar) o'rtasida samarali teskari aloqa o'rnatiladi (abonent ushbu matnning so'rovga qanchalik mos kelishini va to'liq matnning nusxasi kerakligini, ushbu matnning uning axborot ehtiyojlariga muvofiqligi darajasi to'g'risida xabar beradi), bu esa abonentlarning ehtiyojlarini aniqlashtirishga, o'z vaqtida javob berishga imkon beradi. ushbu ehtiyojlarni o'zgartirish va tizim ish faoliyatini optimallashtirish.

Retrospektiv qidiruvda IRS bir martalik so'rovlar bo'yicha barcha to'plangan matnlar qatorida kerakli ma'lumotlarni o'z ichiga olgan matnlarni topadi.

WWW zamonaviy axborot qidirish tizimlarining arxitekturasi.

Keling, bunday tizimning odatiy sxemasini ko'rib chiqaylik. Muayyan tizimlarga bag'ishlangan turli xil nashrlarda bir-biridan faqat o'ziga xos xususiyatlarni qo'llash bilan farq qiladigan sxemalar berilgan dasturiy echimlar, ammo tizimning turli tarkibiy qismlarini tartibga solish printsipi emas. Shuning uchun biz ushbu sxemani keltirilgan misol yordamida ko'rib chiqamiz:

2-rasm - Internet uchun ISS tuzilishi

Ushbu diagrammada quyidagilar ko'rsatilgan:

mijoz ma'lum bir axborot resursining tomoshabinidir. Hozirda Netscape Navigator kabi eng mashhur ko'p protokolli dasturlar. Bunday dastur Dunyo hujjatlarini ko'rishni ta'minlaydi Internet tarmog'i, Gopher, Wais, FTP arxivlari, pochta ro'yxatlari va Usenet yangiliklar guruhlari. O'z navbatida, bularning barchasi axborot resurslari axborot qidirish tizimining qidirish ob'ekti.

foydalanuvchi interfeysi - foydalanuvchi interfeysi shunchaki tomoshabin emas. Axborot qidirish tizimida ushbu ibora foydalanuvchi va tizim qidiruvi o'rtasidagi aloqa usuli sifatida ham tushuniladi, ya'ni. so'rovlarni yaratish va qidiruv natijalarini ko'rish tizimi bilan. Tarmoqning qidiruv natijalari va axborot resurslarini ko'rish butunlay boshqacha narsalar, ular haqida biroz keyinroq to'xtalamiz.

qidiruv tizimi - qidiruv tizimi foydalanuvchining ma'lumot qidirish tilida (IPL) tayyorlangan so'rovini tizimning rasmiy so'roviga tarjima qilish, Tarmoqning axborot resurslariga havolalarni qidirish va foydalanuvchiga ushbu qidiruv natijalarini ko'rsatish uchun ishlatiladi.

indeks ma'lumotlar bazasi - indeks axborot qidirish tizimining asosiy ma'lumotlar qatoridir. Bu axborot resursining manzilini topishga xizmat qiladi. Indeksning arxitekturasi shunday tuzilganki, qidirish imkon qadar tezroq bo'ladi va shu bilan birga tarmoqning har bir topilgan axborot resurslarining qiymatini taxmin qilish mumkin bo'ladi.

so'rovlar - foydalanuvchi so'rovlari uning shaxsiy ma'lumotlar bazasida saqlanadi. Har bir so'rovni disk raskadrovka qilish uchun ko'p vaqt talab etiladi va shuning uchun tizim yaxshi javob beradigan so'rovlarni saqlab qolish juda muhimdir.

indeksli robot - indeksator robot Internetni kezib chiqish va indekslar bazasini yangilab turish uchun ishlatiladi. Ushbu dastur tarmoqning axborot resurslari holati to'g'risida asosiy ma'lumot manbai hisoblanadi.

www saytlari bu butun Internet. Aniqrog'i, bu tomoshabinlar ko'radigan axborot resurslari.

Qidiruv tizimlar odatda uchta tarkibiy qismdan iborat:

1. Internetda sayohat qiladigan va ma'lumot to'playdigan agent (o'rgimchak yoki palakli);

2. o'rgimchaklar tomonidan to'plangan barcha ma'lumotlarni o'z ichiga olgan ma'lumotlar bazasi;

3. ma'lumotlar bazasi bilan aloqa qilish uchun odamlar interfeys sifatida foydalanadigan qidiruv tizimi.

Rossiya Federatsiyasi Ta'lim vazirligi.

Adighe davlat universiteti

Kurs ishlari.

"Avtomatlashtirilgan axborot qidirish tizimlari" mavzusida.

Bajarildi

guruh talabasi

Tekshirildi

Kirish …………………………………………………………… .. 3

1. Axborot tizimlari …………………………… .4

Kontseptsiya axborot tizimlari………………………………………4

Axborot tizimlarining tuzilishi ……………………………………………… 4

Axborot tizimlari tasnifi …………………………… ..6

2. Axborot-qidirish tizimlari …………………………………… 7

Qidiruv tizimlarni rivojlantirishning tarixiy dastlabki shartlari ………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………… 7

Qidiruv tizimlar kontseptsiyasi …………………………………………………………………………………………………………………………… 9 9

Qidiruv tizimlarining xususiyatlari …………………………………………………… 10

· tarmoq tuzilishi ………………………………… ...

· qidiruv tizimlarining tuzilishi ......................................... 13

3. Qidiruv tizimlarning xususiyatlari ……………………………… 17

4. qidiruv tizimlarining muammolari va imkoniyatlari ………………… 24

Xulosa …………………………………………… .25

Adabiyotlar …………………………………………………… ... 26

KIRISH

Sivilizatsiya rivojlanishining zamonaviy bosqichi insoniyatning eng rivojlangan qismidan o'tishi bilan tavsiflanadi sanoat jamiyati axborotga. Ushbu jarayonning eng yorqin hodisalaridan biri bu global axborot kompyuter tarmog'ining paydo bo'lishi va rivojlanishi.

Bunda muddatli ish hisobga olinadi nazariy asos axborot olish, axborot qidirish tizimlarining tasnifi va navlari. Hozirda ishlatilgan ma'lumotlarning materiallari - qidiruv katalogi to'liq matnli va gipermatnli qidiruv tizimlari.

Internet paydo bo'lishi bilan qidirish muammosi dolzarb bo'lib qoldi. Internet - butun dunyo bo'ylab kompyuter tarmog'i, bu birlashgan axborot muhiti bo'lib, istalgan vaqtda ma'lumot olishga imkon beradi. Ammo boshqa tomondan, Internetda juda ko'p foydali ma'lumotlar saqlanadi, ammo ularni topish uchun ko'p vaqt talab etiladi. Ushbu muammo paydo bo'lishiga sabab bo'ldi qidiruv tizimlari... Ushbu kurs ishida Internetdagi qidiruv tizimlari ko'rib chiqiladi.

Axborot tizimlari

Axborot tizimlari kontseptsiyasi

Axborot tizimi deganda dasturiy ta'minot, apparat vositalari va boshqa yordamchi vositalarning uyushgan to'plami tushuniladi, texnologik jarayonlar va ma'lum bir mavzudagi axborot resurslarini yig'ish, taqdim etish va to'plashni, foydalanuvchilarning axborot ehtiyojlarini qondirish uchun zarur bo'lgan ma'lumotlarni qidirishni va etkazib berishni ta'minlaydigan ishchilarning funktsional guruhlari. Axborot tizimlari har xil faoliyat turlarini axborot bilan ta'minlash muammolarini hal qilishning asosiy vositasi, qo'llanmasi va axborot texnologiyalari sanoatining eng tez rivojlanayotgan tarmog'idir.

Axborot tizimining tuzilishi

Axborot tizimini uchta kichik tizimga bo'lish mumkin:

1. Axborot yig'ishning tashkiliy - texnologik quyi tizimi axborot tizimini ta'minlaydi va tizimda to'planish uchun axborot tanlashning tashkiliy - texnologik zanjirini o'z ichiga oladi. Axborot to'plash uchun to'g'ri tashkil etilgan quyi tizimsiz butun axborot tizimining ishlashini samarali ravishda bir butun sifatida tashkil etish mumkin emas.

2. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimining yadrosini tashkil etadi va bu tizim ishlab chiquvchilari va obunachilari tomonidan predmet sohasining tuzilishi va rasmining taqdimoti aksidir, bu haqda axborot tizimi aks ettirishi kerak. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimini rivojlantirishning eng murakkab qismlaridan biridir.

3. Normativ - funktsional quyi tizim ma'lumot berish tizimning foydalanuvchilarini yoki boshqa usulda abonentlarini belgilaydi, axborot tizimining vazifalarini tayinlash va amalga oshirishning maqsadli tomonlarini amalga oshiradi.

Barcha qidiruv tizimlarining asoslari ma'lumotlar bazalari - dastur dasturlaridan qat'i nazar, ma'lumotlarni tavsiflash, saqlash va boshqarish uchun umumiy tamoyillarni ta'minlaydigan chegara qoidalariga muvofiq tashkil etilgan ma'lumotlar to'plamidir.

Axborot tizimlari faoliyatining quyidagi elementlarini ajratish mumkin:

* Axborot to'plash - maxsus tartibda tashkil etilgan ma'lumotlarni yig'ish va namoyish qilish jarayoni:

ma'lumot olish

ma'lumotlarning dolzarbligini baholash

ma'lumotlarni tanlash va yozib olish tartibi.

* Sotib olish - ko'p qismlardan ma'lumotlarni bir butunga qo'shish va foydalanuvchiga etkazish jarayoni.

* Axborotni izlash va etkazib berish - boshqaruv tizimi va texnologik jarayonlarda axborot tizimi abonentlarining axborot ehtiyojlarini qondirish uchun maxsus texnologik buyurtmani o'rnatish.

* Axborotning yaxlitligini va saqlanishini ta'minlash - o'z ahamiyatini yo'qotgan ma'lumotlarni qayta ko'rib chiqish, qayta ko'rib chiqish va saralash ajralmas vazifadir axborot birliklari... Axborot xavfsizligi normativ va ko'rsatma hujjatlar yordamida amalga oshiriladi.

Axborot tizimlarining tasnifi

Ta'minotning mohiyati bo'yicha mantiqiy tashkilot saqlanadigan ma'lumotlar haqiqiy, hujjatli va geo-axborotga bo'linadi.

Faktograflar ma'lumotlarni bir yoki bir nechta turdagi bir nechta nusxalar shaklida to'playdi va saqlaydi strukturaviy elementlar... Ushbu tuzilish elementlarining har bir nusxasi yoki ularning bir qismi biron bir voqea, hodisa to'g'risidagi ma'lumotlarni aks ettiradi. Har bir turdagi axborot ob'ekti tuzilishi ma'lum predmet sohasi ob'ektlari uchun ma'lumotlarning asosiy jihatlari va xususiyatlarini aks ettiruvchi atributlarning cheklangan to'plamidan iborat.

Hujjatli hujjatlarda ma'lumotlarning yagona elementi kichik elementlarga bo'linmaydigan hujjat bo'lib, ma'lumotlar kiritilganda odatda tuzilmaga kirmaydi yoki cheklangan shaklda tuziladi. Kiritilgan hujjat uchun ba'zi rasmiylashtirilgan lavozimlar belgilanishi mumkin - ishlab chiqarilgan sanasi, ijrochisi, mavzusi. Hujjatli axborot tizimlarining ayrim turlari kiritilgan hujjatlar o'rtasida mantiqiy aloqaning o'rnatilishini ta'minlaydi - semantik mazmun jihatidan subordinatsiya.

Geoinformatsion ma'lumotlar umumiy elektron topografik asosga bog'langan alohida axborot ob'ektlari shaklida tashkil etilgan. Geografik axborot tizimlari ularda axborotni qo'llab-quvvatlash uchun foydalaniladi mavzular, geografik komponent mavjud bo'lgan axborot ob'ektlari va jarayonlarining tuzilishi.

Qidiruv tizimlarni tasniflashning yana bir mezonlari echilishi kerak bo'lgan vazifalar yoki vazifalardir.

Ma'lumotnoma - bu axborot tizimi funktsiyalarining eng keng tarqalgan turi bo'lib, tizim abonentlariga ob'ektlarning ayrim sinflari uchun o'rnatish ma'lumotlarini olish imkoniyatini berishdan iborat.

Qidiruv tizimlar axborot tizimlarining eng keng tarqalgan sinfidir. Umuman olganda, shaklni predmet sohasini mantiqiy tavsiflash nuqtai nazaridan ko'rsatilgan axborot makonining bir turi deb hisoblash mumkin.

Hisoblash tizimdagi ma'lumotlarni turli maqsadlar uchun ma'lum hisoblash algoritmlariga muvofiq qayta ishlashdan iborat.

Axborot tizimlarining texnologik funktsiyalari butun texnologik tsiklni yoki uning alohida tarkibiy qismlarini, ishlab chiqarish yoki tashkiliy tuzilishini avtomatlashtirishdan iborat.

Ma'lumotlarni qidirish tizimlari

Qidiruv tizimlarni rivojlantirish uchun tarixiy old shartlar.

Keling, turli xil kompyuter tizimlari o'rtasida taqsimlangan axborot resurslarini almashish zarurati bilan bog'liq holda yaratilgan Internet tarixiga to'xtalamiz. Dastlabki dasturlarning aksariyati, shu jumladan FTP va elektron pochta, faqat Internet-xostlar o'rtasida ma'lumot almashish uchun ishlab chiqilgan.

Boshqa dasturlar, masalan, Telnet, foydalanuvchiga nafaqat ma'lumotlarga, balki masofaviy tizimning ish resurslariga ham kirish imkoniyatini berish uchun ishlab chiqilgan. Internet rivojlanishi bilan (ko'proq foydalanuvchilar va ko'proq xostlar) ma'lumotlar almashinuvining eski usullari foydalanuvchilarning ortib borayotgan ehtiyojlarini qondira olmay qoldi. Tarmoq resurslarini izlash va ularga kirishning yangi usullarini ishlab chiqish zarurati tug'ildi, bu esa uning shakli va joylashuvidan qat'i nazar ma'lumotlardan foydalanish imkoniyatini yaratdi.

Bunday ehtiyojlarni qondirish uchun birinchi bo'lib Archie qidiruvi yaratildi. muammoni hal qilish FTP-serverdagi resurslarni lokalizatsiya qilish va turli xil kirishni osonlashtiradigan Gopher tizimi tarmoq manbalari... Keyin tarmoq haqida ma'lumot wWW tizimlari va ma'lumot olishning mutlaqo yangi usullarini taklif qiluvchi WAIS. Ushbu tizimlarning ishlash printsiplari Internetning o'zi ishlash mexanizmlarini taqdim etmasdan juda ko'p miqdordagi axborot resurslarida harakat qilishni osonlashtiradi. Ushbu yondashuv nafaqat o'zaro bog'liq manbalar haqida gapirish imkonini beradi kompyuter tizimlari, lekin tarmoqning maxsus ma'lumot bo'shliqlari haqida.

Tizim Archi kompleks dasturiy vositalarmaxsus ma'lumotlar bazalari bilan ishlash. Ushbu ma'lumotlar bazalarida FTP xizmati orqali kirish mumkin bo'lgan fayllar to'g'risida doimiy ravishda yangilanadigan ma'lumotlar mavjud. Archie tizimining xizmatlaridan foydalangan holda siz uning nomidagi naqsh bo'yicha faylni qidirishingiz mumkin. Bunday holda, foydalanuvchi tarmoqdagi saqlash joyini aniq ko'rsatgan fayllar ro'yxatini, shuningdek fayllarning turi, yaratilish vaqti va hajmi to'g'risida ma'lumot oladi. Archie axborot qidirish tizimiga elektron pochta orqali so'rovlar va Telnet xizmatlaridan tortib, grafik Archie mijozlaridan foydalanishga qadar turli usullar bilan kirish mumkin.

Tizim Gopher FTP-Internet resurslarini lokalizatsiya qilish jarayonini soddalashtirish va FTP-serverlarda saqlanadigan fayllar tarkibi to'g'risidagi ma'lumotlarni qulayroq taqdim etish uchun ishlab chiqilgan. Gopher tizimi foydalanuvchilarga mavjud fayllar va ularning mazmuni haqida taqdim etish uchun qulay shaklda (menyu ko'rinishida) imkoniyat yaratadi. Gopher server menyularida boshqa Gopher va FTP serverlariga havolalar bo'lishi mumkin. Shunday qilib, foydalanuvchi Internetda "bemaqsad qilish" imkoniyatiga ega bo'lib, qiziqish manbalarining joylashuviga ahamiyat bermaydi va ushbu manbalarga kirish huquqini qo'lga kiritadi.

Tizim Veronika menyu elementlari sarlavhalari bo'yicha Gopher makonida ma'lumot topish uchun ishlatiladi. Kalit so'zni kiritgandan so'ng, Veronica tizimi uning biron bir Gopher serveridagi menyuda mavjudligini aniqlaydi va kalit so'zni o'z ichiga olgan menyu elementlari sarlavhasini qidiruv natijalari sifatida qaytaradi. Veronika tizimi avtonom bo'lmaganligi sababli qidiruv dasturi, lekin Gopher tizimi bilan chambarchas bog'liq, u Gopher tizimi bilan bir xil kamchiliklarga ega: sarlavhadan u yoki bu ma'lumot manbai nima ekanligini bilish har doim ham mumkin emas. Tizimning afzalligi shundaki, topilgan ma'lumotlar qaerda joylashganligini aniqlashga hojat yo'q, ro'yxatdan kerakli yozuvni tanlash kifoya.

Axborot qidirish tizimlari haqida tushuncha.

Avtomatlashtirilgan qidiruv tizimi - bu belgilangan funktsiyalarni bajarish uchun axborot texnologiyalarini amalga oshiradigan xodimlar va uning faoliyatini avtomatlashtirish vositalari to'plamidan iborat tizim.

Faoliyatning turli sohalarida tizimlarni yaratish tajribasi va amaliyoti ularning mohiyatining barcha jihatlarini yanada to'liq aks ettiradigan kengroq va universal ta'rif berishga imkon beradi.

Shundan so'ng, axborot tizimi deganda ma'lum mavzudagi sohada axborot resurslarini yig'ish, taqdim etish va to'plashni, belgilangan axborot ehtiyojlarini qondirish uchun zarur bo'lgan ma'lumotlarni qidirishni va etkazib berishni ta'minlaydigan dasturiy ta'minot, apparat va boshqa yordamchi vositalar, texnologik jarayonlar va funktsional jihatdan aniqlangan ishchilar guruhining uyushgan to'plami tushuniladi. foydalanuvchilarning kontingenti - tizim abonentlari.

Qidiruv tizimlarining xususiyatlari.

Asarda qidirish jarayoni to'rt bosqich bilan ifodalanadi: shakllantirish (qidiruv boshlanishidan oldin sodir bo'ladi); harakat (qidirishni boshlash); natijalarga umumiy nuqtai (qidiruvdan so'ng foydalanuvchi ko'radigan natija); va takomillashtirish (natijalarni ko'rib chiqqandan so'ng va xuddi shu ehtiyojning boshqa formulasi bilan qidiruvga qaytishdan oldin). Lineer bo'lmagan ma'lumotni qidirish sxemasi quyidagi bosqichlardan iborat:

1. Tabiiy tilda axborotga bo'lgan ehtiyojni qondirish;

2. Tanlash qidiruv xizmatlari ma'lum tarmoqlarni qidirish tillarida (IPL) axborotga bo'lgan ehtiyojlarni qayd etish tarmoqlari va rasmiylashtirilishi;

3. Yaratilgan so'rovlarni bajarish;

4. Hujjatlarga olingan havolalar ro'yxatlarini oldindan qayta ishlash;

5. Kerakli hujjatlar uchun tanlangan manzillar bilan bog'lanish;

6. Topilgan hujjatlar tarkibini oldindan ko'rib chiqish;

7. Keyinchalik o'rganish uchun tegishli hujjatlarni saqlash;

8. So'rovni kengaytirish uchun tegishli hujjatlardan havolalarni chiqarish;

9. Saqlangan hujjatlarning butun massivini o'rganish;

10. Agar ma'lumotga bo'lgan ehtiyoj to'liq qondirilmagan bo'lsa, unda birinchi bosqichga qayting.

Qidiruv jarayoni nihoyatda chuqur didaktik jihatga ega - masalan, interaktiv axborot tizimlaridan foydalanish oddiy foydalanuvchilar orasida odatda eng taniqli olimlarga xos bo'lgan axborot qidirish faoliyati uslubining shakllanishiga olib kelishi aniqlandi.

Ko'pgina hollarda, har qanday ma'lumotni o'rgangandan so'ng, ma'lumotga ehtiyoj paydo bo'ladi yangi ma'lumotlarfoydalanuvchi tomonidan qabul qilingan. Vaziyat ko'pincha foydalanuvchida kerakli mavzu bo'yicha ma'lum bir qator hujjatlar mavjud bo'lganda paydo bo'ladi. Ushbu hujjatlarni avtomatlashtirilgan kompilyatsiya uchun ishlatish taklif etiladi qidiruv so'rovi yordamida ixtisoslashgan tizim hujjatlarni boshqarish (DMS) (tizim ishlab chiqilmoqda).

Tizim barcha foydalanuvchi hujjatlarini indeksatsiya qilishi kerak. Indekslash jarayonida hujjatlardagi barcha so'zlar quyidagi semantik sinflarga bo'linadi: to'xtash so'zlari; kundalik (og'zaki) tilning eng tez-tez uchraydigan so'zlari; umumiy madaniy terminologiya; umumiy ilmiy terminologiya; tizimga ma'lum domen shartlari; noma'lum so'zlar. Bo'lish kerak bo'lgan tegishli lug'atlar asosida amalga oshiriladi qismi tizimlar. Mavzu doirasidagi ko'plab maxsus so'zlar noma'lum so'zlar deb tasniflanadi. Yangi tuzilgan atamalar va xatolarni o'z ichiga olgan so'zlar ham u erga etib boradi.

Indeks asosida hujjatlarning vektorli namoyishi quriladi, shundan so'ng DMS hujjatlar to'plamining ierarxik klasterini amalga oshiradi, natijada ushbu to'plam tematik guruhlarga bo'linadi. Foydalanuvchi bilan dialog davomida bir yoki bir nechta eng mos hujjatlar klasterlari tanlanadi va qidirish jarayonining xususiyatlari o'rnatiladi.

Qidiruv so'rovi tanlangan klasterning centroid vektoriga asoslangan bo'lishi kerak. Eng maqbul so'rov hajmi 8-12 dan 25-30 gacha. SUD tomonidan amalga oshirilgan so'nggi tayyorgarlik jarayoni IPLga so'rov yozishdir.

Tarmoq tuzilishi.

Ma'lumki, Internetda ma'lumot qidirishni kengaytirishning eng oddiy usuli metasearch tizimlarida qo'llaniladi va ishlatiladigan asosiy ISS sonini ko'paytirishdan iborat. Ushbu mexanizm ishlab chiqilayotgan har qanday tizimda amalga oshirilishi kerak. Qidiruv tizim resurslarini global tarmoqning turli XKS-larida tarqatish muammosi, avvalgi qidiruv sessiyalari davomida tegishli deb tan olingan havolalar ulushiga qarab, mos ravishda hal qilinishi kerak.

Avtomatlashtirilgan qidiruv tizimining ikkinchi bloki yaratilgan so'rovni yuboradi va qabul qilingan havolalarni saralash va saralashni amalga oshiradi, shundan so'ng tanlangan manzillarga murojaat qiladi va tarmoqdan o'z ichiga ko'priklar ham bo'lgan hujjatlar to'plamini oladi.

Tadqiqot shuni ko'rsatadiki, global tarmoq tarkibining tasodifiyligi va aloqalarning biron bir tuzilmasining yo'qligi haqidagi keng tarqalgan fikr aldanishdir. "Jamiyatlar" deb ataladigan narsalar aniqlandi - bir-biriga o'xshash mavzulardagi materiallarni o'z ichiga olgan saytlarning yaxshi bog'langan guruhlari. Belgilangan "markaziy" sahifalar - ko'plab havolalar olib boradigan katta havolalar va sahifalar ro'yxati - "vakolatli" sahifalar. Shunday qilib, qidiruvning 8-bosqichining maqsadi ana shunday guruhlarni topish va ularning a'zolari orasida eng "obro'li" ni aniqlashdir. Ko'rsatilganidek, ushbu muammoni hal qilish algoritmi juda oddiy.

Qidiruv natijalarini qayta ishlash.

Tarmoqda qidirish natijasida ma'lum bir hujjatlar to'plamini olgandan so'ng, ular orasida eng munosiblarini tanlash kerak. "Jamiyatlar" ning mavjudligi bu vazifani osonlashtirmaydi. Eng keng tarqalgan vaziyatlarning quyidagi bir nechta sinflarini ajratish mumkin.

1. Tarmoqning o'rganilayotgan segmentida kerakli ma'lumotlarning yo'qligi. Xuddi shunday holat ham tasvirlangan. Bunday holda siz boshqa segmentga o'tishingiz kerak, ya'ni odatda boshqa tillarda yaratilgan resurslarni o'rganishingiz kerak.

2. Topilgan "jamoalar" kerakli mavzudagi emas, balki asosan kerakli mavzuga yaqin bo'lganlar haqidagi ma'lumotlarni o'z ichiga oladi.

3. Juda ko'p ma'lumot manbalari topildi.

So'nggi ikkita holatda, topilgan barcha hujjatlarni avtomatik ravishda ro'yxatga olish va ularning asl so'rovga yaqinlik darajasini aniqlash kerak. Ishda vektorli tasvirda hujjatlarni taqqoslash uchun mos bo'lgan 20 dan ortiq o'lchov o'lchovlari ko'rib chiqilgan. Reyting masalasini optimal echimiga agentga asoslangan yondashuvga asoslangan tizim yordamida erishiladi.

Ko'p hollarda, qidirish yangi maydonfoydalanuvchining umumiy darajasi etarlicha yuqori bo'lmaganida, namoyish etilgan ma'lumotlarni matn uslubi bo'yicha filtrlash maqsadga muvofiqdir, shunda material bilan dastlabki tanishish ommabop va ilmiy-ommabop matnlar yordamida amalga oshiriladi.

Ko'rib chiqilgan materiallar miqdorini kamaytirish uchun siz qidiruv natijalarini manba turlari bo'yicha filtrlashingiz kerak. Ilmiy saytlarda, tijorat saytlarida yoki media-serverlarda joylashgan hujjatlar tabiatan sezilarli darajada farq qilishi shunchalik ravshanki.

Qidiruv tizimlarning tuzilishi.

Qidiruv ko'rsatkichi uch bosqichda ishlaydi, shulardan dastlabki ikkitasi tayyor va foydalanuvchiga ko'rinmaydi. Qidiruv indekslari avval ma'lumot to'playdi Dunyo Keng Internet . Ushbu foydalanish uchun maxsus dasturlar, shunga o'xshash brauzerlar. Ular berilgan veb-sahifani qidiruv indekslari serveriga ko'chirib olishlari, ko'rishlari, tarkibidagi barcha ko'priklarni, u erda joylashgan resurslarni topishlari, u erda yana ko'priklarni topishlari va h.k. qurtlar, o'rgimchaklar, tırtıllar, sudraluvchilar, o'rgimchaklar va shunga o'xshash boshqa ismlar. "Har bir qidiruv indekslari ushbu maqsadlar uchun o'ziga xos dasturdan foydalanadi, u ko'pincha o'zini o'zi rivojlantiradi. Ko'plab zamonaviy qidiruv tizimlari Internetni kuzatuvchi avtomatik dasturlarni ishlab chiqish va amalga oshirish bilan bog'liq eksperimental loyihalardan tug'ildi. Nazariy jihatdan muvaffaqiyatli kirish bilan. o'rgimchak butun Web-maydonni bitta immersiya bilan tarashga qodir, ammo bu juda ko'p vaqtni talab qiladi va u erda sodir bo'lgan o'zgarishlarni kuzatib borish va "o'lik" havolalarni, ya'ni dolzarbligini yo'qotganlarni aniqlash uchun vaqti-vaqti bilan ilgari tashrif buyurilgan resurslarga qaytishi kerak.

Qidirilgan veb-resurslarni qidiruv tizimining serveriga nusxalashdan so'ng, ishning ikkinchi bosqichi - indeksatsiya boshlanadi. Indekslash jarayonida maxsus ma'lumotlar bazalari yaratiladi, ularning yordamida Internetda ma'lum bir so'zni qaerda va qachon uchratganligini aniqlash mumkin. Indekslangan ma'lumotlar bazasini lug'at turi sifatida tasavvur qiling. Buning uchun qidiruv tizimi foydalanuvchi so'rovlariga juda tez javob berishi uchun kerak. Zamonaviy tizimlar bir soniyada javob berishga qodir, ammo agar siz indekslarni oldindan tayyorlamasangiz, unda bitta so'rovni ko'rib chiqish bir necha soat davom etadi.

Uchinchi bosqichda mijozning so'rovi ko'rib chiqiladi va qidiruv natijalari unga ko'priklar ro'yxati shaklida qaytariladi. Aytaylik, xaridor Internetda taniqli gollandiyalik mexanik, optik va matematik Kristian Gyuygens haqida so'z yuritadigan veb-sahifalar mavjud. U yozuv maydoniga Gyuygens so'zini kiritadi kalit so'zlar tugmachasini bosadi. Toping (Qidiring). Bir soniya ichida qidiruv mexanizmi o'z indekslari bazasidan foydalangan holda mos veb-resurslarni qidiradi va qidiruv natijalari sahifasini yaratadi, unga tavsiyalar ko'priklar ko'rinishida keltirilgan. Keyin mijoz ushbu havolalardan qiziqish manbalariga o'tish uchun foydalanishi mumkin.

Bularning barchasi etarlicha sodda ko'rinadi, ammo aslida bu erda muammolar mavjud. Asosiy muammo zamonaviy internet veb-sahifalarning ko'pligi bilan bog'liq. Masalan, qidiruv maydoniga futbol kabi oddiy so'zlarni kiritish kifoya, va rus qidiruvi bir necha ming havolani qaytarib beradi, ularni ko'rsatilgan sahifada 10-20 ga guruhlaydi.

Bir necha ming juda ko'p emas, chunki shunga o'xshash vaziyatda bo'lgan xorijiy qidiruv tizimi yuz minglab havolalarni beradi. Ularning orasida to'g'ri topishga harakat qiling! Biroq, oddiy iste'molchi uchun ular unga mingta qidiruv natijalarini yoki millionni berishlari muhim emas. Qoida tariqasida, mijozlar 50 dan ortiq birinchi havolalarga qarashmaydi va juda kam odam keyingi voqealar haqida qayg'uradi. Biroq, mijozlar sifat haqida juda va juda xavotirda. juda birinchi havolalar. Birinchi o'nlikda o'z ahamiyatini yo'qotgan havolalar mavjud bo'lganda, mijozlarga yoqmaydi, ketma-ket bir xil serverning qo'shni fayllariga havolalar bo'lganida, ular bezovtalanadilar. Eng yomon variant - bir xil manbaga olib boradigan, ammo turli xil serverlarda joylashgan qatorda bir nechta havolalar mavjud bo'lganda.

Mijoz eng foydali havolalar birinchi bo'lib bo'lishini kutish huquqiga ega. Bu erda muammo paydo bo'ladi. Inson foydali manbani foydasiz manbadan osongina ajrata oladi, ammo buni dasturga qanday tushuntirish mumkin?! Shu sababli, eng yaxshi qidiruv tizimlari o'zlarining resurslari sifati bo'yicha topilgan havolalarni saralashda sun'iy intellekt mo''jizalarini yaratadilar. Va ular buni tezda qilishlari kerak - mijoz kutishni yoqtirmaydi.

To'liq aytganda, barcha qidiruv tizimlari bir xil veb-maydondan ma'lumot olishadi, shuning uchun ularning manba ma'lumotlar bazalari nisbatan o'xshash bo'lishi mumkin. Va faqat uchinchi bosqichda, qidiruv natijalarini ko'rsatishda har bir qidiruv tizimi o'zining eng yaxshi (yoki yomon) individual xususiyatlarini namoyish eta boshlaydi. Olingan natijalarni saralash reyting deb nomlangan. Tizim har bir topilgan veb-sahifaga materialning sifatini aks ettiradigan reytingni belgilaydi. Ammo sifat sub'ektiv tushuncha bo'lib, dastur taqqoslash uchun mos raqamlar bilan ifodalanadigan ob'ektiv mezonlarga muhtoj.

So'rovda foydalanilgan kalit so'z sarlavhaga kiritilgan veb-sahifalarga yuqori reytinglar berilgan. Agar so'z veb-sahifada bir necha marta paydo bo'lsa, lekin tez-tez ko'rinmasa, reyting ko'tariladi. Kirish reytingiga ijobiy ta'sir qiladi to'g'ri so'z matnning dastlabki 5-6 xatboshilarida - ular indekslash uchun eng muhim deb hisoblanadi. Shu sababli tajribali veb-ustalar o'z sahifalarining boshida jadval berishdan qochishadi. Qidiruv tizim uchun jadvaldagi har bir katak abzatsga o'xshaydi va shuning uchun mazmunli asosiy matn ancha orqaga surilganga o'xshaydi (garchi bu ekranda sezilmasa ham) va qidiruv tizimi uchun hal qiluvchi rol o'ynashni to'xtatadi.

So'rovda ishlatiladigan kalit so'zlar illyustratsiyalar bilan birga keladigan muqobil matnga kiritilgan bo'lsa juda yaxshi. Qidiruv tizim uchun bu sahifa so'rovga to'liq mos kelishiga ishonch hosil qiluvchi belgi. Veb-sahifa sifatining yana bir belgisi - bu boshqa veb-sahifalardan havolalarga ega bo'lishi. Qancha ko'p bo'lsa, shuncha yaxshi bo'ladi. Bu shuni anglatadiki, ushbu veb-sahifa mashhur va yuqori darajaga ega keltirish darajasi. Eng ilg'or qidiruv tizimlari o'zlari ro'yxatdan o'tgan veb-sahifalarning havolalar darajasini kuzatib boradi va reytingda hisobga oladi.

Veb-sahifalarni yaratuvchilari har doim ko'proq odamlarni ko'rishni xohlashadi, shuning uchun ular qidiruv tizimlari ularga yuqori darajalarni berishlari uchun sahifalarni maxsus tayyorlaydilar. Veb-ustaning yaxshi va malakali ishlashi veb-sahifadagi trafikni sezilarli darajada ko'paytirishi mumkin, ammo qidiruvchilarni aldab, o'zlarining veb-sahifalariga aslida yo'q qiymatni berishga urinadigan sehrgarlar mavjud. Ular ba'zi bir so'zlarni yoki so'zlar guruhini veb-sahifada bir necha bor takrorlaydilar va ularni o'quvchining ko'z o'ngida qoldirmaslik uchun ularni juda kichik bosma nashrga aylantiradi yoki fon rangiga mos keladigan matn rangidan foydalanadi. Bunday "hiyla-nayranglar" uchun qidiruv tizimi veb-sahifani penalti salbiy bahosini tayinlash bilan jazolashi mumkin.

So'nggi yillarda tijorat reytingi amaliyoti ham rivojlandi. Texnik jihatdan ular 2000 yil darajasiga mos keladigan eng zamonaviy vositalar bilan jihozlangan va bugungi kunda Runet (Internetning rus sektori) ning umumiy hajmi taxminan 1994-1995 yillarda g'arbiy sektor bilan bir xil. Shuning uchun, bugungi kunda Rossiyada ma'lumot topishda alohida muammolar mavjud emas va ular yaqin kelajakda kutilmaydi. Va g'arbiy sektorda qidiruv muammolari juda katta va turli xil qidiruv tizimlari ularni turli yo'llar bilan engishga harakat qilmoqda. Buning qanday sodir bo'lishi haqida sizga aytib beramiz.

Bugungi kunda Rossiyadagi qidiruv indekslaridan uchta "kitlar" mavjud (kichikroq tizimlar ham mavjud, ammo biz ularga to'xtalmaymiz). Ular Rambler (www.rambler.ru), Yandex (www.yandex.ru) va Aport2000 (www.aport.ru).

Tarixiy jihatdan eng mashhur qidiruv tizimi Rambler. U boshqalarnikidan erta boshlangan va uzoq vaqt davomida qidiruv indekslari hajmi va qidiruv sifati bo'yicha etakchi bo'lgan. Afsuski, bu yutuqlar bugun o'tmishda. "Rambler" qidiruv indeksining hajmi taxminan 12 million veb-sahifani tashkil etishiga qaramay, u haqiqatan ham uzoq vaqt davomida yangilanmagan va eskirgan natijalarni bermoqda. Bugungi kunda Rambler - bu ommabop portal, Rossiyadagi eng yaxshi tasniflash va reyting tizimi (biz quyida nima borligini aytib beramiz) va reklama platformasi. An'anaga ko'ra, ushbu tizim Rossiyada qatnashish bo'yicha birinchi o'rinni egallaydi va yaxshi reklama daromadlariga ega. Qidiruv vositalarini rivojlantirishga mablag 'kiritilmaydi, chunki biz quyida ko'rsatamiz.

Eng katta ko'rsatkich Yandeks tizimining markazida joylashgan - taxminan 27 million veb-sahifa, ammo bu shunchaki hajmi emas. Bu nafaqat manbalarga ko'rsatgich, balki eng dolzarb manbalarga ishora qiladi. Bugungi kunda Yandeks dolzarbligi bo'yicha so'zsiz etakchidir (7.3-rasm).

Aport tizimi uchinchi bosqichda g'olib chiqadi: mijozga ma'lumot taqdim etish paytida. U eng katta indeksni avtomatik usulda yaratishga intilmaydi, aksincha @Rus katalogidan qo'lda ishlov beriladigan ma'lumotlardan keng foydalanadi. Shuning uchun tizim eng yaqin raqobatchilari kabi ko'p natijalarni bermaydi, lekin, qoida tariqasida, ushbu natijalar aniq va aniq taqdim etiladi.

Qidiruv tizimlarining xususiyatlari.

Internetda biron bir narsani qidirishni boshlash va minimal ma'lumotlarga ega bo'lish, shuningdek vaqtni behuda sarflashni cheklash, maksimal darajada foydalanish umumiy ma'lumot ehtimol quyidagi ma'lumotlar bazasiga murojaat qilish.

Ma'lumotlar bazasi: Ushbu element kutubxonachilar tomonidan qurilgan Internet-resurslarga olib keladi.

Qidiruv: Izlashlar manba nomi, uning tavsifi yoki belgilangan mavzu sarlavhalari bilan cheklanishi mumkin.

Natijalar: natijalar alifbo tartibida manba nomi bilan ko'rsatilgan.

Manzil: http://sunsite.berkeley.edu/InternetInd ex /

Yahoo! Eng mashhur qidiruv tizimi. Uning saytlari kalit so'zlar bilan tasniflanadi va tasniflanadi. Unda mavjud foydali ma'lumotlar uning uy sahifasi... Boshqa qidiruv tizimlariga ulanishi mumkin

Ma'lumotlar bazalari: Internet-resurslar, yangiliklar, xaritalar, reklama ma'lumotlari, sport ma'lumotlari, biznes, telefon raqamlari, shaxsiy WWW sahifalari va elektron pochta manzillarini qidirish xizmati tomonidan boshqariladi (alohida ma'lumotlar bazasi).

Qidiruv: Yahoo-ning barcha sahifalari nafaqat oddiy qidiruv maydonchasini, balki ushbu qidiruv uchun variantlarni, shuningdek Usenet yoki Elektron pochta orqali qidirishni taklif qiladi. Qidiruv ma'lum bir vaqtni belgilash bilan cheklanishi mumkin. Mantiqiy operatorlar (va, yoki) va ketma-ket qidirish ham qo'llab-quvvatlanadi. Izoh: Agar siz Yahoo! ijobiy natijaga olib kelmadi, qidiruv jarayoni avtomatik ravishda qidiruvni davom ettiradigan Alta Vista-ga o'tadi va ijobiy natijalar bo'lsa, avtomatik ravishda topilgan ma'lumotlarni Yahoo-ga qaytaradi!

Agar Yahoo! Alta Vista bilan tezda ulana olmaydi, keyin Yahoo! qidiruv vositalari to'plami bilan havola sahifasini taqdim etadi. Ushbu havolalardan biri tanlanganidan so'ng, kalit so'zlar siz tanlagan qidiruv tizimiga uzatiladi.

Qidiruvni osonlashtiradigan vosita - bu "maslahat qidiruvi" (TS) - "maslahat" yordamida qidirish: Yahoo! Bu bo'ysunuvchi katalog, ya'ni tizimda qidiruv tizimlari kabi ko'p sahifalar yo'qligini anglatadi, ammo eng umumiy kalit so'zlarni ko'rsatish sahifada kerakli mavzuni topishga imkon beradi. yuqori daraja (saytga kirishda foydalanuvchi oldida paydo bo'ladigan birinchi sahifa) tashkilot yoki kompaniya uchun.

Natijalar: Havolalar izlanishlar ketma-ketligi tartibiga ko'ra ularning tavsifiy matni va bo'ysunuvchi ierarxiyasi bilan birga ko'rsatiladi.

Manzil: http://www.yahoo.com/

Yangilash chastotasi: har kuni

Alta Vista kalit so'zlarni qidirishni qo'llab-quvvatlaydi va ma'lum bir sahifaning tilini aniqlash uchun sun'iy intellekt usullaridan foydalanadi. Foydalanuvchilar qidiruv parametrlarini sozlashi va qidirish turini tanlashlari mumkin - murakkab yoki soddalashtirilgan, shuningdek foydalanish turli xil yo'llar ma'lumot berish. Faqat kalit so'zlarni indekslaydigan mashinalardan farqli o'laroq, u barcha matnlarni indekslaydi, bunga imkon beradi to'liq qidirish... Biroq, shuning uchun foydalanuvchi shunchaki ma'lumotlarga g'arq bo'lishi mumkin.

Ma'lumotlar bazalari: WWW-ning butun dunyo bo'ylab sahifalari va Usenet News (yangiliklar).

Qidirish: Oddiy (S) qidirishni yoki (ancha rivojlangan (MMS)) taklif qiladi, ya'ni. yanada rivojlangan, yo'l. S - qidiruv asosan ishlatilishi kerak umumiy masalalar, MMS - qidirish ma'lum qidiruv sintaksisidan foydalanadi. Jarayonni engillashtirish uchun oddiy qidiruv bo'yicha yordam ko'rsatiladi. MMS - mantiqiy yordamida qidirish, ya'ni. (va (yoki, emas))) va oddiy qo'shni (yaqin - (haqida)) yordamida birlashtiruvchi so'z birikmalaridan foydalanib, izlash uchun bir nechta so'zlarni, so'zlarni almashtirib, iborani ishlatishga imkon beradi.

TS - qidirish: "Sizning iborangiz" kabi kalit so'zni birinchi qidirish yo'nalishi sifatida kiritish, bu topilgan WWW sonini cheklaydi - "Sizning iborangiz" kabi sarlavhali hujjatlar.

Natijalar: uchta tanlov natijalarini taklif qiladi (lekin ikkitasi bir xil natijani beradi):

1) "Standart" - manzil, fayl hajmi va so'nggi yangilanish sanasi mavjud bo'lgan holda, mashina tomonidan qisqartirilgan paragraflar ro'yxati shaklida olingan natijalar. Natijalar ekranda o'nta element sifatida qaytariladi,

2) "ixcham" har bir elementni fayllar kabinetining so'nggi yangilangan sanasi bilan bitta qatorga qo'yadi

3) "Standart" bilan bir xil bo'lgan "batafsil".

Manzil: http://altavista.digital.com

Yangilash chastotasi: doimiy ravishda WWW-robot.

Axborotni tahlil qilish uchun Excite foydalanadi qidirish texnologiyasi IntelligentConceptExtraction, bu sizga namunalar bo'yicha so'rovlar qilish imkonini beradi. Bu Amerikadagi eng mashhur qidiruv tizimidir. Topilgan har bir sahifa uchun u so'rovga qanchalik mos kelishini baholaydi.

Ma'lumotlar bazalari: Butun dunyo bo'ylab WWW sahifalari, yangiliklar, xaritalar, sariq sahifalar, bepul dasturiy ta'minot, asosiy ko'rsatmalar, televizion dasturlar, ob-havo, elektron pochta. pochta manzillari, aviakompaniyalarning reyslari.

Qidiruv: Faqatgina M-qidiruv parametrlarini qo'llab-quvvatlaydigan S-qidiruvni taklif qiladi.

TS - qidirish: plyus (+) dan foydalanib, barcha hujjatlarda berilgan so'z borligini yoki minus (-) dan foydalanib, biron bir hujjatda ushbu so'z yo'qligini aniqlang. Mantiqiy operatorlar tomonidan qo'llab-quvvatlash ham mumkin.

Guruhlash uchun "AND", "OR" va "AND NOT" operatorlari va qavslardan foydalanishingiz mumkin. Masalan: (raqamli yoki virtual yoki elektron) VA kutubxona.

(raqamli yoki virtual yoki elektron) VA kutubxona.

Natijalar: natijalar hujjat sarlavhasi, dolzarbligi darajasi, url, xulosa bilan ko'rsatilgan dasturiy ta'minot hujjat va hujjatni sizning savolingiz sifatida ishlatishga imkon beradigan "Shunga o'xshash" ni tiklash variantini tanlang.

Manzil: http://www.excite.com/

Yangilash chastotasi: doimiy ravishda - WWW roboti.

Internetda qidirish uchun har kuni 10 million sahifani ko'p protsessorli parallel qayta ishlashdan foydalaniladi. Hot Bot-ning foydali tomoni tugmachalarni tanlash orqali sahifalar turini cheklashdir.

Ma'lumotlar bazasi: Butun dunyo bo'ylab veb-sahifalar.

Qidiruv: S - qidirish va mutaxassisni taklif qiladi - qidirish, mantiqiy operatorlarni (AND va OR), so'z birikmalarini qidirishni va "shaxs" yoki "URL" ni tanlashni qo'llab-quvvatlaydi. Elektron qidiruv shuningdek sana, joylashuvni (mamlakatni va boshqalarni) qo'llab-quvvatlaydi.

TS - qidirish: ibora atrofida ikkita tirnoq belgisini ishlatadi (masalan, "so'z birikmalari").

Natijalar: natijalar hujjat nomi, foiz darajasi, URL, hujjat hajmi bilan ko'rsatiladi.

Manzil: http://www.hotbot.com/

Yangilash chastotasi: Doimiy ravishda WWW-robot ("Slurp").

Infoseek - bu kompyuter sanoatidagi eng mashhur qidiruv tizimi. 1996 yil may oyida u eng ishonchli ma'lumot beruvchi mashina deb tan olindi. Mashinaning jozibadorligi shundaki, ma'lumotlarni filtrlaganingizdan so'ng, topilgan ma'lumotlarni qayta tekshirishingiz mumkin.

Ma'lumotlar bazalari: Butun dunyo bo'ylab veb-sahifalar, yangiliklar, aktsiyalar kotirovkalari, xaritalar, sariq sahifalar, elektron pochta manzillari va boshqalar.

Qidirish: faqat oddiy S qidiruvni taklif qiladi, ammo qidirish kalit so'zlari ma'lum maydonlar bilan chegaralanishi mumkin (masalan, hujjat sarlavhalarida), funktsiyalar yordamida qidirish, yoki ma'lum bir so'zni hisobga olmaganda (bu so'z oldin minus "-") yoki kerakli so'zni ( bu so'zdan oldin "+") qo'yilgan. Uchun qo'shimcha ma'lumot qidiruv tanloviga nisbatan foydalaniladi. Infoseek yordami.

Natijalar: hujjat sarlavhasi, hujjatlar kabinetining kattaligi, URL manzili, hujjatdan olingan xulosa va dolzarblik darajasi.

Manzil: http://www.infoseek.com/

Yangilash chastotasi: Doimiy ravishda WWW-Robot.

Qo'shimcha ma'lumot: Qo'shimcha ma'lumot uchun http://info.infoseek.com/ saytiga qarang.

Lycos - bu birinchi qidiruv tizimlaridan biri. Mashina bir vaqtning o'zida qidirish bilan ishlash va saytlarni ko'rib chiqish uchun qulay. Ma'lumotni namoyish qilganda, u ko'rsatiladi qisqa sharhva topilgan manzillar.

Ma'lumotlar bazalari: World Wide Web-sahifalar, tovushlar, rasmlar, "eng yaxshi 5% saytlar"

Qidiruv: S - qidirish va maxsus (C) qidirishni taklif qiladi. C qidiruvi mantiqiy operatorlar AND va OR (AND va OR) va boshqa ba'zi topshiriqlarni qo'llab-quvvatlaydi.

Natijalar: natijalar buyurtma qilingan ro'yxatda keltirilgan; ma'lumotlarga hujjat manzili (URL), sarlavha, fayl hajmi va fayl ko'chirmalari kiradi.

Manzil: http://www.lycos.com/

Yangilash chastotasi: doimiy ravishda WWW-robot.

Qidiruv tizimlarining muammolari va imkoniyatlari.

Ko'pgina qidiruv tizimlari juda muvaffaqiyatli hisoblanadi. Biroq, barcha zamonaviy qidiruv tizimlari ba'zi jiddiy kamchiliklardan aziyat chekmoqda:

1. Kalit so'zlarni qidirish juda ko'p havolalar beradi va ularning ko'plari foydasiz.

2. juda ko'p turli xil qidiruv tizimlari foydalanuvchi interfeyslari kognitiv ortiqcha yuk muammosini keltirib chiqaradi.

3. Ma'lumotlar bazasini indekslash usullari odatda axborot mazmuni bilan bog'liq emas.

5. Mashinalar tabiiy tilni tushunish uchun hali rivojlangan emas

yilda so'nggi paytlarda intellektual yordamga ehtiyoj tez o'sib bormoqda. Bu aqlli agentlarning paydo bo'lishiga olib keldi.

Odatda, aqlli agentlar ishlatilgan qidiruv tizimining asosiy qismidir sun'iy intellekt... Foydalanuvchi agentga dars beradi, so'ng u qidirish uchun Internetga kiradi.

Aqlli agentlar foydalanuvchi nomidan ko'rsatmalarni bajaradi va bir oz mustaqillikka ega. Tintuvdan so'ng ular foydalanuvchiga natijalar to'g'risida xabar berishadi. Agentlar o'z faoliyati natijasida o'rganadilar.

Aql-idrok - o'rganishga asoslangan mulohaza xatolar misollari va boshqa agentlar bilan o'zaro aloqalar yordamida.

Foydalanish qulayligi - agent tabiiy til yordamida o'qitilishi mumkin.

Shaxsiy yondashuv - foydalanuvchi afzalliklariga moslashish.

Integratsiya - doimiy ravishda o'rganish va mavjud bo'lgan bilimlarni yangi vaziyatlarda qo'llash.

Muxtoriyat - atrof-muhitni anglash va xulosalarni tahlil qilish.

Xulosa.

Men ko'rib chiqqan qidiruv tizimlari mukammal emas. Ideal qidiruv tizimi quyidagi talablarga javob berishi kerak deb ishoniladi:

1. foydalanish oson

2. yaxshi tashkil etilgan va yangilangan ko'rsatkich.

3. ma'lumotlar bazasida tezkor izlash va tezkor javob berish.

4. qidiruv natijalarining ishonchliligi va aniqligi.

Axborot resurslari ko'lami va ularning soni doimiy ravishda kengayib bormoqda. Ma'lumotlar bazasi mukammal emasligi ayon bo'lmoqda. Aqlli agentlar - bu ma'lumotni filtrlashi va aniqroq natijalarga erishishi mumkin bo'lgan yangi avlod qidiruv tizimlari markazida yangi yo'nalish. Internet dunyoda axborot tarqatish va qabul qilishdagi cheklovlarni yo'q qilib, tinimsiz shiddat bilan rivojlanishda davom etmoqda. Biroq, ushbu ma'lumot okeanida kerakli hujjatni topish juda oson emas, shuni ham yodda tutish kerakki, uzoq vaqt davomida ishlaydigan serverlar bilan bir qatorda, tarmoqda yangilari ham paydo bo'ladi.

Axborotni saqlash va qayta ishlash kompyuter texnologiyalari yordamida amalga oshiriladigan axborot tizimlari avtomatlashtirilgan, har xil faoliyat turlari va axborot texnologiyalari sanoatining eng rivojlangan sohasi deb nomlanadi.

Adabiyotlar ro'yxati.

1. E.A. Yakubaitis "Informatika-elektronika-tarmoqlari". M., "Moliya va statistika", 1989 y.

2 .. A. V. Gavrilov " Mahalliy tarmoqlar Kompyuter ", Moskva," Mir "nashriyoti, 1990 y.

3. N.A. Gaidamakin "Avtomatlashtirilgan axborot tizimlari, ma'lumotlar bazalari va ma'lumotlar banklari", M.: "Helios", 2002 y.

Ishdan parcha

KIRISH

Sivilizatsiya rivojlanishining zamonaviy bosqichi insoniyatning eng rivojlangan qismining sanoat jamiyatidan axborot jamiyatiga o'tishi bilan tavsiflanadi. Ushbu jarayonning eng yorqin hodisalaridan biri bu global axborot kompyuter tarmog'ining paydo bo'lishi va rivojlanishi.

Axborotni izlash va yig'ish muammosi axborot qidirish tizimlarining muhim muammolaridan biridir. Albatta, bu borada, masalan, O'rta asrlarni taqqoslash mumkin emas, chunki ma'lumot izlash muammoli bo'lgan, chunki bu ma'lumotlar kam bo'lgan va faqat qiziqishning ozmi-ko'pmi muhim masalasi bo'yicha hech bo'lmaganda biror narsa topish uchun harakat qilish kerak edi. Shunday qilib, dastlab kutubxonaga borish va katalogdan to'g'ri kitobni tanlash uchun vaqt sarflab, kerakli ma'lumotlarni topish imkoniyati mavjud edi. Ammo kataloglar hatto bitta kutubxona doirasida ham ma'lumot topish muammolarini to'liq hal qilmaydi, chunki katalog yozuviga nisbatan kam ma'lumot kiritilgan: sarlavha, muallif, nashr etilgan joy. Axborotni topish muammosi 20-asrda yangi tus oldi, axborot texnologiyalari asrining rivojlanishi boshlandi. Endi bu ma'lumot kamligidan emas, shuning uchun uni topish qiyinligidan iborat, aksincha, aksincha, u tobora ko'payib bormoqda va bundan qiziqish haqidagi savolga javob topish juda qiyin bo'lishi mumkin. Ma'lumotni topish muammosi virtual manbalardan foydalanganda ancha murakkablashadi. Bunda onlayn kataloglar texnologiyasidan foydalaniladi, natijada foydalanuvchi bir vaqtning o'zida bir nechta kutubxonalarning kataloglarini qidirish imkoniyatiga ega bo'ladi, bu aslida o'z vazifasini yanada murakkablashtiradi, ammo, boshqa tomondan, uni hal qilish imkoniyatini oshiradi.

1. MA'LUMOTNI QIDIRISH TIZIMLARI

Axborot tizimi deganda ma'lum predmet sohasidagi axborot resurslarini yig'ish, taqdim etish va to'plashni, foydalanuvchilarning axborot ehtiyojlarini qondirish uchun zarur bo'lgan ma'lumotlarni qidirish va etkazib berishni ta'minlaydigan dasturiy ta'minot, apparat va boshqa yordamchi vositalar, texnologik jarayonlar va funktsional jihatdan aniqlangan ishchilar guruhining uyushgan to'plami tushuniladi. Axborot tizimlari har xil faoliyat turlarini axborot bilan ta'minlash muammolarini hal qilishning asosiy vositasi, qo'llanmasi va axborot texnologiyalari sanoatining eng tez rivojlanayotgan tarmog'idir.

Axborot qidirish tizimi - bu ma'lumot qidirish tili va tegishli qidirish qoidalariga asoslangan ma'lumot manbalari (indeks) tavsiflari bilan maxsus ma'lumotlar bazasida kerakli ma'lumotlarni qidirish va tanlashni ta'minlaydigan tizim.

Hozirgi kunda tobora ko'payib borayotgan axborot makonida ma'lumot izlash uchun ikkita tubdan farq qiluvchi axborot qidirish tizimidan foydalanish mumkin: global tarmoq uchun axborot qidirish tizimlari va yuridik ma'lumotnoma tizimlari (ATP). Ikkala tizim ham bir-biridan mustaqil ravishda rivojlanadi va ishlaydi. Ushbu tizimlardan birgalikda foydalanish keng ko'lamli muhandislik muammolarini hal qilishda axborotni qidirib topish muammosini tez va samarali hal qilishga imkon beradi.

Har qanday IRS-ning asosiy vazifasi foydalanuvchining axborot ehtiyojlariga mos ma'lumotlarni topishdir. Qidiruv natijasida hech narsani yo'qotmaslik, ya'ni so'rov bilan bog'liq barcha hujjatlarni topish va ortiqcha narsalarni topmaslik juda muhimdir. Shuning uchun, qidiruv protsedurasining sifatli xarakteristikasi - dolzarbligi kiritiladi.

1.1 Axborot qidirish tili va axborot qidirish lug'ati

Axborot qidirish tizimi haqida gap ketganda, demak, u sub'ekt indeksidan foydalanadi. Mavzu ko'rsatkichi ma'lum bir "mavzu" bilan bog'liq hujjatlarni topishga imkon beradi. Mavzu indeksini tuzish uchun hujjatning mazmuni tahlil qilinadi va hujjatda ko'rsatilgan "mavzu" yoki "ob'ektlar" aniqlanadi. Keyin ushbu mavzular nomlari ma'lumot olish tiliga (IPL) tarjima qilinadi. Shunday qilib, biz hujjatning qidiruv rasmini (POD) olamiz. Barcha ma'lumot manbalarini indekslash (qidirish rasmlarini yaratish) bilan biz odatda ma'lumotlar bazasi deb ataladigan ma'lumotni olamiz - bu XKSning asosiy ma'lumotlar majmuasi.

Qidiruv jarayoni foydalanuvchi so'rovini mavjud ma'lumotlar bilan moslashtirishdan iborat bo'lganligi sababli, olingan so'rov IPL-ga tarjima qilinishi kerak. IPL-ga tarjima qilingan so'rovni va hujjatlar rasmlarini qidirishni taqqoslagandan so'ng, foydalanuvchi tizim fikriga ko'ra, uning so'roviga mos keladigan hujjatlar bilan bog'lanishlar ro'yxatini oladi.

Qidiruv hujjatlar matni bo'yicha emas, balki ularning IPL-da tuzilgan qidiruv rasmlari bo'yicha amalga oshiriladi. Shuning uchun IPL axborotni qidirish tizimining asosiy qismidir, bunga tizimning sifati avvalo bog'liqdir. Axborot olish tili quyidagilarni o'z ichiga oladi.

1. Indekslangan atamalarning lug'ati - ko'plab indekslash atamalari.

2. Kod lug'ati - ko'plab kodli atamalar.

3. Ma'lumotlar lug'ati - ko'plab kirish atamalari.

4. OITS indekslash tili - indekslash atamalari bilan birgalikda ma'lum tushunchalarni kengaytirish yoki torayish uchun ishlatiladigan vositalar.

5. Indekslash tilidan foydalanish qoidalari.

Odatda sxema Mavzu indeksatsiyasidan foydalangan holda ISS shakl. 1.1.

1.1-rasm - Odatda ISS sxemasi

Qidiruv samaradorligini oshirish uchun tizim foydalanadigan so'z boyligini boshqarish kerak, ya'ni qidiruvning to'liqligi va aniqligi maqbul bo'ladigan tarzda tashkil qilinishi kerak. Shubhasiz, lug'atni tashkil qilish ko'pgina omillarga - XKS ishlatiladigan mavzular maydoniga, foydalanuvchilarning qiziqishlari xususiyatiga, ularni o'qitish darajasiga va boshqalarga bog'liq.

Umuman olganda, qidiruv protsedurasi iterativ protsedura hisoblanadi, ya'ni qidiruv natijalarini berish bosqichidan keyin so'rovlarni to'g'rilash, ushbu so'rov bo'yicha qidirish va hk. Ushbu protsedura sxematik tarzda shakl. 1.2.

1.2-rasm - Izlash protsedurasi

So'rovni tuzatish qabul qilingan hujjatlar soni va ularning dolzarbligi asosida amalga oshiriladi va foydalanuvchi tomonidan ham, axborot qidirish tizimining o'zi ham amalga oshirishi mumkin.

1. 2 Axborot tizimining quyi tizimlari

Axborot tizimini uchta kichik tizimga bo'lish mumkin:

1. Axborot to'plashning tashkiliy - texnologik quyi tizimi axborot tizimini ta'minlaydi va axborot manbalarining to'plamini, tizimda to'plash uchun ma'lumot tanlashning tashkiliy - texnologik zanjirini o'z ichiga oladi. Axborot to'plash uchun to'g'ri tashkil etilgan quyi tizimsiz butun axborot tizimining ishlashini samarali ravishda bir butun sifatida tashkil etish mumkin emas.

2. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimining yadrosini tashkil etadi va bu tizim ishlab chiquvchilari va obunachilari tomonidan predmet sohasining tuzilishi va rasmining taqdimoti aksidir, bu haqda axborot tizimi aks ettirishi kerak. Axborotni taqdim etish va qayta ishlashning quyi tizimi axborot tizimini rivojlantirishning eng murakkab qismlaridan biridir.

3. Axborotni berishning me'yoriy va funktsional quyi tizimi tizimning foydalanuvchilarini yoki boshqa usulda abonentlarini aniqlaydi, axborot tizimining vazifalarini tayinlash va bajarishning maqsadli tomonlarini amalga oshiradi.

2. Ma'lumotni qidirish tizimlarining vazifalari

Barcha qidiruv tizimlarining asosini ma'lumotlar bazalari tashkil etadi - amaliy dasturlardan qat'i nazar, ma'lumotlarni tavsiflash, saqlash va manipulyatsiya qilishning umumiy tamoyillarini ta'minlaydigan chegara qoidalariga muvofiq tashkil etilgan ma'lumotlar to'plami.

Axborot tizimlari faoliyatining quyidagi elementlarini ajratish mumkin:

Axborot yig'ish - bu ma'lumot to'plash va namoyish qilishning maxsus tashkil etilgan jarayoni:

Axborot olish;

Axborotning dolzarbligini baholash;

Axborotni tanlash va yozib olish tartibi.

Sotib olish - bu ko'p qismlardan ma'lumotlarni bir butunga qo'shish va foydalanuvchiga etkazish.

Axborotni izlash va etkazib berish - boshqaruv tizimi va texnologik jarayonlarda axborot tizimi abonentlarining axborot ehtiyojlarini qondirishning maxsus texnologik tartibini belgilash.

Axborotning yaxlitligini va saqlanishini ta'minlash - o'z ahamiyatini yo'qotgan ma'lumotlarni qayta ko'rib chiqish, qayta ko'rib chiqish va saralash axborot bo'limlarining ajralmas vazifasidir. Axborot xavfsizligi normativ va ko'rsatma hujjatlar yordamida amalga oshiriladi.

Saqlanadigan ma'lumotlarning mantiqiy tashkil etilishini ta'minlash xususiyati bo'yicha axborot tizimlari faktik, hujjatli va geoinformatsion tizimlarga bo'linadi.

Haqiqiy axborot tizimlari ma'lumotlarni bir yoki bir nechta turdagi tarkibiy elementlarning bir nechta nusxalari shaklida to'playdi va saqlaydi. Ushbu tuzilish elementlarining har bir nusxasi yoki ularning bir qismi biron bir voqea, hodisa to'g'risidagi ma'lumotlarni aks ettiradi. Har bir turdagi axborot ob'ekti tuzilishi ma'lum predmet sohasi ob'ektlari uchun ma'lumotlarning asosiy jihatlari va xususiyatlarini aks ettiruvchi atributlarning cheklangan to'plamidan iborat.

Hujjatli axborot tizimlarida axborotning yagona elementi bu kichikroq elementlarga bo'linmaydigan hujjat bo'lib, ma'lumotlar, qoida tariqasida, kiritilganda tuzilmagan yoki cheklangan shaklda tuzilgan hujjatdir. Kiritilgan hujjat uchun ba'zi rasmiylashtirilgan lavozimlar belgilanishi mumkin - ishlab chiqarilgan sanasi, ijrochisi, mavzusi. Hujjatli axborot tizimlarining ayrim turlari kiritilgan hujjatlar o'rtasida mantiqiy aloqaning o'rnatilishini ta'minlaydi - semantik mazmun jihatidan subordinatsiya.

Geografik axborot tizimlarida ma'lumotlar umumiy elektron topografik asosga bog'langan alohida axborot ob'ektlari shaklida tashkil etilgan. Geografik axborot tizimlari ushbu predmet sohalarida, geografik komponent mavjud bo'lgan axborot ob'ektlari va jarayonlarining tuzilishini axborot bilan ta'minlash uchun ishlatiladi.

Qidiruv tizimlarni tasniflashning yana bir mezonlari echilishi kerak bo'lgan vazifalar yoki vazifalardir. Shu asosda ma'lumotnoma, qidiruv va hisob-kitob tizimlari farqlanadi.

Ma'lumotnoma - bu axborot tizimi funktsiyalarining eng keng tarqalgan turi bo'lib, tizim abonentlariga ob'ektlarning ayrim sinflari uchun o'rnatish ma'lumotlarini olish imkoniyatini berishdan iborat.

Qidiruv tizimlar axborot tizimlarining eng keng tarqalgan sinfidir. Umuman olganda, shaklni axborot nuqtai nazaridan aniqlangan axborot maydonining bir turi sifatida ko'rib chiqish mumkin - mavzu sohasini mantiqiy tavsifi.

Hisoblash tizimdagi ma'lumotlarni turli maqsadlar uchun ma'lum hisoblash algoritmlariga muvofiq qayta ishlashdan iborat.

Axborot tizimlarining texnologik funktsiyalari butun texnologik tsiklni yoki uning alohida tarkibiy qismlarini, ishlab chiqarish yoki tashkiliy tuzilishini avtomatlashtirishdan iborat.

Shunday qilib, XKSning asosiy funktsiyalariga quyidagilar kiradi:

- katta hajmdagi ma'lumotlarni saqlash;

tezkor qidiruv talab qilingan malumot;

- saqlangan ma'lumotlarni qo'shish, o'chirish va o'zgartirish;

- odam uchun qulay shaklda axborot chiqishi.

Ajratib ko'ring: - avtomatlashtirilgan (nusxa ko'chirilgan);

- bibliografik (ma'lumotnoma);

- interaktiv (onlayn);

- hujjatli va daliliy ma'lumot olish tizimlari.

Axborotni qidirish tizimlari so'nggi paytlarda tez rivojlana boshladi, yangi tizimlar paydo bo'ldi, ular keng reklama qilinmoqda va sotilmoqda. Bu jamiyatning huquqiy va me'yoriy texnik ma'lumotlar bilan samarali ishlashga va kompyuter ma'lumotlarini qidirish tizimlaridan foydalanishga bo'lgan ehtiyojining sezilarli darajada oshganligi bilan bog'liq. Qidiruv tizimlarning keng qo'llanilishi Rossiyada axborotlashtirish sohasida haqiqiy yutuq bo'ldi va korxonalarning texnik mutaxassislariga huquqiy va me'yoriy hujjatlardan bepul foydalanish imkoniyatini yaratdi.

Mutaxassis tomonidan qabul qilingan qarorlarning sifati qayta ishlangan ma'lumotlarning hajmiga bog'liq. Zamonaviy sharoitda ma'lumotni izlash va qayta ishlashga yordam beradigan kuchli va qulay vositasiz buni amalga oshirish mumkin emas. Qidiruv tizimlardan samarali foydalanish texnikning ushbu yangi axborot tizimlarining o'ziga xos xususiyatlari, imkoniyatlari va ko'lamini qay darajada bilishiga bog'liq.

Maxluq zamonaviy tizimlar axborotni saqlash ikki asosiy usulda amalga oshiriladi: ierarxik va gipermatnli modellar yordamida. Ierarxik model ma'lumotni tasniflashda ko'p darajali sarlavhalardan foydalanadi. Hujjatni qidirish uchun uni ishlating qisqa Tasvir, tizimga ma'lumot kiritishda tuzilgan. Zamonaviy gipermatnli model elektron hujjatlarda boshqa hujjatlarga havolalardan foydalanishga imkon beradi.

Operatsion tajribasi turli xil tizimlar bunday modellar asosida ma'lumotlarni qayta ishlash va olish, ular kamchiliklardan xoli emasligini ko'rsatadi. Ikkala tizim ham rivojlanish va shakllantirish uchun katta moddiy xarajatlarni talab qiladi, ya'ni ular saqlanadigan ma'lumot miqdori cheklangan. Sarlavhalar va havolalarni shakllantirish mutaxassislar tomonidan amalga oshiriladi va ularning ma'lumot taqdimoti va foydalanuvchi taqdimoti farq qilishi mumkin.

3. Zamonaviy ma'lumot qidirish tizimlariga umumiy nuqtai

Ham iqtisodiy, ham siyosiy sohada asosli qarorlar qabul qilish, etarli miqdordagi huquqiy ma'lumotlarga ega bo'lmasdan mumkin emas. Ushbu ehtiyoj, ayniqsa, iqtisodiy va siyosiy tizimni isloh qilish davrida juda seziladi. Turli ommaviy axborot vositalari (ommaviy axborot vositalari) kerakli hajmdagi huquqiy ma'lumotlarni o'z vaqtida taqdim etish zarurligini qondirish muammosini hal qiladi.

Ushbu sohada an'anaviy ommaviy axborot vositalari va huquqiy ma'lumotnoma tizimlari (SPS) raqobatlashadi. Haqiqiy samarali PCA faqat zamonaviy axborot texnologiyalaridan foydalangan holda yaratilishi mumkin. Shu tarzda yaratilgan SPS kompyuter deb nomlanadi.

Kompyuterning huquqiy ma'lumotnoma tizimi - bu ko'plab huquqiy ma'lumotlar va ular bilan ishlash vositalarini o'z ichiga olgan dasturiy ta'minot to'plami. Ushbu vositalar sizga hujjatlarni qidirish, hujjatlar to'plamlarini yaratish, hujjatlar yoki ularning qismlarini chop etish imkonini berishi mumkin. Kompyuterga asoslangan SPS-ning afzalliklari aniq. Bu ham ma'lumotlarning mavjudligi, ham ular bilan ishlashning qulayligi. Bunday tizimlarga xos bo'lgan muammo - samaradorlikning etarli emasligi - global Internet yordamida hal qilinishi mumkin.

O'zlarining dasturiy ta'minot tizimini ishlab chiqadigan va mavjudlariga xizmat ko'rsatadigan ko'plab kompaniyalar Rossiyada yuridik ma'lumotnoma tizimlari bozorida ishlaydi. Bunday firmalarning eng taniqli mahsulotlari ("Konsultant Plyus" OAJ tomonidan taqdim etilgan):

"Consultant Plus" (OAJ "Consultant Plus");

"GARANT" (AES "Garant-Service");

"Kodeks" (Kompyuterni rivojlantirish markazi).

Davlat idoralarining huquqiy axborot ehtiyojlarini qondirish uchun davlat korxonalari tomonidan yaratilgan tizimlar:

"Etalon" (Rossiya Federatsiyasi Adliya vazirligi huzuridagi NTSPI);

"Sistema" (FAPSI da "Sistema" STC).

Bundan tashqari, kuni rossiya bozori kabi tizimlar:

"YUSIS" (firma "Intalex");

"Referent" (OAJ "Referent-Service");

Yuridichesky Mir (Delo i Pravo nashriyoti);

"Sizning Pravo" va "Huquqiy maslahatchi" (Axborot tizimlari va texnologiyalari firmasi);

"Rossiya qonunchiligi" (Bank texnologiyalarini rivojlantirish assotsiatsiyasi) va boshqalar.

Turli xil mahsulotlar nafaqat ularning yordami bilan hal qilingan vazifalarda, balki sifat jihatidan ham sezilarli darajada farq qilishi mumkin.

ATP sifati taqdim etilgan ma'lumotlarning sifatiga ham, ular bilan ishlash uchun ishlatiladigan asboblarning sifatiga ham bog'liq. Eng so'nggi dastur kompyuter texnologiyalari agar PCA to'liq huquqiy ma'lumotlarni o'z ichiga olmasa yoki ma'lumotlar yetarlicha chastotada yangilanmasa yordam bermaydi. Aksincha, eng to'liq va tezkor yangilangan ma'lumotlarni ham o'z ichiga olgan ATP, ushbu ma'lumotni qayta ishlash uchun sifatli vositalar taqdim etilmasa, etarli darajada samarali bo'lmaydi. Shunday qilib, axborot bazasi tarkibining sifatini aniqlashning asosiy parametrlari:

ma'lumotlarning to'liqligi;

ma'lumotlarning ishonchliligi;

ma'lumotni yangilashning tezkorligi.

Dastur qobig'ining sifatini tavsiflovchi parametrlar:

tizimning qidirish imkoniyatlari;

ma'lumotni yangilash vositalari;

qo'shimcha xizmat funktsiyalari.

Keling, asosiy yordam tizimlarini ko'rib chiqamiz.

3.1 "Consultant Plus" ma'lumot-huquqiy tizimi

"Consultant Plus" ma'lumot-huquqiy tizimi "Konsultant Plyus" OAJ tomonidan yaratilgan va 1992 yildan buyon tarqatib kelinmoqda. Tizim taniqli va 2005 yil boshida Rossiyada etakchi o'rinlardan birini egallab turibdi. "Konsultant plyus" kompaniyasining tarmog'i ATP, xizmat ko'rsatuvchi va foydalanuvchilarga ma'lumot uzatuvchi 300 dan ortiq mintaqaviy axborot markazlarini birlashtiradi. "Consultant Plus" ma'lumot-huquqiy tizimida eng ko'p ma'lumotlar mavjud turli xil turlari huquqiy ma'lumotlar: normativ hujjatlar, sud amaliyoti materiallari, sharhlar, veksellar, moliyaviy maslahatlar, buxgalteriya hisobotida operatsiyalarni aks ettirish sxemalari, hisobot shakllari va yuqori ixtisoslashtirilgan hujjatlar, hujjatlar "Consultant Plus" yagona ma'lumot massivida joylashgan. Har bir turdagi hujjatlar o'ziga xos xususiyatlarga ega bo'lganligi sababli, ular axborot massivining tegishli bo'limlariga kiritilgan: qonunchilik, sud amaliyoti, moliyaviy maslahat, qonunchilik sharhlari, hujjat shakllari, qonun loyihalari, xalqaro huquqiy hujjatlar, sog'liqni saqlashga oid huquqiy hujjatlar.

"Consultant Plus" SPS-da hujjatlarni qidirish uchun siz bir nechta vositalardan foydalanishingiz mumkin, asosiysi qidiruv kartasi.

Qidiruv karta - bu bir qator qidirish maydonlari joylashgan jadval. Har bir qidiruv maydoni uchun tizim lug'at bilan ta'minlanadi, u avtomatik ravishda to'ldiriladi va ma'lumotlar bazasiga hujjatlar tushishi bilan yangilanadi (IB). Har bir hujjat tizimga kiritilganda uning tafsilotlari tegishli lug'atga kiritiladi.

ATP "Consultant Plus" da topilgan hujjatni yoki uning bir qismini o'tkazish mumkin matn muharriri O'zingizning tarkibingizga tirnoq qo'shish uchun so'z.

"Consultant Plus" dasturida Huquqiy Navigator mavjud. Bu asosiy tushunchalarning alfanumerik ko'rsatkichi. Yaqindagi asosiy tushunchalar guruhlangan. Ushbu ikki pog'onali tuzilma hujjatlarni qidirish uchun ularni kiritishda asosiy tushunchalarni tanlashni osonlashtiradi.

"Consultant Plus" ATP-ning barcha ma'lumotlar bazalari bir-biriga bog'langan bo'lib, ular kalitni bosish orqali darhol, masalan, maslahat matnidan javob muallifi murojaat qilgan me'yoriy hujjat matniga o'tishga imkon beradi. Gipermatn foydalanuvchilarga beradigan eng asosiy narsa - bu konsultatsiyani o'qiyotganda ma'lum bir masala bo'yicha o'z pozitsiyasini bahslashish uchun foydalanadigan me'yoriy hujjatlarni tezda ko'rib chiqib, qo'shimcha kuch sarflamasdan muallifning fikrlash mantig'ini aniqlash qobiliyati.

3.2 "Garant" ma'lumot-huquqiy tizimi

"Garant" ma'lumot-huquqiy tizimi 1990 yildan buyon tarqatilib kelinmoqda va ATP bozorida ko'plab foydalanuvchilar orasida munosib keng ommalashmoqda. U yuridik ma'lumotnoma tizimlarini ishlab chiqaruvchi kompyuter kompaniyasi - "Garant-Service" ilmiy-ishlab chiqarish korxonasi (AES) tomonidan ishlab chiqilgan va tarqatilgan.

Firma Davlat Dumasining yuridik bo'limi va boshqa bir qator davlat muassasalari va tashkilotlari bilan faol hamkorlik qiladi. Uning yuqori texnologiyali va ilm-fanni talab qiladigan ishlab chiqarish quvvati Moskvada katta xodimlari va Rossiyada va chet ellarda keng vakolatxonalari tarmog'iga ega.

Garant tizimi - bu turli xil huquqiy hujjatlar bilan ishlash va ishlashni ta'minlaydigan ma'lumotnoma tizimi. Tizimga me'yoriy hujjatlar, sharhlar va tushuntirishlar, sud va hakamlik amaliyoti, shuningdek tushuntirish lug'atlari kiradi.

Tizimda davriy yangilanishlar mexanizmi mavjud axborot bazalari, shuning uchun siz har doim qonunchilikdagi so'nggi o'zgarishlardan xabardor bo'lasiz.

Garant tizimida kichik va yirik axborot-huquqiy bloklarning butun bir guruhi mavjud bo'lib, ulardan foydalanuvchi faoliyat turiga ko'ra kerakli narsalarni tanlab olishi va hujjatlarni oxiridan oxirigacha qidirish amalga oshiriladigan individual to'plamni tuzishi mumkin.

Garant-Maksimum to'plami federal va mintaqaviy qonunchilikning barcha bloklarini o'z ichiga oladi. Ushbu to'plam qonunchilikning barcha bo'limlari: jinoiy, ma'muriy va xalqaro huquq, shuningdek sud va hakamlik amaliyoti va boshqa ko'plab narsalar haqida hujjatlarni o'z ichiga oladi.

Ba'zi bir maxsus axborot bloklari bugungi kunda boshqa SPS-larda o'xshashlarga ega emas. Ular orasida "Qonunchilik sxemalarida", "Qonun loyihalari", "Qonunchilikka sharhlar", "Ingliz tilida Rossiya qonunchiligi" mavjud.

Ko'pincha, bir yoki boshqa ATP haqida gapirganda, foydalanuvchi faqat ko'rib chiqilayotgan muammoni bilishi bilan bog'liq vaziyat yuzaga keladi, ammo hujjatning rasmiy tafsilotlari haqida ma'lumot yo'q. Bunday holatlarda vaziyatni izlash uchun kuchli qidiruv tizimisiz to'g'ri qonuniylikni topish deyarli mumkin emas. SPS "Garant" da bu muammo ikki darajali kalit so'zlar lug'ati ("Vaziyatlar entsiklopediyasi") tomonidan hal qilingan.

3. 3 "Kod" turkumining axborot-huquqiy tizimlari

"Kod" axborot-huquqiy tizimini (IS) ishlab chiqaruvchisi 1991 yil boshida tashkil etilgan "Kompyuterlarni rivojlantirish markazi" davlat korxonasi ("TsKR" SE, Sankt-Peterburg).

Sankt-Peterburg va Rossiya qoidalarini o'z ichiga olgan tizimning birinchi versiyasini sotish 1992 yil may oyida boshlangan.

"Kodeks" IS barcha asosiy parametrlar (to'liqlik, samaradorlik, qonuniy ishlov berish va boshqalar) bo'yicha ijobiy xususiyatlarga ega bo'lgan yaxshi professional darajada ishlab chiqarilgan dasturiy mahsulotlarni nazarda tutadi.

Kodeksning axborot mahsulotlariga quyidagilar kiradi: professional huquqiy tizimlar, sud va hakamlik amaliyoti tizimlari, ixtisoslashtirilgan ma'lumotnoma tizimlari, elektron yuridik ma'lumotnomalar.

Bog'langan infobazalar sonidan qat'i nazar, ish ko'priklar bilan bog'langan yagona axborot makonida amalga oshiriladi.

Bir qator dasturiy mahsulotlar bir qator ishlanmalarni o'z ichiga oladi, jumladan Codex-Master dasturiy ta'minot to'plami, bu turli yo'nalishdagi to'liq matnli ma'lumot olish tizimlarini yaratish va boshqarish vositalari to'plamidir.

Kodeks axborot tizimining ochiqligi printsipi Kodeks-Master kompleksi yordamida yangi loyihalarni yaratishga imkon berdi, shu bilan birga Kodeks axborot mahsulotlari turini sezilarli darajada kengaytirdi, masalan: Auditor yordamchisi, Rossiya uy-joy kommunal xo'jaligi, sanoat xavfsizligi bu bizning texnogen ofatlar davrida juda muhimdir.

Kodeks konsortsiumi faoliyatining muhim yo'nalishi Internet orqali huquqiy ma'lumotlarga ega bo'lish, Kodeks tizimining huquqiy manbalariga ham tijorat, ham erkin kirishni ta'minlashdir.

3. 4 "Referent" seriyasining tizimlari

ma'lumot olish tizimining kafili

1995 yil oxirida "Referent-Service" YoAJ tarqatilishi 1996 yilda boshlangan Referent integratsiyalashgan axborot tizimini (IIS) ro'yxatdan o'tkazdi. Bu vaqtga qadar SPS Consultant Plus, Garant va Kodeks allaqachon taniqli bozor rahbarlari edi , va Referent-Service ushbu firmalar erishgan barcha eng yaxshi narsalarni hisobga olish imkoniyatiga ega edilar.

"Referent" oilasining tizimlari qobiq va axborot modullaridan iborat. Hozirda eng mashhur qobiq "Referent-2000" dir. Bu bir vaqtning o'zida mahalliy ma'lumotlar bazalari va huquqiy ma'lumotlarning Internet-serverlari bilan ishlashga, shuningdek, kuchli muharrir va boshqaruv vositalari yordamida qobiq ichida o'zingizning ma'lumotlar bazangizni yaratishga imkon beradi.

"Referent" oilasining ma'lumot-huquqiy tizimlari qulay interfeysga ega va hujjatlarni qidirish, shuningdek hujjatlar ro'yxati va matni bilan ishlash uchun an'anaviy huquqiy asoslarning barcha asosiy funktsiyalarini amalga oshiradi.

"Referent" interfeysi iloji boricha Windows-ga yaqin bo'lib, foydalanuvchi dasturni o'zlashtirishga ko'p vaqt sarflashiga hojat qolmaydi. "Referent" Drag and Drop funktsiyasini qo'llab-quvvatlaydi, bu hujjatlarni qidirish uchun so'rov yaratishda sichqoncha yordamida ekran bo'ylab ma'lumotlarni ko'chirishga imkon beradi. Qidiruvning o'zi birlashtirilgan modullarda bir vaqtning o'zida amalga oshirilishi mumkin va bir qator hujjatlar Rossiya yoki Moskva emblemasi singari o'rnatilgan rangli grafik moslamalarni o'z ichiga oladi.

O'rnatilgan hujjat muharriri nafaqat matnlarni tahrirlash, balki hujjat xaritasini yaratish, izohlar berish, shuningdek grafik tasvirlarni, shu jumladan animatsion (harakatlanuvchi) rasmlarni kiritish va gipermatnli havolalarni joylashtirishga imkon beradi.

"Referent" qobig'ining yana bir xususiyati - 200 tagacha hujjatlarni, shu jumladan grafikalar va videolarni o'z ichiga olgan hujjatlar bazasini yaratish va saqlash qobiliyati. Ushbu funktsiya, ayniqsa, ish oqimi va ishchilar soni kam bo'lgan kompaniyalar uchun juda qiziq. Yirik firmalarga hajmi 65000 gacha bo'lgan hujjatlarni saqlash tizimi taklif etiladi.

Xulosa

Internetning tobora kengayib borayotgan axborot maydonida ma'lumot olishning eng oson usuli bu turli xil qidiruv tizimlaridan foydalanishdir. Bunday mashinaning asosiy vazifasi Tarmoq tugunlarini avtomatik ravishda skanerlash va yig'ishdir zarur ma'lumotlar... Yig'ilgan ma'lumotlar indekslanadi, ya'ni ma'lum tartibda joylashtiriladi va ma'lum bir mezon bo'yicha tasniflanadi. Kelajakda ushbu ma'lumotlar mijozlarning so'rovlariga xizmat qilish uchun ishlatiladi.

Ixtisoslashgan kataloglar yoki ma'lumotnomalar alohida tarmoqlar va mavzular, yangiliklar, shaharlar, manzillar uchun yaratilgan elektron pochta va h.k.

Foydalanuvchiga xizmat ko'rsatishda ikkita asosiy yondashuv amalga oshiriladi: ma'lumotni ierarxik katalog daraxti bo'ylab harakatlanish yoki tizim tomonidan qo'llab-quvvatlanadigan qidiruv tili doirasida qidiruv so'rovini shakllantirish.

Zamonaviy Internet foydalanuvchisi uchun asosiy muammo tashkilotdir samarali qidiruv ma `lumot. Ushbu muammoni hal qilish bilan bog'liq qiyinchiliklar vaqt o'tishi bilan oshib borishi aniq, chunki har to'rt oyda tarmoqdagi ma'lumotlar miqdori ikki baravar ko'payadi.

Bibliografiya

1. Alekseev E. G., Bogatyrev S. D. Informatika. Multimedia elektron darsligi.

2. Ashmanov IS Qidiruv tizimlarida veb-saytni reklama qilish / IS Ashmanov. - M.: "Uilyams", 2007. - 304 p.

3. Ivasenko A. G. Iqtisodiyot va menejmentdagi axborot texnologiyalari: qo'llanma / A.G. I vasenko, A. Yu. Gridasov, V. A. Pavlenko. - 2-nashr, ser. - M.: KNORUS, 2007. - 160p.

4. Informatika. Asosiy kurs: darslik / nashr. S. V. Simonovich. - SPb.: "Piter", 2007. - 110 p.

5. Kadeev DN Axborot texnologiyalari va elektron kommunikatsiyalar / DN Kadeev.- M.: "Electro", 2005.- 250 b.

6. Kolisnichenko DN Internetda qidiruv tizimlari va veb-saytlarni reklama qilish / DN Kolisnichenko. - M.: "Dialektika", 2007. - 272 b.

7. Lande DV Internetda bilimlarni izlash / DV Lande. - M.: "Dialektika", 2005. - 272 b.

8. Manning K. Axborot olish bilan tanishish / K. Manning. - M.: "Uilyams", 2011. - 200 p.

9. Mixheeva E. V. Kasbiy faoliyatda axborot texnologiyalari: o'quv qo'llanma.- M.: TK VELBI, Prospekt nashriyoti, 2007.- 448s.

10. Hujjatlar bilan ishlashni tashkil etish: Darslik / Ed. prof. V. A. Kudryaeva.- 2-nashr, Qayta ishlangan. va qo'shimcha - M.: INFRA-M, 2001. - 592s.

11. Saxarova EV informatika. Uslubiy ko'rsatmalar / E. V. Saxarova.- Stavropol: STIS, 2006.- 200 p.

12. Chursin N. A. Ommabop informatika / N. A. Chursin.- M.: "Uilyams", 2007.- 300 b.

Maqola sizga yoqdimi? Do'stlar bilan bo'lishish uchun: