Matnli fayllarni qidirish. Fayllardan matn topish uchun WinGrep


Hozir nima bo'lganligi haqida gapiring axborot texnologiyalari va shaxs uchun ham, jamiyat uchun ham mavjud bo'lgan ma'lumotlarning cheksiz o'sishi, axborotni qayta ishlash va olish bilan bog'liq ko'plab muammolar mavjud - bu allaqachon muqaddasdir. Kim faqat bu mavzuni ko'tarmaydi. Va sizga turli xillardan kelib chiqqan sub'ektiv va qisman ob'ektiv hukmlarni yuklamaslik uchun axborot manbalari muammo bilan bog'liq holda, men to'g'ridan-to'g'ri echimga boraman. Bugun biz qidiruv haqida gaplashamiz. Ya'ni, kerakli hujjatlar va ma'lumotlarni qidiradigan dasturlar va jiddiy axborot tizimlari haqida.

To'g'ridan-to'g'ri qidiruvni yangilash

Yaqinda, daraxtlar katta bo'lganida va hatto ma'lumot ham bo'lganida mahalliy tarmoq u qadar ko'p korxonalar yo'q edi, har qanday qidiruv bir nechta odamni oddiy qidirish bilan amalga oshirildi mavjud fayllar va ularning sarlavhalari va mazmunini doimiy ravishda tekshirish. Bunday qidiruv to'g'ridan-to'g'ri deb nomlanadi va to'g'ridan-to'g'ri qidirish texnologiyasidan foydalanadigan dasturlar (yordamchi dasturlar) an'anaviy ravishda barchada mavjud operatsion tizimlar va asboblar to'plamlari. Ammo, hatto kuch zamonaviy kompyuterlar to'g'ridan-to'g'ri qidirishda ulkan hajmdagi ma'lumotlarni tez va etarli darajada qidirish uchun etarli emas. Diskdagi bir necha yuzta hujjatlarni ko'rib chiqish va ulkan kutubxonani va bir necha o'nlab pochta qutilarini qidirish - bu ikki xil narsa. Shu sababli, bugungi kunda to'g'ridan-to'g'ri qidiruv dasturlari aniq fonga aylanib bormoqda - bu universal vositalar haqida.

Albatta, ushbu turdagi qidiruvlar uzoq vaqt davomida korporativ sektorda talab qilinmagan. Hajmi bir xil emas. Va shuning uchun, qaysi yil uchun va so'nggi paytlarda shubhasiz, har xil formatdagi hujjatlarni tez va aniq qidirib topadigan texnologiyalar turli manbalardan ko'proq ahamiyatga ega. Yaqinda Microsoft-ning "dadasi" Bill Geyts, go'yo Internet-qidiruv tizimining g'ayrioddiy yutug'iga havas qilib, matbuot anjumanlaridan birida dasturiy ta'minotni (va nafaqat) qidiruv tizimlari va texnologiyalarini yaratishni rivojlantirish, rivojlantirish va chuqurlashtirish istagini e'lon qildi. Ammo Microsoft-dan yoki Internetdagi raqobatbardosh serverdan biron bir ajoyib ish dasturini yaratish hali erta (MSN hali ham Google-dan kam). Shuning uchun, keling, mavjud ishlanmalarga murojaat qilaylik. Indeks, so'rov, dolzarbligi

Zamonaviy texnologiyalar asosida ikkita asosiy jarayon yotadi. Birinchidan, u mavjud ma'lumotlarni indekslaydi va natijalarni keyingi chiqishi bilan so'rovni qayta ishlaydi. Birinchisiga kelsak, har qanday dastur (ish stoli qidiruvi, korporativ axborot tizimi yoki Internet qidiruvi) bo'lsin, o'z qidiruv maydonini yaratadi. Ya'ni, u hujjatlarni qayta ishlaydi va ushbu hujjatlar indeksini shakllantiradi (qayta ishlangan ma'lumotlar haqidagi ma'lumotlarni o'z ichiga olgan uyushgan tuzilma). Kelajakda bu yaratilgan indeks bo'lib, ish uchun ishlatiladi - so'rovga binoan kerakli hujjatlar ro'yxatini tezda olish. Qolganlari, hech qanday texnologiya jihatidan oddiy bo'lmasada, oddiy foydalanuvchi uchun juda tushunarli. Dastur so'rovni (asosiy iboralar bo'yicha) qayta ishlaydi va ushbu asosiy iborani o'z ichiga olgan hujjatlar ro'yxatini namoyish etadi. Axborot tizimli indeksda joylashganligi sababli, so'rovni qayta ishlash to'g'ridan-to'g'ri qidirishga qaraganda ancha tezroq (o'nlab va yuzlab marta!) (Hujjatlarni tanlash fayllarni sanab chiqish bilan emas, balki indeksdagi matnli ma'lumotlarni tahlil qilish orqali amalga oshiriladi).

Dastur topilgan hujjatlarni dolzarbligi bo'yicha olingan ro'yxatda aks ettiradi - hujjatning so'rovlar matniga muvofiqligi. Turli xil texnologiyalarda, albatta, mavjud turli xil usullar qidirish va hujjatning dolzarbligini aniqlash (so'zning "paydo bo'lishi" soni va uning hujjatda zikr qilish chastotasi, ushbu parametrlarning hujjatdagi so'zlarning umumiy soniga nisbati, izlangan fayllardagi so'rovlar jumlasining so'zlari orasidagi masofa va boshqalar). Ushbu parametrlarga asoslanib, hujjatning "og'irligi" aniqlanadi va unga qarab, ma'lum bir pozitsiyada natijalar ro'yxatida ma'lum bir fayl paydo bo'ladi. Internet orqali qidirish holatida vaziyat yanada murakkablashadi. Darhaqiqat, bu holatda boshqa ko'plab omillarni hisobga olish kerak (Google-ning Page Rank-ga misoldir). Ammo bu alohida maqola uchun mavzu, shuning uchun biz Internetga tegmaymiz.

Ushbu maqolada bir nechta mashhur qidiruv dasturlarining imkoniyatlari muhokama qilinadi, ular yaxshi tezlik va yaxshi funksiyalar bilan maqtanishlari mumkin. Ammo reklama risolalarida maqtanish boshqa, mutaxassisning qarashlariga bardosh berish esa boshqa narsa. Va mutaxassislar na ko'p, na kam topildi to'liq ofis dasturiy ta'minotdan foydalanish uchun foydalanishni yoqtiradiganlar. Eksperimental kompyuterda (Athlon 2,2 MGts, bilan tasodifiy kirish xotirasi 1 GB, 160 gigabaytli IDE Seagate qattiq diskida 7200 rpm va Windows XP) o'rnatilgan dasturlar to'plami o'rnatildi: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Sinovlar uchun hujjatlarning matn bazasi doc, txt va html keng tarqalgan hajmi na ko'p, na kam, lekin 20 gigabayt. Sizning kamtar xizmatkoringiz rahbarligidagi bir guruh o'rtoqlar har bir dastur bo'yicha o'zlarining sub'ektiv taassurotlarini sinovdan o'tkazdilar, taqqosladilar va o'rtoqlashdilar. Quyidagi xulosalarning qisqacha mazmunini ko'ring. dtSearch Desktop

Ishlab chiquvchilarning fikriga ko'ra, eng tezkor, eng qulay va eng yaxshi deb da'vo qiladigan dastur qidiruv tizimi... Umuman olganda va boshqalar ushbu sharhdan. DtSearch interfeysi juda sodda, ammo ba'zi derazalar yoki yorliqlar biroz haddan tashqari yuklangan, bu ulardan foydalanish qiyinligi haqida taassurot qoldiradi. Ammo aslida, hech qanday qiyinchiliklar mavjud emas. Faqatgina yoqimsiz moment - bu rus tilidagi dasturiy ta'minotni qo'llab-quvvatlashning etishmasligi (dastur bir nechta tillarda hujjatlarni qidirishi mumkinligiga qaramay, uning interfeysi faqat ingliz tilida).

Ammo dtSearch - veb-sahifalarni foydalanuvchi tomonidan ko'rsatilgan "chuqurlik" ga indekslashi mumkin bo'lgan bir nechta dasturlardan biri (dtSearch Spider qo'shimcha to'plamidagi "qo'shimcha xarid" ni hisobga olgan holda ham). Bu diskdagi fayllarni har xil matn formatida qo'llab-quvvatlashdan tashqari va elektron pochta xabarlari ning pochta qutisi Outlook. Shu bilan birga, dastur ma'lumotlarning ko'pligi va kompaniyalarda, shuning uchun korporativ tarmoqlarda keng tarqalganligi sababli qidiruv tizimlari uchun juda mazali lahza bo'lgan ma'lumotlar bazalari bilan ishlashni bilmaydi. DtSearch hujjatlarining indekslash tezligi tegishli darajada edi. Oldinga qarab aytamanki, ushbu dastur ma'lum bir ma'lumot miqdorini boshqa raqobatchisi - iSYS bilan indeksatsiyalashga muvaffaq bo'ldi va u bilan eng tezkor tizimlar ro'yxatida ikkinchi o'rinni egalladi. DtSearch testni 6 soat 13 daqiqada 20 gigabayt ma'lumotni indeksladi va keyingi izlanishlar uchun 7,9 Gb indeks yaratdi.

Qidiruv qobiliyatiga kelsak, bu erda ular kerakli darajada. Birinchidan, dtSearch-da morfologik qidiruv mavjud (so'zni barcha morfologik shakllarida qidirish). Foydalanish bu imkoniyat, siz o'zingizni, masalan, "menga kerak bo'lgan hujjatda qanday holatda ma'lum bir so'z ishlatilgan?" kabi fikrlardan ozod qilasiz. Morfologik qidiruvdan foydalanish deyarli doimo oqlanadi, shuning uchun u har qanday professional qidiruv tizimida bo'lishi kerak.

Ovozli qidirish hatto professional qidiruv tizimlari uchun ham nostandart xususiyatdir. Uning mohiyati shundan iboratki, dastur siz kiritgan so'z bilan bir xil bo'lgan so'zlarni qidiradi. Va eng muhimi, bu xususiyat rus tili uchun ham ishlaydi! Masalan, qidiruv so'rovida "quloq" so'zini yozish nafaqat "quloq", balki "quloq" ni ham keltirib chiqaradi.

Xatolarni tuzatishni qidirish juda muhim xususiyatdir. U sintaksis xatolarini o'z ichiga olgan so'zlarni izlash uchun ishlatiladi - masalan, belgilarni aniqlash tizimlari yordamida olingan xatolar ham, hujjatlardagi xatolar ham bo'lishi mumkin. Oddiy misol - siz klaviatura so'zini qidirmoqdasiz. Ba'zi hujjatlarda "klaviatura" so'zi bor, aslida bu "klaviatura" so'zi ekanligi aniq, shunchaki bir kishi matnni tergan. Endi xatolarni tuzatib qidiring, natijada hujjat "klaviatura" so'zi bilan kiritiladi. Shuningdek, dtSearch-da mumkin bo'lgan xato belgilar darajasini aniqlashga imkon beruvchi sozlama mavjud.

Sinonimlardan foydalanib qidirish. Ushbu xususiyat turli xil so'zlar uchun sinonimlar ro'yxatidan foydalanadi. Masalan, "tez" so'zini kiritish bilan dastur "tez" so'zlarini va "tez" so'zining sinonimlari bo'lgan boshqalarni topadi, agar ular, albatta, sinonimlar ro'yxatida bo'lsa. Sinonimlarning tayyor ro'yxati dtSearch dasturi bilan ta'minlanmagan, ammo Internetdagi ro'yxatlardan foydalanish mumkin (shunga ko'ra, har doim ham qulay bo'lmagan ulanish kerak) yoki siz o'zingizning sinonimlar ro'yxatini yaratishingiz mumkin.

Ro'yxatda keltirilgan funktsiyalardan tashqari, dtSearch mantiqiy amallar bilan bog'langan so'zlardan tashkil topgan iboralar yordamida qidirishi mumkin. So'rovdagi har bir so'zga o'z "og'irligi", ya'ni ahamiyati berilishi mumkin. Foydali variant - izlashda ularni hisobga olmaslik uchun ahamiyatsiz so'zlardan iborat lug'atdan foydalanish, ammo bu lug'at ham bo'sh va uni o'zingiz to'ldirishingiz kerak bo'ladi.

Keyinchalik, biz tarmoqda ishlashda dasturning imkoniyatlarini ko'rib chiqamiz. Aslida, dtSearch tarmoq bilan ishlash uchun aniq imkoniyatlarni taklif qilmaydi. Biroq, uni Internetda ishlatish juda mumkin. Shu bilan bir qatorda, siz biron bir indeksni yaratishingiz va uni umumiy (umumiy) papkaga qo'yishingiz mumkin. Dasturning o'zi har bir foydalanuvchi tomonidan kompyuterga o'rnatilishi yoki ochilgan papkada joylashtirilishi mumkin umumiy kirishva parametrlardan foydalangan holda har bir foydalanuvchi uchun alohida usulda yorliqlar yarating buyruq satri, maqsadi dastur bilan ta'minlangan yordam faylida tasvirlangan. Bundan tashqari, bu mumkin avtomatik o'rnatish yordamida tarmoqqa dasturlar MSI fayli... Bunda har bir ulangan foydalanuvchi uchun sozlamalar hisobga olinadi.

Umuman olganda, bu professional qidiruv tizimlari toifasidan yaxshi dastur. Bu yaxshi belgi deb da'vo qilishi mumkin, lekin ba'zi omillar tufayli dtSearch uchun foydalanuvchilarning ishonchini va hurmatini qozonish qiyin bo'lishi mumkin (interfeys bilan hamma narsa silliq emas, rus foydalanuvchilari mahrum, tarmoq bilan ishlash uchun yorqin xususiyatlar yo'q). To'g'ridan-to'g'ri hujjatlarni qidirishga kelsak, dasturda ruscha matn bilan hech qanday o'xshashlik yo'q edi. Chunki e'lon qilingan morfologiyaga ega bo'lmagan yoki loyqa qidiruvga ega bo'lganlar yo'q edi. Tizim kerakli hujjatlarni bir so'z bilan oddiy so'rov orqali ham, as yordamida ham etarli darajada topdi asosiy ibora bir necha xatboshi, hujjat.

Rasmiy sayt:
Tarqatish hajmi: 23 Mb

Ismga asoslanib, ushbu dasturda rus tilini qo'llab-quvvatlash borligini taxmin qilishingiz mumkin. Bu allaqachon yaxshi. Interfeysga kelsak, umuman olganda, bu biroz g'ayrioddiy, ammo u juda jozibali ko'rinadi. Qulaylik - bu boshqa masala. Juda munozarali mezon, ammo, ehtimol, ko'p oynali echim eng yaxshi variant emas (so'rov bitta oynaga kiritiladi, natijasi boshqasida ko'rsatiladi va shunga o'xshash).

Snoop tezkor qidiruvni amalga oshirish uchun bir xil indekslardan foydalanadi, ammo indekslash boshqa dasturlarga qaraganda ancha sustroq. Bu juda g'alati, ayniqsa, uning qidiruv so'rovlarini qayta ishlash imkoniyatlari juda zaifligini hisobga olsak, bu indeksning tuzilishi murakkab emasligini anglatadi. Ehtimol, bu optimallashtirilmagan algoritmlarga bog'liq. Ushbu dastur indekslash va qidirish tezligining aniq autsayderi bo'lib chiqdi: indeksni yaratishga sarflangan vaqt xuddi shu dtSearch va iSYS-ga qaraganda olti baravar ko'p. Qonli it uchun 20 gigabayt matnni indeksatsiya qilish 38 soat 46 minut ish olib bordi. Va yaratilgan "qidiruv maydoni" qattiq diskda bir xil minus - 19 gigabayt bo'lgan asl ma'lumot bilan bir xil hajmni egallagan.

Snoop Windows-ning standart qidiruviga alternativa sifatida taqdim etilishi mumkin, chunki u ko'p narsaga qodir emas. Bloodhound-ning eng ustuvor vazifasi eng oddiy qidirish fayllar nafaqat qidiruv so'rovlari matnini va fayl atributlari bo'yicha kengaytirilgan qidirishni tahlil qilish uchun funktsiyalarning oz sonini, balki topilgan fayllarga, shuningdek ushbu fayllarni o'z ichiga olgan papkalarga to'g'ridan-to'g'ri havolalarni ko'rsatadigan natijalar oynasini ham ko'rsatadi. Natijalar oynasi juda ko'p ma'lumotga ega emas, chunki siz topilgan faylni faqat uni ishga tushirish orqali o'qishingiz mumkin, ya'ni o'rnatilgan faylni ko'rish vositasi yo'q. Ammo qidiruv so'zi topilgan fayldan parcha ko'rsatiladi, umuman olganda, bunday ekran sxemasi Internet qidiruv tizimlariga juda o'xshaydi.

Qidiruv so'rovlarini qayta ishlashning o'ziga xos imkoniyatlari haqida gapirganda, shuni ta'kidlash joizki, "matnni qidirish" degan narsa yo'q, agar siz ko'p satrli matn kiritish maydoni mavjud bo'lmasa, maksimal darajada bu iborani qidirishingiz mumkin. Shunga qaramay, siz kiritilgan iborani tahlil qilishingiz mumkin va Snooper bizga bu erda standart qidiruv to'plamini taklif qiladi: mantiqiy operatsiyalar, maskalarni qidirish va tirnoqlarni qidirish ... juda ko'p emas. Dasturda ba'zi bir morfologik izlanishlar mavjud, ammo, ehtimol, u shunchalik qo'polki, u to'g'ri ishlashiga xalaqit beradi (testlar paytida, morfologiyani noto'g'ri ishlatganligi sababli ko'pgina to'qnashuvlar kuzatilgan).

Ammo dastur sizga fayl atributlarini qidirishda (hujjat sanasi, fayl nomi, papka nomi) ko'rsatishga imkon beradi va ushbu so'rovlarda siz ham xuddi shu qidiruv to'plamidan foydalanishingiz mumkin. Shuningdek, siz parametrlarni belgilash orqali harflarni qidirishingiz mumkin (From, Subject .... va boshqalar).

Shunday qilib, biz qidiruvning o'zi bilan aniqladik, rasmiy veb-sayt ma'lumotlariga ko'ra, shuncha mukofotga sazovor bo'lgan dasturning yana nimasi qiziq? Bu borada nimani o'ziga xosligini aytish qiyin, ehtimol Snooper interfeysi o'ziga tegishli (tashqi ko'rinishda, qulaylik haqida emas).

Indeks operatsiyalari juda standart, eng yaxshi narsa - indekslarni jadval bo'yicha yangilash. Internetda indekslardan ham foydalanish mumkin. Bundan buyon tafsilotlar kerak.

Qidiruv so'rovlarning ibtidoiyligiga qaramay, dastur fayllarni topish uchun ishlatilishi mumkin, shuning uchun uni ishlatishni tarmoqlarda oqlash mumkin. Katta hajmda bo'lsa ham, chunki katta tarmoqda juda katta miqdordagi ma'lumot tufayli murakkab qidiruv so'rovlari yordamida ma'lumotlarni tezda qidirish ustuvor vazifa hisoblanadi, ammo qidirish tezligi va dastur bilan bog'liq muammolar aniq. Aytishim kerakki, Bloodhoundning tarmoq bilan ishlashi yaxshi o'ylangan. Buning uchun alohida dastur - Snoop Server ishlab chiqilgan. U oddiy Snooper singari ishlaydi (ular bir xil qidiruv tizimiga ega), faqat markaziy serverda yoki korporativ tarmoqdagi umumiy resurslarda joylashgan hujjatlar uchun. Snoop Server umumiy manbalarda yangi indekslarni yaratadi yoki ilgari yaratilganlardan foydalanadi. Korporativ tarmoqdagi har qanday foydalanuvchi Snoop-serverga ulanishi va undan Internet-brauzer yordamida istalgan hujjatga (joriy indeksda topilgan) kirish uchun foydalanishi mumkin. Qabul qilaman, ushbu sxema juda qulay: o'z tarmog'idagi fayllarni, masalan, Google orqali Internetdagi ma'lumotlar kabi qidirish mumkin.

Ushbu dasturning barcha afzalliklari va kamchiliklarini baholab, xulosa shuni ko'rsatadiki, korporativ tarmoqlar uchun uning imkoniyatlari, ehtimol, etarli bo'lmaydi (hatto tarmoq bilan ishlashni yaxshi tashkil qilganiga qaramay), balki uy kompyuteri yoki hatto uy tarmog'i u, asosan, paydo bo'lishi mumkin. Garchi na ish tezligi, na qidiruv qobiliyatlari dalda beradi ...

Rus tilidagi rasmiy veb-sayt:
Tarqatish hajmi: 6 MbGoogle Desktop Search + GDS Enterprise

Albatta, biz bunday taniqli ishlab chiquvchini e'tiborsiz qoldirolmas edik. Google nomi allaqachon ko'p gapiradi. Ko'p yillar davomida eng kuchli Internet qidiruv tizimidan foydalanib kelgan odamlar, shubhasiz, ushbu qidiruv tizimini o'zlarining kompyuterlariga o'rnatishga qaror qilishadi. O'ylab ko'ring: uy kompyuteringizda Google! Biroq, keng ommalashgan brend bilan provokatsiyalarga berilmasdan, keling, hushyorlik bilan, eng muhimi ob'ektiv ravishda, Google-dan "ish stoli" qidiruv tizimining imkoniyatlarini ko'rib chiqaylik.

Ko'zingizni tortadigan birinchi narsa bu dastur uchun o'z qobig'ining etishmasligi. Google Desktop Search hali ham brauzer oynasida, shuning uchun ish stoli versiyasining butun interfeysi dasturiy ta'minotni keksa Internet akasidan oldi. Bu yaxshi yoki yomonmi - munozarali masala: Kimdir ushbu qidiruv tizimining dizaynidagi minimalizmni yoqtiradi, ammo kimdir har xil tugmachalar bilan to'ldirilgan to'liq dasturni va boshqalarni ko'rishni xohlaydi.

Loyihalashdan so'ng darhol sizning ko'zingizga nima tushadi? Va xuddi shu Google Desktop Search kompyuteringizda hamma narsani indekslashni boshlaydi, hech qanday talabsiz! Eng qizig'i shundaki, Google Desktop Search yordamida indeksatsiya yo'llarini tanlash mumkin emas. Siz bir oz kengayishingizga imkon beradigan alohida dasturni (TweakGDS) yuklab olishingiz kerak bo'ladi google sozlamalari Ish stoli, shu jumladan indekslash uchun zarur joylarni belgilash. Garchi, siz aniqlamaguningizcha, u allaqachon standart qattiq diskni indekslaydi, shuning uchun ushbu parametr juda ko'p miqdordagi ma'lumotlar bilan ishlashda kerak bo'ladi, bu korporativ tarmoqlarda ishlatilganda juda muhimdir (Enterprise versiyasi). Biroq, TweakGDS-ni yuklab olib, muammolaringiz hal etilishi haqiqat emas. Unga Microsoft ishlashi kerak. NET Framework va Microsoft Scripting ish vaqti. Ha ... o'rnatishni va sozlamalarga kirishni osonlashtirishi mumkin edi, garchi ishlab chiquvchilar tushunishlari mumkin bo'lsa: nima uchun yangi qidiruv tizimi mavjud bo'lsa, uni qidirib toping mahalliy kompyuter va foydalanuvchi "zavqlansin", va taniqli ism "bu" ni yana bir asarga aylantiradi. Hodiy, keling, lirik chekinishni tugatamiz va izlashga o'tamiz.

Qidiruv so'rovlarini tahlil qilish va natijalarni berishga kelsak, bu erda hamma narsa Internetdagi Google bilan mutlaqo bir xil: natijalarni ko'rsatish uchun bir xil tizim, qidiruv so'rovlari uchun bir xil standart mantiqiy operatsiyalar to'plami. Umuman olganda, Google Desktop Search, oldingi dastur singari, faqat fayllarni qidirish uchun mo'ljallangan - albatta, bu fayllar uchun ichki tomoshabin yo'q. Google Desktop Search tomonidan qo'llab-quvvatlanadigan fayl formatlari soni etarlicha, shuningdek, tashrif buyurilgan Internet-sahifalarni keshdan ma'lumotlarni olib qidirishi juda yoqimli. Qidiruv va indekslash tezligi juda maqbuldir. To'g'ri, uchun uyda foydalanish... Google Desktop Search 8 soat 17 daqiqada ta'sirchan 20 gigabaytli matn bilan kurashdi. Bir necha kun davomida yirik korxonaning korporativ tarmog'idagi ma'lumotlarni qayta ishlashga sarflash uchun hech qanday tizim ma'muri tabassum qilmaydi. Ijobiy tomoni: yaratilayotgan indeks hajmi (4,5 Gb) darajasida bo'lib, ushbu sharhda tekshirilgan boshqa qidiruv tizimi - SearchInform.

Google Desktop Search-ning katta afzalligi (yoki siz e'tiborsiz qoldirasiz), bu o'zgarishlarni amalga oshiradigan plaginlarni qo'llab-quvvatlashidir. Yana bir narsa shundaki, plaginlarni ulash va ularni sozlash qidiruv tizimini o'rnatish vazifasini shunchalik murakkablashtiradiki, hamma narsa allaqachon mavjud bo'ladigan oddiy, to'liq dasturni o'rnatishingiz mumkin bo'lsa, bularning barchasi zarurmi, degan savol tug'iladi. Axir, har bir xususiyatdan foydalanish uchun siz yangi plagin o'rnatishingiz kerak bo'ladi. Dasturning arxivlar bilan to'liq ishlashi uchun ham alohida gadjet kerak. Ushbu qo'shimcha modullarning erkinligi hayratga soladi va o'ziga jalb qiladi. Ammo, agar siz qidiruv tizimining ish stoli versiyasini hisobga olmasangiz, unda vakolatli sozlash GDS Enterprise sizning ixtiyoringizda bo'lmasligi mumkin - Google mutaxassislari ularni sozlash uchun o'z xizmatlarini taklif qilishlari bejiz emas. dasturiy ta'minot sizning tarmog'ingiz uchun atigi $ 10,000.

Agar siz hali ham sozlash va o'rnatish tartibini yaxshi bilsangiz (yoki Google ofisidan tezkor javob guruhiga 10000 dollar to'laysiz), shunda tushunasizki, o'rnatishning murakkabligi korporativ tarmoqlarda ishlatilganda juda moslashuvchan sozlamalar bilan qoplanadi. Google Desktop-ning korporativ tarmoqdagi ishining muhim jihati har bir foydalanuvchi uchun sozlamalarni o'rnatishga imkon beradigan guruh siyosatidan foydalanishdir.

Xulosa qilib aytish mumkinki, ushbu dastur uchun eng oqilona dastur bu uy yoki ish kompyuteridir. Darhaqiqat, oddiy kompyuter uchun dasturni oddiygina o'rnatish kifoya - qolganini o'zi bajaradi (hatto sizdan hech narsa haqida so'ramaydi).

Shunga qaramay, Google Desktop Search Enterprise qidiruv tizimidan foydalanish uchun tarmoq siyosatining moslashuvchan konfiguratsiyasiga shoshilinch zarurat bo'lgan hollarda qabul qilinadi, shu bilan birga qidiruv so'rovlarini qayta ishlash qobiliyati ikkinchi o'rinda turadi va dasturni o'rnatishga sarflangan vaqt (yoki pul) birinchi o'rinda turadi. Manzil.

Rasmiy sayt:
TweakGDS bilan tarqatish to'plamining hajmi: 1.2 Mb Copernic Desktop Search

Kattalashtirish uchun rasmni bosing

Dastur interfeysi o'ta ijobiy his-tuyg'ularni uyg'otadi - barchasi umumiy qabul qilingan standartlarga muvofiq amalga oshiriladi, ortiqcha narsa yo'q, bir so'z bilan aytganda, yoqimli dizayn. Copernic Desktop Search interfeysi boshlang'ich uchun juda oson tushuniladi. Shunga qaramay, dizaynerlar dasturning ishlashini inobatga olgan holda dastur interfeysini aniq yaratganliklari biroz xijolat tortmoqda. standart mavzu Windows XP dizayni. Klassik mavzudan foydalanganda dastur endi unchalik chiroyli ko'rinmaydi. Ammo bu ko'proq ta'mga bog'liq.

Dastlab, dastur qidirish uchun indekslarni yaratishni taklif qiladi. Indekslash uchun papkalarni tanlagandan so'ng, dastur "Indekslashni boshlash" kabi biron bir tugmani bosishni taklif qilmasligi va indekslash avtomatik ravishda boshlamasligi shunchaki g'ayrioddiy bo'lib tuyuldi, shundan keyingina Kopernik kompyuter bo'sh turgan vaqtda indekslashni boshlashga urinayotgani sezildi. Har bir narsani to'g'ri sozlash uchun dastur variantlarini biroz qazishingiz kerak bo'ladi. Shuni ta'kidlash kerakki, bu erda juda keng xususiylashtirish imkoniyatlari mavjud. avtomatik yaratish indeks: o'rnatilgan rejalashtiruvchi, kompyuter bo'sh turgan paytda indekslash qobiliyati, fonda, ustuvorligi past. Indekslash juda tez bo'lmagan - 10 soat 51 daqiqa - bu boshqa qidiruv tizimlariga qaraganda sekinroq (Snooper bundan mustasno, Kopernik hanuzgacha iSleuthHound Technologies rivojlanishiga qaraganda tezroq.

Endi indeksning tuzilishi haqida. Umuman olganda, bu erda alohida narsa yo'q. Umumlashtirilgan shaklda ham, batafsil shaklda ham fayl turlarini tanlash mumkin. Ya'ni, dastlab siz indekslashni xohlagan narsani tanlashingiz mumkin - Hujjatlar, Tasvirlar, Videolar, Musiqa. Variantlar oynasining boshqa oynasida kengaytma bo'yicha ma'lum fayl turlarini tanlash mumkin bo'ladi. Bundan tashqari, siz indeksni sozlashingiz mumkin, masalan, o'lchamlari 16x16 dan kam bo'lgan rasmlar indekslanmaydi yoki 10 soniyadan kam bo'lgan ovozli fayllar indekslanmaydi. Kopernik papkalardan fayllarni indekslashdan tashqari, Microsoft Outlook va Microsoft-ning manzillar kitobidagi elektron pochta va kontaktlar bilan ishlashi mumkin. Outlook Express, Internet Explorer-dan Sevimlilar va Tarixni indekslash mumkin.

Bu erda qidiruv qobiliyatlari zaif. Sinovlar paytida, hattoki dastur rus tilidagi txt va html formatidagi hujjatlarni izlamasligi, ularni faqat sarlavhalar bilan topishga imkon beradigan va hech qanday mazmunga ega bo'lmaganligi aniqlandi. Qidiruv samaradorligini oshirish uchun dastur taqdim etadigan yagona narsa - bu mantiqiy operatsiyalarning standart to'plamidan foydalanish va hatto shunda ham bu imkoniyat eksperimental ravishda topilgan, chunki u hujjatlashtirilmagan. Aytgancha, dasturning yordami ham yaxshi emas - u faqat Internet orqali mavjud, bu siz ko'rib turganingizdek, juda noqulay va tarmoqdagi yordam ma'lumotlari juda ko'p emas. Ko'rinishidan, ishlab chiquvchilar dasturning oddiy interfeysi odatdagi yordam mavjudligini anglatmaydi degan qarorga kelishdi. Qidiruv qobiliyatlari to'g'risida suhbatni davom ettirishda ta'kidlash kerakki, so'rovlarning zaif tahliliga qaramay, dastur qiziqarli qidiruv tizimini taqdim etadi - foydalanuvchi fayllar turini (rasmlar, videolar, musiqa va hk) tanlashi, qidiruv so'rovini kiritishi va o'ziga xos xususiyatlarni tanlashi mumkin. tanlangan fayl turi. Masalan, uchun ovozli fayllar, bu mp3 teglaridagi qiymatlar bo'lishi mumkin (ijrochi, albom, sana va boshqalar), rasmlar uchun, masalan, siz ularning o'lchamlarini (o'lchamlari bo'yicha) tanlashingiz mumkin, umuman, har bir turdagi o'z parametrlari mavjud. Muayyan fayl turini qidirgandan so'ng, dastur natijalar oynasida juda ma'lumotli ro'yxatni ko'rsatadi va agar sizning so'rovingizda boshqa turdagi fayllar bo'lsa, ularni ma'lum bir havolani bosish orqali ochishingiz mumkin.

Natijalarni ko'rsatish oynasini ham eslatib o'tishimiz kerak. Ushbu fayllarning tarkibi topilgan fayllar ro'yxati ostida ko'rsatiladi (shunga o'xshash sxema ko'pincha ishlatiladi pochta mijozlari). To'g'ri, matnni faqat asl formatida ko'rish mumkin va oddiy matnni ko'rsatish rejimi mavjud emas, bu har doim ham qulay emas, chunki bu holda hujjatni ochish ko'proq vaqt talab etadi. Ammo, Kopernik rasmlar va musiqalarni qidirishga qodir ekanligini hisobga olsak, ushbu multimedia fayllarini ko'rish mumkin.

Ushbu dasturning asosiy tamoyillari tavsiflangan, endi ko'rib chiqaylik Copernic Desktop Search bizni tarmoq bilan ishlash uchun nimani taklif qilishi mumkin ... Aslida siz juda uzoq vaqt tomosha qilishingiz mumkin, ammo siz hech narsani ko'ra olmaysiz. Boshqacha qilib aytganda, ushbu dastur tarmoqqa ulanish uchun mo'ljallanmagan. Copernic Desktop Search - bu faqat uy qidiruvi.

Shubhasiz, ushbu dasturning yagona (eng mantiqiy) ishlatilishi uy kompyuteri... Bu erda u foydalanuvchilarning bitta yoki ikkita so'zdan iborat barcha oddiy qidiruv so'rovlarini topadi zarur ma'lumotlarva qidiruvni fayl turlari bo'yicha ajratish va multimedia fayllarini qo'llab-quvvatlash, past darajadagi ustuvor rejimda fon indeksatsiyasi, yoqimli interfeys bilan birgalikda dasturga tajribasiz foydalanuvchilar orasida ishonchni qozonish uchun faqat kuch beradi.

Rasmiy sayt
Tarqatish hajmi: 2.6 MbISYS ish stoli

Kattalashtirish uchun rasmni bosing

Juda yuqori kuchli dastur... Har xil funktsiyalarga ega bo'lgan uskunalar darajasi bo'yicha bu SearchInform ro'yxatidagi keyingi qidiruv tizimiga yaqin. Bundan tashqari, hajmi o'rnatish fayli 40Mb dan ortiq! Bunday o'lchamlarga nima kiritilishi mumkinligi haqida gapirish qiyin, chunki xuddi shunday SearchInform, xuddi shunday funktsional imkoniyatga ega, 15Mb oladi.

Bu erda o'rnatish jarayoni ham juda yoqimli emas, aniqrog'i hatto o'rnatish jarayoni ham emas. Dasturni yuklab olishdan oldin sizdan ro'yxatdan o'tishingiz so'raladi, aks holda siz ro'yxatdan o'tmaysiz. Keyinchalik, interfeys. U juda chiroyli tarzda yasalgan, ortiqcha narsa ko'zni tortmaydi, ammo bunga allaqachon o'rganib qolgan odamning taassurotlari. Yangi boshlanuvchilar uchun qaerda va nimada joylashganligini, qaerga bosish kerakligini va nihoyat qaerdan qidirishni aniqlash oson bo'lmaydi. Ishni boshlashdan oldin yordamni o'qish tavsiya etiladi - ko'p asab va vaqtni tejashga yordam beradi. Dasturda rus tilini to'liq qo'llab-quvvatlamaslik hamma narsaga qo'shilgan. Yaxshi emas. Bundan tashqari, bu erdagi oynalar boshqaruv elementlari bilan ortiqcha yuklanmagan, ammo buning uchun to'langan narx ko'p modulli va qo'shimcha oynalardan foydalanish edi. Masalan, qidiruv so'rovlari bitta dasturni ishga tushirish yordamida kiritiladi va indekslarni boshqarish boshqa dastur yordamida amalga oshiriladi. Qidiruv so'rovlari bu erda paydo bo'lgan alohida oynalarda ham kiritiladi. Qaysi biri yaxshiroq - tiqilib qolgan interfeys yoki hamma joyda bir nechta derazalar - aytish qiyin, aksincha, bu ta'mga bog'liq.

Indekslarni yaratish bilan bog'liq holda, dastur yangi indeks uchun parametrlarni o'rnatish jarayonini soddalashtirish uchun xususiyatlarni taqdim etadi. Ushbu imkoniyatlarga "Mening hujjatlarim", "Pochta", "Pochta va hujjatlar", "Maxsus papka", "Fayl turlarini tanlagan papka" va boshqalar uchun indekslarni yaratish uchun bir nechta tayyor shablonlar kiradi. bosqich. Indekslar bilan ishlashning yordamchi dasturi biroz murakkablikni qo'rqitadigan juda yaxshi interfeysga ega emas (bu halol bo'lish uchun juda sub'ektiv baho), ammo agar siz unga qarasangiz, u juda ko'p foydali variantlarni taqdim etadi va umuman, uni ishlatish qiyin emas. ISYS Desktop har xil ma'lumot manbalaridan ma'lumotlarni indeksatsiya qilishga qodir, shuningdek, bunday indekslash uchun ko'plab moslashuvchan sozlamalarni taqdim etadi. Ular orasida qo'shimcha imkoniyatlar indekslash bo'yicha: SQL, FTP, TRIM Context, WORLDOX 2002, skriptlarni qo'llab-quvvatlash. Indeksni yaratishda, agar siz "Fayl turlarini tanlash bilan papka" bandini tanlagan bo'lsangiz, indekslash uchun fayl turlarini qo'lda (kengaytma bo'yicha) tanlash imkoniyatiga egasiz. Shuni aytishim kerakki, qo'llab-quvvatlanadigan fayl turlari shunchaki juda katta raqam, ammo mavjud ro'yxatga o'zingizning turingizni (kengaytmani) qo'shib bo'lmaydi. Siz shuningdek indeksatsiya rejalashtiruvchisi mavjudligini ham qayd etishingiz mumkin. ISYS Desktop indeksni yaratish va 20 gigabaytli ma'lumotlarni qayta ishlashga 6 soatu 13 daqiqa vaqt sarfladi va natijada yaxshi vaqt va yaratilgan fayl hajmini ko'rsatdi - 7,9 Gb.

Ushbu dasturning qidirish imkoniyatlari juda yaxshi. ISYS-da ishlatiladigan odatiy mantiqiy operatsiyalarni qo'llab-quvvatlashga qaraganda ancha kuchliroq. Kengaytirilgan qidiruv imkoniyatlaridan dastur sinonimlardan, saralash filtridan (yo'l, nom va fayl yaratish sanasi bo'yicha) foydalanishni taklif etadi. O'rnatish mantiqiy operatorlar standart to'plamdan biroz kengroq. Mantiqiy operatsiyalardan tashqari, dastur boshqa ko'plab operatorlar bilan ishlashga imkon beradi, ular printsipial jihatdan ba'zi bir qidiruv turlarini almashtirishga qodir, masalan, qidiruvni ajralish maxsus operatorlar yordamida almashtirilishi mumkin. Dasturda morfologiyadan foydalangan holda qidiruv yo'qligiga juda hayron bo'ldim. Bu jiddiy nazoratdir, chunki morfologik tahlildan foydalanganda qidiruv samaradorligi ancha yaxshilanadi. Bundan tashqari, muhim so'zlarning ro'yxati yo'q, ammo ma'nosiz so'zlarning keng ro'yxati mavjud. Shuningdek, "taxminiy qidirish" va "evristik tahlil" kabi qidiruv funktsiyalari e'lon qilinadi.

ISYS bir necha turdagi qidiruv so'rovlarini tanlashni ta'minlaydi, ya'ni turlari - ingl. Bu bilan amalga oshiriladi turli xil turlari qidiruv so'rovlarini kiritish uchun derazalar, ammo aslida hech qanday oyna yuqorida sanab o'tilganlardan boshqa texnologiyalardan foydalanishga imkon bermaydi.

Qidiruv natijalari juda ma'lumotlidir, ular dolzarbligi bo'yicha saralangan hujjatlar ro'yxati sifatida namoyish etiladi. Quyida tanlangan hujjatning oldindan ko'rib chiqilishi keltirilgan. Copernic Desktop Search-dan farqli o'laroq, oldindan ko'rish faqat oddiy matnda mavjud, hujjatlarni asl formatida, Word, Html yoki PDF bo'lsada ko'rsatish mumkin emas edi, ammo bu printsipial jihatdan juda muhim emas. Dastur topilgan hujjatlarni ma'lum mezonlarga muvofiq guruhlarga bo'lishiga imkon beradi (sukut bo'yicha, ular dolzarbligi bo'yicha bo'linadi). Siz allaqachon topilgan hujjatlarni alohida papkalarni tanlab ko'rishingiz mumkin (natijada hujjatlar juda ko'p bo'lganida bu qulay).

Dasturni korporativ tarmoqda ishlatish ham juda oqlanadi, chunki u tarmoq qidiruvini tashkil qilish uchun yaxshi imkoniyatlar yaratadi. Qidiruv tizim umumiy tarmoq resurslaridan indekslangan ma'lumotlarni o'z ichiga olgan ommaviy indeksni yaratishga asoslangan.

Darhaqiqat, ISYS-ning dasturi hech bo'lmaganda u bilan tanishishga loyiqdir. Ushbu dastur juda ko'p funktsiyalarga ega bo'lgan etuk loyihadir (har doim ham va hamma uchun ham emas, albatta, ular kerak, ammo baribir). Dasturning qidiruv so'rovlarini qayta ishlash nuqtai nazaridan biroz yaxshilanishi ehtimoli ma'lum emas, ammo hozirgi paytda uni deyarli universal foydalanish uchun tavsiya etish mumkin. Uy tizimlari uchun hali ham og'irligini hisobga olsak, uni o'rnatishning asosiy joylari korporativ tarmoqlardir.

Rasmiy sayt:
Tarqatish hajmi: 40 MbSearchInform

Kattalashtirish uchun rasmni bosing

Ehtimol, darhol SearchInform interfeysi tavsifidan boshlamasligingiz kerak. Birinchidan, siz o'rnatish jarayonini, aniqrog'i uning tafsilotlaridan birini tasvirlab berishingiz kerak: dasturni Internetga ulanmasdan o'rnatolmaysiz. Haqiqat shundaki, birinchi ishga tushirishdan oldin dastur foydalanuvchini ro'yxatdan o'tkazishni talab qiladi (bepul) va barcha kiritilgan ma'lumotlarni serverga yuboradi. Ko'rinib turibdiki, qaroqchilarga qarshi kurashda ishlab chiquvchilar bunday choralarni ko'rishlari kerak edi, ammo bu o'rnatish qulayligiga ijobiy ta'sir ko'rsatmadi.

Dastur interfeysi barcha umumiy qabul qilingan qoidalarga muvofiq amalga oshiriladi, biroq, birinchi qarashda, bu biroz noqulay. Dasturni birinchi marta ishlatib, juda murakkab bo'lib tuyuladi, ba'zida qaysi menyu yoki yorliq ekanligini eslash oson emas kerakli variantammo, uzoqroq foydalanish bilan, interfeys endi juda dahshatli ko'rinmaydi. Asosiysi, avval yordamni o'qing.

Interfeys haqida ozgina tushuncha bilan siz indeksni yaratishni boshlashingiz mumkin. Jarayonning o'zi juda sodda va indeksatsiya tezligi, hatto ko'z bilan ham ko'rib chiqilgan barcha qidiruv tizimlariga qaraganda ancha yuqori. Sinovlarning aniq raqamlari shuni ko'rsatadiki, SearchInform indekslash tezligida dtSearch va iSYS-dan ikki baravar yuqori bo'ldi! Dastur taqdim etilgan ma'lumotlarni rekord vaqt ichida 20 gigabayt miqdorida indeksatsiya qildi - 3 soat 17 daqiqa. Va yaratilgan indeksning hajmi eng kichik 4,4 Gb bo'lib chiqdi - bu Google Desktop Search-dan 100 MB kam.

Dastur oddiy fayllar va papkalar bilan bir qatorda elektron pochtalarni indekslash, ma'lumotlar bazalarini ulash va indekslashni (!) Va boshqa tashqi manbalarni (DMS, CRM) qo'llab-quvvatlaydi, indekslash paytida darhol morfologik qidirish uchun lug'atni belgilashingiz mumkin va barcha atributlar indekslanishi mumkin fayllar. Indeksni yaratgandan so'ng, hujjatlar bo'yicha birinchi sinov qidiruvini o'tkazishga urinayotganda siz biroz chalkashib ketishingiz mumkin: "qidiruvning ikki turi bor, ammo qaysi biri menga kerak?" Avval aytib o'tganimizdek, asosiy narsa yordamni o'qishdir, shunda hamma narsa aniq bo'ladi. Dastur haqiqatan ham ikki xil qidiruvni qanday amalga oshirishni biladi - so'z birikmasi va so'rovlar matniga o'xshash tarkibni qidirish.

Qidiruv so'rovini tahlil qilish uchun barcha asosiy funktsiyalarning tavsifi yuqorida keltirilgan edi, shuning uchun endi biz ushbu dastur tomonidan taqdim etilgan qidirish imkoniyatlarini faqat ro'yxatga olamiz. Frazeologik qidiruvdan boshlaylik: albatta, morfologik qidirish, iqtibos izlash, mantiqiy operatsiyalar, so'zni ajratish bilan qidirish (so'z boshida, oxirida, o'rtada yoki to'liq o'yinda qidirish), aralash tirnoq izlash (so'rovdagi barcha so'zlar mavjud bo'lganda) hujjatda, lekin shartli ravishda kiritilgan tartibda emas), xatolarni tuzatishda qidirish, sinonimlardan foydalanish, "deyarli iqtibos qidirish" (kiritilgan iborani tirnoq sifatida qidiradi, lekin kiritilgan so'zlar orasida boshqa so'zlar ham bo'lishi mumkin) va boshqalar. Ro'yxatdagi ba'zi variantlarning o'ziga xos sozlamalari mavjud. Bundan tashqari, ahamiyatsiz so'zlarning lug'atidan foydalanish mumkin va dastur allaqachon mavjud tayyor ro'yxat ushbu so'zlar uchun siz qidirish uchun ustuvor so'zlar lug'atidan ham foydalanishingiz mumkin (albatta, uni o'zingiz to'ldirishingiz kerak bo'ladi).

Bu erda, asosan, biz iboralarni izlashning barcha asosiy imkoniyatlarini qisqacha ko'rib chiqdik.

Keling, ushbu dasturning xususiyatlarini - shunga o'xshash hujjatlarni qidirishni ko'rib chiqishga o'tamiz. Ishlab chiquvchilar ta'kidlashlaricha, bu hech qanday matn qidirish emas, aynan u "o'xshashlarni qidirish" - ular hamma joyda shunday ta'rif berishadi, ammo yaxshi, buni xohlagan narsangiz deb atashingiz mumkin - asosiy nuqta. Internetda tezkor qidiruv natijasida "o'xshash qidiruvlar" deb nomlangan matnni tahlil qilishda yangi rivojlanish ekanligini tezda aniqlash mumkin. Ushbu tizim o'zlarining semantik mazmuni jihatidan o'xshash bo'lgan matnlarni topishga imkon beradi. Eng yoqimli tomoni shundaki, test sinovlarini o'tkazgandan so'ng, nazariya amaliyot bilan bir xil ekan! Dastur haqiqatan ham tarkibiga o'xshash hujjatlarni izlaydi va ularni o'xshashlik foizlari bo'yicha saralangan ro'yxatda namoyish etadi.

Keyinchalik, SearchInform korporativ tarmoqda ishlash uchun nimalarni taklif qilayotganini (xususan, uning SearchInform Corporate korporativ versiyasi) ko'rib chiqamiz. Ilovalarning ikki turi mavjud: orqa tomon va odatiy. Server tomoni ko'rsatilgan indekslarni o'zi ishlaydi va foydalanuvchilar ularga berilgan kirish huquqlariga qarab, ularni qidirish uchun ishlatishi mumkin. Foydalanuvchilar hisob ma'lumotlari yordamida avtomatik ravishda sozlanishi mumkin windows yozuvlari (professional tilda SearchInform Windows NTFS autentifikatsiyasidan foydalanadi) va qo'lda (foydalanuvchilar alohida qo'shilishi kerak). Har bir foydalanuvchiga ma'lum indekslarga kirishga ruxsat berilishi yoki berilishi mumkin, shuningdek siz foydalanuvchilarni guruhlarga birlashtira olasiz. Umuman olganda, SearchInform-ning tarmoqqa o'rnatilishi moslashuvchanligi bo'yicha Google-dan, qulayligi va soddaligi bo'yicha Snoop Server-dan ustundir.

Rasmiy sayt:
Tarqatish hajmi: 14,7 Mb Indekslash tezligini taqqoslash

Qidiruv tizimIndekslash vaqtiIndeks hajmi
Snoop Prof Deluxe 4.538 soat 46 daqiqa19 GB
Isys Desktop 7.06 soat 13 daqiqa7,9 GB
DtSearch 7.06 soat 3 daqiqa8,6 GB
Google Desktop Search Enterprise8 soat 17 daqiqa4,5 GB
Kopernik ish stolini qidirish *10 soat 51 daqiqa7 GB
SearchInform 1.5.023 soat 17 daqiqa4,4 GB

* .Html va .txt hujjatlarining aksariyati ruscha matnni o'z ichiga olgan, garchi ular indekslangan bo'lsa-da, lekin ularning ismlaridan tashqari ularni topish imkonsiz edi.

Barcha dasturlar e'tiborga loyiqdir.

Sinovda keltirilgan har bir dasturning sinovlari va sinchkovlik bilan tekshirilishi asosida ma'lum xulosalar chiqarish mumkin. Shunday qilib, Google Desktop Search Copernic Desktop Search tajribasiz foydalanuvchi uchun uy ma'lumotlarini qidirish tizimlari uchun juda mos keladi. Ular oddiy so'rovlar bilan yaxshi ishlashadi, foydalanuvchini sozlamalar bilan ortiqcha yuklamaydilar va bundan tashqari, ular butunlay bepul. Google-ning korporativ qidiruv tizimining bozoriga kirishga urinishi hali yuqori darajada oqlanmagan: to'liq ishlash uchun dasturni qo'shimcha modullar bilan osib qo'yish kerak va uni sozlash juda oson emas. Shu sababli, "Ish stoli qidiruvi", ya'ni "Kopernik" va "orqada" Google "ish stoli" qidiruv tizimlarining o'rnini qoldiradigan so'zlar.

Biroq, yanada kuchli echimlar - dtSearch, iSYS va SearchInform ham pishirilmaydi va foydalanuvchilarga o'zlarining "ish stoli" versiyalarini taklif qiladi. Ammo Google va Copernic-ning bepul dasturlaridan farqli o'laroq, o'rtacha narxda. Albatta, siz quvvat, tezlik va funksionallik uchun to'lashingiz kerak. Ammo dtSearch, iSYS va SearchInform dasturchilari o'zlarining asosiy maqsadlarini, albatta, korporativ sektorga aylantiradilar. Tarmoq, funksionallik, indekslash va qidirish tezligi bu mahsulotlarni "raqobatchilari" dan farq qiladi. Sinov natijalariga ko'ra favorit aniqlandi - SearchInform. Dastur shu kabi hujjatlarni qidirish imkoniyatini beradi, eng yuqori indeksatsiya va qidirish tezligiga ega, yaxshi funktsiyalar to'plamiga ega.

Fayllarning tarkibini qidirish vazifasi, asosan, yangi emas - vaqti-vaqti bilan bir nechta fayllardan matnlarni yoki kod qismlarini qidirishga to'g'ri keladi. Linuxni ishlatadigan va tushunadiganlar uchun bu osonroq, chunki ushbu echim uchun maxsus grep funktsiyasi mavjud. 7 yoshgacha men fayllar tarkibini indekslash orqali asosiy qidirish imkoniyatlarini kengaytirish haqida ba'zi maqolalar bilan tanishdim, ammo mos dasturni topishga qaror qildim. Garchi, printsipial jihatdan, tegishli dasturiy ta'minotni o'rganish ko'proq vaqt talab qilishi kerak deb o'ylab, hamma narsani qo'lda bajarar edim.

WinGrep-ni bepul yuklab olishingiz mumkin, u atigi 730Kb oladi. Windows-ning deyarli barcha versiyalari qo'llab-quvvatlanadi: 98, 2000, XP, Vista va Windows 7. Afsuski, ikkinchisi haqida hech narsa bilmayman. Menda "yetti" bor.

Fayllardan matn topish jarayoni

Keling, fayllar ichidagi matnni qidirish jarayonini batafsil ko'rib chiqamiz. WinGrep-ni ishga tushirgandan so'ng darhol yordamchi oynasi paydo bo'ladi, bu bir necha bosqichda bizning muammoimizni hal qilishga yordam beradi.

Birinchi qadamda siz qanday matnni qidirishingizni belgilashingiz va qidiruv turini ko'rsatishingiz kerak: doimiy iboralardan foydalanib, tez, sizning iborangizga o'xshash. Variantlarni kichik harflar bilan yoki faqat butun so'zni qidirish uchun tekshirishingiz mumkin.

Siz birdaniga bir nechta belgini qo'yishingiz mumkin va pastki katalogdagi fayllar tarkibi bo'yicha qidiruvni faollashtirishingiz mumkin. Interfeys, albatta, eng zamonaviy emas :)

Keyingi bosqichda ishlov beriladigan fayl kengaytmalarini ko'rsating.

Ishni tezlashtirish uchun siz faqat kerakli ba'zi turdagi fayllarni belgilashingiz mumkin. Agar siz hamma narsani ro'yxatga kiritmoqchi bo'lsangiz, "*. *" Universal qiymatini tanlang. O'zingizning kengaytmalarni qo'shishingiz mumkin.

Bu erda siz bajarilgan ishlar haqida ba'zi statistik ma'lumotlarni ko'rasiz. Belgilar bilan ishlaydigan asboblar panelida protsedurani qayta boshlash, fayllardagi matnni almashtirish, saqlash va boshqa imkoniyatlar mavjud.

Aytgancha, agar siz o'zingizni rivojlangan foydalanuvchi deb hisoblasangiz va Grep buyrug'ini yaxshi bilsangiz, Options menyusida Expert Mode-ni yoqishingiz mumkin. Shundan so'ng, qidiruv sozlamalari dialog oynasi biroz boshqacha ko'rinadi.

Bundan tashqari, bir nechta qo'shimcha imkoniyatlar... Yangilar buni qilmasliklari kerak, agar shunday bo'lsa, menyudan yana bir xil Options menyusiga o'tishingiz mumkin.

WinGrep fayllari ichidagi qidiruv dasturining xususiyatlari

Grep funktsiyasini amalga oshirishdan tashqari Windows dasturi fayllardagi matnni qidirish uchun quyidagi xususiyatlar mavjud:

  • Ham yangi boshlanuvchilar, ham ilg'or foydalanuvchilar uchun mavjud. Birinchisi bosqichma-bosqich yordamchi bilan ishlaydi, ikkinchisi uchun kengaytirilgan Ekspert rejimi mavjud.
  • Oddiy matnli fayllarni (shu jumladan UNIX uslubida) qo'llab-quvvatlash: dastur manbalari, HTML, RTF, ommaviy fayllar va hk.
  • Kabi ikkilik fayllar bilan ishlaydi word hujjatlari, elektron jadvallar, ma'lumotlar bazalari, DLL va hatto EXE.
  • Matnni almashtirish. Matchlarni topgandan so'ng darhol ularni boshqa matn satrlari bilan almashtirishingiz mumkin (birdaniga bitta yoki barcha fayllarda). Tez va xavfsiz.
  • Qidiruv natijalarini fayllar tarkibi bo'yicha saqlash va chop etish.
  • Buyruq satrining interfeysiga ruxsat beriladi.
  • Keyinchalik foydalanish uchun qidiruv mezonlarini saqlashingiz mumkin.
  • Multitasking qo'llab-quvvatlanadi, dasturni laganda ichiga kamaytirishingiz mumkin.
  • ZIP arxivlarini qayta ishlash.
  • WinGrep-ning integratsiyasi Windows Explorer har qanday katalogdan kontekst menyusi yordamida yordam dasturini ishga tushirishga imkon beradi.
  • Oson o'rnatish.

Umuman olganda, WinGrep - bu ajoyib echim! Yuqorida aytib o'tganimdek, siz Windows 7-dagi odatiy qidiruvdan fayllarning tarkibini qidirishni boshlashingiz mumkin, ammo dastur bilan ishlash ancha osonroq. Interfeysni o'rnatish va tushunish bir necha daqiqaga to'g'ri keladi. U bepul tarqatiladi, u tezda qidiradi. Endi men undan faqat fayllardan matn izlash uchun foydalanaman. Bitta narsa, Windows-ning so'nggi versiyasida dasturiy ta'minot qanday ishlashi aniq emas. Ehtimol, kimdir buni allaqachon sinab ko'rganmi? - sharhlarda yozing.

Doc, xls, pdf formatidagi hujjatlarda matn izlash men uzoq vaqtdan beri eslatib o'tmoqchi bo'lgan narsadir. Ammo bitta hujjat ichida qidirish emas, bu juda oddiy - hamma Ctrl + F ekanligini biladi, lekin ruscha so'zni qidirish, masalan, 10 yoki\u003e hujjatlarda. Har birini ochish va qo'lda qidirish haqiqiy, ammo uzoq. Va agar yuzlab hujjatlar / fayllar mavjud bo'lsa va siz hamma narsani topishingiz kerak bo'lsa, masalan, Vasil Petrovich ... Men bunday qidiruv haqida batafsilroq gaplashmoqchi edim.

Fayllardan matn qidirish (ingliz tilida)

* .Txt, * .html kabi fayllardan matnni (ingliz tilida) qidirish, masalan, yordamida amalga oshirilishi mumkin Jami qo'mondon 6.53. Umuman Jami qo'mondon - almashtirib bo'lmaydigan fayl menejeriagar siz hali foydalanmasangiz, bunga arziydi yuklab oling va foydalanishni boshlang! Bu sizning qattiq diskingizda juda yaxshi navigatsiyani ta'minlaydi va ikkita oyna tuzilishi bir vaqtning o'zida har qanday fayllar bilan bir nechta operatsiyalarni bajarishga imkon beradi. Shunday qilib, so'zni / bir nechta so'zlarni qidirishni Alt + F7 tugmachalarini bosib, "matn bilan qidirish" katagiga belgi qo'ying va ok! Ammo * .doc, * .xls kabi bir nechta fayllarni qidirish uning imkoniyatidan tashqarida. Siz boshqa dasturdan foydalanishingiz kerak.

Ruscha so'zlarni qidirib toping

Rus tilidagi so'zlarni fayllardan topish uchun turli dasturlar bilan o'tkazgan testlarim FindFiles3 dasturi e'tiborga loyiqligini ko'rsatdi. Fayllarni ism va / yoki tarkib bo'yicha qidirish uchun maxsus ishlab chiqilgan. Qaerda standart qidiruv topilgan matnni ko'rsatmasa, FindFiles hamma narsani osonlikcha topadi.

Dastur bir vaqtning o'zida bir nechta kodlashda kerakli fragmentni qidiradi. Matn topildi alohida maydonda namoyish etadi va rangli ranglarni ta'kidlaydi va hokazo. Dastur qo'ng'irog'i o'rnatilgan kontekst menyusi Explorer "Fayllarni, tarkibni toping ...".

Dastur interfeysi juda oddiy. Siz buni qiyinchiliksiz tushunishingiz mumkin. Yuqoridagi chap burchakda siz qidiruv parametrlarini o'rnatdingiz. "Papkada" maydonida siz qidirish uchun yo'l yoki yo'llarni belgilaysiz, ya'ni. qaysi papkalarni qidirish kerak. Qidiruv maskasini ko'rsatish uchun "*" belgisidan foydalaning. Masalan * .doc, ushbu niqob barcha doc fayllarini topadi. Siz vergul yoki vergul bilan ajratilgan bir nechta qidirish maskalarini belgilashingiz mumkin.

Agar siz fayllarni qidirsangiz, unda ko'rsatilgan matn parchasi sodir bo'ladi, keyin ushbu qismni "Matn" maydonida ko'rsatishingiz kerak. Boshqa ilovalar tomonidan ochilgan fayllar bloklanishi mumkin. Bunday holda, Bloklanganligini ko'rsatish yonidagi katakchani belgilang. Ushbu fayllar topilgan fayllarning umumiy ro'yxatida qizil rang bilan belgilanadi. Topilganlar orasida qidirishni davom ettirish mumkin. Buning uchun tegishli katakchani belgilashingiz kerak. Agar topilgan narsadan qidirsangiz, unda ilgari topilgan fayllar rangli bo'ladi.

Qidiruv muddatini fayl sanasi va boshqalar bo'yicha belgilashingiz mumkin. Qidiruvdan so'ng, topilgan fayllarni istalgan ustunlarga saralashingiz mumkin. Buning uchun faqat ustun nomini bosish kerak. Qidiruv mezonlarini o'zgartirib, qidiruvni davom ettirishingiz mumkin.

Fayllardan matn topish - mashq qilish

Dasturni yuklab oling va o'rnating.

Endi biz qidiradigan fayllar bilan papkani belgilashingiz kerak. Va shunga mos ravishda fayl formati.

Aniqlik uchun men 134 ta faylga ega papkani ko'rsatdim. Va faqat bittasida kerakli so'z bor. "Topish" tugmasini bosing

Va bir necha soniyadan so'ng dastur ushbu so'z paydo bo'lgan faylni topdi. Va shuningdek, juda qulay bo'lgan bir parcha matn!

Hammasi shu! Endi rus tilidagi matnni bir vaqtning o'zida ko'plab fayllardan qidirishingiz mumkin!

Agar siz allaqachon dastur bilan ishlagan bo'lsangiz va rus tilidagi matnni yaxshiroq qidirishni bilsangiz, iltimos, sharh yozib, tajribangiz bilan o'rtoqlashing. U birovga yordam berishi mumkin!

Minglab boshqalar orasida faylni topishingiz kerak bo'lgan har xil vaziyatlar mavjud, ammo matnning (yoki kodning) faqat bir qismi ma'lum. Masalan, saytni dasturlashda, manba kodini tekshirgandan so'ng, qaysi faylda ishlov berish va chiqishni amalga oshirilishini topishingiz kerak. Qanday qilib faylni matn bo'yicha qidirish ichida joylashganmi? Uchun maxsus matnli fayllarni qidirish foydalanishni tavsiya eting Jami qo'mondonchunki u matnli fayllarni tez, aniq qidiradi va bir nechta foydali qidiruv parametrlariga ega. Keling, buni qanday qilishni batafsil ko'rib chiqaylik.

Dastlab, Total Commander-ni yuklab olish havolasini bosish orqali rasmiy veb-saytidan Total Commander-ni yuklab oling va o'rnating. (rasmiy versiyasi to'liq ruslashtirilgan va bepul).

Keyin Total Commander-ni ishga tushiring. Ishga tushganda, u uchta raqamdan birini bosishingizni so'raydi, chunki dastur bepul dasturiy ta'minotdir, lekin uning ishlashida cheklovlar yo'q (topolmadim).

Bizdan oldin papkalarni ko'rib chiqishingiz mumkin bo'lgan ikkita oyna paydo bo'ldi. Har qanday oynada ma'lum bir matnli faylni qidiradigan papkani tanlang. Mening vaziyatimda "pagination_previous" matnli faylni topishim kerak. Ichida joylashgan durbin tugmachasini bosing yuqori panel dasturlar. Keyin, "Matn bilan" yozuvi yoniga belgi qo'ying, kiriting fayllarni qidirish uchun sinov, belgilarni ANSI va UTF-8 kodlashlari yoniga qo'ying va "Izlashni boshlash" tugmasini bosing.

Total Commander qidiruvdan so'ng, quyida qidiruv matni topilgan fayllar ro'yxati paydo bo'ladi.

Endi fayldan to'g'ridan-to'g'ri matnni topishingiz kerak. Fayl ichidagi matnni qanday topish mumkin? Bloknotdan foydalanishning eng qulay usuli Notepad ++ fayllardagi matnni qidirish uchun. Notepad ++ ning so'nggi versiyasini rasmiy veb-saytidan yuklab oling.

Ushbu ajoyib bloknotni o'rnating va u orqali topilgan faylni oching. CTRL + F tugmachalarini bosing (bir vaqtning o'zida ikkita tugma). Ochiladi fayldagi matnni qidirish maydoni... "Topish" maydoniga kerakli matnni kiriting va klaviaturada "Enter" tugmasini bosing. Notepad ++ fayldagi matnni tezda topadi va uni yashil rangda ta'kidlaydi. Agar siz "Enter" tugmachasini yana bir marta bosgan bo'lsangiz, bloknot keyinchalik faylda matn qidirishni davom ettiradi. Agar o'sha matn takrorlangan bo'lsa, u unga o'tadi va shuningdek uni yashil rangda ta'kidlaydi.

Maqola sizga yoqdimi? Do'stlar bilan bo'lishish uchun: