Axborotni o'lchashning semantik usuli: mohiyati, asosiy tushunchalari va xususiyatlari. Olingan material bilan nima qilamiz. Umumiy maqsadlar standartlari guruhiga quyidagilar kiradi

Axborot nima? U nimaga asoslanadi? Maqsad va vazifalar qanday? Bularning barchasi haqida ushbu maqola doirasida gaplashamiz.

umumiy ma'lumot

Qanday hollarda axborotni o'lchashning semantik usuli qo'llaniladi? Ma'lumotning mohiyati ishlatiladi, qabul qilingan xabarning mazmun tomoni qiziqish uyg'otadi - bu erda uni ishlatish uchun ko'rsatmalar mavjud. Ammo avval nima ekanligini tushuntirib beraylik. Shuni ta'kidlash kerakki, ma'lumotni o'lchashning semantik usuli bu hali to'liq shakllanmagan qiyin rasmiylashtirilgan yondashuv. Olingan ma'lumotlarning ma'nosini o'lchash uchun ishlatiladi. Boshqacha qilib aytganda, olingan ma'lumotdan bu holatda qancha ma'lumot zarur. Ushbu yondashuv olingan ma'lumotlarning tarkibiy tomonlarini aniqlash uchun ishlatiladi. Agar biz ma'lumotni semantik o'lchash usuli haqida gapiradigan bo'lsak, ko'rib chiqilayotgan mavzu bilan uzviy bog'liq bo'lgan tezaurus tushunchasi qo'llaniladi. Bu qanday?

Tezaurus

Men kichik kirish so'zini aytmoqchiman va ma'lumotni semantik usul bilan o'lchash haqida bitta savolga javob bermoqchiman. Uni kim tanishtirgan? Kibernetika asoschisi Norbert Viyener ushbu usuldan foydalanishni taklif qildi, ammo u hamyurtimiz A. Yu Shreyder ta'siri ostida ancha rivojlandi. Ma'lumot oluvchisi bo'lgan ma'lumotlarning umumiyligini ko'rsatadigan ism nima. Agar tezaurusni kelgan xabarning mazmuni bilan taqqoslasak, biz uning noaniqligini qancha kamaytirganini bilib olamiz. Ko'pincha ko'p odamlarga ta'sir qiladigan bitta xatoni tuzatmoqchiman. Shunday qilib, ular ma'lumotni o'lchashning semantik usuli Klod Shannon tomonidan kiritilgan deb hisoblashadi. Ushbu noto'g'ri tushuncha qanday paydo bo'lganligi noma'lum, ammo bu noto'g'ri. Klod Shannon "merosxo'r" semantik deb hisoblanadigan ma'lumotni o'lchashning statistik usulini taqdim etdi.

Qabul qilingan xabarda semantik ma'lumot miqdorini aniqlash uchun grafik yondashuv

Nima uchun biror narsa chizishingiz kerak? O'lchovning semantik usuli ushbu imkoniyatdan ma'lumotlarning foydaliligi haqidagi ma'lumotlarni oson tushuniladigan raqamlar ko'rinishida taqdim etish uchun foydalanadi. Bu amalda nimani anglatadi? Vaziyatni aniqlashtirish uchun qaramlik grafik shaklida quriladi. Agar foydalanuvchi qabul qilingan xabarning mohiyati to'g'risida ma'lumotga ega bo'lmasa (nolga teng), unda semantik ma'lumotlarning qiymati bir xil qiymatga teng bo'ladi. Eng maqbul qiymatni topish mumkinmi? Ha! Bu tezaurusning nomi, bu erda semantik ma'lumotlarning miqdori maksimal bo'ladi. Keling, kichik bir misolni ko'rib chiqaylik. Aytaylik, foydalanuvchi notanish chet tilida yozilgan xabarni oladi yoki odam u erda yozilgan narsalarni o'qiy oladi, lekin bu endi unga yangilik emas, chunki bularning barchasi ma'lum. Bunday hollarda, xabar nol semantik ma'lumotlarni o'z ichiga oladi, deyiladi.

Tarixiy rivojlanish

Ehtimol, biz bu haqda biroz ko'proq gapirishimiz kerak, ammo ushlash juda kech emas. Axborotni o'lchashning semantik usuli dastlab Ralf Xartli tomonidan 1928 yilda kiritilgan. Oldin aytib o'tilganidek, Klod Shennon ko'pincha asoschisi sifatida esga olinadi. Nega bunday tartibsizlik paydo bo'ldi? Gap shundaki, ma'lumotni o'lchashning semantik usuli Ralf Xartli tomonidan 1928 yilda kiritilgan bo'lsa-da, uni 1948 yilda umumlashtirgan Klod Shennon va Uorren Uaver edi. Shundan so'ng, kibernetika asoschisi Norbert Viyener tezkor usul usuli g'oyasini shakllantirdi, u Yu. I. Shnayder tomonidan ishlab chiqilgan tadbir shaklida eng ko'p tan olingan. Shuni ta'kidlash kerakki, buni tushunish uchun etarlicha yuqori darajadagi bilim talab etiladi.

Ishlash

Tezaurus usuli bizga amalda nima beradi? Ma'lumot nisbiylik kabi xususiyatga ega ekanligi tezisning haqiqiy tasdig'idir. Shuni ta'kidlash kerakki, u nisbiy (yoki subyektiv) qiymatga ega. Ilmiy ma'lumotni xolisona baholash uchun biz universal tezaurus tushunchasini kiritdik. Uning o'zgarishi darajasi, shuningdek, insoniyat olgan bilimlarning ahamiyatini ko'rsatadi. Biroq, ma'lumotlardan qaysi yakuniy natijani (yoki oraliq) olish mumkinligini aniq aytish mumkin emas. Masalan, kompyuterlarni oling. Hisoblash texnikasi chiroq texnologiyasi va har bir strukturaviy elementning bit holati asosida yaratilgan va dastlab hisob-kitoblarda ishlatilgan. Endi deyarli har bir kishi ushbu texnologiya asosida ishlaydigan narsaga ega: radio, telefon, kompyuter, televizor, noutbuk. Hatto zamonaviy muzlatgichlar, pechkalar va idishlarni yuvish vositalarida ozgina elektronika mavjud bo'lib, ular odamning ushbu maishiy texnikani ishlatishini engillashtirish to'g'risidagi ma'lumotlarga asoslanadi.

Ilmiy yondashuv

Axborotni o'lchashning semantik usuli qayerda o'rganilgan? Kompyutershunoslik - bu masalaning turli jihatlari bilan shug'ullanadigan fan. Xususiyat nima? Usul "true / false" yoki bit tizimining "birlik / nol" tizimidan foydalanishga asoslangan. Ma'lum bir ma'lumot kelganda, u alohida bloklarga bo'linadi, ular nutq birliklari kabi nomlanadi: so'zlar, bo'g'inlar va boshqalar. Har bir blok ma'lum bir qiymatga ega bo'ladi. Keling, kichik bir misolni ko'rib chiqaylik. Yaqin atrofda ikkita do'st bor. Biri ikkinchisiga: "Ertaga bizning dam olish kuni" degan so'zlar bilan murojaat qiladi. Dam olish kunlari qachon - hamma biladi. Shuning uchun ushbu ma'lumotlarning qiymati nolga teng. Ammo agar ikkinchisi u ertaga ishlaydi deb aytsa, unda birinchi uchun kutilmagan voqea bo'ladi. Darhaqiqat, bu holda, bitta kishi tomonidan qurilgan rejalar buzilishi, masalan, bouling o'ynash yoki ustaxonada delved o'ynashga o'tishi mumkin. Ta'riflangan misolning har bir qismini birliklar va nollardan foydalanib tasvirlash mumkin.

Tushunchalar bilan ishlash

Ammo tezaurusdan tashqari yana nima ishlatiladi? Axborotni o'lchashning semantik usulini tushunish uchun yana nimani bilishingiz kerak? Keyinchalik o'rganilishi mumkin bo'lgan asosiy tushunchalar signal tizimlari. Ular belgilarni yoki ularning kombinatsiyasini talqin qilish qoidalari kabi ma'nolarni ifodalash vositalarini anglatadi. Keling, kompyuter fanidan yana bir misolni ko'rib chiqaylik. Kompyuterlar shartli nol va boshqalari bilan ishlaydi. Aslida, bu uskunaning tarkibiy qismlariga qo'llaniladigan past va yuqori kuchlanishdir. Bundan tashqari, ular ushbu birliklar va nollarni oxir va chekkasiz uzatishadi. Qanday qilib texnikani farqlash mumkin? Bunga javob topildi - uzilishlar. Xuddi shu ma'lumot uzatilganda, keyin so'zlar, iboralar va individual ma'nolar kabi turli xil bloklar olinadi. Odamlarning og'zaki nutqida ma'lumotni alohida bloklarga bo'lish uchun pauzalar qo'llaniladi. Ular shunchalik tushunarsizki, ularning ko'pchiligini biz "mashina" da ko'ramiz. Xatda nuqta va vergul bu maqsadda ishlatiladi.

Xususiyatlari

Axborotni o'lchashning semantik usuliga ega bo'lgan xususiyatlar mavzusiga ham murojaat qilaylik. Biz bilamizki, bu ma'lumotlarning ahamiyatini baholaydigan maxsus yondashuvning nomi. Shu tarzda baholanadigan ma'lumotlar ob'ektiv bo'ladi deb aytish mumkinmi? Yo'q, bunday emas. Ma'lumotlar sub'ektivdir. Keling, bir maktab misolini ko'rib chiqaylik. Tasdiqlangan dasturdan oldinda boradigan juda yaxshi talaba va sinfda taqdim etilgan narsalarni o'rganadigan o'rtacha talaba bor. Birinchidan, u maktabda oladigan ma'lumotlarning aksariyati juda qiziqish uyg'otadi, chunki u buni allaqachon biladi va birinchi marta eshitmaydi / o'qimaydi. Shuning uchun, subyektiv darajada, bu uning uchun juda ahamiyatli bo'lmaydi (o'qituvchining o'z mavzusini namoyish etish paytida sezgan individual mulohazalari tufayli). O'rtacha odam yangi ma'lumotni faqat masofadan eshitgan bo'lsa-da, shuning uchun u uchun darslarda taqdim etiladigan ma'lumotlarning qiymati kattaroqroq bo'lishi kerak.

Xulosa

Shuni ta'kidlash kerakki, informatika fanida ma'lumotni semantik usul bilan o'lchash mavjud muammolarni hal qilishning yagona varianti emas. Tanlash belgilangan maqsadlar va mavjud imkoniyatlarga bog'liq bo'lishi kerak. Shuning uchun, agar biron bir mavzu qiziqish uyg'otsa yoki unga ehtiyoj bo'lsa, uni batafsil o'rganishingizni va semantikadan tashqari boshqa qanday o'lchash usullari mavjudligini bilib olishingizni maslahat beramiz.

Axborotni o'lchash uchun ikkita parametr kiritiladi: I ma'lumotlar miqdori va V d ma'lumotlar miqdori.

Ushbu parametrlar ko'rib chiqilayotgan adekvatlik shakliga qarab turli xil ifoda va izohlarga ega.

Sintaktik adekvatlik.  U ma'lumotlarning rasmiy va tarkibiy xususiyatlarini namoyish etadi va uning semantik tarkibiga ta'sir qilmaydi. Sintaktik darajada ma'lumotni taqdim etish vositasi turi va usuli, uzatish va ishlov berish tezligi, ma'lumotlarni taqdim etish uchun kodlarning o'lchamlari, ushbu kodlarning konvertatsiyasining ishonchliligi va aniqligi va boshqalar hisobga olinadi.

Faqat sintaktik nuqtai nazardan ko'rib chiqiladigan ma'lumotlar odatda ma'lumotlar deb ataladi, chunki semantik tomoni muhim emas.

Semantik (semantik) moslik.  Ushbu shakl ob'ektning tasviri va ob'ektning o'zi uchun moslik darajasini belgilaydi. Semantik jihat axborotning semantik tarkibini ko'rib chiqishni o'z ichiga oladi. Ushbu darajada ma'lumotni aks ettiruvchi ma'lumotlar tahlil qilinadi, semantik munosabatlar ko'rib chiqiladi. Informatika fanida ma'lumotni taqdim etish kodlari o'rtasida semantik aloqalar o'rnatiladi. Ushbu shakl tushunchalar va tushunchalarni shakllantirish, ma'lumotlarning mazmunini, mazmunini aniqlash va uni umumlashtirishga xizmat qiladi.

Pragmatik (iste'molchi) etarliligi.  U axborot va uning iste'molchisi o'rtasidagi munosabatni, ma'lumotlarning unga asoslangan boshqaruv maqsadiga muvofiqligini aks ettiradi. Axborotning pragmatik xususiyatlari faqat axborot (ob'ekt), foydalanuvchi va boshqarish maqsadlarining birligi mavjudligida namoyon bo'ladi.

Pragmatik jihat  ko'rib chiqish iste'molchilarning qarorlarini ishlab chiqishda o'z maqsadlariga erishish uchun ma'lumotlardan foydalanishning ahamiyati, foydaliligi bilan bog'liq. Shu nuqtai nazardan, ma'lumotlarning iste'mol xususiyatlari tahlil qilinadi. Muvaffaqiyatning ushbu shakli tizimning maqsadli funktsiyalariga mos keladigan ma'lumotlardan amaliy foydalanish bilan bevosita bog'liqdir.

Muvofiqlikning har bir shakli ma'lumot va ma'lumotlar miqdorining o'z o'lchoviga ega (2.1-rasm).

Shakl 2.1. Axborot choralari

2.2.1. Axborotning sintaktik o'lchovi

Sintaksis o'lchovi  ma'lumotlar miqdori ob'ektga semantik munosabatni bildirmaydigan anonim ma'lumot bilan ishlaydi.

Xabardagi V d ma'lumotlar miqdori ushbu xabardagi belgilar (bitlar) bilan o'lchanadi. Turli xil raqam tizimlarida bitta raqam boshqa og'irlikka ega va ma'lumotlarning o'lchov birligi mos ravishda o'zgaradi:

  • ikkilik notasida o'lchov birligi oz (  bit   - ikkilik raqam - ikkilik raqam);
  • o'nlik belgilarida o'lchov birligi dit (o'nlik) dir.

Bir misol. Ikkilik tizimda sakkiz bitli ikkilik kod 10111011 ko'rinishidagi xabarda ma'lumot hajmi V d \u003d 8 bit.

Oltita raqamli raqam 275903 shaklida bo'lgan o'nlik tizimdagi xabar V d \u003d 6 dit ma'lumotlar hajmiga ega.

Ma'lumotlar miqdori quyidagi formula bo'yicha aniqlanadi.

bu erda H (a) - bu entropiya, ya'ni. ma'lumotlar miqdori tizim holatining noaniqligi o'zgarishi (pasayishi) bilan o'lchanadi.

N mumkin holatga ega bo'lgan H (a) tizimning entropiyasi, Shannon formulasiga muvofiq quyidagicha bo'ladi:

bu erda p i - tizimning i-holatida bo'lish ehtimoli.

Tizimning barcha holatlari teng ehtimolligi bo'lgan taqdirda, uning entropiyasi o'zaro bog'liqlik bilan belgilanadi

bu erda N - barcha mumkin bo'lgan holatlar soni;

m - raqamlar tizimining asosi (alfavitda ishlatiladigan harflar xilma-xilligi);

n - xabardagi bitlar (belgilar) soni.

2.2.2. Axborotning semantik o'lchovi

Axborotning semantik tarkibini o'lchash uchun, ya'ni. uning miqdori semantik darajada, ma'lumotlarning semantik xususiyatlarini foydalanuvchi kiruvchi xabarni olish qobiliyati bilan bog'laydigan tezaurus o'lchovi eng ko'p tan olingan. Buning uchun kontseptsiya ishlatiladi. foydalanuvchi tezaurusi.

Tezaurus - bu foydalanuvchi yoki tizim ega bo'lgan ma'lumotlar to'plami.

S ma'lumotining semantik tarkibining va foydalanuvchi tezaurusining nisbatlariga qarab, men o'zgartirgan, foydalanuvchi tomonidan qabul qilingan va keyinchalik uning tezaurusiga kiritilgan semantik ma'lumotlarning miqdori o'zgaradi. Ushbu qaramlikning tabiati 2.2 rasmda ko'rsatilgan:

  • s p \u003d 0 bo'lganda, foydalanuvchi sezmaydi, kiruvchi ma'lumotni tushunmaydi;
  • chunki S p → as, foydalanuvchi hamma narsani biladi, unga kiruvchi ma'lumot kerak emas.

Shakl 2.2. Iste'molchi tomonidan qabul qilingan semantik ma'lumotlar hajmining tezisiga bog'liqligi I c \u003d f (S p)

Axborotning semantik (mazmunli) tomonlarini baholashda S va S p qiymatlarini muvofiqlashtirishga harakat qilish kerak.

Semantik ma'lumot miqdorining nisbiy o'lchovi tarkibiy C bo'lishi mumkin, bu semantik ma'lumot miqdorining uning hajmiga nisbati sifatida aniqlanadi:

2.2.3. Axborotning pragmatik o'lchovi

Ushbu o'lchov foydalanuvchi tomonidan qo'yilgan maqsadga erishish uchun ma'lumotning (qiymatning) foydaliligini aniqlaydi. Ushbu o'lchov ma'lum bir tizimda ma'lumotlardan foydalanish xususiyatlari tufayli ham nisbiy qiymatdir. Ob'ektiv funktsiya o'lchanadigan birliklarda (yoki ularga yaqin) ma'lumotlarning qiymatini o'lchash tavsiya etiladi.

Taqqoslash uchun, kiritilgan ma'lumotlar choralari jadvalda keltirilgan. 2.1.

2.1-jadval. Axborot birliklari va misollar

Axborot o'lchovi Birliklar Misollar (kompyuter maydoni uchun)
Sintaktik:

shannon yondashuvi

kompyuterga yondashuv

Noaniqlikning pasayish darajasi Voqealar ehtimoli
Axborot taqdimot bloklari Bit, Bayt, Kbyte va boshqalar.
Semantikaga oid Tezaurus Ilova to'plami, shaxsiy kompyuter, kompyuter tarmoqlari va boshqalar.
Iqtisodiy ko'rsatkichlar Daromadlilik, samaradorlik, amortizatsiya darajasi va boshqalar.
Pragmatik Foydalanish qiymati Pul ifodasi
Xotira hajmi, kompyuterning ishlashi, ma'lumot uzatish tezligi va boshqalar. Axborotni qayta ishlash va qaror qabul qilish vaqti

o'rtacha holat deb ataladi diskret ma'lumot manbai entropiyasi

matlar.

H p i logp i

i 1 N

Agar biz yana ikkilik birliklardagi noaniqlikni o'lchashga e'tiborni qaratadigan bo'lsak, u holda logarifmaning asosini ikkiga bo'lish kerak.

H p ilog 2 p i

i 1 N

Barchasiga tenglashtirilgan saylovlar bilan

p log

va formula (5) R. Xartli formulasiga (2) aylantiriladi:

1 log2

N log2

Taklif qilingan chora tasodifiy emas, balki entropiya deb nomlandi. Gap shundaki, ifodaning rasmiy tuzilishi (4) ilgari Boltsman tomonidan aniqlangan jismoniy tizimning entropiyasi bilan mos keladi. Termodinamikaning ikkinchi qonuniga ko'ra, yopiq kosmosning entropiyasi ifoda bilan aniqlanadi

P i 1

o'sishi

sifatida yozilishi mumkin

p iln

i 1 N

Ushbu formula (4) bilan to'liq mos keladi

Ikkala holatda ham qiymat tizimning xilma-xilligini tavsiflaydi.

(3) va (5) formuladan foydalanib, manba alifbosi qisqartirilishini aniqlashimiz mumkin

Ushbu alifboning harflari qanday oqilona ishlatilishini ko'rsatadigan:

) (3) formula bilan aniqlanadigan maksimal mumkin bo'lgan entropiya;

() - entropiya

manba, (5) formula bo'yicha aniqlanadi.

Ushbu o'lchovning mohiyati shundan iboratki, teng imkoniyatli tanlov bilan belgi bo'yicha bir xil axborot yuki teng bo'lmagan tanlov holatiga qaraganda kichikroq hajmdagi alifbo yordamida ta'minlanishi mumkin.

Semantik darajadagi ma'lumot o'lchovlari

Axborotning semantik tarkibini o'lchash uchun, ya'ni. uning miqdori semantik darajada, eng keng tarqalgan bo'lib foydalanuvchining kiruvchi xabarni olish qobiliyati bilan ma'lumotning semantik xususiyatlarini bog'laydigan tezaurus o'lchovidir. Darhaqiqat, olingan ma'lumotni tushunish va undan foydalanish uchun oluvchi ma'lum bilimlarga ega bo'lishi kerak. Mavzuni to'liq bilmaslik, ushbu mavzu bo'yicha olingan xabardan foydali ma'lumotlarni olishimizga imkon bermaydi. Mavzu to'g'risidagi bilimlar oshgani sayin, xabardan olinadigan foydali ma'lumotlar miqdori oshadi.

Agar biz oluvchining mavzu haqidagi bilimlarini "tezaurus" deb nomlasak (ya'ni so'zlar, tushunchalar, semantik bog'lanishlar bilan bog'langan ob'ektlarning nomlari), unda xabar tarkibidagi ma'lumotlar miqdori ushbu xabarning ta'siri ostida tezisning o'zgarishi darajasi bilan baholanishi mumkin. .

Tezaurus - bu foydalanuvchi yoki tizim tomonidan saqlanadigan ma'lumotlar to'plami.

Boshqacha qilib aytganda, oluvchi kiruvchi xabarlardan olgan semantik ma'lumotlarning miqdori uning tezaurusining bunday ma'lumotni qabul qilishga tayyorlik darajasiga bog'liq.

Axborotning semantik tarkibi va foydalanuvchi tezaurusi o'rtasidagi munosabatlarga qarab, foydalanuvchi tomonidan qabul qilingan va kelajakda uning tezaurusiga kiritilgan semantik ma'lumotlar miqdori o'zgaradi. Ushbu munosabatlarning tabiati 3-rasmda ko'rsatilgan. Semantik ma'lumotlarning miqdori cheklangan ikkita holatni ko'rib chiqing

3-rasm - Iste'molchi tomonidan qabul qilingan semantik ma'lumotlar miqdorining tezaurusiga bog'liqligi ().

Iste'molchi qachon semantik ma'lumotlarning maksimal miqdorini oladi

kiruvchi ma'lumot foydalanuvchi uchun tushunarli bo'lib, unga ilgari noma'lum (tezaurusida yo'q) ma'lumotni keltirganda, uning semantik tarkibini tezaurusiga () kiritish.

Shuning uchun xabardagi semantik ma'lumotlarning miqdori, foydalanuvchi tomonidan olingan yangi bilimlarning miqdori nisbiy qiymatdir. Xuddi shu xabar vakolatli foydalanuvchi uchun semantik tarkibga ega bo'lishi mumkin va qobiliyatsiz foydalanuvchi uchun ma'nosiz bo'lishi mumkin.

Axborotning semantik (mazmunli) tomonlarini baholashda va va uning qiymatlari to'g'risida kelishishga harakat qilish kerak.

Semantik ma'lumotlar miqdorining nisbiy o'lchovi tarkibiy omil bo'lishi mumkin, bu semantik ma'lumot miqdorining uning hajmiga nisbati sifatida aniqlanadi:

Ilmiy fan doirasida ishlab chiqilgan ma'lumotni semantik baholashga yana bir yondashuv shundaki, tahlil qilinadigan hujjat (xabar, nashr) tarkibidagi ma'lumotlarning semantik qiymatining asosiy ko'rsatkichi sifatida boshqa hujjatlardagi unga bog'lanishlar soni olinadi. Maxsus ko'rsatkichlar turli namunalardagi bog'lanishlar sonini statistik qayta ishlash asosida shakllantiriladi.

Pragmatik axborot choralari

Ushbu o'lchov foydalanuvchi tomonidan qo'yilgan maqsadga erishish uchun ma'lumotning (qiymatning) foydaliligini aniqlaydi. Bu ma'lum bir tizimda ushbu ma'lumotlardan foydalanish xususiyatlari tufayli ham nisbiy qiymatdir.

A. A. Xarkevich ushbu muammoni birinchi rus olimlaridan biri sifatida hal qildi, u maqsadga erishish uchun zarur bo'lgan ma'lumotlarni ma'lumotlarning ahamiyati o'lchovi sifatida olishni taklif qildi, ya'ni. maqsadga erishish ehtimolligi ortishini hisoblang. Agar shunday bo'lsa

Shunday qilib, ma'lumotlarning qiymati ma'lumotlar birligida, bu holda bitlarda o'lchanadi.

Ifodani (7) natijalar sonini normalizatsiya qilish natijasi deb hisoblash mumkin. 4-rasmdagi tushuntirishda 0 va 1 nuqtalari uchun 2 va 6 natijalar soni uchun bir xil qiymatlarni oladigan uchta sxemalar mavjud. Boshlang'ich pozitsiyasi - 0 nuqta. Olingan ma'lumotlarga asosan 1-bandga o'tish amalga oshiriladi. Maqsad xoch bilan ko'rsatilgan. Qulay natijalar maqsadga olib boradigan chiziqlar bilan tasvirlangan. Olingan ma'lumotlarning har uch holatda ham qiymatini aniqlaymiz:

a) ijobiy natijalar soni uchta:

va shuning uchun

b) bitta ijobiy natija mavjud:

c) ijobiy natijalar soni to'rtta:

B) misolda ma'lumotlarning salbiy qiymati olinadi (manfiy ma'lumotlar). Dastlabki noaniqlikni oshiradigan va maqsadga erishish ehtimolini kamaytiradigan bunday ma'lumot dezinformatsiya deb ataladi. Shunday qilib, birinchi navbatda) biz 1.58 ikkilik birliklari haqida noto'g'ri ma'lumot oldik.

AXBOROT O'TKAZMALARI

Axborot jarayonlarini amalga oshirishda, ma'lumotlar doimo bo'shliqda va vaqt ichida ma'lumot manbasidan qabul qiluvchiga (qabul qiluvchiga) uzatiladi. Shu bilan birga, ma'lumotni uzatish uchun turli xil belgilar yoki belgilar qo'llaniladi, masalan, tabiiy yoki sun'iy (rasmiy) til, bu uni ma'lum bir shaklda xabar deb atashga imkon beradi.

Xabar- uzatish uchun ishlatiladigan belgilar (belgilar) to'plami shaklida ma'lumotlarni taqdim etish shakli.

Aloqa semiotika nuqtai nazaridan belgilar to'plami sifatida (yunon tilidan semeyon -belgi, belgi) - belgilar va signal tizimlarining xususiyatlarini o'rganadigan fan - uch bosqichda o'rganilishi mumkin:

1) sintaktikxabarlarning ichki xususiyatlari ko'rib chiqiladi, ya'ni berilgan signal tizimining tuzilishini aks ettiruvchi belgilar o'rtasidagi munosabatlar. Tashqi xususiyatlar semantik va pragmatik darajada o'rganiladi;

2) semantikbu erda belgilar va ular tomonidan belgilangan ob'ektlar, harakatlar, fazilatlar, ya'ni xabarning semantik tarkibi, ma'lumot manbasiga aloqasi tahlil qilinadi;

3) pragmatikbu erda xabar va qabul qiluvchi o'rtasidagi munosabatlar ko'rib chiqiladi, ya'ni xabarning iste'molchi tarkibi, qabul qiluvchiga munosabati.

Shunday qilib, axborot uzatish muammolari va signal tizimlarini o'rganish darajalari o'rtasidagi ma'lum bir munosabatni hisobga olgan holda, ular uchta darajaga bo'linadi: sintaktik, semantik va pragmatik.

Muammolar sintaksis darajasiular asosiy ko'rsatkichlari imkon qadar yaqin bo'lishi mumkin bo'lgan axborot tizimlarini yaratishning nazariy asoslarini yaratish, shuningdek ulardan foydalanish samaradorligini oshirish uchun mavjud tizimlarni takomillashtirish bilan bog'liq. Bular xabarlarni uzatish usullarini va ularning moddiy tashuvchilari - signallarni takomillashtirishning aniq texnik muammolari. Ushbu darajada xabarlarni qabul qiluvchiga belgilar to'plami sifatida etkazish muammolari, axborotni taqdim etishning turi va usuli, uzatish va ishlov berish tezligi, ma'lumotlarni taqdim etish kodlarining hajmi, ushbu kodlarning konvertatsiyasining ishonchliligi va aniqligi va h.k.larni hisobga olgan holda, xabarlarning semantik tarkibidan to'liq mavhum. va ularning maqsadi. Ushbu darajada faqat sintaktik nuqtai nazardan ko'rib chiqiladigan ma'lumotlar odatda ma'lumotlar deb ataladi, chunki semantik tomoni muhim emas.

Zamonaviy axborot nazariyasi asosan ushbu darajadagi muammolarni o'rganadi. U uzatilayotgan xabarlarning ma'nosi yoki ahamiyatini aks ettirmaydigan belgilar ishlatilish chastotasining o'lchovi bo'lgan "ma'lumotlarning miqdori" tushunchasiga asoslanadi. Shu munosabat bilan ba'zan zamonaviy axborot nazariyasi sintaktik darajada ekanligi aytiladi.

Muammolar semantik darajauzatilayotgan ma'lumotning mazmunini rasmiylashtirish va ko'rib chiqish bilan bog'liq bo'lib, ob'ekt va ob'ektning o'zi tasvirining moslik darajasini belgilaydi. Ushbu darajada ma'lumotni aks ettiruvchi ma'lumotlar tahlil qilinadi, semantik aloqalar ko'rib chiqiladi, tushuncha va g'oyalar shakllantiriladi, ma'lumotning mazmuni, mazmuni ochiladi, uni umumlashtirish amalga oshiriladi.

Ushbu darajadagi muammolar juda murakkab, chunki ma'lumotlarning semantik tarkibi har qanday tilda keltirilgan xabarning semantikasiga emas, ko'proq qabul qiluvchiga bog'liq.

Pragmatik darajada ular ushbu ma'lumotni iste'molchi tomonidan olish va undan foydalanish oqibatlari bilan qiziqishadi. Ushbu darajadagi muammolar o'z maqsadlariga erishish uchun iste'molchilar echimlarini ishlab chiqishda ma'lumotlardan foydalanishning ahamiyati va foydaliligini aniqlash bilan bog'liq. Bu erda asosiy qiyinchilik shundaki, ma'lumotlarning qiymati, foydaliligi har xil qabul qiluvchilar uchun mutlaqo boshqacha bo'lishi mumkin va bundan tashqari, u bir qator omillarga bog'liq, masalan, uni etkazib berish va ishlatishda o'z vaqtida. Axborotni etkazib berish tezligiga nisbatan yuqori talablar ko'pincha nazorat harakatlari real vaqt rejimida, ya'ni boshqariladigan ob'ektlar yoki jarayonlar holatining o'zgarishi bilan amalga oshirilishi kerakligi bilan izohlanadi. Axborotni etkazib berish yoki undan foydalanishning kechikishi halokatli bo'lishi mumkin.

Yuqorida ta'kidlab o'tilganidek, axborot tushunchasini uning xususiyatlariga qo'yiladigan turli xil cheklovlar sharoitida ko'rib chiqish mumkin, ya'ni. ko'rib chiqishning turli darajalarida. Asosan, uchta daraja mavjud - sintaktik, semantik va pragmatik. Shunga ko'ra, ularning har biri bo'yicha ma'lumotlarning miqdorini aniqlash uchun turli xil baholardan foydalaniladi.

Sintaktik darajada ma'lumotlarning miqdorini aniqlash uchun ehtimoliy usullar qo'llaniladi, ular faqat ma'lumotning ehtimollik xususiyatlarini hisobga oladi va boshqalarni (semantik tarkib, foydalilik, ahamiyatlilik va boshqalar) hisobga olmaydi. XX asr o'rtalarida ishlab chiqilgan. matematik va, xususan, ehtimoliy usullar bilimlarning noaniqligini kamaytirish chorasi sifatida ma'lumot miqdorini baholashga yondashuvni shakllantirishga imkon berdi.

Ehtimollik deb ham ataladigan ushbu yondashuv printsipga asoslanadi: agar xabar bizning bilimimiz noaniqligining pasayishiga olib keladigan bo'lsa, unda bunday xabarda ma'lumot mavjud deb bahslashish mumkin. Bunday holda, xabarlarda turli ehtimolliklar bilan sodir bo'lishi mumkin bo'lgan har qanday hodisalar haqida ma'lumotlar mavjud.

1948 yilda amerikalik olim C. Shannon tomonidan turli xil ehtimolliklarga ega va aniq ma'lumot manbasidan olingan hodisalar uchun ma'lumot miqdorini aniqlash formulasi taklif qilingan. Ushbu formulaga muvofiq, ma'lumotlarning hajmini quyidagicha aniqlash mumkin:

Qayerda Men  - ma'lumotlar miqdori; N  - mumkin bo'lgan hodisalar (xabarlar) soni; p i  - individual hodisalar (xabarlar) ehtimoli.

(2.1) formuladan foydalanib aniqlanadigan ma'lumotlar miqdori faqat ijobiy qiymatni oladi. Ayrim hodisalarning ehtimolligi birlikdan kam bo'lganligi sababli, 2-ifoda logi - manfiy miqdor va (2.1) formulasida ma'lumot miqdorining ijobiy qiymatini olish uchun yig'indisi belgisidan oldin minus belgisi bo'ladi.

Agar biron bir voqea sodir bo'lishi ehtimoli bir xil bo'lsa va ular to'liq voqealar guruhini tashkil qilsa, ya'ni:

keyin (2.1) formula R. Xartli formulasiga aylanadi:

(2.1) va (2.2) formulalarda ma'lumotlar miqdori o'rtasidagi bog'liqlik Men  va shunga ko'ra, individual hodisalarning ehtimoli (yoki miqdori) logarifm yordamida ifodalanadi.

(2.1) va (2.2) formulalarda logarifmlardan foydalanish quyidagicha izohlanishi mumkin. Fikrlashning soddaligi uchun biz aloqani ishlatamiz (2.2). Biz ketma-ket dalillarni tayinlaymiz N  masalan, bir qator raqamlardan tanlangan qiymatlar: 1, 2, 4, 8, 16, 32, 64, va hokazo. Qaysi voqea sodir bo'lganligini aniqlash N  Bir xil ehtimolli hodisalar qatorida, seriyalarning har bir soni uchun ikkita mumkin bo'lgan hodisadan saralash operatsiyalarini ketma-ket bajarish kerak.

Shunday qilib, bilan N  \u003d 1 operatsiyalar soni 0 bo'ladi (hodisaning ehtimoli 1), bilan N  \u003d 2, operatsiyalar soni 1 bo'ladi, bilan N  \u003d 4 operatsiyalar soni 2 bo'ladi, bilan N  \u003d 8, operatsiyalar soni 3 ga teng bo'ladi va hokazo. Shunday qilib, biz quyidagi raqamlar seriyasini olamiz: 0, 1, 2, 3, 4, 5, 6, va hokazo, bu funktsiyaning mos keladigan qiymatlari deb hisoblash mumkin. Men  munosabati bilan (2.2).

Dalilni oladigan sonlar ketma-ketligi N, matematikada geometrik progressiyani tashkil etuvchi raqamlar qatori va funktsiya bajaradigan raqamlar qiymatlari ketma-ketligi deb nomlanuvchi ketma-ketlik. Menarifmetik progressiyani tashkil etuvchi qator bo'ladi. Shunday qilib, (2.1) va (2.2) formulalardagi logarifm matematikada juda yaxshi ma'lum bo'lgan geometrik va arifmetik progressiyalarni ko'rsatadigan qatorlar o'rtasidagi munosabatni o'rnatadi.

Har qanday fizik miqdorni aniqlash (baholash) uchun o'lchov nazariyasida o'lchov birligini aniqlash kerak. chora-tadbirlar .


Yuqorida aytib o'tilganidek, ma'lumotni qayta ishlash, uzatish va saqlashdan oldin kodlash kerak.

Kodlash maxsus alifbolar (signal tizimlari) yordamida amalga oshiriladi. Hisoblash (kompyuter) tizimlaridan foydalangan holda ma'lumotlarni olish, qayta ishlash, uzatish va saqlash jarayonlarini o'rganuvchi kompyuter fanida asosan ikkilik kodlash qo'llaniladi, bunda 0 va 1 ikkita belgidan iborat signal tizimi qo'llaniladi.Shuning uchun (2.1) va formulalarda (2.2) 2 raqami logarifmaning asosi sifatida ishlatiladi.

Axborot miqdorini aniqlashga bo'lgan ehtimoliy yondashuvga asoslanib, ikkilik signal tizimining ushbu ikkita belgisini ikkita turli xil voqea sifatida ko'rib chiqish mumkin, shuning uchun ma'lumotlar miqdori bilimlarning noaniqligini yarimga kamaytiradigan xabarni o'z ichiga olgan ma'lumot sifatida olinadi (hodisalar olinishidan oldin ularning ehtimolligi 0 ga teng). , 5, qabul qilingandan keyin - 1, noaniqlik mos ravishda pasayadi: 1 / 0,5 \u003d 2, ya'ni 2 baravar). Bunday ma'lumot birligi biroz deyiladi (inglizcha so'zdan) ikkilik raqam  Ikkilik raqamdir). Shunday qilib, ikkilik kodlash sharti bilan sintaksis darajasida ma'lumot miqdorini baholash uchun bir bit qabul qilinadi.

Keyingi eng katta ma'lumot o'lchov birligi bayt bo'lib, u sakkiz bitdan iborat ketma-ketlikdir, ya'ni:

1 bayt \u003d 2 3 bit \u003d 8 bit.

Informatika fanida ma'lumot miqdorining bayt ko'paytmalari ham keng qo'llaniladi, ammo metrik tizimdan farqli o'laroq, multiplikatsion omillar 10n koeffitsienti, bu erda n \u003d 3, 6, 9, va hokazo, ma'lumotlar miqdorining ko'paytmalarida. 2n koeffitsienti qo'llaniladi. Ushbu tanlov kompyuter asosan raqamlar bilan emas, balki ikkilik bilan ishlaydiganligi bilan izohlanadi.

Axborot miqdorining bayt birliklariga quyidagilar kiritiladi:

1 kilobayt (KB) \u003d 210 bayt \u003d 1024 bayt;

1 megabayt (MB) \u003d 210 KB \u003d 1024 KB;

1 gigabayt (GB) \u003d 210 MB \u003d 1024 MB;

1 terabayt (TB) \u003d 210 GB \u003d 1024 GB;

1 petabayt (PB) \u003d 210 TB \u003d 1024 TB;

1 eksabayt (Eb) \u003d 210 Pbit \u003d 1024 Pbit.

Nomi nomidan "kilo", "mega" va hokazo prefikslari bo'lgan ma'lumotlarning o'lchov birliklari o'lchov nazariyasi nuqtai nazaridan to'g'ri emas, chunki bu prefikslar o'lchovlar tizimida ishlatiladi, bunda koeffitsient ko'p birliklarga ko'paytirgich sifatida ishlatiladi. 10 n, bu erda n \u003d 3, 6, 9 va boshqalar. Ushbu noto'g'ri ishlashni bartaraf etish uchun xalqaro tashkilot Xalqaro elektrotexnika komissiyasi, elektron texnologiyalar sanoati uchun standartlarni yaratadigan, u ma'lumot miqdorini o'lchash uchun bir qator yangi konsollarni tasdiqladi: kibi (kibi), mebli (mebi), gibi (gibi), tebi (tebi), peti (peti), exby (exbi). Ammo eski belgi ma'lumotlarning o'lchov birliklari uchun ishlatilgan bo'lsa ham, yangi nomlarning keng qo'llanilishi uchun vaqt kerak bo'ladi.

Imzolovchi yondashuv, shuningdek, tizim tizimlaridan foydalangan holda taqdim etiladigan ma'lumotlar miqdorini aniqlashda qo'llaniladi. Agar biz alfavitning belgilarini N mumkin bo'lgan xabarlarning to'plami deb hisoblasak, alfavitning bitta belgisini olib yuradigan ma'lumot miqdorini (2.1) formula bo'yicha aniqlash mumkin. Agar alfavitning har bir belgisi xabar matnida teng ko'rinadigan bo'lsa, ma'lumotlarning miqdorini aniqlash uchun (2.2) formuladan foydalanish mumkin.

Alfavitning bitta belgisini olib boradigan ma'lumotlar miqdori qancha ko'p bo'lsa, ushbu alifboga ko'proq belgilar kiritiladi. Alfavitdagi belgilar soniga alifboning kuchi deyiladi. Signal tizimi yordamida kodlangan va ma'lum miqdordagi belgilar (belgilar) mavjud bo'lgan xabarda mavjud bo'lgan ma'lumot (ma'lumot hajmi) quyidagi formula yordamida aniqlanadi:

qayerda V  - xabarning ma'lumot hajmi; Men= log 2 N, bitta belgi (belgi) ning ma'lumot hajmi; Kimga  - xabardagi belgilar (belgilar) soni; N  - alifboning kuchi (alfavitdagi belgilar soni).

Sizga maqola yoqdimi? Do'stlar bilan baham ko'ring: