Matn fayllari va ular bilan ishlash dasturlari formatlari: tariximiz va bizning kunlarimiz


Nima uchun matnga ehtiyoj bor?

Bugungi kunda uchta keng tarqalgan matn formati bor - TXT, RTF va DOC. Ularning farqlari nima va ularning umumiyligi nima? Ularning umumiy bir nuqtasi bor: ularning barchasi matnli ma'lumotni saqlaydi. Farqi ular taqdim etgan matnni formatlash va qayta ishlash imkoniyatlarini, shuningdek, dasturlarda ularning uyg'unligi haqida saqlangan ma'lumotlarning qanchalik darajada mavjudligini o'z ichiga oladi.

Eng oddiy matn formati

Formativ jihatdan eng qadimgi va oddiy. Ushbu formatdagi matn bilan amalga oshirilishi mumkin bo'lgan barcha narsalar matni to'g'ri kiritishini va xatboshiligini saqlab qolishdir. Muayyan holatlardagi ushbu oddiylik universallik va shaffoflikning muhimligini ta'minlaydi: TXT har xil dasturlarda va turli platformalarda o'qish uchun osongina mavjud. Bundan tashqari, matn bilan o'zlarining to'g'ridan-to'g'ri ishlashiga ega bo'lmagan ko'pgina dasturlar TXT formatida matnni saqlashga qodir.

TXT-protsessorlari

DOS-ovsk davridan buyon ko'pchilik TXT-formatini juda yuqori darajada boshqarishga muvaffaq bo'lgan Lexicon so'z protsessorini esga olishadi. Bugun TXT bilan ishlashning asosiy vositasi - standart Windows notepad. Uning vazifalarini etarlicha tuyulmasa, har doim ham bepul World Wide Webning ta'mi va ehtiyojlari uchun muharriri topishi mumkin. Misol uchun, bepul Vega Konstantin Sheremetev dasturidan foydalanib, siz ochilgan matn fayli juda katta ekanligini bildirgan xabarni ko'rishingiz mumkin; Muallifning va'dalari, versiya 2.04 Vega 2 Gb fayllarni ochadi, va dastur (Windows XP "bilan Notepad og'irligi" haqida 65 kb uchun, taqqoslash) faqat 9,5 Kb bir oz vaqt oladi (!); Bunday holda, Vega Notepadga qaraganda ancha qulay va o'rnatishni talab qilmaydi. Va bu erda "oddiy matnni" ishlash imkoniyatlarining yana bir misoli mavjud. Siz o'qigan matn, IDM Computer Solutions'dan UltraEdit protsessoriga yozildi. Uning kuchli tomoni dasturlash tillarining sintaksisining maxsus ekrani va ishlovi, ammo eng sodda matn bilan u mo''jizalar yaratishi mumkin. Kirill belgi fotoalbomlarda o'ziga xos "haqida ko'p bilish", eng muhimi qulay Russified dasturlari, ergonomik va, deb Art sevishganlar, Vatanparvar dasturi bilan yaqindan tanishish uchun emas.

Formatlashtirish va universallik

Boy matnli format - bu Microsoft korporatsiyasi tomonidan yaratilgan formatda nomlangan qisqartirishni anglatadi. RTF Agar ishlab chiqarish va etarli darajada murakkab formatlash saqlab, bu qo'shimcha RTF ishlashda kimdan kam DOC ob'ektlari da, Izohlar, üstbilgi va altbilgiler, shakl, jadval va formulalar kiritish imkonini beradi maxsus "nazorat qilib aytganda" bilan belgilangan matn hisoblanadi. u DOC qabul qiladi va fayllar hajmi: uslublar sahifa ixcham emas o'rniga matn "nazorat so'zlarni" formatlashtirish uchun foydalaning. Biroq, RTF xavfsizlik bilan bog'liq DOC bilan bahsni oladi, chunki uning ichki tashkiloti Ibratli kodini saqlash va Ibratli viruslar, shuning uchun immun uchun bermaydi.

RTF-protsessorlari

RTF ko'pchiligida, eng ko'p bo'lmasa, so'zni qayta ishlash dasturlarida asosiy yoki qo'llab-quvvatlanadigan format sifatida ishlatiladi. Yaxshi vosita   Misol uchun, hiyeroglif Mikhail Morozovga xizmat qilishi mumkin. Bu dastur faqat rus tilida imlo, balki avtomatik ravishda tili klaviatura tartibini o'zgartirish funktsiyasini tekshirish emas, balki amalga oshirilmoqda. , Sun echimlar Rising tijorat va bepul versiyasi albatta ko'p o'ylangan interfeysi foydalanuvchilarni mos ham mavjud dan Atlantis Word Processor, klaviatura terish, olinadigan avtomobil qutisidan va boshqalar bir qator mavjudligi. Vazifalari. RTF va Patriot ishlaydigan redaktor ishlay olishi mumkin.

Eng "katta" matn formati

DOC formatida mumkin bo'lgan eng keng qayta ishlash va matn yaratishida, Izohlar va izohlar yaratish, shu jumladan, shuningdek, yaratish jadval, grafiklar, tasvirlar va boshqa elementlar joylashtirish va tahrirlash imkoniyatini kiritilgan. Biroq, o'z yaxlitligi, va bu xususiyatlar, barcha eng to'g'ri yagona Microsoft holatda, mashhur formatda joriy texnik xususiyatlarini ochib bo'lmaydi yordam MS Word, amalga oshirilmoqda. DOC «tushunish» va boshqa dasturlarga qaramasdan, ularning ishlab chiqaruvchilari har doim ham to'g'ri tan olinishini kafolatlamaydilar. farqli o'laroq, txt, RTF, DOC, bundan tashqari, o'z versiyalari to'liq mosligini ta'minlash emas, oddiy tektovyh muharrirlari u o'qilmaydi qilish, o'zaro bir format va.

DOC-protsessorlari

Yuqorida aytib o'tilgan sabablarga ko'ra asosiy va DOC bilan ishlash uchun "o'zgarmas" so'z protsessor MS Word, bu formatning barcha xususiyatlarini to'la-to'kis amalga oshiradi. WORD ko'plab hosildorlik va funktsionallik uchinchi tomonning rivojlanishi - qo'shimchalar, makrolar va dasturlarning barcha turlari tarmoqda juda ko'p mavjud. Vordu tanlovi, masalan, Corel WordPerfect, Sun Microsystems StarOffice va bepul OpenOffice.org tomonidan taqdim etiladi. Ham Word, ham boshqa dasturlarda ishlaydigan bo'lsak, mos kelmasligi muammosini yuzaga kelmasligiga amin bo'lishingiz kerak.

Formatlarning amal qilishi

Ko'rib shakllaridan biri boshqalardan ko'ra yomonroq, ular ishlatilishi kerak bo'lgan muammolarning o'ziga xos xususiyatlarini hisobga olmagan holda, shubhasizdir. So'z protsessorida tartibni yaratish vazifasini o'zimizga qo'ymaymiz, chunki tanlov deyarli aniqdir. Matn hajmini o'rta dan juda katta hajmgacha tayyorlash va har qanday dastur tomonidan kiritilgan yozuvlarni to'liq tushunishni ta'minlash uchun matn yozish va saqlashning eng oddiy, ixcham va ko'p qirrali vositalarini - TXT formatini ishlatish eng qulaydir. Boshqa foydalanishga kelsak matn formatlari, ularning ko'pchiligi muayyan prototip dasturida ularning amalga oshirilishiga bog'liqdir.
  OpenOffice.org ochiq operatsion platformalarda ishlaydigan, ochiq API va XML formatidagi fayl formati bilan ishlaydigan universal ofis to'plamini yaratishga qaratilgan ochiq kodli xalqaro loyihadir. Aslida, OpenOffice.org - bu loyiha doirasida ishlab chiqilgan dasturlar majmui. Bunga quyidagilar kiradi: bir so'z protsessor, elektron jadvallar, rasm muharriri, taqdimot tizimi va ma'lumotlar uzatish tizimi. Uning qobiliyatlari nuqtai nazaridan u xuddi shunday tijorat dasturlari bilan taqqoslanadi va ularga muqobil deb qaralishi mumkin. Hozirgi vaqtda OpenOffice.org ikkilamchi litsenziyaga ega: GPL va SISSL. Ushbu litsenziyalardagi farqlarga qaramasdan, oxirgi foydalanuvchilar uchun OpenOffice.org bepul.

OpenOffice.org o'rta 90s nemis firmasi StarDivision tomonidan ishlab chiqilgan, bir ofis paketi StarOffice uning kelib chiqishi, bor. 1999 yilning kuzida Sun StarDivision ni sotib oldi. 2000 yil iyun oyida, allaqachon Sun savdo belgisi ostida MS Windows, Linux va Solaris ostida StarOffice 5,2 qoldirgan. Oktyabr 13, 2000, (boshqalar tomonidan ishlab chiqilgan ba'zi kodi modul uchun bundan mustasno) StarOffice manbai kodni ochildi va bu kun rasman OpenOffice.org tug'ilgan kun. dunyo bo'ylab ko'ngillilar va dasturchilar intilmoqda korporatsiyasi kabi OpenOffice.org kodi ish Bugungi kunda

StarOffice, komponentlar mulkiy litsenziya va bepul OpenOffice.org ostida qo'shiladi bo'lgan: Ayni paytda, manba kodi biri ishlab chiqilmoqda OpenOffice.org jamoa ikki mahsulot ishlab chiqarilgan. StarOffice mavjud eng OpenOffice.org mulkiy qismlariga, ularning erkin hamkasblariga o'rniga.

(Cnews.ru saytiga ko'ra).

Faylga ma'lumotlarni saqlash uchun bir qator qoidalar fayl formati deb ataladi. Turli xil turlari   matnli fayllar, raster grafikalar va h.k. kabi fayllar turli formatlardan foydalanadi. Umuman, bir necha turdagi fayllar uchun bir nechta turli formatlar, odatda bir xil fayl va formatni tushunish mumkin. Fayl formati Agar hokazo misol, DOC, GIF, ma'lum bir shaklda, uni saqlash va qachon fayl nomi kiritiladi fayl nomi kengaytmasi. D tomonidan belgilanadi.

Qoidaga ko'ra, fayl formatlari aniq belgilangan dastur dasturida ishlatiladi. Misol uchun, CDR bilan fayllar va uzaytirish xar bir fayl sifatida diskka yozib, boshqa tasvir ishlash to'plami, CorelXara tomonidan tashkil tasvirlar sifatida saqlanadi vektor grafika CorelDRAW, bir ma'lum paketi yaratilgan grafik ob'ektlar. Ba'zi formatlar muayyan ilovalar bilan bog'liq emas, ya'ni universaldir. Eng mashhur universal formatlardan biri TXT formatidir (format matnli fayllar   DOS).

Ko'pincha kompyuter fayllarini siqish o'rta joyni saqlash uchun ishlatiladi. Fayllarni siqishning ko'plab usullari mavjud. Ushbu usullar asl fayl formatiga bog'liq. Odatda, siqishni darajasi qanchalik yuqori bo'lsa, o'qish va yozish operatsiyalari sekinlashadi.

ma'lumotlar yo'qotish mumkin bo'lgan foydalanib ma'lumotlar va algoritmlar yo'qolishi holda ikkala siqishni algoritmlarni mavjud siqishni algoritmlarni, kelsak.



Kayıpsız siqilish, faylni paketlenmeden keyin siqishni oldin faylda mavjud bo'lgan barcha ma'lumotlarni taqdim etadi. Masalan, matn yoki raqamli ma'lumotlarni saqlash vaqtida siqishni mexanizmlari yo'qoladi elektron jadvallar   yoki hujjat fayllari. Kayıpsız siqishni algoritmalarının misollar, ZIP, ARJ va boshqalarga yaxshi ma'lum algoritmalardır.

Amaldagi asosiy formatlarning qisqacha tavsifini keltiramiz:

ASCII (TXT) ma'lumot almashinuvi uchun Amerika standart kodi. Amerika Standartlar Instituti (Amerika Milliy Standartlari Instituti) tomonidan ishlab chiqilgan matnli fayl formati. Hammasi tomonidan qo'llab-quvvatlanadi operatsion tizimlar   va barcha dasturlar. Bu DOS-kodlashda matn fayli, rasmni kiritish funktsiyasi yo'q, formatlash mavjud emas, barcha mashinalarda ishlaydi, faqat kichik hajmdagi fayllarni yaratish mumkin.

§ ANSI (TXT). ANSI kodlashda matnli fayl formati (kod sahifasi uchun Microsoft Windows)

§ DOS, Windows (DOC) uchun MsWord. Microsoft korporatsiyasi tomonidan ishlab chiqilgan hujjat formati MS-DOS dasturlari va ko'pchilik so'z protsessorlari tomonidan qo'llab-quvvatlanadi. Hujjatlarning asl formatlashi, shuningdek, belgi uslublarini saqlaydi. Matnli ma'lumotlarga qo'shimcha ravishda, ushbu formatdagi fayllar turli parametrlarga ega bo'lgan grafik tasvirlarni o'z ichiga olishi mumkin. 256 rangni qo'llab-quvvatlaydi. Siquvni qo'llab-quvvatlamaydi. Turli xil platformalar va ilovalar o'rtasida formatlashtirilgan matnli ma'lumotlarni almashish uchun ishlatiladi.

§ Hypertext Markup Language HTML (HTM, HTML). Belgilash tili hiper matnli hujjatlar. Internetda joylashgan barcha sahifalar ushbu maxsus til yordamida yaratilgan. HTML hujjatlari ASCII fayllari bo'lib, har qanday matn muharriridan ko'rish va tahrir qilish uchun foydalanish mumkin. An'anaviy matn faylidan farq HTML hujjatida hujjatni formatlash qoidasini belgilaydigan maxsus tag buyruqlari mavjud. Agar siz HTML tilini o'rgana olsangiz, Internet uchun sahifalar yaratishingiz mumkin. Teglar (teglar) odatiy matnga qo'shilsa, tomoshabinni ushbu matnni ma'lum bir tarzda ko'rsatishga majbur qiladi va uni rasm sahifasiga joylashtiradi. Java va JavaScript-ni o'rgangan bo'lsangiz, teglar ichidagi skript tilida yozilgan buyruqlarni qo'yish orqali HTMLning imkoniyatlarini qanday kengaytirishni bilasiz.

§ Portativ hujjat formati PDF (.PDF). Adobe sifatida kompaniya tomonidan ishlab chiqilgan, bu hujjat saqlash format, Veb uchun ochiq poligrafiya standart deb da'vo. HTMLga muqobil sifatida ko'riladi. HTML ahvolga tushgan hujjatlar eshitish juda cheklangan miqdordagi ko'rish HTML taklif original format, ushlab turmang odatda, HTML tarjima qilingan, deb hisoblanadi. farqli o'laroq, yaratish tarqatish va original formatda hujjatlar ko'rish uchun dastur Acrobat va PDF-uslubiyatini foydalanuvchilar, ular o'quvchi uni qilingan aniq tarzda nashr ko'rasiz, deb bilaman. Agar zarur hujjat aniq nusxasini olish bo'lsangiz, PDF formatida zaruriy hisoblanadi. Muvaffaqiyatli misol sifatida dastur PDF   rus tilidagi hujjatlar uchun "Moscow News" serverini Internetga joylashtiramiz. Unda ko'rsatilgan materiallar elektron shaklda bosma usul bilan bosilgan qog'oz aslini takrorlaydi.

§ Standart umumiy belgilash tili (SGML). HTML taraqqiyoti umumlashtirilgan belgining standart tili sifatida tarjima qilinadi. Teg bilan belgilangan tuzilgan hujjatlarni yaratish mexanizmlari to'plami. HTML bilan solishtirganda, bu veb-format uchun yanada moslashuvchan va ko'p tomonlama imkoniyatlarini beradi. Biroq, SGML farq qiladi va ortdi tezligishuning uchun oddiy vosita sifatida PDF qo'llaniladi. SGML kuchi hujjatlar mazmunan ta'rifi, uning ko'ndalang platforma tuzilgan yondashuv hisoblanadi. SGML, aslida, bir metall tili, ya'ni. Hujjatlar yaratishda ishlatiladigan formatlash tillarining tavsifi uchun mo'ljallangan.

   Kompyuter dunyosida va Internetda eng tez-tez ishlatiladigan ma'lumotlar turi matndir. yuz marta eshitish ko'ra ko'proq rang-barang va hatto yaxshi Video va grafik bir marta ko'rish uchun. Eshitish ham yomon emas - bu holda audio ma'lumot formatlari mavjud. Biroq, kompyuter to'pi oddiy va oddiy harflar va raqamlar tomonidan boshqariladi. Ularsiz, hech qaerda, hatto boshqa fayl nomi ham berilmaydi. Matnli ma'lumotlar muhim va xilma-xildir - kitoblar, hujjatlar va dastur kodi. Va har bir maqsad uchun turli xil formatlar mavjud. Ushbu maqolada muhokama qilinadi. haqiqat darhol zahirani qilish kerak - bu sharh e-kitob shakllari tomonidan ta'sir qilmaydi, ular alohida muhokama loyiq. Bu erda hujjatlar shakllari haqida gapiriladi.

Matn formati - TXT (PlainText)

Shunday qilib - eng oddiy format TXT. Bu matn, aslida, sof va sodda shaklda. Matn tarkibini va xizmat ma'lumotlarining mutlaq minimalini - matning boshi va oxiri, yuk tashuvchisi va shunga o'xshash belgilarni o'z ichiga oladi.

Spartanning soddaligiga qaramasdan, format variant va farqlardan mahrum emas. Birinchidan, ba'zi bir farqlar bor Windows   , Unix va MacOS versiyalarida turli xil yakuniy belgilar ishlatiladi. Bundan tashqari, farqlar 8-bit (ASCII) yoki 16-bitli (UNICODE) kod sahifalaridan foydalanish mumkin.

Ammo, shunga qaramay TXT formati juda ko'p tomonlama bo'lib, biz dasturchilar va tizim ma'murlarini juda yaxshi ko'ramiz.

MS Office hujjatlari va analoglari formatlari - DOC, DOCX, RTF, ODT

Tiklanishning barcha tomonlari va soddaligi uchun, aniq hujjatlar yaratish uchun aniq qoidalar - muayyan qoidalar va dizayn qoidalariga rioya qilish bilan bosib chiqarish uchun mo'ljallangan matnlar uchun mutlaqo yaroqsiz. Matndan tashqari boshqa hujjatlarda matnni tuzish va formatlash haqida juda ko'p ma'lumotlar bo'lishi kerak. Va shuningdek, ularni joylashtirish kerak bo'lgan qog'oz varaqlarining shakli va hajmi haqida ham.

Ushbu maqsadlar uchun turli xil ofis paketlari uchun bir nechta formatlar yaratilgan. Eng ommabop va aslida universalga yaqin bo'lgan MS Word formatlari - doc va docx sifatida ko'rib chiqilishi mumkin. Birinchisi, Microsoft tomonidan matn muharriri uchun yaratilgan maxsus yopiq format (aniqrog'i, butun formatdagi formatlar - uning mavjudligiga bir necha marotaba takomillashtirildi). Shu bilan birga, kompaniyaning rivojlanishi oldidan Adobe bilan hamkorlikda RTF (Rich Text Format) formati yaratildi. DOCdan farqli o'laroq, ushbu formatning tuzilishi mavjud bo'lib, deyarli mavjud matn muharrirlari tomonidan qo'llab-quvvatlanadi. Mavjud vazifalar to'plami uchun DOC dan ancha past bo'lsa ham.

Microsoft rivojlanishining yaqinligi Open Office ofisini ochdi. ODT (OpenDocument matn formati) formati ishlab chiqilgan. Ushbu format, shu jumladan, tijorat muharrirlari tomonidan yaxshi qo'llab-quvvatlanmaydi MS Word   va ularni xatolari bilan ochishi mumkin.

Nihoyat, 2007 yilda Microsoft DOC formatini tark etishga qaror qildi va Office Open XML formatidagi oilani ishlab chiqdi, bu esa MS Wordning yangi versiyalari uchun asosiy formatga aylangan DOCXni o'z ichiga oladi.

PDF formatida

Microsoft bilan hamkorlik qilishdan voz kechib, Adobe o'zining usulini o'zgartirdi. U ishlab chiqilgan pDF formatida bu hujjatlarni ishlab chiqish uchun emas, balki ularni ko'rib chiqish va chop etish uchun emas, balki format bo'ldi. Shunday bo'lsa-da, ayniqsa, mashina ustida qarab farq qilishi mumkin shakli bo'lgan matn formatlangan oldingi guruhlar, farqli o'laroq, u aks yoki chop etiladi, PDF hujjat formati asosda o'zgarmadi va barcha sharoitlarda ko'rinishi va vorstku saqlab qoladi. Bu, shuningdek, bosma elementlari va qo'shimcha xizmatlar sifatida juda keng doiradagi qo'llab-quvvatlaydi (masalan, parol bilan hujjatlarni himoyalash   tahrirlash yoki bosib chiqarish va h.k.). Barcha bu ko'proq murakkab va professional-qarab hujjatlar va hatto kitoblar tarqatish uchun PDF formatini qiladi.

Har bir kompyuter Foydalanuvchi doimo matn fayllari turli formatlar bilan duch kelgan, lekin odamlarga bir kitob o'qish uchun imkoniyat berish, bu shakllari va dasturlar, boy tarixi matni bilan qanday ishlashi haqida o'ylab va kompyuterga to'g'ridan barcha zarur hujjatlarni yaratish mumkin emas.

Matn fayllari tarixi o'zlaridan ko'ra ancha yoshroq emas shaxsiy kompyuterlar   - o'zlarining durdonalari birinchi zamonaviy o'xshash "Bloknot" yozilgan edi bor. Shunday qilib, matn fayllari va dasturlarni formatlar ular bilan ishlash uchun nima? Birinchi Agar matn fayllari, ularga va nima ular umumiy bo'lgan o'rtasidagi farqni kerak tushunish kerak. matn ma'lumotlarni saqlash uchun - birlashtiradi hamma narsa matn ularning asosiy vazifasi formatlaydi. Ular boshqa dasturlar bilan muvofiqligi jihatidan fayllar saqlangan ma'lumotlarga imkoniyatlari va ishlash, shuningdek, ruxsat ham farq qiladi.

Oddiy matn formati an'anaviy txt formatda bo'ladi. U imkoniyatlari va eng qadimiy matn formatida eng sodda gap. Tufayli, uning soddaligi uchun (iloji TXT matni o'rnatish va xat uni sindirib Limited), bu format ko'pincha platformalarda bir turli ilovalar va dasturlarini katta qator ishlatiladi.

shaxsiy kompyuterlar tarqatmaslik va ularning savdo oshirish bilan birga, Microsoft Boy Matn shaklda (yoki shunchaki RTF) deb nomlangan boshqa bir mashhur formatga yaratadi. Bu ishlab chiqarish, balki murakkab formatlash va joylashtirish formula matn, jadvallar, rasmlar, üstbilgileri, altbilgileri va Izohlar saqlab qolish uchun emas, balki faqat beruvchi, ma'lum bir "tekshirish aytganda" tomonidan belgilangan bir matn.

maxsus nomidagi dasturiy paketi uchun Microsoft tomonidan yaratilgan, deb Biroq, RTF, qobiliyat DOC juda past Microsoft Office. Bundan o'n besh yil avval yaratilgan DOC matnlarni formatlash va qayta ishlash, tasvirlarni, diagramlarni, jadvallarni va boshqa elementlarni yaratish, tahrirlash va joylashtirish uchun juda ko'p imkoniyatlarni o'z ichiga oladi. Shuni ta'kidlash kerakki, ushbu vazifalar faqat MS Word dasturida ishlaydi. Bu, birinchi navbatda, Microsoft joriy DOC format xususiyatlari emas va to'la bu format kuchini uning raqobatchilar va mustaqil ishlab chiquvchilar uchun bermaydi, deb aslida tufaylidir. DOC formatiga qo'shimcha ravishda, bugungi kunda keng foydalaniladigan matnli fayllarning boshqa formatlari ham bu faktning asosiy sabablaridan biridir.

DOC formati va matn va txt o'rtasidagi asosiy farq, uning ikkilikligi bo'lib, Wordpad, Lexicon, Atlantis kabi sodda bo'lgan narsalarda o'qilmaydi. Bundan tashqari, ayrim hollarda MS Wordning turli xil versiyalarida yaratilgan DOC-fayllarining mos kelmasligi kuzatilishi mumkin.

Matn fayllarining formatlari ko'plab dasturlarda ochilishi va tahrirlanishi mumkin. ilgari zikr MS Word tashqari, bu eng keng tarqalgan Sun Microsystems mumkin StarOffice, Corel WordPerfect va bepul OpenOffice.org suite bor.

Elektron kitobxonlarning tarqalishi bilan boshqa matnli fayllar, masalan, FB2 va LRF kabi mashhurlikka ega.

Turli xil platformalarda turli xil matnli formatlardan foydalanish uchun konvertorlar deb nomlangan ko'plab dasturlar yaratilgan. Matnli fayl konvertorlari sizga manba kodini boshqa formatdan boshqasiga saqlashga va keyinchalik turli xil qurilmalar va platformalarda foydalanishga imkon beradi.

Konvertorlar faqat matnni boshqa formatdan ikkinchisiga saqlash uchun emas, balki asl manbalardan farqli o'laroq, asl fayllarni "o'qimaydigan" qurilmalarda ishlatilishi mumkin bo'lgan fayllarni yaratish uchun ham ishlatiladi. Misol uchun, mashhur matnli fayl formatlarini qo'llab-quvvatlamaydigan ba'zi elektron kitoblar konvertor dasturlari yordamida manba fayllaridan olingan LRF yoki FB2 formatlarini osongina aniqlashi mumkin.

Matn ma'lumotlar TXTda faqat bitta konteynerga joylashtirilgan. Boshqa hech kim yo'q edi. Hozir ularning soni ellikka yaqin. Biz doimiy ravishda foydalanamiz, boshqalarga kamdan-kam hollarda duch kelamiz. Uchinchi borligimiz haqida hatto shubhalanmaymiz. Eng qulay matnli ma'lumotlar do'konlarini qulaylik nuqtai nazaridan ko'rib chiqing foydalanish.
<<>>

TTT ("oddiy matn")

"Janr" ning otasi. Bugungi kunda faol ishlatilgan. matn belgilar majmuasini sifatida saqlanadi, chunki, bayt Fayl hajmi belgilar plus non-printable belgilar soni (bo'sh joy, tab, bir bandning va boshqalar uchini belgilang - ular formatlash belgi deyiladi). Shuning uchun, kichik fayl hajmi erishiladi. Biroq, bunday hujjatlarni formatlashtirish imkoniyatlari juda cheklangan. Aslida - bu faqat matn. Matn ma'lumotlar TXT-ning kengaytmasi bo'lgan konteynerlarda saqlanishi mumkin emas. Aslida, bu kengaytmalar majburiy emas. TXT-ni DOC-ga qayta nomlash, hech narsa o'zgarmaydi. Ichki tuzilish bir xil bo'ladi. Xuddi shunday, TXT-ga DOC kengaytmasini o'zgartirib, siz bir xil "vordian" faylini olasiz. Nimaga bu uch harfdan so'ng nima uchun kerak bo'ladi? Sukut bo'yicha ularni ochadigan dasturlarni to'g'ri talqin qilish uchun.

RTF (boy matnli format)

1987-yilda Microsoft tomonidan yaratilgan matnli hujjatlarni formatlash uchun bepul o'zaro faoliyat platformalar saqlash formati. Bugungi kunda u keng tarqalgan, shuning uchun eng zamonaviy matn muharrirlari uni qo'llab-quvvatlamoqda. RTFni Windows platformasida yaratganingizdan so'ng, boshqa platformalarda (Apple, Linux va boshqalar) juda yaxshi o'qiladi va tahrirlanadi. Bosib chiqarishda de facto standart. Biroq, barcha dasturlar uni teng darajada yaxshi tashkil qilmaydi. Ta'kidlash joizki, OpenOffice'da yaratilgan hujjatlarda formatlash ba'zan uchib, ba'zilari esa o'qilmaydigan belgilarga aylandi.

RTF u hali DOC kimdan kam bo'lsa-da, Izohlar, üstbilgi va altbilgiler, shakl, jadval va formulalar ishlab chiqarish va etarli darajada murakkab formatlash saqlab, kiritish imkonini beradi. DOCni qabul qiladi va fayllar hajmida: murakkab hujjatlar DOC-fayllarida (sodda - aksincha) ixchamgina saqlanadi. Biroq, RTF xavfsizlik bilan bog'liq DOC bilan tortishuvni oladi, chunki u makrolardan foydalanmaydi. Shu bois, Word fayllari RTF formatida saqlash orqali "shifo" bo'lishi mumkin. Bundan tashqari, RTF formati fayl korruptsiyasiga chidamli. DOC faylida kamida bitta baytni o'zgartirsangiz, Wordda endi ochilmaydi. Va RTF formatidagi faylni buzish faqat buzilgan matnni yo'qotishiga olib kelishi mumkin.

DOC (ingliz "hujjat" dan)

Dastlab, bu kengaytma formatlashdan oddiy matnli fayllarga murojaat qilish uchun ishlatilgan, ammo 90-yillarning boshida Microsoft aslida uni «xususiylashtirdi». Shuning uchun hozir DOC faqat ushbu kompaniyaning mahsulotlari bilan bog'liq. Ushbu format matnni formatlashtirishda (skriptlar, makrolar) katta imkoniyatlar yaratadi. Shu sababli, uchinchi shaxslarning matn muharrirlari bilan muvofiqligi yomonlashdi. Ushbu formatdagi fayllar shriftlar, xarakterlarni kuzatish, paragraflar va intervallar haqida juda ko'p ma'lumotlarni o'z ichiga oladi. Buning sababi faqatgina matnni o'z ichiga oladigan fayl RTF faylining hajmidan kattaroqligi bilan bog'liq. Biroq, hujjatda turli xil grafik elementlar va tasvirlar kiritilganda, DOC hajmi kattaroq va katta muvofiqligi ta'minlaydi. TXT va RTF dan farqli o'laroq, DOC oddiy formatdagi matn muharrirlari tomonidan o'qilmaydi. Masalan, Eslatma kitoblari ba'zi RTF fayllarini ko'rib chiqishi mumkin. RTF bilan mashhur.

DOCX

Office 2007 yillari kelib chiqishi bilan, Microsoft Office Open XML-ga asoslangan yangi formatlarga ko'chib o'tdi (kengaytmalar oxirida "x" harfini qo'shib tanlagan holda). Format - XML, grafikalar va boshqa ma'lumotlar shaklidagi matnlarni o'z ichiga olgan zip-arxivdir. Fayl hajmini kamaytirish uchun ZiP siqish ishlatiladi. Hujjatlar faqat Office 2000 / XP / 2003 bilan mos keladi, agar Microsoft Office Compatibility Pack o'rnatilgan bo'lsa (rasmiy Microsoft veb-saytidan topishingiz va yuklab olishingiz mumkin, fayl hajmi 27,8 MB). DOCXni tezda boshqa formatga aylantirishingiz kerak bo'lsa, http://docx-converter.com/ saytining xizmatlaridan foydalaning. Agar siz foydalanmoqchi bo'lsangiz oxirgi versiyasi   Ofis va fayllarni boshqasiga o'tkazish rejalashtirilmoqda, hujjatlarni RTF yoki DOC da saqlash.

ODT / ODF ("Hujjatni ochish")

ODF - umumiy ism ochiq format ofis ilovalari uchun hujjatlar (matnlar, jadvallar, ma'lumotlar, ma'lumotlar bazalari, taqdimotlar). Matnli ma'lumotlar ODT kengaytmali fayllarda saqlanadi. Standart OASIS sanoat jamiyati tomonidan ishlab chiqilgan va XML formatiga asoslangan. May 1, 2006 Barcha mavjud ISO / IEC 26300. ODF xalqaro standart sifatida qabul qilingan va cheklovlarsiz foydalanish mumkin. Microsoft-ning yopiq formatlariga bunday bepul alternativ. o'qish va Microsoft mahsulotlari rekord ODF formati uchun, Microsoft Office uchun plagin Sun ODF Plugin ozod etildi. Microsoft Office 2007 ODF qo'llab-quvvatlash RTF va DOC chastotasi hali kimdan kam Afsuski bir Service Pack 2. ozod bilan joriy qilinadi.

HTML

(Ingliz gipermatn belgilash tili - "gipermatn belgilash tili")

Internetdagi hujjatlar uchun standart formatlash tili (extension.htm / html). Veb-sahifalar HTML (yoki XHTML) yordamida yaratiladi. HTML dala tartibini ekspertlar emas odamlar tomonidan foydalanish uchun mos va ilmiy-texnikaviy hujjatlar, almashish uchun til sifatida 1991 yilda ingliz olimi Tim Berners-Li tomonidan ishlab chiqilgan. HTML formatlashtiruvchi matn stilistik va strukturaviy buzilishlarsiz turli xil qurilmalarda takrorlanishi kerak. Biroq, keyinroq multimedia va grafik dizaynni joriy etish bu rejalarni buzdi. HTML-hujjatlarni ko`rish uchun maxsus reja tuzish kerak emas, OS uchun etarli standart vositalar. Ochiqlik, indeksatsiya, konvertatsiya va okunabilirlik boshqa har qanday formatlardan ustundir. Afsuski, jadval alohida papkaga saqlanadi. Internet Explorer   matn va grafiklarni bitta MNT hujjatida saqlashga imkon beradi, lekin boshqa brauzerlar xuddi shunday faylni ochmasligi mumkin.

SNM (kompilyatsiya qilingan HTML)

Snm, aslida, olingan HTML-hujjatlarni majmui, uning hajmi kichik tufayli qaysi veb-sahifalar, bir arxiv kabi bir narsa. Yordamchi dasturni ko'rish uchun o'rnatilgan Windows 98 / NT va undan yuqori versiyasi ishlatiladi. Shuningdek, uchinchi tomon tomoshabinlar ham bor. .Chm fayllarini yaratish uchun foydalanishingiz mumkin bepul vosita   HTML yordam dastgohi. Endi turli dasturlar uchun faol ravishda foydalaniladi.

PDF

(Portativ hujjat formati - ko'chma hujjat formati)

Adobe Systems tomonidan bir nechta PostScript funktsiyalaridan foydalangan holda yaratilgan elektron hujjatlarning o'zaro faoliyat platformasi formati. Birinchidan, bu poligrafiya mahsulotining elektron ko'rinishda taqdim etish uchun mo'ljallangan. Siz rasmiy vakildan foydalanishingiz mumkin bepul dastur Adobe Reader, shuningdek, boshqa ishlab chiquvchilar dasturlari. Qulay muammo uchib formatlash noto'g'ri ko'rsatish, ko'milgan grafik elementlar, turli shriftlar yo'qligi bilan hal bo'ladi deb. Har qanday platformadagi fayl yaratilgan shaklda ko'rsatiladi. quyidagicha PDF-hujjatlarni yaratish an'anaviy yo'lidir: kabi hujjat PDF eksport keyin o'z dasturida tayyorlangan va. Ba'zi dasturlar to'g'ridan-to'g'ri eksport qilish imkoniyatiga ega (virtual printerni ishlatmasdan). Misol uchun, OpenOffice.org. MS Wordda hali bunday imkoniyat yo'q. Hujjatlarning aksariyati uchun haqiqiy standart.

DjVu ("deja vu")

maxsus skanerdan hujjatlarni saqlash uchun mo'ljallangan yo'qotishlar bilan tasvir siqishni texnologiyasi, - formulalar, diagrammalar, rasmlar va xati mavjudligi, ularning to'la e'tirof qiluvchi juda vaqti qiladi kitoblar, jurnal, qo'lyozmalar, va hokazo .. Agar bunday tarixiy hujjatlar sifatida dizayn barcha nüansları, o'tkazish kerak bo'lsa, u ham samarali hal. Ko'plab kutubxonalar skanerlangan ilmiy kitoblarni saqlash uchun juda ko'p qo'llaniladi. DjVu ba'zida "matn-grafik" deb nomlanadi. DjVu texnologiya mohiyati optimal siqish algoritmi tanlanadi har biri bir necha joylarda (masalan, matn, kompaniya logotipi va raster tasvir), tasvir Avtomatik bölümlendirme hisoblanadi. qulay navigatsiya amalga oshirish imkonini beradi Ishoratlarni, - Bundan tashqari, DjVu-fayl mazmuni va faol joylarda interaktiv jadval ko'milgan bo'lishi mumkin. Bu o'rtacha o'n besh yildan yigirma marta GIF-formatda nisbatan fayl hajmi bir foyda beradi.

XML-formatlari

("Kengaytirilgan gipermatnli til")

Muayyan qurilma yoki dastur uchun yaratilgan juda ko'p matnli formatlar mavjud. Masalan, elektron kitoblar. Bunga Rocket elektron kitob (.rb), Microsoft Reader (.lit), PalmDoc, MobiPocket (.pro) va boshqalar kiradi. Odatda, ularning barchasi XML tilidan foydalanib yaratilgan. Bularning eng muvaffaqiyatli va eng keng tarqalgan turi FictionBook formatidir (FB2). Bugungi kunda ushbu elektron kitoblar uchun eng progressiv va istiqbolli formatdir. Uning yagona kamchiliklari - dastlabki matnni tayyorlashda ko'p vaqt sarflangan. O'qish nimani anglatadi, o'qishning qulayligi. FictionBook'ning ta'kidlashicha, hujjatning tuzilishiga alohida e'tibor beriladi: teglardan foydalangan holda, turli xil matn maydonlarini (bo'limlar, sarlavhalar, sitatlar, ramkalar) tanlashingiz mumkin. Har bir narsa ekranda qanday ko'rinishini dastur o'quvchiga bog'liq. Hujjatni ma'lum bir shaklda chizish bo'lsangiz, uslublar jadvalini qo'shishingiz mumkin.

Siz maqolani yoqtirasizmi? Do'stlar bilan o'rtoqlashing: