Formats de fichiers texte et programmes pour travailler avec eux: historique et nos jours


Pourquoi avez-vous besoin d'un texte?

Aujourd'hui, il existe trois formats de texte les plus courants: TXT, RTF et DOC. Quelle est leur différence et qu'ont-ils en commun? Ils ont une chose en commun: ils stockent tous des informations textuelles. La différence réside dans les possibilités de mise en forme et de traitement du texte qu’elles fournissent, ainsi que dans la mesure dans laquelle les informations qu’elles contiennent concernant la compatibilité des programmes sont disponibles.

Le format de texte le plus simple

Le plus ancien et modeste en termes de format. Tout ce qui peut être fait avec le texte dans ce format est de produire l’entrée correcte du texte et de sauvegarder le saut de paragraphe. Cette simplicité dans certaines situations acquiert l’importance de l’universalité et de la transparence: TXT est facilement disponible pour la lecture dans différentes applications et sur différentes plates-formes. En outre, de nombreux programmes qui n’ont même pas leur propre travail avec du texte peuvent enregistrer du texte au format TXT.

TXT-processeurs

Depuis le DOS-ovskih fois, beaucoup se souviennent du traitement de texte Lexicon, qui était capable de gérer le format TXT à un niveau assez élevé. Aujourd'hui, le principal outil pour travailler avec TXT est le Bloc-notes Windows standard. Quiconque ne semble pas avoir suffisamment de ses fonctions peut toujours trouver un éditeur pour les goûts et les besoins du World Wide Web, y compris gratuitement. Par exemple, en utilisant le programme gratuit Vega Konstantin Sheremetyev, vous ne verrez probablement pas de message indiquant que le fichier texte ouvert est trop volumineux. sur les assurances de l'auteur, Vega version 2.04 ouvre les fichiers jusqu'à 2 Go (!), et le programme lui-même ne prend que 9,5 kb (comparé, Notepad dans Windows XP "pèse" environ 65 kb); Dans ce cas, Vega est encore plus pratique que Notepad et ne nécessite aucune installation. Et voici un autre exemple des possibilités de traitement de "texte brut". Le texte que vous lisez a été tapé dans un processeur UltraEdit à partir de IDM Computer Solutions. Son côté fort est un affichage et un traitement spéciaux de la syntaxe des langages de programmation, mais avec le texte le plus simple, il peut faire des merveilles. Pour les connaisseurs de programmes russifiés pratiques, ergonomiques et, surtout, "bien informés" sur les spécificités des encodages cyrilliques, il convient de se familiariser avec le programme Patriot.

Formatage et universalité

Format RTF (Rich Text Format): abréviation qui désigne le format créé par Microsoft Corporation. RTF est un texte marqué par des "mots de contrôle" spéciaux qui vous permettent de produire et de sauvegarder un formatage assez complexe, d'insérer des notes de bas de page, des dessins, des tableaux et des formules, bien que RTF soit inférieur au format DOC. Il concède le DOC et la quantité de fichiers: l'utilisation de "mots de contrôle" pour la mise en forme du texte au lieu d'une table de style ne conduit pas à la compacité. Toutefois, RTF remporte le différend avec DOC concernant la sécurité, car son organisation interne ne fournit pas de stockage de code macro et est donc immunisée contre les macro-virus.

Processeurs RTF

RTF est utilisé comme format principal ou pris en charge dans de nombreux programmes de traitement de texte, voire la plupart. Un bon outil   peut servir, par exemple, Hiéroglyphe Mikhail Morozov. Dans ce programme, non seulement l'orthographe de la langue russe est implémentée, mais également la fonction de changement automatique de la disposition du clavier de langue. Le traitement de texte Atlantis de Rising Sun Solutions, disponible à la fois dans les versions commerciales et dans les versions gratuites, conviendra sûrement à de nombreux utilisateurs grâce à la délicatesse de l'interface, à la présence d'un grand nombre de raccourcis clavier, d'une barre d'outils interchangeable et d'autres fonctions. Avec le RTF est en mesure de travailler et l'éditeur déjà mentionné Patriot.

Le format de texte le plus "grand"

Le format DOC inclut les possibilités les plus étendues de traitement et de mise en forme du texte, y compris la création de notes de bas de page et de commentaires, ainsi que la création, le placement et l’édition de tableaux, diagrammes, images et autres éléments. Il est vrai que toutes ces fonctionnalités sont implémentées uniquement dans MS Word, ce qui est facilité par la position de Microsoft, qui ne divulgue pas les spécifications actuelles du format courant. Malgré le fait que DOC "comprenne" et d’autres programmes, leurs fabricants ne parviennent pas toujours à s’assurer de leur reconnaissance. Contrairement à TXT et RTF, DOC est un format binaire, ce qui le rend illisible dans les éditeurs de texte simples et, de plus, ne fournit pas une compatibilité totale avec ses propres versions.

DOC-processeurs

Le traitement de texte "irremplaçable" pour travailler avec DOC est le principal et, pour les raisons susmentionnées, MS Word, qui implémente le plus complètement toutes les fonctionnalités de ce format. Beaucoup de productivité et de fonctionnalités WORD a ajouté le développement de tiers - tous les types d'add-ons, de macros et de programmes existent en grand nombre sur le réseau. Le concours Vordu est fourni, par exemple, par WordPerfect, Sun Microsystems StarOffice et OpenOffice.org. En travaillant à la fois dans Word et dans d'autres programmes, il convient de garder à l'esprit le problème de la compatibilité des formats et d'enregistrer le document dans DOC uniquement si vous êtes certain que des incompatibilités ne se produiront pas.

Applicabilité des formats

Il est injustifié de dire que l'un des formats considérés est pire que les autres, sans tenir compte des spécificités des problèmes pour lesquels ils doivent être utilisés. Comme nous ne nous donnerons pas la tâche de faire une mise en page dans un traitement de texte, le choix est presque sans ambiguïté. Pour préparer le volume de texte de taille moyenne à très grande et pour permettre une compréhension complète de la composition typée par n'importe quel programme, il est préférable d'utiliser les moyens les plus simples, compacts et polyvalents pour taper et stocker du texte: le format TXT. Quant à l'utilisation d'autres formats de texte, beaucoup dépend de la mise en œuvre de leur support dans un programme de prototypage spécifique.
  OpenOffice.org est un projet international open source visant à créer une suite bureautique universelle fonctionnant sur différentes plates-formes d'exploitation, avec une API ouverte et un format de fichier basé sur XML. En fait, OpenOffice.org est un ensemble de programmes développés dans le cadre de ce projet. Il comprend: un traitement de texte, des feuilles de calcul, éditeur d'image, un système de présentation et un système d'accès aux données. En termes de capacités, il est comparable à des programmes commerciaux similaires et pourrait bien être considéré comme une alternative. OpenOffice.org est actuellement publié sous une double licence: GPL et SISSL. Malgré les différences entre ces licences, pour l'utilisateur final, OpenOffice.org est gratuit.

OpenOffice.org tire son origine de la suite bureautique StarOffice, développée par la société allemande StarDivision au milieu des années 90. À l'automne 1999, Sun a acheté StarDivision. En juin 2000, StarOffice 5.2 était commercialisé sous la marque Sun sous MS Windows, Linux et Solaris. Le 13 octobre 2000, le code source de StarOffice a été ouvert (à l'exclusion du code de certains modules développés par des sociétés tierces), et ce jour est officiellement considéré comme l'anniversaire d'OpenOffice.org. Aujourd'hui, sur le code OpenOffice.org, il y a des volontaires du monde entier, ainsi que des programmeurs de Sun.

Actuellement, deux produits sont produits à partir du même code source développé par la communauté OpenOffice.org: StarOffice, qui ajoute des composants sous une licence propriétaire et OpenOffice.org gratuit. Dans OpenOffice.org, la plupart des composants propriétaires présents dans StarOffice sont remplacés par leurs homologues gratuits.

(Selon cnews.ru.)

Un ensemble de règles pour stocker des données dans un fichier s'appelle le format de fichier. Différents types   les fichiers, tels que les fichiers texte, les graphiques raster, etc., utilisent des formats différents. En général, pour plusieurs types de fichiers, plusieurs différents formats, bien que souvent le même type de fichier et de format soit compris. Le format de fichier est déterminé par l'extension du nom de fichier, qui est ajoutée au nom du fichier lorsqu'il est enregistré dans un certain format, par exemple, DOC, GIF, etc.

En règle générale, les formats de fichiers sont créés pour être utilisés dans un programme d'application strictement défini. Par exemple, les objets graphiques créés dans un package de graphiques vectoriels CorelDRAW connu sont enregistrés en tant que fichiers avec une extension CDR et les images générées par un autre package graphique, CorelXara, sont écrites sur le disque en tant que fichiers avec l'extension XAR. Certains formats ne sont pas associés à des applications spécifiques, c’est-à-dire qu’ils sont universels. L'un des formats universels les plus connus est le format TXT (format fichiers texte   DOS).

Souvent, la compression de fichiers informatiques est utilisée pour économiser de l'espace sur le support. Il existe plusieurs façons de compresser des fichiers. Ces méthodes dépendent du format de fichier d'origine. En règle générale, plus le taux de compression est élevé, plus les opérations de lecture et d'écriture sont lentes.

En ce qui concerne les algorithmes de compression, il existe à la fois des algorithmes de compression sans perte de données et des algorithmes dans lesquels il est possible de perdre des données.



La compression sans perte garantit que toutes les données présentes dans le fichier avant la compression sont présentes une fois le fichier décompressé. Les mécanismes de compression sans perte sont utilisés lors de l'enregistrement de données textuelles ou numériques, par exemple feuilles de calcul   ou des fichiers de documents. Des exemples d'algorithmes de compression sans perte sont les algorithmes bien connus ZIP, ARJ et autres.

Donnons une brève description des principaux formats utilisés:

Code standard américain pour l'échange d'informations ASCII (TXT). Le format des fichiers texte développés par l’American Institute of Standards (American National Standards Institute). Soutenu par tous systèmes d'exploitation   et tous les programmes. C'est un fichier texte en codage DOS, il n'y a pas de fonction pour insérer une image, il n'y a pas de formatage, cela fonctionne dans toutes les machines, il est possible de créer uniquement de petits fichiers de volume.

§ ANSI (TXT). Le format des fichiers texte en encodage ANSI (pour la page de code Microsoft Windows)

§ MsWord pour DOS, Windows (.DOC). Le format de document développé par Microsoft Corporation est pris en charge par les programmes pour MS-DOS et la plupart des traitements de texte. Il enregistre le formatage original des documents, ainsi que les styles de caractères. En plus des informations textuelles, les fichiers de ce format peuvent contenir des images graphiques avec différents paramètres. Prend en charge 256 couleurs. Ne supporte pas la compression. Utilisé principalement pour échanger des données textuelles formatées entre différentes plates-formes et applications.

§ Hypertext Markup Language HTML (HTM, HTML). Langage de balisage hyper documents texte. Toutes les pages situées sur Internet sont créées à l'aide de cette langue spéciale. Les documents HTML sont des fichiers ASCII, accessibles pour visualisation et édition dans n'importe quel éditeur de texte. La différence avec un fichier texte classique réside dans le fait que dans les documents HTML, il existe des commandes de balises spéciales qui définissent la règle de formatage d'un document. Si vous maîtrisez le langage HTML, vous pouvez créer des pages pour Internet. En ajoutant des balises (étiquettes) au texte habituel, vous forcez le spectateur à afficher ce texte d'une certaine manière et à le placer sur la page de l'image. Si vous avez étudié Java et JavaScript, vous savez comment étendre les fonctionnalités de HTML en plaçant des commandes écrites dans le langage de script à l'intérieur des balises.

§ Portable Document Format PDF (.PDF). Ce format de stockage de documents, développé par Adobe, revendique le rôle d’une norme typographique ouverte pour le Web. Il est considéré comme une alternative au HTML. L'inconvénient de HTML est que les documents traduits en HTML ne conservent généralement pas le format d'origine et que HTML offre un nombre très limité de casques lors de la visualisation. Au contraire, les utilisateurs du programme Acrobat et des outils PDF pour créer, distribuer et visualiser des documents dans leur format d'origine savent que les lecteurs verront la publication telle qu'elle a été créée. Le format PDF est indispensable si vous souhaitez obtenir une copie exacte du document requis. Comme exemple de réussite application PDF   pour les documents en russe, nous apportons le serveur "Moscow News" sur Internet. Les matériaux présentés sous forme électronique reprennent complètement l’original en papier imprimé avec la méthode d’impression.

§ Langage de balisage généralisé standard (SGML). Le développement de HTML est traduit par le langage standard du balisage généralisé. C'est un ensemble instrumental de mécanismes pour créer des documents structurés marqués avec des étiquettes. Comparé au HTML, il offre des capacités de formatage plus flexibles et polyvalentes sur le Web. Cependant, SGML est différent et vitesse accrue, par conséquent, comme un outil plus simple applique PDF. La puissance de SGML réside dans son approche structurelle multi-plateforme pour la description du contenu des documents. SGML est en fait un métalangage, c’est-à-dire Il est destiné à la description des langages de balisage utilisés lors de la création de documents.

   Le type de données le plus fréquemment utilisé dans le monde informatique et Internet est le texte. La vidéo et les graphiques sont beaucoup plus colorés et généralement mieux vus qu'une seule fois. Eh bien, entendre est également pas mal - dans ce cas, il existe des formats de données audio. Cependant, la balle de l'ordinateur est régie par des lettres et des chiffres sans prétention et modestes. Sans eux, nulle part, même le nom d'un autre fichier ne peut pas être donné. Les données textuelles sont importantes et diverses - ce sont des livres, des documents et du code de programme. Et pour chaque objectif, il existe des variantes de formats. C'est à leur sujet que nous discuterons dans cet article. La vérité doit immédiatement faire une réserve - dans cette revue n’a pas d’incidence sur les formats des livres électroniques, ils méritent une conversation séparée. Ici, on parlera des formats des documents.

Format de texte - TXT (PlainText)

Donc, le format le plus simple est TXT. Ce texte dans sa forme, en fait, pure et simple. Contient uniquement le contenu du texte et le minimum absolu des données de service - caractères du début et de la fin du texte, chariot de transport et similaires.

Malgré la simplicité quasi spartiate, le format n’est pas dénué d’options et de différences. Premièrement, il existe des différences entre Windows   , Versions Unix et MacOS dans lesquelles différents caractères de fin de ligne sont utilisés. En outre, des différences peuvent être causées par l’utilisation de pages de codes 8 bits (ASCII) ou 16 bits (UNICODE).

Cependant, malgré cela, le format TXT est extrêmement polyvalent, pour lequel nous aimons beaucoup les programmeurs et les administrateurs système.

Formats de documents MS Office et analogues - DOC, DOCX, RTF, ODT

Malgré sa polyvalence et sa simplicité, le TXT est absolument inadapté à la création des documents réels - des textes destinés à l’impression en respectant certaines règles et règles de conception. Étant donné que ces documents autres que le texte doivent contenir de nombreuses informations sur la conception et la mise en forme du texte. Et aussi sur le format et la taille d'une feuille de papier, où ils doivent être placés.

À ces fins, un certain nombre de formats ont été créés pour divers progiciels. Les formats les plus populaires et les plus proches de l'universel peuvent être considérés comme les formats MS Word - doc et docx. Le premier est un format fermé spécial créé par Microsoft pour son éditeur de texte (plus précisément, toute une ligne de formats - il a été amélioré à plusieurs reprises). Parallèlement à cela, à l'aube du développement de l'entreprise, en coopération avec Adobe, le format RTF (Rich Text Format) a été créé. Contrairement à DOC, la structure de ce format est disponible et est supportée avec succès par presque tous les éditeurs de texte existants. Bien que légèrement inférieur à DOC pour un ensemble de fonctions disponibles.

La proximité du développement de Microsoft a conduit à la création d'une suite bureautique ouverte Open Office. Pour lequel le format ODT (OpenDocument Text Format) a été développé. Le format n'est pas bien pris en charge par les éditeurs commerciaux, y compris MS Word   et peut être ouvert par eux avec des erreurs.

Enfin, en 2007, Microsoft a décidé d'abandonner le format DOC et a développé une famille de formats pour Office Open XML, qui inclut DOCX, qui est devenu le principal format pour les nouvelles versions de MS Word.

Format PDF

Refusant de coopérer avec Microsoft, Adobe a évolué à sa guise. Il a été développé format PDF qui était un format moins pour développer des documents que pour les visualiser et les imprimer. Contrairement au groupe précédent, qui est un texte formaté, dont l'apparence peut varier en fonction de la machine sur laquelle il est affiché ou imprimé, le format PDF est fondamentalement inchangé et conserve son apparence et sa présentation dans toutes les conditions. En outre, il prend en charge une gamme assez large d’éléments d’impression et de services supplémentaires (par exemple: protection des documents avec un mot de passe   de l'édition ou l'impression et ainsi de suite). Tout cela fait de PDF un format pour la distribution de documents complexes et exécutés par des professionnels et même des livres.

Chaque utilisateur de PC rencontre constamment différents formats de fichiers texte, mais ne pense guère à la richesse de l'historique de ces formats et programmes, ce qui a permis à la personne de lire des livres, de travailler avec le texte et de créer toute la documentation nécessaire directement sur l'ordinateur.

L'historique des fichiers texte n'est pas beaucoup plus jeune qu'eux ordinateurs personnels   - déjà leurs chefs-d’œuvre ont été écrits dans les premiers analogues du "cahier" moderne. Alors, quels sont les formats des fichiers texte et des programmes pour travailler avec eux? D'abord, vous devez comprendre à quoi servent les fichiers texte, quelles sont les différences entre eux et ce qu'ils ont en commun. Il réunit absolument tous les formats de texte dans leur tâche principale - en sauvegardant les informations textuelles. Ils diffèrent dans les capacités de traitement et l'accès aux informations stockées dans les fichiers en termes de compatibilité avec d'autres programmes.

Le format de texte le plus simple est traditionnellement le format TXT. Il est le plus modeste en termes de fonctionnalités et de format de texte le plus ancien. En raison de sa simplicité (les capacités TXT se limitent à la saisie et à la décomposition en paragraphes), ce format est souvent utilisé par un grand nombre d’applications et de programmes sur diverses plates-formes.

Avec la prolifération des ordinateurs personnels et l'augmentation de leurs ventes, Microsoft crée un autre format populaire, appelé Rich Text Format (ou simplement RTF). C'est un texte marqué à l'aide de certains «mots de contrôle» qui permettent non seulement de produire, mais aussi de conserver des éléments de mise en forme complexes et d'insérer des formules, des tableaux, des figures, des notes de bas de page et des notes de bas de page.

Cependant, les fonctionnalités de RTF sont assez inférieures à celles du format DOC, également créé par Microsoft spécifiquement pour le progiciel appelé Microsoft Office. Créé il y a plus de quinze ans, DOC comprend un grand nombre d'opportunités de formatage et de traitement de texte, de création, d'édition et de placement d'images, de diagrammes, de tableaux et d'autres éléments. Il convient de noter que les fonctions les plus correctes ne fonctionnent que dans MS Word. Cela est principalement dû au fait que Microsoft ne correspond pas aux spécifications actuelles du format DOC et ne permet pas à ses concurrents et aux développeurs indépendants d’utiliser au maximum les capacités de ce format. Ce fait est l’une des principales raisons pour lesquelles, outre le format DOC, d’autres formats de fichiers texte sont largement utilisés de nos jours.

La principale différence entre le format DOC et le texte et TXT est sa binaire, ce qui le rend illisible dans des fichiers aussi simples que Wordpad, Lexicon, Atlantis. De plus, dans certains cas, il est possible d'observer une incompatibilité de fichiers DOC créés dans différentes versions de MS Word.

Les formats de fichiers texte peuvent être ouverts et édités dans un grand nombre de programmes. Outre MS Word précédemment mentionné, les plus courants sont StarOffice, publié par Sun Microsystems, WordPerfect de Corel et un package gratuit OpenOffice.org.

Avec la prolifération des lecteurs électroniques, d'autres types de fichiers texte gagnent en popularité, par exemple FB2 et LRF.

Afin de pouvoir utiliser différents formats de texte sur différentes plates-formes, un grand nombre de programmes ont été créés, appelés convertisseurs. Les convertisseurs de fichiers texte vous permettent d’enregistrer le code source d’un format à un autre et de l’utiliser ultérieurement sur divers appareils et plates-formes.

Les convertisseurs servent non seulement à enregistrer du texte d’un format à un autre, mais aussi à créer des fichiers qui, contrairement à leur source, peuvent être utilisés sur des appareils qui ne peuvent pas "lire" les fichiers originaux. Par exemple, certains livres électroniques qui ne prennent pas en charge les formats de fichiers texte courants peuvent facilement reconnaître les formats LRF ou FB2 obtenus à partir de fichiers sources à l'aide de programmes de conversion.

Une fois les données de texte placées dans un seul type de conteneur - TXT. Il n'y en avait pas d'autres. Maintenant, leur nombre, peut-être, approche la cinquantaine. Nous utilisons constamment, nous rencontrons rarement d'autres. Sur l'existence du troisième, nous ne soupçonnons même pas. Considérer les magasins de données de texte les plus courants en termes de commodité dans utiliser.
<<>>

ТХТ ("texte simple")

L'ancêtre du "genre". Activement utilisé à ce jour. Étant donné que le texte est stocké sous la forme d'une séquence de caractères, la taille du fichier en octets est égale au nombre de caractères et aux caractères non imprimables (espace, tabulation, signe de fin de paragraphe et autres). De ce fait, une petite taille de fichier est atteinte. Cependant, les possibilités de formatage de tels documents sont très limitées. En fait, c'est juste du texte. Les données de texte peuvent être stockées non seulement dans des conteneurs avec l'extension de TXT. En fait, ces extensions ne sont pas obligatoires. Renommez TXT en DOC, rien ne changera. La structure interne restera la même. De même, en changeant l'extension DOC en TXT, vous obtenez le même fichier "vordian". Pourquoi alors besoin de ces trois lettres après le point? Pour l'interprétation correcte des programmes qui les ouvrent par défaut.

RTF (Rich Text Format)

Un format de stockage multiplateforme gratuit pour les documents texte de balisage, créé par Microsoft en 1987. Aujourd'hui, il est largement distribué, de sorte que la plupart des éditeurs de texte modernes le supportent. Ayant créé RTF sur la plate-forme Windows, il sera parfaitement lu et édité sur d’autres plates-formes (Apple, Linux et autres). Le standard de facto en matière d'impression. Cependant, tous les programmes ne le créent pas aussi bien. Il est à noter que dans le document créé dans OpenOffice, le formatage a parfois volé et une partie du texte est devenue illisible.

RTF vous permet de produire et de sauvegarder un formatage assez complexe, d’insérer des notes de bas de page, des pieds de page, des dessins, des tableaux et des formules, bien qu’il soit encore inférieur au format DOC. Il concède DOC et dans le volume des fichiers: les documents complexes sont stockés de manière plus compacte dans les fichiers DOC (simple - et vice versa). Cependant, RTF gagne un différend avec DOC concernant la sécurité, car il n'utilise pas de macros. Par conséquent, les fichiers Word infectés par des virus de macro peuvent être "traités" en les sauvegardant au format RTF. De plus, le format RTF résiste à la corruption de fichiers. Si vous modifiez au moins un octet dans le fichier DOC, il ne sera plus ouvert dans Word. Et corrompre un fichier au format RTF ne peut que conduire à la perte d'un morceau de texte corrompu.

DOC (extrait du document anglais)

Initialement, cette extension était utilisée pour faire référence à des fichiers texte simples sans formatage, mais au début des années 90, Microsoft l'a en fait «privatisée». Par conséquent, maintenant, DOC est uniquement associé aux produits de cette société. Ce format offre de grandes possibilités pour formater le texte (scripts inclus, macros). Pour cette raison, la compatibilité avec les éditeurs de texte de développeurs tiers s'est détériorée. Un fichier de ce format contient une énorme quantité d'informations sur les polices, le suivi des caractères, les indentations de paragraphe et les intervalles, même si vous n'avez pas besoin de tout cela. C'est à cause de ces informations supplémentaires que le fichier contenant uniquement du texte dépasse la taille du fichier RTF. Cependant, lorsque vous incluez divers éléments graphiques et images dans le document, le document DOC gagne en taille et offre une plus grande compatibilité. Contrairement à TXT et RTF, DOC est un format binaire, ce qui le rend illisible dans les éditeurs de texte simples. Par exemple, le Bloc-notes peut afficher certains fichiers RTF. Il est populaire sur un pied d'égalité avec RTF.

DOCX

Avec l'arrivée d'Office 2007, Microsoft a adopté de nouveaux formats basés sur Office Open XML (distingués visuellement par l'ajout de la lettre "x" à la fin des extensions). Le format est une archive zip contenant du texte sous forme de XML, de graphiques et d'autres données. Pour réduire la taille du fichier, la compression ZiP est utilisée. Les documents sont rétrocompatibles avec Office 2000 / XP / 2003 uniquement si le pack de compatibilité Microsoft Office est installé (vous pouvez le trouver et le télécharger à partir du site Web officiel de Microsoft, la taille du fichier est de 27,8 Mo). Si vous avez besoin de convertir rapidement DOCX dans un autre format, utilisez les services du site http://docx-converter.com/. Si vous utilisez dernière version   Office et prévoyez de transférer des fichiers à quelqu'un, enregistrez les documents au format RTF ou DOC.

ODT / ODF ("Open Document Format")

ODF - nom commun format ouvert documents pour applications bureautiques (textes, tableaux, figures, bases de données, présentations). Les données de texte sont stockées dans des fichiers portant l'extension ODT. La norme a été développée par la communauté industrielle OASIS et repose sur le format XML. Le 1er mai 2006, il a été adopté en tant que norme internationale ISO / IEC 26300. ODF est disponible pour tous et peut être utilisé sans restrictions. Une telle alternative gratuite aux formats fermés de Microsoft. Pour pouvoir lire et écrire le format ODF dans les produits Microsoft, le plug-in Sun ODF Plug-in pour Microsoft Office a été publié. La prise en charge d'ODF dans Microsoft Office 2007 devrait être introduite avec la publication du Service Pack 2. Malheureusement, elle est toujours inférieure à la prévalence de RTF et de DOC.

HTML

(de l'anglais Hypertext Markup Language - "hypertext markup language")

Langage de balisage standard pour les documents sur Internet (extension.htm / html). Les pages Web sont créées à l'aide de HTML (ou XHTML). HTML a été développé par le scientifique britannique Tim Berners-Lee en 1991 en tant que langage d'échange de documentation scientifique et technique, utilisable par des personnes qui ne sont pas des experts dans le domaine de l'imposition. Le texte avec un balisage HTML doit être reproduit sur différents appareils sans distorsions stylistiques et structurelles. Cependant, l'introduction active du multimédia et de la conception graphique a détruit ces plans. Pour afficher des documents HTML, vous n'avez pas besoin d'éditeurs spéciaux, suffisamment d'outils standard intégrés au système d'exploitation. Par l'ouverture, l'indexabilité, la convertibilité et la lisibilité sont supérieures à tout autre format. Malheureusement, la planification est enregistrée dans un dossier distinct. Internet Explorer   vous permet d'enregistrer du texte et des graphiques dans un document MNT, mais les autres navigateurs risquent de ne pas ouvrir un fichier similaire.

СНМ (HTML compilé)

En fait, SNM est un ensemble de documents HTML compilés, quelque chose comme une archive à partir de pages Web, car sa taille est plus petite. Pour afficher l'utilitaire, Windows 98 / NT et supérieur sont utilisés. Il existe également des téléspectateurs tiers. Pour créer des fichiers .chm, vous pouvez utiliser remède gratuit   HTML Help Workshop. Maintenant activement utilisé comme référence pour diverses applications.

PDF

(Format de document portable - Format de document portable)

Format multi-plateforme de documents électroniques créés par Adobe Systems à l'aide d'un certain nombre de fonctionnalités PostScript. Tout d'abord, il est destiné à être représenté sous forme électronique de production polygraphique. Vous pouvez utiliser le fonctionnaire programme gratuit Adobe Reader, ainsi que les programmes d’autres développeurs. Pratique est que le problème avec le formatage des disquettes, l'affichage incorrect des éléments graphiques incorporés, le manque de certaines polices est résolu. Le fichier sur n'importe quelle plate-forme sera affiché sous la même forme qu'il a été créé. La manière traditionnelle de créer des documents PDF est la suivante: le document lui-même est préparé dans son programme, puis exporté au format PDF. Certains programmes ont la possibilité d'exporter directement (sans utiliser d'imprimante virtuelle). Par exemple, OpenOffice.org. Dans MS Word, cette option n'existe pas encore. Le standard de facto pour la plupart des documents.

DjVu ("deja vu")

une technologie de compression avec pertes, spécialement conçu pour le stockage des documents numérisés - livres, revues, manuscrits, etc., où la présence de formules, des diagrammes, des dessins et l'écriture rend extrêmement long de leur pleine reconnaissance .. C'est aussi une solution efficace si vous devez transférer toutes les nuances du design, par exemple des documents historiques. Très commun, de nombreuses bibliothèques l'utilisent pour stocker des livres scientifiques numérisés. DjVu est parfois appelé format "texte-graphique". L'essence de la technologie DjVu est le partitionnement automatique de l'image en plusieurs zones (par exemple, texte, logo et image raster), dont chacun sélectionne l'algorithme de compression optimale. En outre, DjVu fichier peut contenir intégré la table des matières interactive et des zones actives - liens, qui permet de réaliser une navigation facile. Donne une victoire dans la taille du fichier par rapport au format GIF en moyenne une demi-douzaine de fois.

XML-formats

("Langage de balisage extensible")

Il existe un certain nombre de formats de texte créés pour un périphérique ou un programme particulier. Par exemple, les livres électroniques. Il s'agit notamment de Rocket e-book (.rb), de Microsoft Reader (.lit), de PalmDoc, de MobiPocket (.pro), etc. En règle générale, ils sont tous créés en utilisant le langage XML. Le plus réussi et le plus commun d'entre eux est le format FictionBook (FB2). Pour le moment, c'est le format le plus progressif et le plus prometteur pour les livres électroniques. Son seul inconvénient est le long temps passé à préparer le texte initial. Ce qui paie, c'est la commodité de la lecture. Dans FictionBook, l'accent est mis sur la structuration du document: en utilisant des tags, vous pouvez sélectionner différentes zones de texte (chapitres, titres, citations, cadres). La façon dont tout ira à l'écran dépend du lecteur de programme. Si vous souhaitez dessiner un document d'une certaine manière, vous pouvez joindre une feuille de style.

Aimez-vous l'article? Partager avec des amis: