Est-il possible de numériser le document pour résoudre. Un programme de modification des documents numérisés: Quoi de mieux? Comment numériser à partir d'une imprimante aux textes informatiques

Sur le service de la dette doit gérer un grand nombre de documents papier.

Différents ministères me font des copies des prisonniers.

Naturellement la question de l'automatisation de ce processus.

Comment rendre plus petite à faire?

La décision était la suivante:

1. Numérisez les documents dans le dossier;

2. Reconnaître chaque document en finerader avec la conversion en PDF;

3. Enregistrer les documents PDF sur les catalogues cibles;

4. Dans le fichier de rapport (format MS Excel), resserrez de nouveaux documents du catalogue avec la création d'un lien hypertexte.

Après cela, dans le fichier de rapport dans des lignes distinctes, il existe des documents distincts. Il reste seulement de cliquer sur le lien hypertexte du document. Le document est déjà reconnu. Vous pouvez simplement mettre en évidence des morceaux de texte et les prendre au rapport. Ainsi, l'extraction des données des documents devient une question simple.

Donc, dans cet article, je montrerai comment le processus de reconnaissance du document pour le temps minimum.

Allez dans le dossier avec des documents numérisés. Et sur le fichier suivant du document numérisé (généralement dans le format TIF ou PDF), cliquez sur le bouton droit de la souris pour appeler le menu contextuel et sélectionner l'élément correspondant.

FineReader commencera le processus de reconnaissance et de transmission au format PDF.

Ainsi, sur notre disque, la numérisation reconnue du document sera enregistrée.

Et vous pouvez rechercher dans le document.

Dans l'image suivante, vous pouvez voir une liste de fichiers multiples.

Mais comment il va tous regarder dans le fichier de rapport. Pour chaque fichier, il existe un lien hypertexte (les nouveaux fichiers macro du répertoire ont choisi). Assez pour cliquer dessus et le fichier s'ouvrira.

J'espère que cette technique aidera beaucoup à optimiser et à accélérer leur travail.

Après avoir numérisé un document, vous pouvez ouvrir un document en mot pour la modifier. La voie dépend de quelle version de bureau est installée sur votre ordinateur.

Numérisation d'un document sous la forme d'un fichier PDF et de son édition dans Word

Conseil: La transformation est la mieux adaptée aux documents principalement du texte.

    Scannez le document conformément aux instructions du scanner et enregistrez-la sur l'ordinateur sous forme de fichier PDF.

    En mot, ouvrez le menu déposer > Ouvert.

    Naviguez jusqu'au dossier de fichier PDF sur votre ordinateur et cliquez sur Ouvert.

    Un message apparaît que Word convertit le fichier PDF dans le document modifiable Word. appuie sur le bouton d'accord.

La coïncidence complète du document transformé avec l'original peut ne pas être. Par exemple, les lignes et les pages peuvent être situées ailleurs. Des informations supplémentaires peuvent être trouvées dans l'ouverture de fichiers PDF en mot.

Informations Complémentaires

Le paramètre "scanner ou caméra" pour numérisation de documents et d'images n'est pas disponible dans Word 2010. Vous pouvez plutôt numériser le document à l'aide du scanner et enregistrer le fichier sur votre ordinateur.

Microsoft Office Document Imaging a été supprimé de Office 2010, cependant, vous pouvez l'installer sur votre ordinateur à l'aide de l'une des options décrites dans l'installation de l'application Modi à utiliser avec Microsoft Office 2010.

Avant de continuer

    Ouvrez l'imagerie de documents Microsoft Office en suivant la recherche Windows dans le menu Démarrer.

    au menu Déposer Choisis une équipe Ouvert.

    Trouver un document numérisé et cliquez sur Ouvert.

    Après avoir lancé l'imagerie de documents Microsoft Office, appuyez sur Ctrl + A pour mettre en surbrillance tout le document, puis appuyez sur CTRL + C.

    Exécutez Microsoft Word.

    Sur l'onglet Déposer appuie sur le bouton Créer.

    Double-cliquez sur l'élément nouveau document.

    Appuyez sur les touches CTRL + V pour insérer le contenu du document numérisé dans un nouveau fichier.

Le paramètre "du scanner ou de la caméra" pour la numérisation de documents et d'images n'est pas disponible dans Microsoft Office Word 2007. Au lieu de cela, vous pouvez numériser le document à l'aide du scanner et enregistrer le fichier sur votre ordinateur.

Étape 1: Installation de l'imagerie de documents Microsoft Office

    Compléter le travail de tous les programmes.

    Conseil: Avant de compléter tous les programmes, nous conseillons d'imprimer cette section.

    Ouvrez le panneau de commande: cliquez avec le bouton droit sur le bouton Démarrer sous Windows et sélectionnez l'élément. Panneau de commandeou entrer dans le champ de recherche Windows panneau de commande d'élément .

    Sur le panneaux de commande Cliquez sur Programmes, et alors - Programmes et composants.

    Cliquez avec le bouton droit sur le nom de la version installée de Microsoft Office ou cliquez avec le bouton droit de la souris Microsoft Office Word 2007 (Selon si l'application Word est installée dans le cadre du bureau ou en tant que programme distinct), puis cliquez sur monnaie.

    Choisir Ajouter ou supprimer des composantspuis cliquez sur Procéder.

    Au chapitre Paramètres d'installation Cliquez sur le signe plus (+) à côté du composant Bureau.

    Cliquez sur la flèche à côté du composant. Imagerie de documents Microsoft Office, Sélectionnez un paramètre Tout courir de mon ordinateurpuis cliquez sur Procéder.

Étape 2: Création d'un document pouvant être modifié.

Scannez le document en suivant les instructions du scanner.

Avant de continuer Convertissez le fichier créé par le scanner en format TIFF. Vous pouvez convertir un fichier à l'aide de peinture ou d'un autre programme.

Maintenant, vous avez un document qui peut être édité. N'oubliez pas d'enregistrer un nouveau fichier afin de ne pas perdre de modifications.

Créer une bibliothèque et des journaux dans un format de lecture numérique est possible grâce aux éditeurs PDF. Un tel logiciel transforme les pages de papier au fichier PDF. Les produits de programme présentés ci-dessous vous permettent d'effectuer la tâche. Application des dernières technologies, les programmes aideront à obtenir une image numérisée avec une correction de couleur ultérieure ou une affichage du texte de la feuille et de la modifier.

Produit Adobe Company conçu pour créer des documents PDF. Il existe trois versions du programme qui diffèrent dans une certaine mesure. Par exemple, la conversion au format pour fonctionner avec Autodesk AutoCAD, la création d'une signature numérique et d'un accès commun avec d'autres utilisateurs est dans la version Premium, mais est absente dans la norme. Tous les outils sont regroupés dans des catégories de menus spécifiques et l'interface elle-même est décorée et minimalisée. Directement dans l'espace de travail, vous pouvez convertir PDF en DOCX et XLSX, ainsi que d'enregistrer des pages Web sous forme d'objet PDF. Grâce à tout cela, pour collecter votre propre portefeuille et configurer des modèles de travail à l'emploi à l'emploi ne posera pas de problèmes.

Abbyy FineReader.

Une des applications de reconnaissance de texte les plus célèbres qui vous permet de l'enregistrer en tant que document PDF. Le programme reconnaît le contenu de PNG, JPG, PCX, DJVU et la numérisation elle-même survient immédiatement après l'ouverture du fichier. Ici, vous pouvez éditer le document et l'enregistrer dans les formats populaires, en outre, les tables XLSX sont prises en charge. Directement de l'espace de travail FineReader, les imprimantes d'impression et de scanners pour travailler avec des papiers et une numérisation ultérieure sont connectées. Software Universal et vous permet de traiter complètement le fichier à partir d'une feuille de papier à une version numérique.

Correcteur de balayage A4.

Programme simple pour la correction des feuilles et des images numérisées. Les paramètres fournissent un changement de luminosité, de contraste et de tonalité de couleur. Les fonctionnalités font référence à la mémorisation de dix images saisies séquentiellement sans les sauver sur l'ordinateur. Les frontières du format A4 sont configurées dans l'espace de travail pour analyser complètement la feuille de papier. L'interface de programme russophone sera facile à percevoir des utilisateurs inexpérimentés. Le logiciel n'est pas installé dans le système, ce qui vous permet de l'utiliser comme version portable.

Ainsi, le logiciel en question permet de numériser efficacement des photos pour stocker sur PC ou de modifier la tonalité de couleur, et la numérisation de texte lui permettra du format électronique au format électronique. Ainsi, les produits logiciels seront utiles dans une variété de moments de travail.

Au cours de la collaboration avec la documentation et les bases de données, il existe de nombreux problèmes importants. Et nous ne parlons pas de la masse d'erreurs qui peuvent être trouvées dans les documents nécessitant à cause de cette création d'un nouveau fichier avec des corrections, mais également dans une simple paresse humaine. En principe, Lena a toujours été un moteur de progrès, car les gens veulent toujours faire tout ce qui est plus rapide pour se débarrasser des préoccupations supplémentaires, et afin de se détendre peut être autant que possible, vous devriez toujours faire le travail et qualitativement. Dans ce cas, la question concerne le fait que de nombreux documents d'amélioration complète dans certaines bases de données ou dans l'ensemble du registre nécessitent un ensemble de texte de manière nouvelle, et cela ne commence pas simplement fatigué, mais également. Pour un tel cas, il existe un scanner et un programme de modification des documents numérisés.

Qu'est-ce qui fait un scanner?

En général, le scanner est un appareil qui transfère le texte du document imprimé (journal, magazine, livre, etc.) à l'ordinateur, il en fait sous la forme d'une image. Certains appareils ont des programmes spéciaux qui contrôlent le processus de numérisation, tandis qu'il est possible de choisir même le format dans lequel le code source est converti. Dans le cas standard, il s'agit d'un instantané d'un document, dont l'édition est impossible en raison du fait que les caractères ne peuvent pas être reconnus.

Que peut-on faire alors

Vous pouvez gérer librement le document reçu, la modification et la modification du tout ou de la section du texte dans son ensemble, uniquement si un programme spécialisé est utilisé pour modifier des documents numérisés. Ces utilitaires sont engagés dans la traduction dans le texte que vous pouvez traiter et éditer. Il existe de nombreux programmes de ce type et chacun d'entre eux a ses propres nuances.

Bon bon Abbyy FineReader

Peut-être le programme le plus courant de modification des documents numérisés avec fierté Abbyy FineReader est un ensemble complet d'éditeurs qui vous permet de produire toutes sortes de manipulations avec l'image numérisée. Le résultat élevé des travaux est obtenu en raison du fait que le programme peut reconnaître un document de qualité (même si vous avez simplement une photo sur une caméra de téléphonie mobile), ainsi que de la possibilité de reconnaître des fichiers multi-niveaux. qui contiennent des tables, des dessins et d'autres petits détails. Dans le même temps, pendant la reconnaissance, vous pouvez définir la langue qui aide ABBYY FineReader Choisissez les symboles de comparaison corrects, de sorte que le programme donne du texte avec le plus petit nombre d'erreurs.

Entre autres choses, cet éditeur s'oppose parfaitement à cette façon si vous avez un fichier de ce format, puis modifiant les documents numérisés PDF passera rapidement et sans effort. L'interface externe elle-même est intuitive et ne nécessite pas de compétences supplémentaires, cet accès à l'utilisateur de n'importe quel niveau et influencé sa vulgarisation. Oui, et après la reconnaissance, vous pouvez comparer le résultat obtenu et corriger les défauts effectués par le programme, directement dans le menu Editeur. Le résultat lui-même est enregistré comme un document séparé que vous pouvez modifier la façon dont vous vous placez.

Trucs Travailler avec le format PDF

Modification des documents numérisés - L'affaire est monotone et si la source est le fichier PDF, il y a quelques astuces. Le fait est que l'éditeur du type FineReader est très bon dans cette affaire, mais son coût est souvent repoussé par l'utilisateur et le permet de rechercher des analogues. Par conséquent, un certain nombre d'utilitaires individuels vous permettent de produire des travaux hautement spécialisés, destinés aux fichiers de format PDF.

Outils PDFLED PDF.

PDFLED PDF Tools est un programme GRATUIT pour éditer des documents numérisés avec une expansion PDF. Il contient un certain nombre d'options supplémentaires, telles que la combinaison ou la déconnexion de documents, d'édition ou de suppression de contenu complet, convertissez le fichier PDF dans l'image et inversement. Ici, vous pouvez également créer des listes, modifier des images incorporées, aligner le texte et de nombreux autres paramètres qui sont familiarisés avec tout utilisateur de package Microsoft Word ou de ses analogues. Ce programme est absolument libre et est destiné à tout niveau d'utilisation (privé, corporatif, etc.). L'interface ici, bien sûr, n'est pas la plus amicale, mais l'ensemble des fonctions et débogue tout cela remplit d'intérêt. Mais il n'y a pas encore de menu russophone, donc si cela ne fonctionnait pas avec l'anglais, vous devrez bricoler avec le dictionnaire.

Éditeur PDF gratuit

Un autre utilitaire gratuit qui vous permet d'éditer des fichiers PDF. Il y a une interface plus compréhensible et pratique. Oui, et le programme est pris en charge par de nombreux systèmes d'exploitation, le seul point négatif est que le document fini est impossible. Mais vous pouvez numériser directement dans ce programme, puis travailler pleinement. True, vous devez bricoler avec la création, sinon un tel programme pour modifier les documents numérisés ne fonctionnera tout simplement pas.

Éditeur d'OCR

Si vous revenez au début et parlez d'analogues gratuits de FineReader, il existe un programme pour modifier des documents DOC appelés Formulaire OCR. Un utilité suffisamment utile, surtout si vous êtes amené au travail avec plusieurs langues (en faveur de la prise en charge de plus de 20 langues les plus courantes). Elle aboutit parfaitement à une polygraphie ou de documents de mauvaise qualité, mais comme pour le texte manuscrit, tout n'est pas aussi lisse ici. Bien sûr, pour reconnaître un tel texte d'OCR peut, mais la qualité de cette reconnaissance souhaite toujours le meilleur.

Quant à l'apparence, de nombreux éditeurs peuvent l'envier - tout est extrêmement simple: ouvrez le fichier et numérisez, puis enregistrez-le dans un format approprié - et le boîtier avec la fin. La popularité de l'utilité a gagné en raison de la possibilité d'auto-apprentissage, du système de reconnaissance dite adaptatif, qui permettra la reconnaissance meilleure et meilleure dans chaque nouvelle demande.

Une autre famille OCR

La modification est une leçon laborieuse, il n'est donc pas surprenant que certains utilisateurs recherchent d'autres méthodes. Dans de tels cas, il est possible de tirer parti d'un autre utilitaire - SimpleCr. Il ressort clairement du nom selon lequel il s'agit d'une application qui ressemble à la précédente - OCR, mais sous une forme plus simplifiée et parfaite. Ici, vous avez la possibilité d'ajouter manuellement des mots à travers l'éditeur intégré, la possibilité d'éditer du texte directement dans la fenêtre utilitaire, ainsi que de travailler avec des packages de données entiers (vous pouvez télécharger immédiatement plusieurs fichiers qui seront reconnus).

Mais l'apparence peut être légèrement ici pour lire un peu sur le programme et les principes de son travail. Sinon, au lieu d'un excellent éditeur, vous pouvez obtenir un programme inutile pour modifier des documents numérisés qui occupent de l'espace sur votre ordinateur.

Et si le document est une image?

Parfois, lorsque vous modifiez les documents numérisés au format JPG, il est nécessaire d'attribuer non le texte, à savoir l'image (schéma, tableau, calendrier, etc.). Et puis la question est complètement différente. Après tout, lorsque la reconnaissance de texte, la tâche est faite de manière assez différente. Maintenant, vous n'avez pas besoin de reconnaître simplement l'image, mais également de le conduire au look esthétique. Par exemple, si vous numérisez le schéma du livre, vous serez des impressions d'encre visibles d'autres feuilles. Pour se débarrasser de ces "interférences", vous devriez recourir à l'aide d'éditeurs graphiquement.

L'une d'entre elles peut être une vieille bonne peinture, mais dans le monde où les règles de progrès technologiques, les positions primaires dans cette affaire donnent à l'ancienne bonne photoshop, car il est plus rapide et plus pratique. Modification des documents numérisés dans "Photoshop" vous permet de vous débarrasser des taches et de la "saleté", de changer les couleurs des dessins, de modifier leur contraste et de leur luminosité en utilisant des ensembles de toutes sortes de filtres. De plus, des leçons sur la manière de faire une ou une autre opération, abondent, vous n'avez donc pas besoin d'être un "génie" Photoshop "," veux juste vouloir.

Il existe une autre masse d'autres éditeurs que vous pouvez utiliser, également d'excellents analogues peuvent être des utilitaires en ligne qui vous permettent de reconnaître le texte numérisé, sans même s'engager dans la sélection de tout autre logiciel spécialisé. En général, tout programme de modification des documents numérisés a le droit de vivre et que vous l'appréciez.

Enregistrez des documents numérisés sur un disque dur d'un ordinateur ou d'un support externe pratique et sûr. Cependant, comment apporter des modifications aux pages généralement représentées comme une image? Nous aurons besoin de programmes spéciaux sur l'installation et la gestion desquels nous indiquerons ci-dessous.

Comment numériser le document avant d'éditer?

Pour manipuler avec succès le fichier à l'avenir, il est important de le traduire correctement dans le format «images», ainsi que de prendre en compte certaines nuances simples, mais utiles dans le processus lui-même. Pour ça:

  • Faites défiler toutes les chances et les plis afin qu'ils n'apparaissent pas sur le scan et n'ont pas conduit aux difficultés de reconnaissance des lettres.
  • Pour plus de commodité, enregistrez le fichier au format PDF, JPG ou TIFF.
  • Le document PDF peut être ouvert et édité par Adobe Acrobat (ou tout autre destiné à ces fins).
  • Accédez au site Web du scanner Creator ou recherchez un programme de marque sur le disque ci-joint (des marques souvent connues ont leurs propres applications pour modifier les pages numérisées).
  • Pour utiliser ultérieurement le fichier dans MS Office 2003 ou 2007, définissez l'utilitaire de numérisation de documents Microsoft Office. Il permet de convertir le fichier numérisé automatiquement, le transférant immédiatement au texte (le programme ne fonctionne pas avec plus de versions «fraîches» du bureau).
  • Il est recommandé de numériser dans le gamma noir et blanc et non en couleur - il simplifie l'analyse du texte.
  • Le format TIFF est mieux utilisé pour les convertisseurs OCR, c'est-à-dire des programmes produisant une reconnaissance optique.

Comment modifier un document numérisé - Utilisation des utilitaires OCR

Le principe de la méthode de reconnaissance de caractères optique est la lecture sur des caractères papier, leur comparaison ultérieure avec des éléments de sa propre base de données. Ainsi, il y a une conversion d'une image solide sur le texte modifiable. Des exemples lumineux de programmes qui font face à cette tâche sont Adobe Acrobat et Evernote. Pour apporter des corrections à la numérisation disponible, ouvrez simplement l'une de ces applications, l'ensemble du processus suivant se produira automatiquement. Lorsque le programme termine la reconnaissance, il offrira à l'utilisateur de sauvegarder le document dans l'un des formats disponibles.


Comment modifier un document PDF numérisé

Si le document numérisé est enregistré dans le fichier PDF, nous pouvons facilement le modifier dans le programme Acrobat DC. Pour ça:

  • ouvrez le menu "Outils" -\u003e "Modifier PDF";
  • le programme démarre le processus d'édition, montrant le menu des invites dans le coin droit de ci-dessus;
  • en cliquant dessus et en sélectionnant «Paramètres», vous pouvez spécifier la langue de reconnaissance.
  • que faire des modifications, il suffit de cliquer sur n'importe quelle ligne du document;
  • le document, ouvert pour l'édition via l'OCR, est accompagné d'un panneau spécial avec des paramètres publiés sur le côté droit de l'écran;
  • dans la section "Paramètres", à l'exception de la langue, il est également pratique de sélectionner la police affichée, marquez les pages qui doivent être modifiées (toutes ou une).


Sur le réseau mondial, il existe une alternative abordable aux programmes de convertisseur installés. Ce sont des OCRS en ligne qui traduisent facilement l'image résultante en n'importe quel format de texte. Par exemple, le site Web PDFonLine.com permettra quelques minutes à partir du document PDF numérisé pour effectuer le fichier Word MS habituel.

Avez-vous aimé l'article? Partager avec des amis: