Les moteurs et systèmes de recherche d'informations. Informations Informations Recherche Technologies

La recherche d'informations est l'une des principales composantes de l'activité humaine. Nous sommes confrontés quotidiennement: étudier le panneau d'affichage de la théâtre pour choisir une performance intéressante, ramassant un train pratique dans le calendrier des trains annuaire. Une personne, en raison de sa profession ou de ses loisirs, rencontre souvent avec une sélection et une recherche de toute information thématique, tôt ou ultérieur (avec l'augmentation de son volume) doit appliquer des principes de systématisation et de classification des données disponibles fournissant plus pratique et recherche efficace. Donc, dans les bibliothèques composent un fichier: des informations sur le livre pour un schéma spécifique sont écrites sur la carte, le chiffre est placé là-bas - plusieurs lettres et chiffres sur lesquels vous pouvez déterminer l'emplacement du livre (stockage, rack, étagère) ; Les cartes sont définies par ordre alphabétique ou thématique. L'utilisation d'ordinateurs donne plus de possibilités de travailler avec de grandes distributions d'informations.

4.1. Définitions principales

Information et moteur de recherche (IPS) - système logiciel Pour le stockage, la recherche et la délivrance d'informations (abonnés) d'informations. L'abonné traite de l'IPS avec demande d'information - Texte réfléchissant besoin d'informations cet abonnéPar exemple, son désir de trouver une liste de livres sur la théorie de la recherche d'informations ou une liste de pharmacies dans laquelle vous pouvez acheter le bon médicament. La recherche d'informations est effectuée dans arrêté de recherche qui est formé (et au besoin mis à jour) par des développeurs ou des administrateurs système. Les éléments du tableau de recherche sont introduits dans le système d'information et de recherche sur le naturel (ou à proximité de celui-ci), puis sont généralement exposés à indexage . Transfert à formelle langue de recherche d'informations .

Indexage - Expression du thème central ou objet de tout texte ou une description de tout objet dans la langue d'information et de recherche.

Chose - L'objet (chose matérielle, concept, propriété ou attitude), qui est considéré ou mentionné dans la demande de document / d'information.

Matière Demande de documentation / d'information - Section de la science ou de la technologie, un domaine d'activité pratique ou un problème qu'une demande de document / d'information est dédiée.

Selon la nature du tableau de recherche et les informations émises de l'information, les IPS sont divisés en documentaire et facturant .

Documentaire IPS Conçu pour trouver des documents (articles, livres, rapports, descriptions de certificats de droit d'auteur et de brevets) contenant information nécessaire. Le tableau de recherche d'un tel IPS consiste à rechercher des images de documents (c'est-à-dire des éléments, chacun transmet le contenu principal du document) ou des documents eux-mêmes. En réponse à la demande d'informations IPS, il publie de nombreux documents (ou leurs adresses de stockage) contenant les informations souhaitées. Le document s'appelle tout texte significatif qui a une certaine achèvement logique et contient des informations sur sa source et / ou sa créatrice.

IPS factographiques Fournit la délivrance des informations réelles demandées par le consommateur dans la demande d'informations. Le tableau de recherche est composé de documents facturons, c'est-à-dire Des descriptions des faits tirées des documents et présentées dans une langue formelle.

Par exemple, si le service de rencontres a décidé de créer un documentaire IDA, le tableau de recherche serait consistant directement à partir des lettres de son type de clients: "Je m'appelle d'Ilya Muromets. Je me suis assis Sydney sur le four 33 ans et maintenant le roi des gardes ...".Pour créer une IPA factographique pour les lettres de clients, les tables du formulaire seraient remplies: "Nom de famille - Muromets. Nom - Ilya. Age - 33. Position - Sécurité". En conséquence, la demande dans le premier cas servira de partie de la lettre du client avec les souhaits concernant son partenaire: "Je veux une mariée plus jeune que moi, mais je m'inquiète sagement et que la ferme était intéressée par le ménage"Et dans la seconde - la table a compilé dessus: "Age - 33 ans, Intelligence - Haute, Intérêts - Ménage".

Actuellement, IPS factographiques (en tant que classe spéciale de moteurs de recherche) n'est pratiquement pas développé, les actions effectuées sont mises en œuvre à l'aide de SGDM standard. Ensuite, disant l'IPS, nous garderons à l'esprit les informations documentaires et le système de recherche.

L'un des moyens populaires de transférer le document sur la langue intérieure du système est coordonner l'indexation - Ensemble de documents d'affectation mots clés ou des codes qui déterminent son contenu. Deux manières d'indexation sont possibles: gratuites, lorsque les mots-clés sont supprimés directement du texte du document sans prendre en compte toutes les modifications de leurs formulaires et de leurs relations entre elles; et contrôlé lorsque seuls les mots qui ont été enregistrés dans l'image de recherche du document sont inclus. information et recherche Tersaurus où leurs relations synonymes, morphologiques et associatives sont indiquées.

4.2. Thésaurus

Thésaurus - un dictionnaire réglementaire spécialement organisé des unités lexicales d'information et de langage naturel. Les unités lexicales de récupération d'informations sont descripteurs . Le descripteur est placé dans une conformité sans ambiguïté avec le groupe de mots-clés de la langue naturelle choisie dans le texte d'une matière spécifique. Par exemple, tout (de préférence le mot clé ou une phrase ou un code numérique peut être sélectionné en tant que descripteur. Un mot multi-évalué de la langue naturelle correspond à plusieurs descripteurs et plusieurs mots et expressions synonymes sont une poignée. Thésaurus prend en compte les liens sémantiques entre les mots: Antonymes, Synonymes, Hyperoniens, Hyperonymes, Associations.

Synonymes - mots (phrases), différent sur l'écriture, mais la même chose (dans le sujet à l'examen) par signification: sorcière = magicien. Antonymes - mots avec le sens opposé: gentil - mal. Gyonim - terme, qui est un cas particulier d'un autre, plus concept général. Hyperonyme - Le terme, au contraire, qui est commun à un certain nombre d'autres, concepts privés.

Soldat \u003d hyponim ( militaire); humain\u003d hyperonyme ( militaire)

hyperonyme ( savoureux préparé) \u003d Hyperonyme ( contient une maison propre)=

hyperonyme ( sait comment coudre)= bonne hôtesse.

Dans la norme d'état sur les "Informations sur les thésaurus et la recherche Unicnate" définie types suivants Rapports:

- Vue rhodique: moyens de transport - chariot, avion de tapis, boots boosters, le fourneau

- Partie-Integer: mur, une porte, jambe de koya - Les pièces cabane;

- Raison-corollaire: abaissé l'épée - tête avec des épaules;

- produit brut: acier - épée;

- Hiérarchie administrative: sultan - vizir - gardien;

- Process-Sujet: éxécuter - bourreau;

- Objet de processus: éxécuter - victime;

- Similarité fonctionnelle: cuisinière Emelia - jeep Cherokee.;

- Propriété - Propriétés moyennes: sans risque - le dragon;

- antonymie;

- Synonymie.

L'attitude associative est une association d'autres relations qui ne sont pas incluses dans les relations hiérarchiques ni en ce qui concerne la synonymia (c'est-à-dire que tout type de relations entre les mots, éventuellement très spécifique, n'existant que dans une certaine zone).

L'article de mot (à un niveau informel) pourrait ressembler à ceci:

Roue \u003d intelligent

Antonym - stupide

Hyponima: Savoir, éduqué, deviner, lire

Vue - Indicateur Intelligence (High)

Thésaurus et grammaire composent langue de recherche d'informations . La grammaire contient les règles de formation de dérivés des unités de la langue (codes sémantiques, syntaggères, propositions) et réglemente l'utilisation de moyens de relations de syntaxe (par exemple, les pointeurs de communication).

Dans ce qui précède fabuleux service d'information Les datages thésaurus doivent décrire toutes sortes de qualités et de caractéristiques rencontrées dans des lettres client, des règles de leur classification. La grammaire et le thésaurus doivent être compilés de manière à ce que le système puisse comprendre ce qui est spécifié, disons, le numéro spécifié dans la demande: croissance, âge ou nombre de dents (ceci peut être déterminé par un mot-clé - une unité de mesure) , être en mesure de distinguer les informations rapportées par le client sur vous-même, de ses exigences de partenariat (phrases aidera ici j'aimerai vous rencontrer, doit correspondre).

Basé sur le thésaurus et les règles de grammaire, recherchez des images d'un document et d'une demande (ordre de recherche) sont formés. Perpétration - Texte sur une langue de promotion contenant des fonctionnalités des documents demandés par l'utilisateur dans la demande.

Rechercher une image du document - Texte sur une langue de promotion, livré à une conformité sans ambiguïté avec le document et reflétant ses fonctionnalités nécessaires pour la recherche sur demande. En plus des signes de recherche qui révèlent le contenu du document ou, au moins en définissant son sujet, l'image de recherche du document contient généralement l'identification et certains informations Complémentaires (sortie, type de document, sa langue, etc.). Les prescriptions de recherche sont formées lorsque des demandes sont reçues et que la recherche de documents peut être créée à la fois lorsque le système est reconstitué avec de nouveaux documents et lors de la recherche d'une réponse à la demande. Dans les systèmes où les flux d'informations sont importants et souvent mis à jour, il n'est pas nécessaire de dépenser des ressources sur l'indexation, et le document lui-même est souvent accepté pour l'image de recherche du document.

4.3. Pertinence

Le but de l'IPS est la délivrance de documents, pertinent Demande (sémantiquement pertinente) (en anglais pertinent - liée au cas). Distinguer la pertinence contenu et formel . La pertinence est informative comme une conformité du document avec une demande d'information, déterminée par la manière informelle (Vasilisa, Wasilis, apprendra les lettres de tous les gentils gentils et choisir des candidats au marié qui répond à ses exigences) et la pertinence est formelle - comme une conformité déterminée par l'algorithmique en comparant la commande de recherche et l'image de recherche du document sur la base du système de recherche d'informations critère émettant .

Critère émettant - une règle formelle, un ensemble de caractéristiques, sur lesquelles le degré de pertinence formelle de l'image de recherche d'un document et une ordonnance de recherche est déterminé et une décision sur la délivrance de la délivrance / un document non compliqué en réponse à une demande d'informations est effectuée.


Informations

besoin



Formulation

informations



Rechercher

prescription

o pertinence pertinence o

: Documentation


Indexage



Rechercher

déployer


DANS systèmes automatisés La recherche est basée sur une pertinence formelle, la pertinence significative d'eux est déterminée, par exemple, par des évaluations d'experts et est utilisée pour obtenir des données sur efficacité de la recherche d'informations dans le système (qualité de son travail). En tant que critère de délivrance, une correspondance complète des images de recherche du document et de la requête peut être sélectionnée, l'inclusion d'une pluralité de mots-clés dans la requête dans de nombreux mots-clés du document, l'intersection de ces ensembles, etc.

Dans cet exemple, lors de la sélection en tant que critère d'émettre la coïncidence complète des mots-clés du document et de la demande, le client doit recevoir des lettres de caractères qui répondent pleinement à ses exigences. Il est peu probable qu'ils leur satisfontent, car c'est clairement un choix ne sera pas trop grand. Ce critère serait arrivé à un système dans lequel la précision est nécessaire, par exemple, déterminant le choix des médicaments dans le traitement d'une maladie certaine (laissez-les être un peu, mais tout approprié), il est probablement apparemment approprié au critère de le carrefour.

Les coefficients de pesée peuvent être donnés des descripteurs en fonction du degré de leur demande de conformité; Lorsque vous recherchez les coefficients de descripteurs, détectés et dans la requête et dans le document, sont résumés et les documents sont émis en fonction de la valeur de ce montant (par exemple, s'il dépassait une légère valeur). Ainsi, si vous spécifiez que les caractéristiques les plus lourdes sont richesse et puissance, mais non gentillesse et âge, vous pouvez entrer dans le marié a remporté l'immortel. Lorsque vous utilisez des balances, vous pouvez également être appliqué Émission eschononisée- Les documents sélectionnés sont présentés à l'utilisateur non pas dans un ordre arbitraire, mais par le degré de pertinence (quantité de poids descendant), le droit du choix final des documents pertinents - au-delà de l'utilisateur.

L'IPA idéal devrait émettre des documents d'une enquête pertinente contenue et rien que d'eux. Cependant, dans la pratique, cela n'est généralement pas atteint, le silence de l'IPS est observé (non-commission d'un certain nombre de documents pertinents) et de bruit (émission documents inutiles). La gamme de documents est divisée en publié et non fini - un critère et sur pertinent et hors du sujet- différemment.


Ainsi, pour chaque demande, nous obtenons 4 groupes de documents:


Le ratio du nombre de documents dans chacun de ces groupes détermine l'efficacité de la recherche d'informations. Les caractéristiques suivantes sont utilisées pour évaluer l'efficacité:



Plénitude de l'émission \u003d.


tabletable--



Rv + rn.



Précision de l'extradition \u003d


tabletable--



Rv + nv.



Perte d'information \u003d


tabletable--



PV + PP.



Bruit d'information \u003d


tabletable--


x 100%


Rv + nv.



Sensibilité \u003d.


tabletable--



Rv + rn.



Spécificité \u003d.


tabletable--



Nn + nv


Dans l'IPS parfait, pH \u003d hb \u003d 0 et donc complétude et précision \u003d 100%, et bruit \u003d 0 (tous les documents et pas superflu) sont trouvés. DANS systèmes réels Le coefficient d'exhaustivité atteint 70% et le coefficient de précision de recherche fluctue dans des limites très larges, parfois diminué à 10%. Les valeurs de ces coefficients dépendent d'un certain nombre de facteurs: les deux propriétés internes du moteur de recherche (volume et caractéristiques de la langue d'information, de la langue d'information et de recherche, du critère d'émission) et de nombreuses conditions "externes": le diplôme de la spécificité des demandes d'informations, la capacité de l'utilisateur à formuler correctement leurs propres besoins de l'information dans la langue naturelle, l'exactitude de la construction d'une requête spécifique, ainsi que de la soumission subjective de l'utilisateur sur les informations nécessaires. En raison des erreurs et des inexactitudes découlant de chacune des étapes de travail en tant qu'utilisateur et du système, les résultats peuvent être très différents de ce que l'utilisateur souhaitait se rendre à l'IPS.

Il y a un concept stabilité de la recherche - Caractéristiques du changement d'exhaustivité et de précision à de petites modifications (sémantiquement mineures) de la demande. Les valeurs moyennes d'exhaustivité et de précision pour un système particulier sont généralement calculées en le testant sur la base de données de référence.

En fonction des exigences de la quantité et de la qualité des informations IPS émises, différents critères d'émission sont sélectionnés. S'il est important de ne pas manquer information nécessaire (Examen de brevet) - Il est nécessaire d'augmenter la complétude, si vous devez réduire le nombre d'informations émises (bibliothèque) - la précision devrait être améliorée.

Le scientifique anglais S. Cleverdon a révélé la relation inverse entre la plénitude et la précision de la recherche dans un système (lors de l'utilisation des mêmes informations et de la même langue de recherche), c'est-à-dire L'amélioration de la précision entraîne une augmentation du bruit et, au contraire, la précision diminue avec la réduction du bruit. Vous pouvez améliorer ces deux indicateurs en même temps, ne modifiant que les informations et la langue de recherche, rendant la grammaire et le thésaurus de manière plus linguistique. Dans le même temps, la réalisation de l'exhaustivité maximale possible de la recherche est associée à d'énormes difficultés. Les 5-10% ont besoin de la même complication du système du système, ainsi que des 90 à 95% précédents, ce qui entraîne une augmentation de la complexité des informations de traitement et de la durée de recherche.

4.4. Composant de langue

Une augmentation de l'efficacité de l'IPS dans une large mesure aide le traitement plus détaillé du texte du document. Donc, il existe des systèmes que, pour simplicité, une image de recherche du document prend son nom, mais elle ne reflète pas toujours le contenu du texte. Par exemple, dans la préparation de ce matériau, un article «un œil comme un aigle» a été utilisé, n'a rien à voir avec l'ornithologie, ni à des oculistes. Il est également d'une grande importance pour l'application de programmes produisant une transformation linguistique significative des textes dans la langue naturelle (en tenant compte de la morphologie, de la syntaxe). Seules avec leur aide peuvent être installées, ces mots sont ces mots (presque toutes les lettres sont les mêmes) des formes d'un mot ou sont des mots complètement différents, conformément à différentes unités sémantiques.

Plus primitif, allongé à la surface des réceptions peut amener le développeur de l'IPA. Donc, si le système ne prend en compte aucune règle de la langue russe et fonctionne avec des modèles (comme Var *, Text * .exe), alors lors de la recherche de Cendrillon Cavalera, intéressé par la danse de la salle de bal, en tant que modèle de mot clé avoir à choisir balle* (afin qu'il n'y ait aucune perte d'informations, sinon vous pouvez ignorer cette caractéristique exprimée par des mots j'aime danser sur le bala). Ensuite, à la suite de la recherche, on peut lui demander de se familiariser avec tous les amants ballet, balyka, Balmont, Balzaca, avec tout vivant autour baltique mer, maisons avec balcon, ainsi que de toutes sortes de balovniki et balavres du destin.

Tous ces candidats seront supprimés, si l'adjectif sera donné comme mot-clé salle de bal Et le système sera en mesure de le reconnaître sous toutes ses formes (l'utilisation de l'analyse morphologique des mots permet également de réduire le volume de thésaurus, en le payant des informations redondantes - sinon toutes les formes d'un mot doivent être déterminées comme synonymes ). Une autre façon de réduire le bruit et d'augmenter la précision est l'introduction d'un dispositif avec des mots à une seule main dans la langue de récupération d'informations. Dans notre exemple, lors de la définition d'une clé racine balle Seuls les documents contenant différentes formes de mots seraient émis balle et salle de bal. Cependant, dans ce cas, la lettre du prince d'accueil est perdue entre les messages sur salons de la robe de salle de bal, propriétaires de salles de bal de balles, musiciens et serveurs, servir des balles. Avec l'aide de l'analyse syntaxique, il est possible de déterminer plus précisément la phrase (par exemple, de les reconnaître non seulement lorsque des mots sont derrière l'autre, mais lorsqu'ils sont séparés par un certain nombre d'autres mots). Dans l'exemple donné, le système avec un composant syntaxique pourrait être fondé pour rechercher des documents avec des phrases. la danse de salon et danser sur la balle. Bien sûr, il ne fournit pas de précision de 100% (par exemple, rien n'interdit la délivrance de rapports sur enseignants de la danse de salle de balCependant, il est clair que le nombre de documents émis sera considérablement réduit et Cendrillon ne se transformera pas en une vieille vierge, examinant les informations proposées par celui-ci.

Les informations développées et les langues de recherche permettent l'utilisation de ligaments logiques: tromper\u003d Pas ( intelligent), bon bien fait=(homme) Et ( jeune). À l'avenir, la possibilité d'une description de la signification de l'ensemble de la phrase dans la langue de recherche d'informations (qui ne développe pas toujours les significations des mots incluses) et la possibilité de la formulation des requêtes sémantiquement complexes pertinentes.


Notez que dans la publicité ou les téléspectateurs des installations de recherche, vous pouvez souvent trouver les mots "indexation" ou "indexation". Ces termes signifient que la création d'un glossaire commun tout au long de la matrice pour augmenter la vitesse de recherche. Pour toute la base de texte, une liste de personnes rencontrées et chacune d'entre elles est mise en conformité avec un index (coordonnées dans la base de texte); Le plus souvent, il s'agit du numéro de document et du numéro de texte dans le document. Lors de la demande de demande, le mot est recherché pour la première fois cette liste et les documents nécessaires sont délivrés en fonction des coordonnées trouvées. S'il y a plusieurs mots dans la requête, une opération d'intersection est effectuée au-dessus de leurs coordonnées. C'est ainsi que la recherche d'articles est organisée, y compris le mot spécifié, dans les sous-systèmes d'aide Windows.

Topic 3.1.1 Recherchez des informations sur Internet

Internet grandit dans un rythme très rapide, de trouver ainsi les informations nécessaires entre des centaines de milliards de pages Web et des centaines de millions de fichiers deviennent plus compliqués. Des informations spéciales sont utilisées pour rechercher des informations. moteurs de recherchequi contiennent des informations constamment mises à jour sur l'emplacement des pages Web et des fichiers sur des centaines de millions de serveurs Internet.

Lorsque vous recherchez des informations, vous devez répondre à trois questions: Que rechercher, c'est-à-dire quelles sources d'informations, où rechercher (des endroits pour placer ces sources) et sur la recherche de (quels outils pour cela).

Quelles sont les principales sources d'informations présentées sur Internet? Ce sont des documents www, des articles dans des groupes de nouvelles et des listes de distribution, des fichiers dans les bibliothèques de fichiers, des références d'informations d'adresse pour des organisations et des personnes (courrier électronique, adresse, téléphone), articles de bases de données thématiques, encyclopédies.

Où sont ces sources d'informations? Ce sont des ressources Internet populaires comme www, groupes de discussion, listes de diffusion et serveurs FTP.

Bien sûr, vous pouvez rechercher les sources d'informations nécessaires manuellement, apprendre les adresses des journaux informatiques spécialisés et des revues Internet, utilisez des livres de référence sur papier spéciaux avec des catégories d'adresses classifiées.

Toutefois, pour un tel espace changeant comme Internet, il est nécessaire d'apprendre à profiter des outils spéciaux, dont le but est de collecter des informations sur les ressources d'information et de fournir aux utilisateurs des utilisateurs. recherche rapide.

IPS (système de récupération d'informations) - Il s'agit d'un système qui fournit la sélection et la sélection des données nécessaires dans une base de données spéciale avec des descriptions de sources d'informations (index) basées sur la récupération d'informations et les règles de recherche pertinentes.

La tâche principale de tout IPA est de rechercher des informations par les besoins d'informations pertinents de l'utilisateur. Il est très important du fait que la recherche ne contenait rien à perdre, c'est-à-dire de trouver tous les documents liés à la demande et de ne pas trouver quoi que ce soit superflu. Par conséquent, la caractéristique qualitative de la procédure de recherche est introduite - pertinence.

La pertinence est la conformité des résultats de la recherche à la requête formulée.

Les serveurs de recherche Internet peuvent être divisés en deux groupes:

- moteurs de recherche usage général;

- moteurs de recherche spécialisés.

Systèmes à usage général

Le but général de l'interface à usage général contient le champ de recherche et la liste des partitions de répertoires. Les outils de recherche suivants pour www sont distingués: catalogues, moteurs de recherche, systèmes de métapoik.


Catalogue

Catalogue - Moteur de recherche avec annotations classifiées d'annotations en référence aux ressources Web. La classification est généralement effectuée par des personnes.

La recherche dans le catalogue est très pratique et est effectuée par un raffinement constante. Toutefois, les répertoires prennent en charge la possibilité de rechercher rapidement une catégorie ou une page spécifique par des mots-clés à l'aide d'un moteur de recherche local. La base de données de référence (Index) du catalogue a généralement une quantité limitée, est remplie de personnel d'annuaire manuellement. Certains répertoires sont utilisés mise à jour automatique indice.

Le résultat de la recherche dans le catalogue est représenté comme une liste composée de brève description (Annotations) Documents avec référence hypertext à la source.

Adresses des catalogues populaires:

1 catalogues étrangères:

a) Yahoo - www.yahoo.com;

b) look intelligent - www.looksmart.com;

c) Magellan - www.mckinley.com;

d) Einet - www.einet.net.

2 catalogues russes:

a) APORT (Constellation d'Internet) - www.aport.ru;

b) ay - www.au.ru;

c) Weblist - www.weblist.ru;

d) Snail - www.ulitka.ru.

Dans la base de données des moteurs de recherche, les sites Web sont regroupés dans des annuaires thématiques hiérarchiques, qui sont des analogues du répertoire thématique de la bibliothèque.

Section thématique de haut niveau, par exemple: Internet, des ordinateurs, des sciences et de l'éducation, etc., contiennent des annuaires intégrés. Par exemple, le répertoire Internet peut contenir des sous-répertoires Recherche, courrier et autres.

La recherche d'informations dans le répertoire se présente à la sélection d'un répertoire spécifique, après quoi l'utilisateur sera présenté avec une liste de liens vers les adresses Internet des sites Web les plus visités et significatifs. Chaque lien est généralement annoté, c'est-à-dire qu'il contient un bref commentaire au contenu du document.

Le catalogue thématique hiérarchique multi-niveaux le plus complet de ressources Internet russophones a un moteur de recherche d'APORT (www.aport.ru). Le répertoire contient une annotation détaillée du contenu des sites Web et de l'indication de leur emplacement géographique.

Moteur de recherche

Moteur de recherche - Moteur de recherche avec une base de données générée par un robot contenant des informations sur les ressources d'information.

Caractéristique distinctive moteur de recherche C'est le fait que la base de données contenant des informations sur les pages Web, les articles USenet, etc., est formée par un programme de robot.

La recherche d'un tel système est effectuée sur la demande effectuée par un utilisateur composé d'un ensemble de mots-clés ou d'une phrase clos entre guillemets. L'indice est formé et maintenu à l'état actuel des robots-indexeurs. Par exemple, pour rechercher des systèmes de recherche eux-mêmes, vous pouvez entrer des mots-clés " système russe Rechercher des informations Internet. "

Après un certain temps, après avoir envoyé une demande, le moteur de recherche retourne une liste d'adresses Internet de documents dans lesquels les mots-clés spécifiés ont été trouvés. Le document décrivant le document contient le plus souvent plusieurs premières offres ou extraits du texte du document avec l'attribution de mots-clés. En règle générale, la date de mise à jour (vérification) du document est spécifiée, sa taille en kilo-octets, certains systèmes définissent la langue du document et son codage (pour les documents russophones).

Pour afficher ce document dans le navigateur, il suffit d'activer la référence en indiquant.

Si les mots-clés ont été sélectionnés sans succès, la liste des adresses de document peut être trop grande (peut contenir des dizaines et même des centaines de milliers de références). Afin de réduire la liste, vous pouvez entrer des mots-clés supplémentaires dans le champ de recherche ou utiliser le répertoire des moteurs de recherche.

De nombreux moteurs de recherche vous permettent de rechercher des documents trouvés et vous pouvez clarifier votre demande d'introduction de termes supplémentaires. Si l'intellectualité du système est élevée, vous pouvez vous proposer un service de recherche pour des documents similaires. Pour ce faire, vous choisissez un document particulièrement apprécié et indiquez son système comme un échantillon à imiter. Mais souvent cette fonction fonctionne correctement à vos espoirs. Certains moteurs de recherche vous permettent de rembourser les résultats. Pour enregistrer votre temps, vous pouvez enregistrer les résultats de la recherche dans le formulaire d'un fichier sur disque local Pour une étude ultérieure hors ligne.

Adresses des moteurs de recherche les plus populaires à l'étranger et en Russie:

1 moteurs de recherche étrangers:

a) Google - www.google.com;

b) Alta Vista - www.altavista.com;

c) Excite - www.excite.com;

d) hotbot - www.hotbot.com;

d) Lumière de Notation - www.northernlight.com;

e) aller (Infoseek) - www.go.com (Infoseeek.com);

g) lycos - www.lycos.com;

h) rapide - www.alltheweb.com.

2 moteurs de recherche russe:

a) yndex - www.yandex.ru (ou www.ya.ru);

b) Rambler - www.rambler.ru;

c) APORT - www.aport.ru.

L'un des moteurs de recherche les plus complets et les plus puissants est Google (www.google.ru), dans lequel 8 milliards de pages Web sont stockées dans la base de données et chaque mois, les robots ont 5 millions de nouvelles pages. Dans Runet (partie russe d'Internet), de nombreuses bases de données contenant 200 millions de documents ont des moteurs de recherche Yandex (www.yandex.ru) et Rambler (www.rambler.ru).

METAPOISK machine

Notez que divers moteurs de recherche décrivent un nombre différent de sources d'informations sur Internet. Par conséquent, il est impossible d'être limité à la recherche uniquement dans l'un des moteurs de recherche spécifiés. Maintenant, mettons connaissance avec des outils de recherche qui ne forment pas leur propre index, mais ils peuvent utiliser les capacités d'autres moteurs de recherche. C'est des systèmes de métapoik ( services de recherche) - Systèmes capables d'envoyer des demandes utilisateur simultanément multiple serveurs de recherche, puis combinez les résultats obtenus et soumettez-les à l'utilisateur sous la forme d'un document avec référence.

Les systèmes METAPOISK n'ont pas leur propre base de données. Ce sont des programmes qui acceptent le processus de demande d'utilisateur cette demande à l'aide d'algorithmes. intelligence artificielle Puis cherchez des moteurs de recherche. C'est-à-dire qu'ils sont machines à la recherche Moteurs de recherche. L'avantage de ces systèmes est leur capacité à synthétiser le but de la recherche et non seulement à la recherche en fonction de la requête verbale. Les résultats d'une telle recherche sont clairs pour l'utilisateur et correspondent le plus au fait qu'il recherche. Les sites de métapoiques offrent un grand nombre d'options, cherchant à être utiles pour tout utilisateur. Disponible diverses versions Les systèmes de métapoik qui parcourent constamment Internet pour obtenir des informations correspondant à vos critères de recherche.

Quand le système trouve nouvelle informationElle vous avertit ou le charge automatiquement. Si vous voulez trouver des sites dédiés à questions générales, voyagez et ainsi de suite, les véhicules METAPOISK vous permettront d'accéder rapidement aux informations nécessaires. Ils offrent également un accès direct aux sites d'informations spécifiques, telles que des annuaires téléphoniques, des guides et des sites gouvernementaux. Le temps de fonctionnement des systèmes de métapoiques est généralement légèrement augmenté, car ils interviewent d'autres moteurs de recherche. Il est logique d'appliquer lorsque des moteurs de recherche ordinaires n'ont pas donné de résultats.

Adresses de célèbres systèmes de métapoisisk:

- Metacrawler - www.metacrawler.com;

- Savvysearch - www.savvvysearch.com

Envoyez votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

bon travail au site "\u003e

Étudiants, étudiants diplômés, jeunes scientifiques qui utilisent la base de connaissances dans leurs études et leur travail vous seront très reconnaissants.

posté par http://www.allbest.ru/

introduction

4. Technologies IPS

Conclusion

Liste bibliographique

introduction

Actuellement, pour la plupart des organisations d'État russes et des entreprises commerciales, l'absence d'un système ordonné de travaux de bureau, malgré le fait qu'il s'agissait de travaux de bureau rationnels et clairement organisés, qui détermine le soutien de la documentation pour l'organisation de l'organisation, peut augmenter considérablement l'efficacité. de l'entreprise. L'organisation des travaux avec des documents est une partie intégrante des processus de gestion et de prendre des décisions de gestion qui affecte de manière significative l'efficacité et la qualité de la gestion. Le processus de prise de décision consiste à: obtenir des informations, son traitement, son analyse, sa préparation et sa prise de décision. Toutes ces étapes sont très étroitement liées à la recherche de documents et d'informations sur eux. Ce rôle est effectué par le moteur de recherche d'informations (IPS) pour travailler avec les documents de l'organisation. La fiabilité et la qualité de la gestion dépendent de la qualité et de la précision, de l'efficacité de la réception d'informations, du bon établissement du service de référence et d'information, une organisation claire de la recherche, du stockage et de l'utilisation des documents. Les principales tâches de la gestion de la documentation sont les suivantes: réduction des flux d'informations à un minimum optimal, assurant des processus de simplification et de réduction de collecte, de traitement et de transmission d'informations à l'aide de nouvelles technologies automatisation de ces processus. Ainsi, pour toute organisation est essentielle d'améliorer constamment la gestion de la documentation, car elle affecte directement la qualité des décisions de gestion. Les tâches de l'IPS consistent en plusieurs étapes dont nous allons dire dans cette papier à terme.

Objectif: La tâche de ce cours est de se familiariser avec l'objet d'informations et de moteurs de recherche de l'organisation. Découvrez les objectifs, les caractéristiques et la portée de cet objet d'étude.

Objectifs:

1. Décrire les types d'informations et de moteurs de recherche

2. Enregistrement des documents comme base de l'information et du moteur de recherche

3. Autres sources pour la construction d'IPS

4. Technologie

document de document Information Gestion du compte

1. Types d'informations et de moteurs de recherche

Les organisations sont créées par type manuel IPS, mécanisées et automatisées. Les IPS incluent l'enregistrement et l'indexation des documents créés sur leurs tableaux de recherche d'informations de base (cartes, réseaux sur les supports de machine), stockage opérationnel des documents.

Pour obtenir une compatibilité des informations sur les réseaux de recherche des organisations de l'industrie, un développement centralisé des classificateurs est requis: une nomenclature typique des cas; Correspondants de classificataire; classificateur d'unités structurelles (en présence de structures standard); classificateur de types de documents; problèmes de classificateur des activités de l'organisation; Problèmes classifieurs contenus dans des phrases, des déclarations, des plaintes de citoyens, etc.

Informations intersectorielles La compatibilité des IPS est assurée par l'utilisation de OK TEI; Lors de l'utilisation d'Intrasystems, les classificateurs doivent pouvoir passer à des codes OK TEI Référence ou contrôle et référence, sur lesquels le cours d'exécution de documents ou de leur utilisation est surveillé. La base de la systématisation dans ces tableaux est la différence de plusieurs types d'IPS indépendants: une règle, la date (terme) de l'exécution;

2 Documents de surveillance et de référence accès limité, en règle générale, dans des magazines numérotés, cousus et scellés;

3 Contrôle et références sur propositions, applications et plaintes de citoyens dans lesquels la base de la systématisation fait l'objet de questions soulevées dans les appels;

4 Référence (codifications) sur les actes de réglementation reflétant les problèmes de l'organisation (environnement juridique) de l'Organisation. Les systèmes de cette espèce prend indépendamment toutes les questions sur lesquelles il existe des informations dans le document et la base de la systématisation fait également l'objet de dispositions réglementaires. Dans la saisie de documents provenant des informations de traitement ou d'annulation dans l'IPS est annulée , mais non détruit, mais est transmis à l'archive de l'organisation avec des documents.

Les fichiers de référence sont divisés en deux parties: documents non remplis et exécutés, RKK dans lesquels sont systématisés par les caractéristiques suivantes:

question de sujet ou thématique (conformément au contenu des documents ou à la zone d'activité auxquels les documents sont liés);

1. sur la nomenclature des cas (conformément aux noms des affaires sur la nomenclature des affaires ou de leurs indices);

2. correspondant (selon les noms ou désignations conditionnelles des organisations avec lesquelles la correspondance est effectuée);

3. Selon les interprètes (par divisions structurelles);

4. alphabétique (par ordre alphabétique, noms, noms d'objets ou d'objets);

5. géographique (selon les noms des unités administratives-territoriales);

6. nominal (par titre ou espèce de documents);

7. Enregistrement (par ordre d'augmentation des numéros d'enregistrement des documents).

La sélection de la fonction de recherche est déterminée en fonction des types de documents et de la nature des demandes d'informations.

La première partie du fichier de carte est utilisée pour rechercher des informations sur les documents dans le processus de son exécution. La deuxième partie du fichier de carte est utilisée pour rechercher des documents exécutés.

Comme les documents RSC sont exécutés avec les marques requises, passez à partir de la première partie du fichier de carte aux sections correspondantes et aux en-têtes de la seconde;

En fonction du montant de la gestion des documents, de l'enregistrement et du contrôle de l'exécution de documents, les tâches de recherche peuvent être effectuées des personnes déplacées de référence unifiées ou plusieurs indépendantes. Des fichiers séparés (bases de données) sont formés dans des documents entrants, des documents sortants d'initiative, un appel des citoyens. Avec un grand nombre d'actes juridiques réglementaires et de documents de gestion utilisés dans les activités de l'organisation, des fichiers de codification distincts (bases de données) peuvent être créés sur eux.

La liste des noms de base de données est similaire à la liste des noms de fichiers.

Comptabilisation de la gestion des documents:

1. Le volume de la gestion de documents est le nombre de documents obtenus (entrant) et créé (interne, sortant) pour une certaine période;

2. Compter le nombre de documents est effectué sur les formulaires d'inscription dans les domaines de l'enregistrement.

Pour une unité de comptabilité, une instance du document est faite sans compte de copies créées lors de l'impression et de la reproduction. Chaque document est pris en compte une fois. Les applications du document sont prises en compte avec un document.

Séparément, les documents reçus et créés par l'organisation, appel des citoyens.

Les copies multipliées (copies) sont prises en compte séparément selon des journaux de travail dans le bureau dactylographié et multiplier multiplier et (ou) sur les listes de diffusion.

L'organisation peut effectuer une comptabilisation complète et sélective du volume de la gestion des documents (dans l'ensemble de l'organisation, en fonction des divisions structurelles, selon des groupes de documents, etc.).

La comptabilité et l'analyse du montant de la gestion des documents dans l'organisation sont effectuées sous la direction du service DOU;

Les résultats du volume comptable du flux de travail sont résumés par le service DOU et sont soumis à la gestion de l'organisation pour élaborer des mesures pour améliorer le travail avec des documents;

Les informations sur le volume de la gestion de documents permettent d'établir la structure et le numéro de personnel du service DOW, le choix des technologies de travail avec des documents et les moyens d'automatisation des travaux de bureau, déterminant le degré de chargement du service de DOU et des travailleurs individuels. Les moteurs de recherche d'informations jouent un rôle important dans la résolution des tâches les plus importantes des institutions d'archives: l'intensification des processus de l'heuristique archivistique, la rapidité et l'efficacité de la résolution de tâches de recherche dans tous les thèmes et complexes de documents, à tous les niveaux de recherche; Élargir l'accès des utilisateurs à des informations sur le document (comme la restriction de l'accès n'est souvent pas liée à la présence de Griff de confidentialité et de la qualité insuffisante de l'appareil scientifique et de référence, qui entrave de manière significative le travail des chercheurs); Améliorer l'intensité et l'efficacité de l'utilisation documents d'archives Dans toutes les formes d'utilisation, la diversité des services d'information fournis par des archives, y compris sur une base contractuelle; L'élaboration d'une ingérence et de la coopération internationale sur la base de l'échange d'informations, la mise en œuvre de projets communs pour l'introduction d'importants complexes de sources historiques dans un chiffre d'affaires scientifique. Le contenu de la recherche d'informations a commencé avec l'étude des fonctionnalités de l'information documentaire et de la recherche Moteurs (IPS). La recherche d'informations dans ces systèmes signifie une séquence d'opérations effectuées afin de trouver des documents (articles, rapports scientifiques et techniques, descriptions de certificats de droit d'auteur et de brevets, de livres, etc.) contenant certaines informations (suivies de la délivrance des documents eux-mêmes ou leurs copies), ou afin de délivrer des données réelles, répondant aux questions posées.

2. Enregistrement des documents - la base de la construction de l'IPS

Enregistrement des documents - fixant le fait de créer ou d'entrer dans un document par la simplicité d'index1, suivi d'enregistrement des informations nécessaires sur le document sur les formulaires d'inscription.

L'indice de document consiste en un numéro de séquence dans la matrice enregistrée de documents, qui, sur la base de la tâche de la recherche, est complétée par des indices sur la nomenclature des cas, le classificateur de correspondants, interprètes, etc. dans l'indice de document, le la séquence suivante (ou inverse) de celle-ci est observée composants: Numéro d'enregistrement en série, index sur la nomenclature des cas, indice sur le classificateur utilisé. Les parties composites de l'indice sont séparées par un latéral.

Les inscriptions sont soumises à tous les documents nécessitant une comptabilité, une exécution et une utilisation à des fins de référence (administratif, planifiées, rapport, comptabilité et statistique, comptabilité, financière, etc.), à la fois créées et utilisées au sein de l'organisation et envoyées à d'autres organisations et provenant de la hausse -level, subordonné et autres organisations et individus. L'inscription est soumise à des documents traditionnels dactylographiés (manuscrites) et moyens Équipement informatique (lisible à la machine, informatismes).

Les documents sont inscrits dans l'organisation une fois: entrant - le jour de la réception, créé - le jour de la signature ou de l'approbation. Lors du transfert d'un document enregistré d'une unité à une autre, il est enregistré à plusieurs reprises. L'enregistrement des documents est effectué dans les groupes, en fonction du nom du type de document, de son auteur et du contenu. Par exemple, les ordres du chef de l'activité principale, les ordres du chef du personnel, les ordonnances du chef de l'organisation supérieure pour l'activité principale, les décisions du collegium de l'organisation supérieure, l'audit de la finance et économique Activités, rapports comptables, rapports d'entreprises, actes de mise en œuvre des résultats de la recherche scientifique, des organisations de plans de travail subordonnés, des applications de logistique, etc. Les numéros d'enregistrement ordinaux sont attribués à des documents au sein de chaque groupe enregistré. L'enregistrement des documents entrants et créés est effectué principalement de manière centralisée: dans des lieux de création et d'exécution de documents. Par exemple, la documentation prévue est enregistrée dans le département prévu, des documents d'approvisionnement - dans le département de l'offre, des protocoles et des décisions du conseil - au Secrétariat, des documents de direction sur les principales activités signées par le chef de l'Organisation, des documents provenant des organisations supérieures ou envoyé à eux - dans le service de support de documentation, etc. Le lieu d'enregistrement du document est inscrit dans les instructions de documentation de la gestion et de la table des documents des documents. Les documents sont enregistrés sur des cartes. Pour obtenir une compatibilité des informations des données d'enregistrement et créer des conditions de transition vers l'enregistrement automatisé, il est déterminé par la composition obligatoire des détails de l'enregistrement: l'auteur (correspondant), le nom du type de document, la date du document, le document index (index de date et de réception du document) 2, en-tête de document ou son résumé, Résolution (exécuteur, assurance de la mission, de l'auteur, de la date), de la période d'exécution, de la marque d'exécution (bref enregistrement de la question de la question de l'essence, la date de l'exécution effective et de l'indice de réponse-réponse, le numéro de cas ). La composition des détails obligatoires, si nécessaire, peut être complétée par ce qui suit: interprètes, signature de l'artiste, certifiant la réception du document, la progression de l'exécution, la marque sur les annexes, etc. La procédure de localisation des détails sur les formulaires d'inscription et l'utilisation de la circulation des cartes d'enregistrement et de contrôle est déterminée par l'organisation elle-même. Nombre d'instances de cartes d'enregistrement -Control sont déterminées par le nombre de cartes de référence et de contrôle dans les divisions structurelles, où le document sera Exécuté et contrôlé. L'enregistrement des documents-réponses est effectué sur les formulaires d'inscription des documents d'initiative. Le document de réponse est attribué à un numéro d'enregistrement série indépendant dans la matrice enregistrée correspondante. Les suggestions, déclarations et plaintes de citoyens sont enregistrées sur les cartes d'enregistrement et de contrôle de la forme établie. Les techniques de copie et de calcul peuvent être utilisées pour enregistrer des documents. Dans une UIP automatisée, l'enregistrement des documents est effectué à l'aide d'une carte d'enregistrement orientée machine, construite sur la base de détails d'enregistrement obligatoires ou par entrée directe du document. Les cartes de référence sont formées à partir d'enregistrement et de cartes de contrôle en fonction des tâches d'IPS spécifiques conformément aux classificateurs utilisés. Les fichiers suivants sont compilés:

référence;

contrôle et référence;

dans la géographie des documents entrants;

sur des suggestions, des déclarations et des plaintes de citoyens;

thématique (commandes, solutions), etc.

Les tableaux d'informations et de recherche d'IPS automatisés sont formés en fonction des informations sur les documents enregistrés sur les médias de la machine.

Types de formulaires de comptabilité d'enregistrement:

Dans les activités pratiques, utilisez divers comptes d'enregistrement: journal, carte, ordinateur. Le formulaire d'inscription du magazine est utilisé par des organisations et des divisions structurelles, où le flux de travail est inférieur à 500-600 documents par an. Toutes les feuilles de magazines sont numérotées dans le coin supérieur droit, à partir de la seconde. Toutes les feuilles couchent avec des fils durables. Les extrémités des fils sont retirées sur la dernière feuille numérotée (côte arrière). En utilisant un carré de papier sur le diamètre des impressions plus rondes, colle au milieu des extrémités du fil. D'en haut, mettez l'organisation de l'organisation avec la capture de la partie de la place ou directement au milieu de la place. Sur la même page, faites une inscription, assurer l'exactitude de la conception. Par exemple: "Dans ce journal, numéroté et collé joint rond 90 (quatre-vingt-dix) feuilles ». Le détachement assure la signature personnelle du projet de fabrication (secrétaire), indiquant une position et conduisant la décomposition de la signature personnelle (nom de famille, initiales). Après la fin des enregistrements du journal, ils font Une inscription, par exemple, le contenu, "Dans cette revue enregistré 372 document du №1 par №372. Numéro 41 manqué au hasard. " L'enregistrement est attribué par la signature. Tous les journaux ont des chiffres sur la nomenclature des cas. La couverture du magazine doit être écrite: le nom du magazine, le nom de l'organisation, le numéro d'enregistrement sur la nomenclature des cas, dans le coin inférieur droit - Début 00h00.00 et a mis fin à 00.00.00. Le numéro de début et de fin du magazine mettait l'enregistrement du premier et dernier document de la Journal (au cours de l'année civile). La forme d'enregistrement juridique a ses inconvénients technologiques:

Nature formelle de la fixation du document pour le numéro de séquence brute;

Complexité de la journalisation des travaux de recherche, de référence et de test;

La complexité de l'enregistrement multiple obligatoire des documents;

Manque de possibilité de refléter le mouvement du document dans le processus de considération et d'exécution.

Pour enregistrer des documents, utilisez une seule carte d'enregistrement et de commande. Préparez des cartes avec une méthode typographique sur papier A5 (148x210 mm). Pour une orientation plus rapide, vous pouvez appliquer des différences de couleur dans les catégories de documents. Dans ce cas, les cartes sont fabriquées avec des rayures colorées le long du champ supérieur. Une carte vierge de couleur est possible: pour les documents entrants - vert, sortant - bleu, couleur interne - jaune graphiques sur la carte, dans le journal et l'ordinateur Il n'y a pas de différences significatives.

L'organisation, réglemente dans les instructions de travail de bureau:

L'emplacement des détails sur la carte;

Enregistrement des zones;

La procédure d'utilisation du côté circulation de la carte;

La composition de détails supplémentaires (définit l'organisation);

Le nombre de copies de cartes remplies (est déterminée par le nombre de références, de contrôle et de contrôle et de cartes de référence ayant des bureaux et des unités structurelles).

Fichier de la carte de référence

La carte de référence est composée de 2 parties et contient:

Cartes pour documents non remplis, incl. dirigé vers des unités structurelles pour la familiarisation et l'étude;

Cartes pour des documents exécutés.

Le fichier de documents non remplis comprend les groupes de cartes suivants:

Sur les documents reçus;

Sur les documents systématisés par des correspondants;

Sur les documents d'utilisation nationaux regroupés par des divisions structurelles, des gestionnaires, des spécialistes;

Pour les documents, date de réception uni.

Une partie des fichiers de cartes pour les documents exécutés est formée conformément au schéma de la nomenclature des cas ou dans la direction des activités de l'organisation. À l'intérieur des partitions des cartes sont placées sur les dates de réception. Le département informatif du fichier de carte d'information pour les offres exécutées, les applications, les plaintes sont construits selon l'alphabet des noms des candidats.

Travailler avec les fichiers de cartes suggère:

Arrivée en temps opportun de cartes sur des documents nouvellement enregistrés;

Exécution régulière des fichiers de cartes;

Introduction dans la carte d'informations supplémentaires (résolutions, marques sur le transfert de spécialistes, exécution, etc.);

Amendements aux enregistrements;

Réorganiser les cartes d'une section du fichier de carte à une autre.

Avec la bonne référence de fichier de carte et recherche de travail Il est effectué rapidement et efficacement.

Toutes les nouvelles fonctionnalités de travail avec des documents électroniques sont implémentées dans les systèmes ci-dessus. Malgré leur nomination différente, ils travaillent avec des documents et effectuent toutes les opérations nécessaires conformément à la documentation réglementaire, sur la base desquelles sont créées. Bonne organisation La gestion des documents dans la société vous permet de mettre en œuvre ces systèmes avec un coût minimal. En conséquence, l'ensemble de la documentation réglementaire et actuelle, la procédure de circulation des documents reste inchangée. En outre, il est possible d'inclure de nouveaux types de documents dans le système de gestion de documents, qui n'avaient pas encore trouvé leur place dans la nomenclature des cas. Besoin d'envisager de nouveaux types de documents que courriels, cinéma-- et matériel photo, documents numérisés, catalogues électroniques, sites de partenaires et clients, enregistrements de chats, livres électroniques Et autre informations électroniques. Cela entraîne une augmentation du volume de la gestion des documents, augmentant espace disque et réduire la vitesse de traitement de l'information. Tous ces inconvénients sont objectifs, mais ils ne causeront pas de difficultés dans les travaux de la société, si la nomenclature des cas est compétente, les types de documents, leurs détails et leurs attributs sont approuvés, l'heure de stockage a été établie. Cela doit être fait pour une autre raison. De nouvelles fonctionnalités obtiennent rapidement des informations complètes, la documentation de traitement de groupe, à l'aide d'une base de données comme source de création d'un document et d'autres fonctionnalités seront réduites à zéro sans ces travaux. Le résultat peut être encore pire si vous ne le faites pas. L'augmentation des flux d'informations sous la forme de documents apportés au système sans détails et attributs conduira dans le temps à la situation du chaos complet. La recherche dans les informations de base de données sans détails et attributs devient un art disponible pour un peu. Jusqu'à présent, tous les espoirs de réduction de la documentation papier à l'aide de techniques de calcul étaient stériles. Ceci est un résultat logique de stocker des documents dans structure de fichiers système opérateur. En fait, tous les documents électroniques stockés dans système opérateurne sont pas; Il s'agit d'un bouquet de brouillons préparés pour l'impression et, étant donné que la vitesse de préparation des courants d'air pour l'impression est accrue à l'aide de la copie, de la numérisation, de l'utilisation de modèles et de partage de réseau, le papier est maintenant passé dix fois plus. Les systèmes modernes vous permettent de modifier considérablement la situation. Tous les originaux sont stockés dans le système protégé par les droits d'accès, signature numérique et la procédure de changement et des copies sont affichées sur l'impression uniquement en cas de besoin extrême. Il est particulièrement nécessaire de noter les nouvelles fonctionnalités non seulement pour rechercher rapidement le document nécessaire, mais également une analyse des informations entrantes. Possibilités de contrôler l'exécution des commandes effectuées dans les commandes, les ordonnances et les réunions, la notification automatique de toutes les parties intéressées sur la période à venir d'exécution ou le début de la réunion. Les détails et les attributs des documents vous permettent de faire du travail, auparavant impossible en raison d'un grand nombre de documents et d'informations. Tout cela permet de préparer une information supérieure à prendre une décision et de soumettre des documents tels qu'ils sont reçus. La gestion de documents utilisant des attributs vous permet de trier et de regrouper des documents en fonction du degré d'importance, de matières, de divisions. Il est toujours possible de voir le statut du document sur les étapes de sa préparation et de prendre la décision sur l'allocation des ressources. Le rôle du secrétaire et de l'enregistreur acquiert les éléments de la créativité, les tâches définies avant de pouvoir être résolues dans le système. différentes façonsEt le résultat peut dépasser l'attente. Les caractéristiques d'analyse sont très vastes, elles peuvent servir les intérêts et les besoins de tous les employés de votre entreprise. Le système de gestion du cycle de vie du produit est construit pour la gestion des documents techniques, mais ses possibilités d'intérêt ferment les besoins de la gestion ordinaire des documents. Cela vous permet de collecter une documentation interne entière. Pour garder les affaires dans la société, cela est très important en termes de réduction du coût du contenu des archives. Le concept d'un espace d'information unique n'a pas été immédiatement développé. Tout a commencé avec l'introduction de la gestion des processus. Lorsque la tâche consistant à assurer le processus de la commande à des produits est définie, tout retard sur ce chemin apporte des pertes. De la nécessité de fournir les processus de base et auxiliaires de l'entreprise et des exigences d'un espace d'information unique et que le système de gestion des entreprises a commencé à être déterminé. Le principe principal: les informations doivent être fiables et pertinentes. Les informations doivent être nécessaires et suffisantes. Les informations ne doivent pas être dupliquées. Si vous avez mis en œuvre ou déjà mis en œuvre systèmes d'informationLa connaissance des bases d'un espace d'information unique permettra de sauvegarder votre système de santé et de votre système nerveux. Pensez à ce que fonctionnent ces principes. Avec l'exactitude de l'information, il semble qu'il ne devrait pas y avoir de problèmes, mais en fait, ils sont. L'alphabet russe et anglais a de nombreuses lettres du même design. Si vous confondez les lettres lorsque vous travaillez, il est très difficile de détecter une telle erreur et que le système recherche une erreur de nouveau mot et que vous perdez les informations nécessaires ou la dupliquer. Il est très important d'utiliser des matériaux fiables lorsque vous entrez dans les nouveaux enregistrements du système et la précision doit être vérifiée avant d'entrer dans les données. Au fil du temps, les informations perdent la pertinence, il est nécessaire de surveiller sa condition, de maintenir la pertinence et la précision. Par exemple, les attributs "priorité" et "importance" nécessitent une attention constante. Les accessoires «Nom» ne changent pas et ne nécessitent pas d'attention. Le besoin et la suffisance est également un principe très important. Si vous remplissez le système de documents, le besoin est douteux, puis surcharger le système «ordures». D'autre part, des informations devraient suffire aux travaux de la société. Pour réussir au travail, il est nécessaire de vérifier le besoin et la suffisance. Cela créera éventuellement une excellente archive comme une propriété intellectuelle de la société. Évitez la duplication des informations plus difficiles. Pour ce faire, dans le système lui-même, il doit exister une protection contre la duplication, mais également les employés doivent comprendre leur responsabilité. Tout d'abord, toutes les informations réglementaires utilisées par la société ne doivent pas avoir un double. Les canetons conduisent à des erreurs graves lors de la modification. Situation standard: un corrigé, un autre oublié et sur le troisième ne savait pas qu'il existe. Si le travail est construit de manière à créer un travail en double, restructurez-vous. Si vous choisissez dans les informations entrées précédemment, vérifiez si c'est le seul? Lorsqu'un double est détecté, vous devez les bloquer ou les supprimer. DANS systèmes modernes Il y a une protection, mais cela ne fonctionne pas si le double est injecté avec une erreur, et c'est très dangereux à l'avenir. Vous devez distinguer un document en double et un lien en double vers le document. Le premier conduit à une augmentation de l'espace disque occupé, la seconde aide dans le système à organiser lieu de travail. Les liens vers le document dans le système peuvent être beaucoup, mais ils indiquent tous un document. Vous conduisez un changement de document et tous ceux qui ouvrent le document sur leur lien verront vos modifications. L'espace d'information est uniforme si tous les employés de l'entreprise utilisent des informations uniformes, une archive unique de documentation, un cadre réglementaire unique. Mais ce peu, ces données doivent utiliser d'autres programmes de votre entreprise. Ne pas autoriser la duplication. La question se pose: pourquoi, avec toutes les preuves du bénéfice de nouvelles opportunités, est si difficile d'introduire de nouvelles technologies? C'est des raisons naturelles. Pendant de nombreuses années, nous avons des méthodes de gestion des importations pendant de nombreuses années, mais seulement à présent, ils commencent à être utilisés dans la pratique. La technique et les programmes ont immédiatement commencé à être utilisés dans la production, avant l'introduction de nouvelles méthodes. Le résultat est de 80% des échecs lors de la mise en œuvre. Mais les tentatives de création d'un espace d'information unique se poursuivent. Il est maintenant considéré comme un avantage concurrentiel interne. Il réside dans la vitesse de transmission de documents, dans leur fiabilité, en augmentant le volume de traitement pendant le même temps et les mêmes employés, dans la possibilité d'analyser et d'élaborer des prévisions. La vitesse et la qualité du traitement de l'information sont devenues une marchandise. À l'avenir, ces systèmes existeront partout.

3. Autres sources pour la construction d'IPS

La nomenclature des affaires inclut tous les IP aux documents et aux publications. Documents Selon la nécessité de la production et le degré de limitation d'accès est autorisé à regrouper séparément ou avec d'autres documents sur le même problème.

Dans les cas où un grand nombre d'un seul et des mêmes types de documents et d'affaires (commandes, instructions, rapports, etc.) sont formés dans l'organisation (commandes, instructions, rapports, etc.) avec une vautour de restrictions d'accès et sans cela Griff, il est conseillé de prévoir leur formation distincte dans des cas. Dans le même temps, dans le cas de l'indice de cas, la marque spécifiée sur la restriction de l'accès est ajoutée au numéro de cas.

Lorsque vous allumez le document d'accès limité à l'affaire avec des documents non comptables qui n'ont pas de grille similaire, cette affaire reçoit une marque de limitation d'accès et la clarification appropriée est apportée à la nomenclature de l'organisation (agences). L'établissement d'un cas peut être fourni. Par exemple: "Documents" à usage officiel ", la durée de conservation de l'un de ces cas n'est pas établie. Et dans le graphique approprié de la nomenclature des cas, la marque "EK" (commission d'experts) est apposée. À la fin de l'année de travail de bureau, le cas d'accès limité est considéré par la Commission d'experts de l'Organisation (institution) Pols et, si nécessaire, il est décidé de se regrouper de documents. Les documents contenus dans les documents de cas sont regroupés dans un cas séparé, ce qui reçoit un titre indépendant et s'allume en outre à la nomenclature des cas. Si les documents ne sont inclus que par temps de stockage temporaire, il peut ne pas être réorganisé. La durée de conservation de cette affaire est définie sur les échéances maximales contenues. En affaires avec des documents de travail de bureau ouvert. Dans laquelle, en tant que matériaux accumulant, les informations de distribution limitée sont axées sur une catégorie similaire. Sur les couvertures de ces cas sont également apposées sur l'accès des restrictions d'accès. Les clarifications pertinentes sont entrées dans la nomenclature des cas.

Chaque cas inclus dans la nomenclature doit avoir un index. L'indice de cas consiste en un indice d'une unité structurelle (selon le classificateur de divisions structurelles) et le nombre ordinal de l'affaire dans la distribution. En présence de plusieurs volumes (pièces), l'index est apposé sur chaque volume avec l'addition de "T. 1 "," T. 2 ", etc. La nomenclature des cas dans l'organisation est basée sur des normes établies, est imprimée dans la quantité requise d'instances. La première instance de l'article de l'organisation est stockée dans la gestion du support de la documentation de la gestion (DOU), la seconde est utilisée au service du DOW en tant que travailleur, le troisième est utilisé dans les archives ministérielles, avec lesquelles la nomenclature des cas et où les documents arrivent au stockage continu. La nomenclature est établie et est convenu dans le cas des changements fondamentaux des fonctions et de la structure de l'organisation, mais au moins une fois tous les cinq ans. Cela précise annuellement, approuvé par la gestion de l'organisation et est en vigueur à compter du 1er janvier prochain. Au cours de l'année, des informations sur la création de cas sont apportées à la nomenclature approuvée des cas, à l'inclusion de nouveaux cas, etc. À la fin de l'année, les informations finales sur les catégories et le nombre de cas de cas sont faites. L'enregistrement final des activités de l'organisation de l'Organisation est établi sur la base des enregistrements finaux de la nomenclature des unités structurelles. Les organisations sont soumises à la conception de leur institution et à la fin de l'année. La conception des cas comprend un complexe de travail sur leur traitement technique et est effectué par le personnel des divisions structurelles pertinentes dans l'assistance méthodologique et sous le contrôle des archives ministérielles. Les documents correctement exécutés dans les affaires aideront à créer une bonne zone de fondation archivistique, Edge, région. Dans certaines régions, les lois sur le fonds d'archives sont publiées. En fonction de la durée de stockage, la décoration complète ou partielle des cas est effectuée. Les cas de stockage permanent, de stockage à long terme et de composition personnelle sont soumis à une conception complète, qui prévoit un liant ou une liaison de l'affaire, la numérotation des feuilles dans le cas, la préparation d'une feuille - le témoin de l'affaire, le dessin Dans les cas nécessaires aux problèmes internes des documents, des détails de la conception de la couverture de cas. Entreprise temporaire (jusqu'à 10 ans compris) Le stockage ne sont pas moelleux, les feuilles ne leur sont pas numérotées, les documents d'entre eux sont stockés dans des dossiers. La couverture du stockage permanent et à long terme est émise en fonction de la forme établie. À la fin de l'année dans les inscriptions sur les couvertures des affaires de stockage et de stockage à long terme, des clarifications sont effectuées: la conformité des en-têtes de cas sur la couverture du contenu des documents semés est vérifiée, dans les cas nécessaires, Des informations supplémentaires sont effectuées dans l'en-tête de cas (nombre de commandes, de protocoles, de types et de formes de reporting sont apposées. ). La date à laquelle la couverture doit correspondre à l'année de l'institution et à la fin de l'affaire. Dans une affaire contenant des documents pour des années antérieures à la formation de la formation, un enregistrement est effectué à la date: "Il y a des documents de l'au-delà". Sur les couvertures des cas composés de plusieurs volumes (pièces), les dates extrêmes des documents de chaque volume (partie) sont apposées. Avec la désignation de la date de calendrier exacte, le nombre, le mois et l'année, ou l'année, le mois et le nombre sont indiqués. Le nombre et l'année sont désignés par des chiffres arabes, le nom du mois est écrit par des mots. Avec la désignation de l'obligation de calendrier, une écriture numérique abrégée est autorisée, s'il s'agit de l'ambiguïté de l'interprétation de la date. Sur la couverture peut être apposée par un crayon d'accord avec les archives départementales de la question de l'article sur les options, le numéro de l'inventaire et la fondation.

Lors de la modification du nom de l'organisation (son unité structurelle) au cours de la période couverte par les documents, ou lors du transfert d'un cas à une autre organisation (unité structurelle), le nouveau nom de cette organisation (unité structurelle) est ajouté à la couverture. Les inscriptions sur les couvertures de boîtiers de stockage constants et à long terme doivent être clairement notés à l'encre ou à l'encre résistante à la lumière noire. Les cas complétés de stockage permanent, à long terme et de cas de personnel, qui ont adopté l'expertise des valeurs et de la conception conformément aux exigences susmentionnées, les stocks sont compilés annuellement. Les problèmes d'inventaire ne sont pas compilés. Les affaires des unités structurelles constituent des employés responsables de la documentation, sous la direction méthodologique directe des archives ministérielles. Les compositions sont compilées séparément sur les affaires de stockage constant, sur des cas de stockage à long terme, sur le personnel et d'autres cas similaires (rapports scientifiques sur les thèmes, les cas judiciaires et d'enquête, les offres de rationalisation, etc.).

Dans les organisations avec une grande quantité de documents pour chaque division structurelle, les problèmes d'inventaire sont compilés chaque année par chaque subdivision en vertu de la directive méthodologique directe des archives départementales. Les OPs préparés par des unités structurelles servent de base à la préparation de l'inventaire consolidé de l'organisation, que les archives ministérielles se préparent et sur lesquelles il paient des cas pour le stockage de l'État. Dans les organisations ayant une petite quantité de questions formées annuelles, elle est autorisée inclure dans un inventaire des affaires depuis plusieurs années. Les affaires personnelles (actes personnelles) peuvent être élaborées pendant plusieurs années avec une numérotation solide. Les défauts sont compilés par la forme montée en deux ou trois copies. Lors du transfert de cas d'une unité structurelle à une archive ministérielle sur toutes les instances d'OBIA contre chaque cas, un marqueur est fait sur la disponibilité de l'affaire. À la fin de chaque instance, l'inventaire indique des nombres et des mots, le nombre de cas réellement transmis (acceptés) est apposé par les signatures des employés engagés dans la réception de nombres, la date est indiquée. Lorsque vous transférez des cas particulièrement précieux, le nombre de feuilles dans les cas est vérifié.

En collaboration avec les affaires des unités structurelles, les cartes d'enregistrement sont transférées vers les archives ministérielles aux documents, les journaux d'enregistrement et d'autres formulaires d'inscription, qui sont inclus dans l'inventaire comme des unités de stockage distinctes.

Cartes de référence, informations de recherche d'informations sur les supports de la machine.

Les cartes de référence sont formées à partir d'enregistrement et de cartes de contrôle en fonction des tâches d'IPS spécifiques conformément aux classificateurs utilisés. Les cartes suivantes sont établies: référence, contrôle et référence; fichiers de cartes sur des suggestions, des déclarations et des plaintes de citoyens; Dossiers thématiques (codification) des normes, des commandes, des décisions, des décisions, etc. des informations sur les informations automatisées d'IPS sont formées en fonction des informations sur les documents enregistrés sur les médias de la machine.

4. Technologies IPS

La base de la construction de l'IPS est la classification des documents et des informations de document et les divers annuaires de classification développés à sa base (classificateurs). Afin de saisir des enregistrements d'enregistrement dans le système de recherche de formation, les classificateurs sont le plus souvent développés et utilisés pour entrer rapidement sur la valeur de ces indicateurs et assurer leur interprétation sans ambiguïté.

Ceux-ci incluent les classificateurs suivants:

Classificateur pour types de documents qui affiche les types de documents utilisés dans l'organisation, à la fois créés et obtenus. Ce classificateur est utilisé lors de la remplacement de tels accessoires de RCC en tant que "Nom du document". Les noms des types de documents doivent correspondre à la terminologie utilisée dans le classificateur All-Russian de la documentation de la gestion (OKUD), dans le GSDOU et les documents réglementaires sectoriels. Basé sur ce classificateur, diverses listes sont en cours de développement dans l'organisation: "Une liste de documents indiquant le moment de l'exécution"; "Liste des documents non soumis à l'enregistrement"; "Documents tabel de l'organisation et de ses divisions structurelles"; "La liste des cas indiquant l'heure de stockage"; et etc.

Les correspondants de classificificateur comprennent une liste de noms d'organisations, d'institutions, d'entreprises et d'autres correspondants permanents (entreprises, personnes), avec laquelle l'organisation est reliée par la nature de ses activités. Ce classificateur est basé sur l'application du classificateur All-russe des entreprises et des organisations (OKPO). Avec l'aide du classificateur de correspondants, les accessoires de l'auteur de la RSC (correspondant) »est rempli.

Le classificateur des activités de l'organisation comprend une liste de problèmes des activités de l'organisation avec leur corrélation au niveau de compétence, c'est-à-dire La répartition des responsabilités adoptée dans l'organisation en compte également. Utilisation de ce classificateur, les accessoires de l'en-tête de document RSC ou du contenu court »sont remplis. Ce classificateur est également utilisé dans l'examen préliminaire des documents lors de la détermination de la route du document.

Le classificateur des divisions structurelles de l'Organisation est élaboré sur la base de documents organisationnels: la Charte (provisions) de l'Organisation, Structure approuvée et dotation en personnel, réglementation sur les unités structurelles. Souvent, l'industrie peut avoir un document définissant une structure typique pour un groupe d'organisations homogènes (écoles, universités, gestion de la protection sociale, centres d'assistance sociale). Le classificateur des divisions structurelles du premier indique toujours la gestion du support de la documentation de gestion, puis des unités structurelles dans l'ordre dans lequel elles sont données dans la structure approuvée sont données. Les index de l'unité structurelle sont utilisés lors de l'attribution d'un numéro d'enregistrement et de remplir de tels indicateurs de la RSC en tant que «nombre et date du document» (pour les documents nationaux et sortants), «nombre et date de réception du document» (pour les documents entrants).

Le classificateur d'unités structurelles est utilisé pour remplir de tels accessoires de RSC comme "résolution".

Ordinateurs interprètes. En règle générale, les noms des chefs adjoints, gestionnaires de parts structurelles responsables de l'exécution de documents, qui sont répertoriés dans la même séquence que dans le classificateur d'unités structurelles.

Conclusion

Pour obtenir une compatibilité des informations des tableaux de recherche de l'industrie, le développement centralisé des classificateurs est requis: une nomenclature typique des cas, classificateur de correspondants, classificateur d'unités structurelles (en présence de structures typiques), classificateur d'espèces de documents, aspects de classificateur de l'organisation, classificateur de problèmes contenus dans des phrases, des applications et des plaintes citoyens et d'autres poids des IP bien gouvernés ont imposé un flux de documents efficace. Les IP ne sont pas séparés par un système de gestion de documents. DANS monde moderne Le rôle des moteurs d'information et de recherche est plus en demande. Bien sûr, l'âge des technologies électroniques, la tâche de rechercher des documents peut être facilement simplifiée si vous l'automatisez. Cette tâche a été remplie ou rempli toutes les grandes organisations du flux de documents, qui est simplement une recherche très grande et efficace facilite considérablement le travail et économise du temps. Dans ce cours, un exemple de l'œuvre de l'IPA dans l'organisation a été donnée. Sa composition et ses étapes de travail.

Liste bibliographique

1) GOST R 7.08-2013 "Règles de personnalisation en FOIV". M., 2013.

2) Secrétariat du magazine. M., n ° 4.2010.

3) Le site officiel de consultat.ru [ressource électronique] // www.consultant.ru/document/cons_doc_law_58191/?frame\u003d4 (_Date: 10/28/2014).

4) Site officiel de l'Institut de recherche en All-Russie de la documentation et archivé [Resource électronique] // URL: http: // www.vniidad.ru (date d'appel: 10/29/2014).

5) Travaux de bureau du magazine. M., № 8. 20010

6) Archives d'articles [Ressource électronique] // URL: http: // prosekritariatariat (date de manipulation: 10/29/2014).

7) Travail de bureau du magazine. M., № 4.2009

8) Travaux de bureau du magazine. M., № 8.2012

9) Travaux de bureau du magazine. M., № 3.2013

Posté sur allbest.ru.

Documents similaires

    Principes de base pour la construction d'informations et de moteurs de recherche. Architecture de l'information moderne Recherche systèmes www. Principe de fonctionnement des moteurs de recherche. Processus de recherche langue d'information, traduction, descripteur, critère de conformité, indexation.

    cours, ajouté 10.06.2014

    Concept, structure et classification des systèmes d'information. Moteurs de recherche d'informations. Contexte historique de développer des moteurs de recherche. Le concept de moteurs de recherche. Caractéristiques du moteur de recherche: structure de réseau, structure de travail du moteur de recherche.

    cours, ajouté 03/28/2005

    Le concept d'informations et de moteurs de recherche. L'histoire du réseau Internet. Les principaux algorithmes du travail des informations de vocabulaire modernes et des moteurs de recherche. Recherche rapide dans la base de données et la réponse rapide du système. Classement des résultats de la recherche.

    course, ajouté 01.06.2012

    Composants de l'information documentaire et du système de recherche. Résultats des documents d'indexation et des demandes. Schémas de classification hiérarchique, façade et empirique. Informations sur les descripteur et rechercher des langues. Exemples d'un article de descripteur.

    présentation, ajoutée 14.10.2013

    Analyse des moteurs de recherche existants et des algorithmes de recherche de documents utilisés par eux. Développement d'un système d'information de type vocabulaire capable de réaliser recherche pertinente Documents, caractéristiques de sa structure et de sa base de recherche d'informations.

    thèse, ajoutée 19.05.2011

    Méthodes d'utilisation de technologies éducatives d'information. Structure de la base de données logique (base de données) et fonctions de recherche d'informations. Mise en œuvre du programme de la base de données, des vues des tables et des fonctions d'information et de recherche. Composition du logiciel.

    travaux de cours, ajouté le 05/16/2013

    Le concept d'informations et de moteurs de recherche, de leur essence et de leurs caractéristiques, l'histoire de l'émergence et du développement, rôle à l'étape actuelle. Organisation interne et éléments de moteur de recherche. Principe de fonctionnement du moteur de recherche Rambler, une demande de traitement du pillage.

    travail scientifique, ajouté le 01/01/2009

    Description et classification des moteurs d'information et de recherche modernes. Documents hypertextes. Vue d'ensemble et évaluations des principaux moteurs de recherche mondiaux. Développement d'un système de récupération d'informations démontrant le mécanisme de recherche d'informations sur Internet.

    thèse, ajoutée le 06/16/2015

    Caractéristiques des méthodes de recherche d'informations sur Internet, nommément utilisant des liens hypertextes, des moteurs de recherche et des moyens spéciaux. Analyse des nouvelles ressources Internet. L'histoire de l'émergence et description des moteurs de recherche parlées et russophones.

    résumé, ajouté 12.05.2010

    L'enregistrement des documents comme l'un des types de documentation prend en charge les activités de l'organisation. Formes d'automatisation de l'enregistrement de documents. Fonctions des systèmes d'automatisation de la gestion des travaux de bureau et des documents.

Informatique, cybernétique et programmation

Informatique Rechercher des informations Rechercher des types de concepts de base et des formulaires d'organisation Rechercher des informations ou des informations de la recherche représente l'un des principaux. processus d'information. Les objectifs de la possibilité et de la nature de la recherche dépendaient également de la disponibilité d'informations d'information et d'accessibilité et les installations de recherche. Le but de toute recherche est la nécessité de trouver le besoin ou de la volonté de trouver divers types d'informations qui contribuent à la réception par la personne qui doit rechercher la connaissance des connaissances et T. C'est ...


Ainsi que d'autres œuvres qui peuvent vous intéresser

17198. Remarques sur la littérature athée des dernières années 69 Ko.
Remarques sur la littérature transitative des dernières années. Une familiarisation attentionnée avec une très nombreuses littérature anti-religieuse m'a conduit aux conclusions suivantes: 1. Cette littérature étonne principalement avec son incroyable retard. On peut l'trouver dedans ...
17199. À propos du baptême des enfants 41 Ko.
À propos du baptême des enfants qui est écrit dans la Sainte Écriture du baptême, voyons les endroits principaux. 1 MF.28: 1920 Enseignant tous les peuples du Kreat d'eux au nom du Père et du Saint-Esprit et le Saint-Esprit leur apprend à observer tout ce que je t'ai commandé; et être avec vous à Skonchani
17200. Internet orthodoxe en Russie 114 Ko.
Internet orthodoxe en Russie Contenu: Que fera l'orthodoxe Internet Moscou du 7 septembre Métaphrasis la première conférence dédiée aux perspectives de développement des ressources orthodoxes en russe dans les ordinateurs mondiaux ...
17201. Orthodoxie dans les nouvelles sociétés pluralistes 37,5 KB.
proopresswiter Thoma Hopko Recteur du séminaire spirituel de Saint-Vladimir L'orthodoxie de New York dans les nouvelles sociétés pluralistes sur la consultation de la préparation intermédiaire sur la mission mondiale et l'évangélisation Addis Abeba Janvier 1996. Traduction avec un
17202. Étudier des méthodes et des schémas de stockage de maïs 272,5 KB.
Considérer les particularités biologiques botaniques du maïs; Explorez les types de stockage utilisés pour le stockage de maïs; Analyser les aspects du soutien au microclimat lors de la conservation de la culture; considérer les équipements de stockage de base; Conduisez les calculs de la capacité de stockage et du taux de perte pendant le stockage.
17203. Développement d'un système de visualisation scientifique 407,5 kb.
Le papier décrit la mise en œuvre système spécialisé Solutions de visualisation de jeu différentiel. Dans le même temps, l'unification de ce programme est envisagée. Le programme implémente un schéma qui vous permet de former des multiperces des objets
17204. Premiers secours pour les fractures, les brûlures, le choc, les chocs légers et électriques 80,5 kb.
Dans le saignement artériel sur la jambe inférieure, l'artère glacée est pressée. Appuyez sur les deux mains. Dans le même temps, les pouces sont placées sur la surface avant de l'articulation du genou et le reste des doigts est gâché par l'artère dans le montant breveté et l'appuya sur l'os.
17205. Postclaxif-kearbing zogiga. Robot іz boules de vecteur 2,66 Mo.
Robot de laboratoire numéro 5. Postclaxif-kearbing zogiga. Robot II avec boules de vecteur dans le laboratoire Dani Robot Robot Robot із Clasifіkikovy Zobotnia і ї Pozrikka peint Ta Ekport en format vectoriel. Testuvanya Prelnosti Clasifіkatsі ...
17206. Les bases de l'analysement de g_persptrast strigogray. Robot іz biblіotekami spectral 1,06 Mo.
Robot de laboratoire numéro 6. Les bases de l'analysement de g_persptrast strigogray. Robot IZ Spectral Biblіoteki Bripliny Sobrechennikovі Sobrechennya Murge Wickering Regardant pour Vannaya Gorey Dourorthle Millenv Vosіv Roslin, etc. Shah sera confronté au territoire soviétique. Pour Cube ...

FGBOU VPO "Institut d'État arctique des arts et de la culture"

Faculté d'information, technologies de la bibliothèque et gestion culturelle

Département de l'informatique

Moteurs d'infaturation et de recherche

Travail de cours

au tarif "informatique"

Perché Sichkin Anastasia Aleksandrovna, étudiant de 2e année

Spécialité: 071201 "Activité" Libre-Information "

Scientifique: Leverieva ov, préparation.

Yakutsk

introduction

Chapitre 1. Informations et moteurs de recherche

1 concept de systèmes de récupération d'informations

2 Histoire du développement de l'IPS

3 Structure des IPS

4 types d'IPS

Chapitre 2. Systèmes de recherche d'informations modernes

1 secteurs de l'utilisation des IP modernes

2 architecture des IP modernes

3 IPS populaires

Conclusion


introduction

Pertinence. La phase moderne du développement de la civilisation se caractérise par la transition de la partie la plus développée de l'humanité de société industrielle À l'information. L'émergence et le développement du réseau informatique mondial de l'information sont l'un des phénomènes les plus vivants de ce processus.

Le problème de la recherche et de la collecte d'informations est l'un des problèmes les plus importants des moteurs de recherche d'informations. Bien sûr, il est impossible de comparer à cet égard, disons, au Moyen Âge, lorsque la recherche d'informations était un problème, car cette information n'était pas suffisante et que les efforts n'étaient pas obligés de trouver quoi que ce soit sur une question plus ou moins significative. Ainsi, au début, il était possible d'aller à la bibliothèque et de passer du temps à choisir parmi le livre souhaité sur le catalogue, trouvez les informations nécessaires. Mais les catalogues ne résolvent pas les problèmes de recherche d'informations même dans la même bibliothèque, car l'entrée de catalogue inclut relativement peu d'informations: le titre, l'auteur, le lieu de publication. Le problème de la recherche d'informations a gagné un nouveau caractère au XXe siècle, au début du développement des technologies de l'information. Maintenant, il ne réside pas dans le fait qu'il y a peu d'informations et qu'il est donc difficile de le trouver, mais qu'il est de plus en plus de plus en plus, et de trouver une réponse à la question d'intérêt peut également être une tâche assez difficile. . Le problème de la recherche d'informations est significativement compliqué lors de l'utilisation de sources virtuelles. Voici la technologie des annuaires en ligne, à la suite de l'application de laquelle l'utilisateur a la capacité de rechercher dans des répertoires de plusieurs bibliothèques à la fois, que, en fait, complique encore la tâche, mais d'autre part, augmente les chances de la résoudre.

À l'étape actuelle, tout l'espace d'information dans lequel nous vivons est de plus en plus immergé sur Internet. Internet devient la principale forme d'information, sans annuler traditionnel, tels que des magazines, une radio, une télévision, un téléphone, toutes sortes de services de référence.

Le but de l'étude est d'étudier des informations automatisées et des moteurs de recherche.

Le défi dans ce travail est pris en compte. base théorique Recherche automatisée d'informations, classification et variétés de moteurs de recherche d'informations. Le matériau est également analysé par les informations actuellement utilisées - catalogues de recherche Moteurs de recherche en texte intégral et hypertexte.

Si Internet apparaît, le problème de recherche devient plus pertinent. Internet - monde réseau informatique, représentant un environnement d'information unique et vous permet d'obtenir des informations à tout moment. Mais d'autre part, beaucoup est stocké sur Internet informations utilesMais pour rechercher, il est nécessaire de passer beaucoup de temps. Ce problème a servi de raison pour que l'apparition des moteurs de recherche. Dans ce cours, les travaux envisageront des moteurs de recherche sur Internet.

Chapitre 1. Informations et moteurs de recherche

1 Le concept de moteurs de recherche d'informations

Recherchez des informations est la tâche que l'humanité est déjà résolue par de nombreux siècles. Comme le volume augmente ressources d'information, potentiellement accessible à une personne (par exemple, un visiteur de la bibliothèque), ont été produits de plus en plus sophistiqués et parfaits la recherche atteint et des techniques qui vous permettent de trouver le document nécessaire.

Moteur de recherche automatisé - un système composé de personnel et un ensemble de moyens d'automatisation de ses activités qui mettent en œuvre la technologie de l'information fonctions installées.

L'expérience et la pratique de la création de systèmes dans divers domaines d'activité vous permettent de donner une définition plus large et universelle, qui reflète pleinement tous les aspects de leur essence.

Le système de recherche d'informations est un système qui fournit la sélection et la sélection des données nécessaires dans une base de données spéciale avec des descriptions des sources d'informations (index) en fonction des informations et des règles de recherche associées.

La tâche principale de tout IPA est de rechercher des informations par les besoins d'informations pertinents de l'utilisateur. Il est très important du fait que la recherche ne contenait rien à perdre, c'est-à-dire de trouver tous les documents liés à la demande et de ne pas trouver quoi que ce soit superflu. Par conséquent, la caractéristique qualitative de la procédure de recherche est introduite - pertinence.

La pertinence est la conformité des résultats de la recherche à la requête formulée.

Ensuite, nous considérons principalement les IP pour internet (Internet). Les principaux indicateurs de l'IPS pour www sont une échelle spatiale et une spécialisation. Sur l'échelle spatiale de l'IPS peut être divisée en local, global, régional et spécialisé. Les moteurs de recherche locaux peuvent être conçus pour rechercher rapidement des pages sur une échelle de serveur distincte. Les IPS régionales décrivent les ressources d'information d'une région particulière, par exemple des pages russophones sur Internet. Les moteurs de recherche globaux contrairement à la recherche locale de discuter immenses - si possible, la plupart ont décrit les ressources de l'ensemble de l'espace d'information d'Internet.

2 Histoire du développement de l'IPS

Passons à l'historique du réseau Internet, créé en relation avec la nécessité de partager les ressources d'informations distribuées entre divers systèmes informatiques. La plupart des premières applications, y compris FTP et e-mail, ont été conçues exclusivement pour échanger des données entre les hôtes Internet.

D'autres applications telles que Telnet ont été créées pour s'assurer que l'utilisateur a la capacité d'accéder non seulement aux informations, mais également aux ressources de travail du système distant. En tant que développement Internet (augmentation des utilisateurs et des ordinateurs hôtes), les anciennes méthodes d'échange de données ont cessé de répondre aux besoins accrus des utilisateurs. Il était nécessaire de développer de nouvelles façons de rechercher des ressources réseau et d'y accéder, ce qui permettrait d'utiliser des informations quel que soit son format et son emplacement.

Pour répondre à ces besoins, le moteur de recherche d'Archie a été créé pour la première fois, tâche décisive La localisation des ressources sur le serveur FTP et le système gopher qui simplifie l'accès à divers ressources réseau. Le monde de l'information du réseau a ensuite été développé Toile large. et WAIS proposant des méthodes absolument nouvelles pour obtenir des informations. Les principes de fonctionnement de ces systèmes facilitent la navigation dans un grand nombre de ressources d'information sans la nécessité de fournir des mécanismes d'exploitation d'Internet. Cette approche vous permet de ne parler aucun simple sur les ressources d'interdre systèmes informatiques, mais sur des espaces d'information spéciaux du réseau.

L'archie est un complexe logicielTravailler avec des bases de données spéciales. Ces bases de données contiennent constamment reconstituer des informations de fichier auxquelles vous pouvez accéder via le service FTP. En utilisant les services du système Archie, vous pouvez rechercher un fichier par le modèle de son nom. Dans le même temps, l'utilisateur recevra une liste de fichiers avec une indication précise de leur stockage de lieu sur le réseau, ainsi que des informations sur le type, la durée de création et la taille des fichiers. L'accès au système d'informations et de recherche archie peut être effectué de différentes manières, allant des demandes de e-mail Et utiliser le service Telnet et se terminer par des clients graphiques Archie.

Le système Gopher a été conçu pour simplifier le processus de localisation des ressources FTP sur Internet et une vue plus pratique du contenu du fichier stocké sur des serveurs FTP. Le système de gopher permet de fournir aux utilisateurs des fichiers disponibles et de leur contenu disponible sur la forme (sous la forme d'un menu). Le menu Gopher Server peut contenir des liens vers d'autres serveurs Gopher et FTP. Donc, l'utilisateur obtient l'occasion voyage Sur Internet, ne prenez pas l'attention sur l'emplacement de ses ressources et accédez à ces ressources.

Le système Veronica est utilisé pour rechercher des informations dans l'espace Gopher sur les en-têtes d'éléments de menu. Après avoir entré un mot clé, le système Veronica découvre s'il est trouvé dans le menu de n'importe quel serveur Gopher et, en tant que résultats de recherche, il donne une liste des éléments de menu, contenant le mot-clé. Étant donné que le système Veronica n'est pas un programme de recherche autonome et est étroitement lié au système de gopher, il est identique à celui du système Gopher, désavantage: pas toujours l'en-tête peut être dit qu'il représente une ou une autre ressource d'information. Les avantages du système sont qu'il n'est pas nécessaire de déterminer où se trouve les informations trouvées, il suffit de sélectionner l'entrée souhaitée dans la liste.

3 Structure des IPS

La base de la construction de la structure du système d'information et de recherche but fonctionnel, portée et caractéristiques décrites par le domaine.

Le fonctionnel IPS est conçu pour une recherche rapide et pratique et des données d'échantillonnage à partir de grandes distributions d'informations sur des moteurs à pas pour des travaux internes avec des données et une préparation pour divers CAPRS. Cela impose certaines exigences pour la construction d'une interface utilisateur et sur la forme de fourniture d'informations. Lors de la construction d'une structure IPS, la nécessité d'un utilisateur potentiel est également prise en compte pour accéder au système de pointe dépendant du contexte.

La mise en œuvre des exigences ci-dessus est attribuée à la série suivante de composants structurels, appelées blocs:

vérifie la base de données pour l'intégrité;

visualisation;

édition;

mot de passe de protection;

sortie du résultat;

stocker les paramètres de recherche;

Au cœur du choix d'une telle structure du système de récupération d'informations pour les moteurs à pas à pas réside une logique très simple - toute unité du système doit recevoir des données, les traiter et donner à l'utilisateur dans un certain ordre, offrant ainsi la logique du traiter.

Considérez chaque bloc plus en détail (Fig. 1):

L'unité de contrôle de la base de données pour l'intégrité vérifie tous les composants de la base de données.

L'unité de visualisation vous permet de commencer à travailler dans le système en affichant la base de données, puis sélectionnez un autre mode de fonctionnement.

L'unité d'édition n'émet que des champs de base de données numériques et vous permet de modifier les caractéristiques, d'entrer de nouvelles anciennes entrées à la table de base de données. Ici, vous pouvez également déplacer le mode de fonctionnement.

L'unité de protection par mot de passe bloque l'accès aux données d'édition en entrant un mot de passe à six chiffres.

Le bloc de recherche est conçu pour rechercher l'affectation technique entrée (TK) et la transition vers d'autres modes de fonctionnement.

Les résultats de la recherche L'unité de sortie affiche tous les moteurs d'étape trouvés dans un ordre spécifique et leurs caractéristiques conformément à la recherche TK. L'unité de stockage des paramètres de recherche écrit et stocke des informations jusqu'à la prochaine étape de recherche.

Le bloc d'aide effectue le rôle des conseils dans divers modes de fonctionnement du système.

Figure 1. La structure de l'IPS.

Le domaine d'application de l'IPS, comme mentionné ci-dessus, est un travail interne avec des informations et un traitement d'informations pour l'utiliser dans les travaux de la CAO, qui comprend un système IPS comme l'un des modules. De cela, il existe des exigences très élevées pour la fiabilité du système, car toute CAO est une construction assez complexe avec des paramètres de fiabilité spécifiés, et chaque structure incluse dans une telle construction doit avoir une fiabilité d'au moins pas moins que l'ensemble du système en tant que ensemble. S'assurer que les indicateurs de fiabilité nécessaires, à leur tour, sont largement déterminés par la structure de la construction du système. Pour l'organisation de la base de données OPS, une étude complète du sujet est nécessaire. Dans cette IPS domaine C'est une large classe de moteurs à pas.

informations de recherche de l'information ceci

Les moteurs d'information et de recherche (IPS) Internet, avec toute leur diversité externe, tombent également dans l'une de ces classes. Par conséquent, avant de se familiariser avec ces IP, envisagez un abstrait alphabétique (vocabulaire), systématique et désigné IPS. Pour ce faire, nous donnerons la définition de certains termes de la théorie de la recherche d'informations.

Classification Information et systèmes de recherche

La classification IPS utilise une organisation hiérarchique (arborescence) d'informations appelée classificateur. Les sections de classifieur sont appelées rubriques. L'analogue de la bibliothèque de la classification IPS est un répertoire systématique. Le classificateur est développé et amélioré par l'équipe d'auteurs. Ensuite, il utilise une autre équipe de spécialistes appelés systématinants. Systematiseurs, connaissant le classificateur, lire des documents et attribuer des indices de classification indiquant quelles sections du classificateur sont appropriées.

Objet IPS Web Anneaux

La sous-section IPS du point de vue de l'utilisateur est la plus simple. Vous recherchez le nom du sujet souhaité de votre intérêt (le sujet peut être quelque chose d'inopportun, par exemple, de la musique indienne) et que les noms des ressources Internet concernés sont associés au titre. Il serait particulièrement pratique si la liste complète des objets est petite.

Mots ips

Les problèmes culturels associés à l'utilisation de la classification IPS ont conduit à la création d'un type de vocabulaire IPS, avec des moteurs de recherche de nom de langue anglais généralisés. L'idée principale du vocabulaire IPS est de créer un dictionnaire des mots trouvés dans les documents Internet, dans lesquels chaque fois que la liste des documents sera conservée à partir de laquelle ce mot.

La théorie de la recherche d'informations implique deux algorithmes principaux pour le travail de vocabulaire IPS: à l'aide de mots-clés et à l'aide de descripteurs. Dans le premier cas, seuls les mots qui y sont trouvés sont utilisés pour évaluer le contenu du document et sur demande de l'IPA compare les mots de la demande avec les mots du document, déterminant la quantité, l'emplacement, le poids des mots. de la demande dans le document sa pertinence. Tous les IP travaillant pour des raisons historiques utilisent cet algorithme dans diverses modifications.

Lorsque vous travaillez avec des descripteurs, des documents indexés sont transférés à une langue d'information dexciale. La langue d'information artisanale, ainsi que toute autre langue, consiste en un alphabet (symboles), des mots, des moyens d'exprimer des relations paradigmatiques et syntagmatiques entre les mots. Paradigmatics prévoit l'identification de relations lexico-sémantiques cachées dans la langue naturelle entre les concepts. Dans le cadre des relations paradigmatiques, il est possible de considérer, par exemple, synonymie, homonymie. Syntagmatique examine ces relations entre les mots qui leur permettent de les combiner dans des phrases et des suggestions. Les synthagmestics incluent les règles de construction de mots à partir d'éléments de l'alphabet (codage des unités lexicales), de règles de construction de propositions (textes) à partir d'unités lexicales (grammaire).

C'est-à-dire que la demande de l'utilisateur est traduite en descripteurs et est traitée avec IPS déjà dans ce formulaire. Une telle approche est plus coûteuse sur les ressources informatiques, mais également potentiellement plus productives, car elle permet d'abandonner le critère de pertinence et de travailler directement avec les intérêts personnels.

Résultats de recherche classement classement

Les mots de mots sont capables d'émettre des listes de documents contenant des millions de références. Même simplement pour voir de telles listes est impossible et non pas besoin. Il serait pratique de pouvoir définir des critères formels (au moins relatifs) de l'importance (du point de vue de la primauté) des documents afin que les documents les plus importants tombent dans le haut de la liste. Tous les IPS se concentrent actuellement sur l'algorithme du classement des références obtenues.

Les critères les plus couramment utilisés pour le classement des IP sont la présence de mots de la demande dans le document, de leur nombre, de la proximité du début du document, de la proximité des autres;

La présence de mots de la requête dans les titres et sous-titres de documents (les en-têtes doivent être spécifiquement formatés);

Le nombre de références à ce document d'autres documents; "Respectivité" des documents référents.

Chapitre 2. IPS moderne

1 secteurs de l'utilisation des IP modernes

Les IP modernes sont caractéristiques de l'industrie dite de l'information - la plus récente zone Sphère économique et sociale, occupée par le traitement, la systématisation, l'accumulation et la diffusion de l'information. Le développement rapide de l'IPS est associé au succès de l'informatique (informatique). Les demandes IPS peuvent être des données bibliographiques, des informations sur la gestion et des faits, des évaluations d'experts, une expérience rétrospective, des résultats de la recherche de modèles, etc. Un tel large éventail de tâches provoque une grande variété de types IPS. Ils diffèrent par leurs objectifs, la quantité d'informations contenues, les types d'informations, les moyens de l'amener au consommateur. Outre les IP locales, opérant dans le cadre d'une institution (par exemple, polyclinique ou hôpitaux), il existe des services d'information nationaux et internationaux (par exemple dans le domaine de la protection de l'environnement). Les IP bibliographiques (par exemple, contenant une bibliographie dans tous les domaines de la médecine et des sciences biomédicales) ont été répandus. Production de masse d'un ordinateur personnel, développement de communications, capacité à unir ordinateur dans réseaux d'information Et appeler de votre lieu de travail aux informations qui se trouvent dans la mémoire d'autres ordinateurs a considérablement élargi la gamme d'informations, de latitude et de profondeur de sa recherche. Une étape qualitativement nouvelle dans le développement de l'IPS est associée à la formation de bases de données sur un support lisible par ordinateur. Ces bases de données vous permettent d'y accéder à distance, simultanément sur de nombreuses demandes, recevant les résultats de la recherche opérationnels et de manière pratique.

Les médicaments et les soins de santé sont un domaine extrêmement spécifique de la mise en œuvre d'une IPA. Cela est dû à la structure complexe et à la diversité des formulaires d'information médicale et sanitaire, qui comprend des concepts et des catégories difficiles à formaliser, ainsi que des matiers importants de données à prendre en compte. La caractéristique des informations médicales est que les résultats d'observations cliniques ou expérimentales simples à mesure qu'ils accumulent et que les généralisations deviennent la base de la mise en œuvre de grandes événements de santé et de santé. Les informations médicales et sanitaires constituent la base de la prise de décisions de gestion - du choix des domaines de recherche les plus importants des travaux de recherche avant les mesures sanitaires et préventives d'urgence. Dans le tableau de l'information, sur la base de l'analyse de laquelle la gestion de la santé est réalisée, des statistiques (démographiques et population, statistiques sur le cadre, données d'incidence et de mortalité, etc.), des données généralisées sur l'état et les réalisations de la médecine et de Nombre de disciplines scientifiques connexes, l'expérience des années précédentes est généralisée. C'était la nature complexe des informations qui ont été la raison du développement d'un concept unique de l'IPA. Il comprend une création progressive de sous-systèmes individuels dont l'association est atteinte à la fois au niveau des échanges de données et (ou) à l'aide de la communication.

Le processus de développement et d'intégration de sous-systèmes de l'IPA peut être verticalement et horizontalement, car ils créent. Les sous-systèmes qui sont auxiliaires (par exemple, la comptabilité et la circulation du personnel, de la planification et du financement) peuvent être créés indépendamment des autres. Au niveau inférieur des établissements de santé (hôpitaux, cliniques, instituts de recherche, il est utilisé par l'UIP pour maintenir des histoires de maladie, contrôler l'efficacité des mesures thérapeutiques, la collecte et le traitement des données statistiques primaires, ainsi que de résoudre les tâches de gestion de leur Niveau de compétence (utilisation d'un fonds Kainy et de matériel de laboratoire et de diagnostic, équipements de médicaments, etc.). Effectuer des fonctions opérationnelles, ces IP sont accumulés simultanément, puis transmettent les informations nécessaires à plus haut niveau (urbain, régional). Crée séparément des sous-systèmes de référence et de services d'information (dans le domaine de la bibliographie et de la recherche scientifique, du matériel réglementaire, des normes). Dans le cadre de l'IPA générale, des sous-systèmes peuvent être élaborés pour soutenir et développer des services individuels (tels que des programmes psychiatriques, oncologiques) ou ciblés (par exemple, l'effet secondaire des médicaments).

2 architecture des IP modernes pour www

Avant de décrire les problèmes de construction d'informations et de systèmes de recherche Web et les chemins de leur solution, envisagez le schéma modèle d'un tel système (Fig. 2).

Figure 2. Schéma typique Moteur de recherche d'informations.

(Le client) sur ce système est un programme de visualisation d'une ressource d'information spécifique. Aujourd'hui, les programmes multiprotocoles comme Netscape Navigator sont les plus populaires. Un tel programme assure la visualisation documents www., Gopher, WAIS, Archives FTP, Listes de diffusion mailing et groupes de nouvelles Usenet. À son tour, toutes ces ressources d'information sont un objet de recherche du système de récupération d'informations.interface ( interface utilisateur) Ce n'est pas simplement un programme de visualisation, dans le cas d'un moteur de recherche, sous cette phrase, il existe également un moyen de communiquer l'utilisateur avec un appareil de recherche: le système de recherche pour générer des demandes et des vues sur les résultats de la recherche .Engine ( Moteur de recherche) - sert à diffuser des demandes de diffusion d'informations Langue de récupération (IPI), dans une demande de système formelle, à la recherche de liens vers des ressources d'informations réseau et d'émettre les résultats de cette recherche à l'utilisateur.Database (index de base de données) est un index qui est Le tableau principal des données IPS et sert à rechercher l'adresse de la ressource d'information. L'architecture de l'index est conçue de manière à ce que la recherche ait lieu aussi rapidement que possible et cependant, il serait possible d'estimer la valeur de chacune des ressources d'information trouvées du réseau. (Les demandes des utilisateurs) sont stockées dans sa (utilisateur) base de données personnelle. Le débogage de chaque requête est pas beaucoup de temps et il est donc extrêmement important de mémoriser les demandes à laquelle le système donne de bonnes réponses .Robot (Robot Indexer) - sert à numériser Internet et à conserver la base de données d'index comme état actuel. Ce programme est la principale source d'informations sur l'état des ressources d'information réseau .Sites est l'ensemble de l'Internet ou plus précisément - des ressources d'information fournies avec des programmes de visualisation.

2.3 Moteurs de recherche populaires

Selon LiveInternet, des données sur la couverture des requêtes de recherche en russe:

All-parler: (37,2%) (0,8%)! (0,2%) et appartenant à ces moteurs de recherche de la société:

Anglone et international: (Mécanisme Teoma)

Russe-parler - la plupart des moteurs de recherche "russophones" et sont à la recherche de textes dans de nombreuses langues - ukrainien, biélorusse, anglais, tatar et al. Ils diffèrent des systèmes "All-parler" indexer tous les documents dans un rangée, le fait que les ressources situées dans principalement les zones de domaine d'index, où la langue russe domine ou d'autres méthodes limitent leurs robots avec des sites russophones.

Yandex (48,1%). Ru (5,9%)

Rambler (1,2%)

Nigma (0,3%)

Certains des moteurs de recherche utilisent des algorithmes de recherche externes. Ainsi, Qip.ru utilise le moteur de recherche Yandex et Nigma combine à la fois son algorithme et l'équipe nationale émettant d'autres moteurs de recherche.

Conclusion

Rechercher des voitures considérées par moi sont loin de la perfection. On pense que le moteur de recherche idéal doit répondre aux exigences suivantes:

Facile à utiliser

Index clairement organisé et mis à jour.

Recherche rapide dans la base de données et réponse rapide.

Fiabilité et précision des résultats de la recherche.

L'échelle des ressources d'information et leur nombre se développent constamment. Il devient clair que la base de données n'est pas parfaite. Agents intelligents - une nouvelle direction sous-jacente à une nouvelle génération de moteurs de recherche pouvant filtrer des informations et obtenir un résultat plus précis. Internet continue de se développer avec une intensité implacable, laver essentiellement une restriction sur la distribution et la réception de l'information dans le monde. Cependant, cette information océan n'est pas très facile à trouver le document nécessaire, il convient également de garder à l'esprit que sur le réseau, ainsi que de nouveaux serveurs, de nouveaux serveurs se posent.

Liste des littérature d'occasion

1. Ashmanov, I. S. Promotion du site dans les moteurs de recherche / I. S. Ashmanov. - M.: "Williams", 2007. - 304 p.

Baikov, V. D. Internet. Rechercher une information. Promotion des sites / V. D. Baikov. - SPB.: BHV- Petersburg, 2000. - 288 p.

Gavrilov, A. V. Réseaux locaux EUM / A. V. GAVRILOV.- M.: "Paix", 1990.- 154 p.

Gaidamakin, N. A. Systèmes d'information automatisés, bases de données et banques / N. A. Gaidamakin.- M.: "Helios", 2002.-280 p.

Kadeev, D. N. Technologie de l'information et Communications électroniques / D. N. Kadeev.- M.: "Electro", 2005.- 250 p.

Kolisnichenko, D. N. Moteurs de recherche et promotion de sites sur Internet / D. N. Kolisnichenko. - M.: "Dialectique", 2007. - 272 p.

LANDE, D.V. Recherche de connaissances sur Internet / D. V. Lande. - M.: "Dialectique", 2005. - 272 p.

Manning, K. Introduction à l'information Recherche / K. Manning. - M.: "Williams", 2011.- 200 p.

Chursin, N. A. Populaire informatique / N. A. Chursin. - M.: "Williams", 2007.-00 p.

Informations automatisées et moteurs de recherche

Utilisateurs d'une telle information de style - activité de recherchequi est généralement caractéristique du scientifique le plus remarquable.
... Compilation requête de recherche Avec l'aide d'un système de gestion de documents spécialisé (Cour). 1.2. Structure du réseau.


Avez-vous aimé l'article? Partager avec des amis: