Dire et publier des informations. Analyse des pages Web et amélioration des résultats de l'analyse à un ou plusieurs niveaux de la base de données du serveur de recherche. Sources de base d'indexation pour les documents www

Et combien
vaut la peine d'écrire votre travail?

Type d'emploi Thesis (Bachelor / Specialist) Cours avec cours de pratique Tâches de spécifications abstraites Essai Certification TRAVAILLE (VAR / WRC) Plan d'entreprise Questions pour le diplôme d'examen MVA Travaux diplômés (collège / école technique) Autres cas Travail de laboratoire, Diplôme de Maître de RGR Aide en ligne Rapportez-vous à la pratique Recherche d'informations Présentation de PowerPoint Essai pour les documents de soutien des études supérieures pour le diplôme thèse Dessins Terme 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 23 23 24 25 25 26 27 29 30 31 Livraison Janvier février mars Avril mai juin juillet août septembre octobre novembre décembre prix

Avec l'estimation du coût que vous recevrez gratuitement
Prime: accès spécial À la base de travail payante!

et obtenir du bonus

Merci, vous avez envoyé une lettre. Vérifier le courrier.

Si une lettre ne vient pas pendant 5 minutes, une erreur dans l'adresse est autorisée.

Informations documentaires Technologie de recherche en ligne

Horaires connexes:

Caractéristiques des moteurs de recherche: essence, tâches, composants de base; Réglages principaux. Les moteurs de recherche globaux, leurs avantages et leurs inconvénients; Caractéristiques du système juridique - Garant. Stratégie et méthodes de recherche d'informations professionnelles.

Principes généraux pour organiser la recherche d'informations sur Internet. Recherche par catalogues ressources d'information et avec l'aide de moteurs de recherche. Règles visant à trouver des informations sur la comptabilisation des obligations actuelles et des établissements avec les acheteurs et les clients.

Kabardino-Balcarian State University College Technologies de l'information et l'essai de l'économie «moteurs de recherche Internet» effectués:

Programme de programme Internet Explorer. Comme l'extension du guide du programme, orientée non seulement avec système de fichiers cet ordinateur, mais aussi avec des documents Web d'Internet. Caractéristiques du spectateur d'applications de programme Pixgrabber images.

2. Moteurs et machines de recherche sur Internet. Passons à l'historique du réseau Internet, qui a été créé en relation avec la nécessité de partager les ressources d'informations distribuées entre différents systèmes informatiques. La plupart des premières applications, y compris FTP et ...

Structure systèmes de recherche de référence Internet, mécanismes de recherche de travail. Aperçu comparatif Systèmes de référence (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Rechercher des robots, les moteurs de référence et de recherche les plus populaires.

La connaissance des concepts de base et des termes vous permet d'effectuer une recherche approfondie avec l'utilisation de mots-clés caractérisant de manière précise le sujet souhaité. Dans le même temps, il est nécessaire de distinguer les techniques de recherche simple, étendue et contextuelle.

Caractéristiques des méthodes de recherche d'informations sur Internet, nommément utilisant des liens hypertextes, des moteurs de recherche et des moyens spéciaux. Analyse des nouvelles ressources Internet. L'histoire de l'émergence et description des moteurs de recherche parlées et russophones.

Le World Wide Web est une combinaison de ressources d'information relatives aux moyens de télécommunication et sur la base de la présentation hypertextile de données dispersées dans le monde entier. Le World Wide Web est également indiqué comme www.

La recherche est d'une importance vitale pour les utilisateurs, avec elle, ils fonctionnent avec des sites Web complexes. Les meilleurs sites Web offrent un champ. recherche simple sur le page d'accueil Et refuser de faire progresser la recherche et l'utilisation du cadre de recherche.

Typologie des méthodes de recherche. Recherche directe en utilisant des liens hypertextes. Technologie de recherche à l'aide de moteurs de recherche. Établissement et exécution des requêtes pour rechercher des moteurs.

La technologie d'hyper-choc contenue dans les documents www et les programmes d'accès géré aux serveurs www est la principale différence entre www, permettant aux utilisateurs de naviguer rapidement sur Internet.

Qu'est-ce que l'internet. Brève historique d'Internet. Les principaux protocoles d'Internet et les recherchent. Le World Wide Web. Moteurs de recherche en Russie.

Internet m'a fourni un accès facile et rapide à un grand nombre de matériel d'information, la possibilité de lire, d'enregistrer, d'imprimer ces matériaux et du lieu d'utilité, et peut-être des informations inutiles sur le réseau.

Étudier les types de connexion (ligne dédiée permanente, numérotation téléphonique de session), accès à l'information, types de services (lecture interactive, directive, diffusion différée) et moteurs de recherche (Lycos, Altavista, Yahoo, OpenText, WAIS) sur Internet.

L'histoire de l'émergence et du développement d'Internet, des particularités de son côté humanitaire et technique. Application du système mondial Toile large. - "Le World Wide Web". Aspects clés de la technologie www, la spécificité de son utilisation pour créer des ressources éducatives.

Le concept du système "Internet", l'utilisation, la taille du réseau, le nombre d'abonnés et d'utilisateurs. Moteurs de recherche, approche de la collecte d'informations sur les ressources d'Internet. Serveurs de recherche modernes. Travaillez avec des catalogues de ressources, économisant des informations sur Internet.

Technologies de recherche Internet

Chaque année, le volume de l'Internet augmente parfois la probabilité de trouver information nécessaire Augmente radicalement. Internet combine des millions d'ordinateurs, de nombreux réseaux différents, le nombre d'utilisateurs est augmenté de 15 à 80% par an. Et, néanmoins, de plus en plus lorsque vous contactez Internet, le problème principal n'est pas l'absence des informations souhaitées, mais de le trouver. En règle générale, une personne ordinaire pour différentes circonstances ne peut pas ou ne veut pas dépenser de la réponse à lui plus de 15 à 20 minutes. Par conséquent, il est particulièrement important d'apprendre correctement et de manière compétent comment cela semblerait des choses simples - où et comment rechercher pour recevoir la réponse souhaitée. Pour trouver les informations dont vous avez besoin, vous devez trouver son adresse. Pour cela, il existe des serveurs de recherche spécialisés (robots d'index (moteurs de recherche), catalogues Internet thématiques, systèmes de recherche méta, services de recherche de personnes, etc.). Cet atelier décrit les principales technologies de recherche d'informations sur Internet, fournissent des fonctionnalités générales des outils de recherche, les structures sont prises en compte. requêtes de recherche Pour les moteurs de recherche russophones et anglophones les plus populaires.

La technologie Web (www) Web (www) est considérée comme une technologie spéciale pour la préparation et la mise en place de documents sur Internet. Le www inclut les pages Web et bibliothèques électroniques, catalogues et même musées virtuels! Avec une telle abondance d'informations, la question est brusquement: "Comment naviguer dans un espace d'information aussi vaste et à grande échelle?" En résolvant ce problème, les outils de recherche sont à la rescousse. Les outils avancés sont des logiciels spéciaux, dont le but principal est de garantir la recherche la plus optimale et la plus haute qualité des informations sur les utilisateurs sur Internet. Les instruments de recherche sont affichés sur des serveurs Web spéciaux, chacun effectuant une fonction spécifique:

Analyse des pages Web et amélioration des résultats de l'analyse à un ou plusieurs niveaux de la base de données du serveur de recherche.

Rechercher des informations sur la demande utilisateur.

Fournir une interface pratique pour rechercher des informations et afficher le résultat de la recherche par l'utilisateur.

Les techniques de travail utilisées lorsque vous travaillez avec ceux-ci ou d'autres instruments de recherche sont presque identiques. Avant de passer à leur discussion, considérez les concepts suivants:

L'interface d'outil de recherche est représentée en tant que page d'hyperliens, une ligne de recherche (chaîne de recherche) et des outils d'activation de requête.

L'index des moteurs de recherche est base de l'informationcomprenant le résultat de l'analyse des pages Web compilées par certaines règles.

Demande est mot-clé Ou la phrase que l'utilisateur entre dans la chaîne de recherche. Pour la formation de différentes demandes, des caractères spéciaux sont utilisés (", ~), des symboles mathématiques (*, +,?).

Le schéma de recherche d'informations est simple. L'utilisateur gagne phrase clé Et active la recherche, obtenant ainsi une sélection de documents sur la demande formulée (spécifiée). Cette liste de documents est classée selon certains critères de sorte que le sommet de la liste s'est avéré être les documents qui se conforment le plus à la demande de l'utilisateur. Chacun des outils de recherche utilise divers critères de classement de documents, à la fois lors de l'analyse des résultats de la recherche et lors de la génération d'un index (remplissant la base de données d'index de la page Web) de telle manière, si vous spécifiez la requête dans la barre de recherche pour chaque outil de recherche, La requête peut être obtenue. Recherche. Pour que l'utilisateur revêt une grande importance, quels documents seront dans les deux ou trois douzaines de documents sur les résultats de la recherche et le nombre de ces documents correspondent aux attentes des utilisateurs. La plupart des outils de recherche offrent deux méthodes de recherche - Recherche simple (recherche simple) et recherche avancée (recherche avancée) à l'aide d'une forme spéciale de demande et sans elle. Considérez les deux types de recherche sur un exemple de moteur de recherche anglophone. Par exemple, AltaVista est pratique à utiliser pour des demandes arbitraires, "quelque chose sur les degrés en ligne dans la technologie de l'information", tandis que l'outil de recherche Yahoo vous permet de recevoir des nouvelles du monde, des informations sur les devises de change ou les prévisions météorologiques.

L'élaboration de critères de mise à jour de la demande et des réceptions de la recherche avancée vous permet d'augmenter l'efficacité de la recherche et de trouver rapidement les informations nécessaires. Tout d'abord, vous pouvez augmenter l'efficacité de la recherche par usage dans les requêtes. opérateurs logiques (opérations) ou, et, près, pas, mathématiques et caractères spéciaux. Utilisation des opérateurs et des caractères, l'utilisateur relie les mots-clés de la séquence souhaitée pour obtenir le résultat de recherche le plus adéquat. [ neuf ]

Les ressources sur Internet du réseau mondial deviennent de plus en plus en plus de plus en plus de plus en plus de plus en plus des informations nécessaires chaque jour de plus en plus difficile. Par conséquent, tous les participants au marché des moteurs de recherche modernes ont déjà eu l'impression que les technologies de recherche d'aujourd'hui sont obsolètes et qu'il est nécessaire de changer le concept de recherche lui-même. DANS actuellement Un responsable de recherche incontesté est toujours Google - 47% de tous les internautes choisissent ce service particulier, puis vous allez à Yahoo! et MSN - 21 et 13% des appels, respectivement, c'est-à-dire que, en général, plus de 80% des habitants de la planète préfèrent ces moteurs de recherche. L'un des trois principaux serveurs de recherche dispose d'un degré élevé de fidélité parmi ses utilisateurs permanents: près de 71% de ceux qui recherchaient Yahoo! participaient parfois à l'un des deux autres services - Google ou MSN Search, 70% de ceux qui étaient À la recherche de MSN, a également torturé bonne chance dans un ou plusieurs moteurs de recherche compétitifs. Voyant une telle insatisfaction avec les résultats de la recherche, les créateurs de moteurs de recherche tentent d'améliorer leurs moteurs de recherche et tentent d'appliquer de nouvelles technologies de recherche. Ainsi, le soi-disant auto-constructeur (auto-constructeur) a été lancé sur Google Portal, où les utilisateurs de ce moteur de recherche peuvent configurer le processus de recherche à leur discrétion. Par exemple, si l'utilisateur est intéressé par la météo, il peut voir l'informateur météo de sa ville. Une méthode d'affichage des nouvelles, la production de rapports d'échange et de nombreuses autres choses utiles peuvent être configurées conformément à vos intérêts. Naturellement, tout le monde paramètres similaires L'utilisateur sera en mesure d'utiliser uniquement jusqu'à ce qu'il soit autorisé sur le site Web du moteur de recherche. Avec l'avènement de cette technologie, le site Web de Google a avancé ses concurrents à bien des égards - les portails les plus anciens Internet Yahoo. ! et msn.

Le module a pour but d'obtenir une idée des principes de base du fonctionnement des moteurs de recherche Internet, d'apprendre la technologie recherche efficace ressources d'information.

Définition de la tâche de recherche

Considérez la formulation de la tâche de recherche. Pour ce faire, nous devons répondre à trois questions: que rechercher (quelles sources d'informations); Où chercher (placer l'emplacement de ces sources) et sur la recherche (quels outils à utiliser pour cela).

Sources d'information sur Internet

Nous mettons en évidence les principales sources d'information présentées sur Internet. Il:

  • documents www;
  • articles dans les journaux et listes de diffusion;
  • fichiers dans les bibliothèques de fichiers;
  • certificat d'adresse Informations sur les organisations et les personnes (email, adresse, téléphone);
  • articles dans des bases de données thématiques, des encyclopédies.

Placer des sources d'informations sur Internet

Répondez maintenant à la question où ces sources d'informations sont placées. Ce sont de telles ressources Internet populaires commeWww , groupes de discussion, listes de diffusion etFtp. - les serveurs. Actuellement, le principal placement d'informations dansl'Internet C'est un Web mondial.

Recherche de mode

Bien sûr, vous pouvez rechercher des sources «manuellement», en commençant par toute adresse de départ et en tournant les liens souhaités. Vous pouvez trouver les adresses de journaux spécialisés sur l'informatique et Internet, utilisez des livres de référence appelés Pages Jaunes avec des catégories classées aux adresses des entreprises et des institutions. De tels livres de référence sont disponibles dans une version papier ou sur CD -ROM. Cependant, pour trouver efficacement des informations dans un espace aussi volatil comme Internet, vous devez apprendre à utiliser des outils spéciaux, dont le but est de collecter des informations sur les ressources d'information du monde. réseau informatique et fournir aux utilisateurs recherche rapide.

Systèmes d'information et de recherche (IPS). Définition.

Ainsi, nous abordons le concept de l'outil de recherche autonome - système de récupération d'informations.

L'IPS est le système qui fournit la sélection et la sélection des données nécessaires dans une base de données spéciale avec des descriptions de sources d'informations (index) en fonction des informations et des règles de recherche pertinentes.

La tâche principale de l'IPS

La tâche principale de tout IPA est de rechercher conformément aux besoins d'informations de l'utilisateur qui sont générés comme une demande. Il est très important du fait d'une recherche ne conductait rien à perdre, c'est-à-dire de trouver tous les documents de l'indice relatif à la requête (de recherche de recherche) et de ne pas trouver quoi que ce soit superflu (précision de la recherche). Par conséquent, la caractéristique qualitative de la procédure de recherche est introduite - pertinence.

La pertinence est la conformité des résultats de la recherche à la requête formulée.

Indicateurs principaux d'IPS pour www

Ensuite, nous examinerons principalement les IP pour le World Wide Web (Www ). Les principaux indicateurs de l'IPS pourWww sont une échelle spatiale et une spécialisation.

Sur l'échelle spatiale de l'IPS peut être divisée en local, global, régional et spécialisé. Les moteurs de recherche locaux peuvent être conçus pour rechercher rapidement des pages sur une échelle de serveur distincte. Les IPS régionales décrivent les ressources d'information d'une région donnée, par exemple des pages de langue russe sur Internet. Les moteurs de recherche globaux contrairement aux efforts locaux, si possible, décrivent la plupart des ressources de l'ensemble de l'espace d'information sur Internet.

De plus, IPS peut se spécialiser dans la recherche de diverses sources d'information, telles que des documentsWww , fichiers, adresses, etc.

Les tâches principales de concevoir un IPS pour www

Examinons plus en détail les tâches principales que les développeurs IPS doivent résoudre. Comme suit la définition, les IPS pourWww La recherche dans sa propre base de données (index), qui contient le résultat de la description des sources d'informations distribuées. Donc, vous avez d'abord besoin de décrire les ressources d'informations et de créer un index. Construire un index commence par la définition de l'ensemble initialURL Sources d'information. Ensuite, la procédure d'indexation est effectuée.

Indexation - Description des sources d'informations et de la construction de l'indice.

Index - une base de données spéciale pour rechercher efficacement les ressources d'information décrites.

Dans certaines informations et moteurs de recherche, la description des sources d'information est effectuée par le personnel du HSP, c'est-à-dire des personnes qui constituent une brève annotation pour chaque ressource. En règle générale, en réglant les ressources décrites sur des sujets (établissant le catalogue thématique). Bien sûr, une description compilée par une personne sera correctement source. Vrai, dans ce cas, la procédure d'indexation prend une période de temps significative. L'index généré a donc une règle un volume limité. Mais la recherche dans un tel système peut être effectuée aussi facilement que dans les directeurs thématiques des bibliothèques.

Dans les ops d'un autre type, la procédure de décrivant des ressources d'information est automatisée. Pour cela, un programme de robot spécial est en cours de développement, qui par une technologie spécifique contourne des ressources, les décrit (indexation) et analyse les liens de la page en cours pour élargir la zone de recherche. Comment le document peut-il décrire? Le plus souvent, la liste des mots, qui se trouvent dans le texte et d'autres parties du document, sont prises en compte la fréquence de la répétition et de l'emplacement du mot, c'est-à-dire que le mot est attribué au coefficient de poids particuliers en fonction sur son importance. Par exemple, si le mot est dans le titreLa toile. - L'assistant, le robot lui attribuera un coefficient supérieur. Étant donné que la description est automatisée, le temps passé est petit, et l'index peut être très important.Donc avec la tâche environnante pour le deuxième type IPS est le développement d'un indexeur de robot.

L'indexer du robot est un programme qui sert à numériser Internet et à prendre en charge la base de données d'index est à jour.

Chercher dans les systèmes ce type L'utilisateur doit apprendre à compiler des demandes, dans le cas le plus simple, composé de plusieurs mots. Ensuite, l'IPS recherchera des documents dans son indice, dans les descriptions desquelles il y a des mots de la demande. Pour effectuer une meilleure recherche, vous devez développer une langue de requête spéciale pour l'utilisateur. Selon les caractéristiques de la construction du modèle d'index et de la langue de requête prise en charge, le mécanisme de recherche et l'algorithme de tri des résultats sont développés.

Étant donné que l'indice a une somme importante, le nombre de documents trouvés peut être assez important. Par conséquent, il est extrêmement important car un moteur de recherche recherchera et triera ses résultats.

Il a essentiel apparence Le moteur de recherche qui apparaît devant l'utilisateur, une des tâches est donc le développement d'une interface pratique et belle.

Enfin, la forme de résultats de visualisation représentant est extrêmement importante, car l'utilisateur doit apprendre autant que possible sur la source des informations, de prendre la bonne décision sur la nécessité de le visiter.

Travailler avec IPS pour www

Considérons le schéma généralisé de l'interaction de l'utilisateur avec le système de recherche d'informations pour le Web World Wide Web www (fig. 1.). L'utilisateur utilisant un programme client standard pour le World Wide Web (navigateur) se connecte à l'IPS à son adresse et formule une demande de recherche.

Le composant principal de l'IPS est le moteur de recherche qui détient dans la recherche d'index des références aux ressources d'information et émet des résultats de recherche à l'utilisateur.

Comme mentionné précédemment, la recherche est effectuée dans une base spéciale appelée par l'index. L'architecture de l'index est conçue de manière à ce que la recherche soit passée aussi rapidement que possible, et il a été possible d'utiliser des algorithmes de résultats de recherche efficaces pour le tri. Idéalement, les résultats de la recherche doivent être triés de manière à ce que les liens les plus pertinents soient en haut de la liste.


Sources de base d'indexation pour les documents www

Comme vous le savez, le Web est un document sophistiqué composé d'une variété d'éléments. Lorsque vous décrivez ce document, le programme de robot doit être pris en compte, dans lequel une partie du Web est l'affectation de ce mot. Sources d'indexation pour les documentsWww Sont généralement:

  • titre Web - Suprest (titre);
  • titres de différents niveaux (H 1- H 6);
  • résumé (description);
  • listes de mots-clés (Mots-clés);
  • liens hypertextes;
  • textes complets de documents.

Les moteurs de recherche décrivant l'intégralité du texte du document www sont appelés texte intégral.

Caractéristiques et procédures d'indexation

Au cours de la procédure d'indexation, la normalisation du vocabulaire est souvent produite (apportant des mots à la forme de base). Certains mots non informatifs, tels que des syndicats ou des prépositions, ne sont pas indexés. Dans chaque IPA, il existe une liste de mots de stoppe qui sont ignorés pendant le processus d'indexation. Dans les systèmes avec des langues hautement variables, par exemple, russe, la morphologie est effectuée. La comptabilité de la morphologie signifie la capacité de travailler avec diverses formes de mots spécifiques. Ici, il convient de noter la complexité relative de la langue russe, dont les paroles varient en nombre, les cas, les accouchements et les temps, et souvent de manière inattendue (par exemple: cela va, ça va, etc.). Tous les IP existants, en tenant compte de la morphologie de la langue russe, utilisent le "Dictionnaire grammaire de la langue russe", compilé par Andrey Anatolyevich Zaliznyak. Le dictionnaire comprend 90 000 articles de vocabulaire, pour chaque mot d'informations sur le mot, qu'il s'agisse de la modification et de la manière dont il est enclin ou caché.

Outils de recherche sur www

De ce qui précède, il suit que les principaux outils de recherche d'informations dansWww sont des IP. Cependant, Internet dispose d'outils de recherche qui ont des différences fondamentales de l'IPAS discutée ci-dessus. En général, vous pouvez sélectionner les outils de recherche suivants pourWww : Moteurs de recherche, systèmes de métapoik ( services de recherche) et accéléré des programmes de recherche (agents de recherche).


Le lieu central appartient légitimement à des moteurs de recherche, qui sont à son tour divisés en répertoires, index automatiques (moteurs de recherche) et machines de catalogues. Seuls les moteurs de recherche possèdent presque totalement les capacités et les propriétés de l'IPS.

Catalogue (répertoire) - système de recherchedans quelle description de la ressource est effectuée par le personnel (personnes). Ensuite, il y a le tri des ressources décrites sur des sujets (la compilation du catalogue thématique).

Moteur de recherche (moteur de recherche) est un moteur de recherche qui automatise la procédure de décrivant des ressources d'informations utilise un programme de robot.

Récemment dans internet Les systèmes qui recherchent automatiquement dans deux index (index de répertoire et index des moteurs de recherche) ont commencé à apparaître. Ces systèmes vous permettent d'utiliser les avantages des serveurs de recherche des deux types et appelés catalogues.

La principale différence de systèmes de métapoiques et de programmes de recherche accélérée de l'IPS est l'absence de son propre index. Ces outils recherchent dans les index d'autres moteurs de recherche.

METAPOISK SYSTEM (METACRRAWLER) - Un moteur de recherche qui n'a pas son propre index, mais peut envoyer des demandes d'utilisateurs simultanément plusieurs serveurs de recherche, puis sélectionner les résultats les plus pertinents, les combiner et soumettre à l'utilisateur comme document avec référence.

Le programme de recherche accéléré (Search Bots) est un programme installé sur un ordinateur d'un utilisateur capable d'envoyer une demande à plusieurs serveurs de recherche et de trier les résultats obtenus en supprimant les doublons.

Notez que la plupart des moteurs de recherche sont l'un des composants de la multifonctionSystèmes Web Internet - Doit appelé des portails.

Portail - multifonctionnelWeb -un Internet Offrant une variété de services: recherche d'informations, email gratuit, etc.

Catalogues www.

Considérez les fonctionnalités des catalogues. Dans les catalogues, la description des sources d'informations est effectuée par le personnel, c'est-à-dire des personnes qui constituent une brève annotation pour chaque ressource. En règle générale, en réglant les ressources décrites sur des sujets (établissant le catalogue thématique).

La recherche dans le catalogue est très pratique et est effectuée par un raffinement constante. Lors de la page initiale (home) du système de ce type, vous verrez une liste des principaux sujets (catégories) alloués par le personnel du répertoire mis en œuvre sous la forme de liens hypertextes. Par exemple, les ordinateurs, Internet, l'éducation, l'art, etc. Après avoir choisi un lien vers la catégorie de premier niveau, vous serez sur la page avec la liste des sous-catégories, etc. Ainsi, sans approfondir dans la difficulté d'établir des demandes, vous trouverez facilement des sources pour vos sujets choisis. Il convient de noter que les ressources décrites dans les catalogues sont généralement des sites de haute qualité spécialisés.

De nombreux catalogues prennent en charge la possibilité de trouver rapidement une page de catégorie ou de mots clés spécifique à l'aide d'un moteur de recherche local.

Notez que la base de données de référence (index) du catalogue a généralement un volume limité. Certains catalogues utilisent des programmes de robots pour mise à jour automatique indice.

Le résultat de la recherche dans le catalogue est représenté comme une liste; Pour chaque ressource est donnée brève description (Résumé) avec une référence hypertext à la source d'origine.

Adresses de catalogues célèbres

Parmi les répertoires étrangers les plus populaires devraient d'abord mentionner le catalogueYahoo. . Dans le nombre de taille d'index sur 2 millions de liens, on trouve des cataloguesOpen Directory and LookMart.

  • Yahoo!
  • Ouvrir le répertoire.
  • L'air intelligent.

Catalogues populaires russes:

  • Catalogue @ mail.ru (list.ru)
  • Constellation Internet (catalogue de APORT)

Apparition de Yahoo! Catalogue

Considérer l'apparence page d'accueil Le catalogue anglais le plus populaireYahoo (http: // www. yahoo. Com ) (Fig. 3). Comme d'habitude, sur page de démarrage Systèmes de catalogue Vous verrez certainement une liste de grands sujets (catégories). Dans le catalogueYahoo. ! Il est possible de rechercher rapidement des mots-clés à l'aide d'un blanc pour entrer une requête. Les plus façon simple La recherche est la série de clics série avec la souris de la catégorie dont vous avez besoin. Par exemple, notre tâche- Trouver Web. - site consacré àeN LIGNE Cours sur les sciences informatiques, c'est-à-dire des cours menés une formation à traversl'Internet . Dans ce cas, vous pouvez choisir le programme de raffinement suivant par thèmes: de la page d'accueil, sélectionnez le lien science (Science), puis informatique(Sciences informatiques), puis cours (Cours) et cours en ligne (Cours en ligne). À la suite des transitions, nous recevons une liste d'annotations avec les noms des pages correspondantes (fig. 4). Ensuite, en cliquant sur le lien dans le lien, vous pouvez accéder à la source d'origine et l'explorer.



Moteurs de recherche

Une caractéristique distinctive des moteurs de recherche est le fait que la base de données avec des informations surLa toile. Les assistants sont forméset maintenu à jour un programme de robot et, par conséquent, a un volume beaucoup plus important que les systèmes de type catalogue. Par exemple, moteur de rechercheAltavista. Contient dans l'indice d'environ 550 millions de références (à partir du 04.04.2001).

La recherche dans un tel système est généralement effectuée sur demande, comme décrit par l'utilisateur et consistant dans le cas le plus simple d'un ensemble de mots-clés. DANS dernièrement Il y a une tendance tri des contenus de l'index par catégorie, ce qui vous permet de réduire la zone de recherche et d'utiliser la possibilité de rechercher avec le raffinement du sujet.

Recherche simple. Demande généralisée pour la formation de la demande.

En règle générale, les moteurs de recherche prennent en charge deux modes: mode de recherche simple et mode de recherche étendu. Considérez les possibilités généralisées de former une demande en mode de recherche simple. Vous pouvez simplement entrer un ou quelques mots via de l'espace; La recherche de mots avec toutes sortes d'extrémités est modélisée par un symbole * à la fin du mot. De nombreux systèmes vous permettent de rechercher une phrase ou une phrase, pour cela, un fragment souhaité doit être enfermé dans des guillemets. Il est possible d'inclusion obligatoire ou d'exclusion de certains mots mis en œuvre par des signes + et - respectivement, recrutés près du mot clé.

Le problème de recherche principal par requête compilée primitive (sous la forme de mots-clés) est que le moteur de recherche trouvera toutes les pages sur lesquelles les mots spécifiés se trouvent dans n'importe quelle partie du document. En conséquence, le nombre de pages trouvées sera trop volumineux. Pour améliorer la qualité de la recherche en mode de recherche simple, il est permis d'utiliser des opérateurs logiques et des opérateurs pour limiter la zone de recherche, ainsi que la sélection d'une catégorie spécifique de documents de la liste présentée.

Opérateurs établissant des relations entre les mots-clés

La plupart des moteurs de recherche utilisent ce qui suit Opérateurs établissant des relations entre les mots-clés:

  • Et (et) et - la présence obligatoire de tous les mots-clés;
  • Ou (ou) | - la présence d'au moins un des mots-clés;
  • Pas pas)! - manque de mot clé;
  • Près de (environ) ~ - un certain intervalle entre les mots-clés.

À titre d'exemple, donnez une demande pouvant être formulée dans moteur de recherche Altavista. Pour rester Documents dans lesquels il existe un mot Internet dans toutes sortes de fins et de phrases recherches d'emploi, et la distance entre eux ne doit pas dépasser 10 mots:

internet * près de "Recherche d'emploi"

Opérateurs spéciaux

De nombreux moteurs de recherche comprennent des opérateurs spéciaux dans leur langue, ce qui vous permet de rechercher dans certaines zones du document (par exemple, dans son titre) ou de rechercher un document dans une partie bien connue de son adresse. Opportunité utile est la recherche de documents sur le réseau qui fait référence à la page avec l'adresse que vous avez spécifiée (URL). De cette façon, vous pouvez trouver sur la page des pages qui ont des liens vers votre site Web. Certains systèmes vous permettent de limiter la zone de recherche dans le domaine spécifié.

En tant qu'opérateurs spéciaux supplémentaires, vous pouvez allouer:

  • documenter les opérateurs de recherche avec définis fichier graphique;
  • restriction des opérateurs par date;
  • opérateurs de clarification par le nombre de mots entre les mots-clés spécifiés;
  • opérateurs de comptabilité de mots de texte;
  • opérateurs Tri des résultats (par pertinence, fraîcheur, vieillesse).

Noter. Malheureusement, aujourd'hui, il n'y a pas de norme sur le nombre et la syntaxe des opérateurs pris en charge pour divers moteurs de recherche, mais des tentatives sont faites pour développer norme générale. À ce stade du développement des outils de recherche, l'utilisateur, qui fait référence à un moteur de recherche spécifique, doit nécessairement voir ses règles pour la compilation des demandes. Habituellement, la liaison d'aide est présente sur la page d'accueil, que vous pouvez accéder aux informations de référence.

Comparez le type d'opérateur de recherche dans le titre des moteurs de recherche AltaVista, Yandex, APORT:

  • Altavista: Titre: (expression)
  • Index: $ Titre (expression)
  • APORT: TITRE \u003d (expression)

Recherche avancée (détaillée, avancée)

Pour écrire une demande avec le raffinement des paramètres, vous devez connaître la langue de la citation d'un moteur de recherche spécifique. Ce n'est pas très simple pour l'utilisateur, de nombreux index automatiques sont proposés pour utiliser les capacités du mode de recherche approfondie. En règle générale, sur la page de départ du moteur de recherche, une recherche avancée de lien (recherche avancée), la mise en œuvre de la transition vers le mode de requête approprié.

Mode de demande avancé ou détaillé différents systèmes Il est mis en œuvre individuellement, mais le plus souvent, il s'agit d'une forme dans laquelle les déclarations mentionnées ci-dessus sont implémentées en installant les indicateurs correspondants ou en sélectionnant des paramètres dans la liste. Ainsi, vous avez la possibilité de faire une demande de qualité sans recourir à une langue complexe et à de nombreux opérateurs.

Présentation des résultats de la recherche

Considérons des moyens de visualiser les résultats de la recherche dans moteurs de recherche. En règle générale, le nombre de documents trouvés dépasse plusieurs dizaines et, dans certains cas, il peut atteindre des centaines de milliers! Par conséquent, comme une forme de liste de références aux documents 5-10-15 unités sur une page avec la possibilité de transition au groupe suivant au bas de la page. Nécessairement indiquer le titre etURL (adresse) du document trouvé, parfois le système indique un pourcentage de la pertinence du document.

Le document décrivant le document contient le plus souvent plusieurs premières offres ou extraits du texte du document avec l'attribution de mots-clés. En règle générale, la date de mise à jour (vérification) du document est spécifiée, sa taille en kilo-octets, certains systèmes définissent la langue du document et son codage (pour les documents russophones).

Traitement des résultats de la recherche

Que peut-on faire avec les résultats obtenus? Si le nom et la description du document répondent à vos besoins, vous pouvez immédiatement aller à sa source d'origine. Il est plus pratique de faire dans une nouvelle fenêtre pour pouvoir analyser davantage les résultats de l'émission. De nombreux moteurs de recherche vous permettent de rechercher des documents trouvés et vous pouvez clarifier votre demande d'introduction de termes supplémentaires. Si l'intellectualité du système est élevée, vous pouvez vous proposer un service de recherche pour des documents similaires. Pour ce faire, vous choisissez un document particulièrement apprécié et indiquez son système en tant qu'échantillon. Cependant, l'automatisation de la définition de «similarité» est une tâche très non-triviale et souvent, cette fonctionnalité peut ne pas justifier vos espoirs. Certains moteurs de recherche vous permettent de rembourser les résultats. Les résultats de la recherche standard sont triés par pertinence, mais vous pouvez ensuite choisir une autre méthode de tri (par exemple, pour la fraîcheur, de sorte que la nouvelle liste apparaisse en haut de la liste, les derniers documents trouvés sur votre demande). Vous pouvez enregistrer les résultats de la recherche sous forme de fichier sur disque local Pour une étude ultérieure hors ligne.

Adresses des moteurs de recherche populaires

Nous donnons les adresses de certains des moteurs de recherche les plus populaires à l'étranger et en Russie.

Moteurs de recherche étrangers:

Moteurs de recherche russe:

Primaire Recherche dans le moteur de recherche Rambler

Considérez la recherche de systèmes d'enregistrement russes dans le moteur de recherche du portail Rambler (http://www.rambler.ru). Sur la page d'accueil du moteur de recherche (Fig. 5) Il existe une forme d'entrée de requête pour un simple mode de recherche. Faites attention au lien de recherche avancé qui implémente la transition vers le mode de recherche avancée et le lien d'aide pour appeler les règles de référence.

L'un des composants du portail est le système de classement volontaire de sites / pages sur la participation TOP100. Ce système permet aux propriétaires des serveurs de déterminer leur popularité basée sur une évaluation comparative avec d'autres serveurs. Sur les pages dont les propriétaires souhaitent participer au système de notation, il existe un compteur spécial, qui enregistre des informations sur les visiteurs de cette page. Sur la base de ces données, les cotes de base des sites des catégories sont établies et le visiteur de Rambler peut se familiariser avec eux.

Nous ferons la demande de test la plus simple, composée de trois mots moteurs de recherche russes. En conséquence, Rambler a trouvé 75562 documents sur le site 11041 (Fig. 6). Pour chaque page trouvée, nous voyons le titre, le début du texte publié sur la page, date dernière mise à jour, taille de fichier, codage et url de document. Pour affiner les résultats de la recherche, il est possible d'installer l'interrupteur de la requête trouvée dans le formulaire d'entrée, entrez les termes de clarification dans le champ de saisie et recherchez les documents trouvés. De plus, vous pouvez vous reporter au moteur de recherche vous demandant de trouver des pages similaires en sélectionnant le lien trouvant la similaire placé sous la description de vos favoris.



Mode de recherche étendu à Rambler

Selon le lien, la recherche avancée peut être traitée au mode de recherche approprié. Ce mode Il suppose la possibilité d'établir une requête suffisamment complexe sans utiliser d'opérateurs. Vous voyez le formulaire d'entrée de la requête et un nombre de commutateurs et de champs vous permettant de spécifier les paramètres de recherche. Par exemple, nous devons trouver des documents avec les mots moteurs de recherche russes dans le titre de la page, avec la limite de distance entre les mots-clés et les résultats de tri par date (Fig. 7).



Avec les contraintes établies, Rambler n'a trouvé que 77 documents, ce qui facilite considérablement l'analyse ultérieure des résultats obtenus (Fig. 8).

METAPOISK SYSTEMS (Services de recherche)

Notez que divers moteurs de recherche décrivent un nombre différent de sources d'informations sur Internet. Par conséquent, il est impossible d'être limité à la recherche uniquement dans l'un des moteurs de recherche. Nous nous familiariserons avec des outils de recherche qui ne forment pas leur propre index, mais ils peuvent utiliser les possibilités d'autres moteurs de recherche. Il s'agit de systèmes de métapoik (services de recherche, métacrales) capables d'envoyer une demande d'utilisateur simultanément plusieurs serveurs de recherche, sélectionnez le nombre limité des sources d'informations les plus pertinentes, qui, en règle générale, sont placées au sommet du résultat résultant. Liste, combinez ensuite les résultats obtenus et soumettez-les à l'utilisateur sous forme de document avec des références. Les capacités de recherche étendues dans de tels systèmes signifient la sélection de moteurs de recherche spécifiques pour la recherche.

Adresses de célèbres systèmes de métapoisisk:

  • Métacrawler.
  • Search.com.
  • Dogpile.

Programmes de recherche accélérés. Définition.

Enfin, considérons le dernier outil de recherche dans la classification - Recherche accélérée ou agents de recherche (Agent de recherche ou searchbots).

Le programme de recherche accéléré est une application installée sur l'ordinateur d'un utilisateur et capable:

  • envoyer des demandes à plusieurs serveurs de recherche;
  • trier les résultats de la recherche de pertinence;
  • supprimer des doublons;
  • vérifiez la disponibilité des documents sur le réseau.

La facilité d'utilisation de ce type de programmes est évidente, car il n'est pas nécessaire d'établir une connexion avec de nombreux moteurs de recherche et d'envoyer des demandes à chaque individu. Assez pour courir sur votre ordinateur personnel Le programme Agent de recherche est une demande (vous pouvez utiliser quelques raffinements, tels que la recherche dans les titres des pages recherchées) et l'envoyer directement à plusieurs moteurs de recherche populaires précédemment choisis dans la liste intégrée. Certaines versions commerciales des programmes de recherche accélérée permettent la création de leur propre liste de moteurs de recherche. Vous pouvez également pré-installer nombre maximum Liens reçus de chaque système.

Nous donnons les noms certains programmes populaires Recherche accélérée et adresses de leurs développeurs dansL'Internet:

  • Web furet.
  • Sujet Search Spider (SSSPIDER)

Ainsi, en utilisant des systèmes de métapoiques et des agents de recherche, vous pouvez consulter les sources d'informations les plus populaires et les plus pertinentes indexées dans divers moteurs de recherche.

Paramètres d'efficacité de recherche d'informations

Après une étude détaillée des principales caractéristiques des outils, nous nous tournons vers le problème de l'efficacité de la recherche. Les principaux paramètres de l'efficacité de la recherche sont les suivants:

  • recherche complète comme rapport du nombre de documents présentés au nombre total de documents pertinents;
  • précision de la recherche - le ratio du nombre de documents pertinents au nombre total de documents reçus;
  • la pertinence des références aux documents est l'existence des documents trouvés sur le réseau pour le moment;
  • vitesse de recherche.

Facteurs affectant l'efficacité de la recherche

Donc, nous avons découvert que dansl'Internet Il existe différents outils de recherche avec différentes fonctionnalités. La qualité de la recherche dépend donc principalement des paramètres d'un moteur de recherche particulier, par exemple de la taille de l'index, sur la méthode de recherche (clarification des sujets ou la recherche sur demande), etc. En outre, travailler avec un moteur de recherche spécifique, vous devez avoir une idée des méthodes d'élaboration des demandes, connaître les opérateurs nécessaires.

Ainsi, les facteurs suivants peuvent être distingués affectant l'efficacité de la recherche:

  • propriétés et opportunités pour le moteur de recherche;
  • la qualité de la formulation de la requête de mot.

Moteurs de recherche comparative

Comment puis-je évaluer la qualité de l'outil de recherche? Les moteurs de recherche sont généralement comparés aux paramètres suivants:

  • Nombre de pages indexées (volume d'index).
  • Période de mise à jour de l'indice. Cet indicateur affecte un tel paramètre en tant que pertinence des liens trouvés. Plus l'index est mis à jour, le moins souvent que les liens obsolètes seront trouvés dans les résultats de la recherche.
  • Retard avant l'enregistrement. Ce paramètre indique l'intervalle de temps avant la description de la description de la demande Web à l'index après la demande de son auteur.
  • Le nombre d'opérateurs pris en charge.
  • Trier par catégorie.
  • Opérateur standard combinant plusieurs mots-clés. Si l'opérateur standard est l'opérateur et que le moteur de recherche recherchera automatiquement des documents sur lesquels tous les mots-clés entrés seront présents. Sinon (opérateur ou) Les documents seront trouvés avec tous les mots-clés et avec chacun séparément.
  • Rechercher une phrase exacte.
  • Recherche par modèle (à la recherche de mots avec des terminaisons différentes).
  • Word de la comptabilité. Lorsque mode automatique Le système WordForm comptable recherchera un mot dans des documents avec toutes ses modifications.
  • Sensibilité à la lettre majuscule. Si le système ne distingue pas les lettres majuscules et minuscules, les résultats de la recherche seront moins de haute qualité.
  • Le formulaire de représentation de formulaire.
  • Caractéristiques supplémentaires: Recherchez des articles dans des groupes de nouvelles, des personnes, des organisations, des fichiers multimédia, etc.

Technologie de recherche d'informations sur Internet

Maintenant, considérez comment il est préférable de préparer l'utilisateur à compiler une demande. Tout d'abord, il est nécessaire de mener une analyse lexicale globale des informations que vous allez chercher. Il est souhaitable de faire un ensemble de mots-clés (si nécessaire, en plusieurs langues) sous la forme de termes individuels et de phrases spécifiques à votre domaine.

Vos actions:

  • sélection d'outils de recherche;
  • formulation précise des demandes utilisant des opérateurs pris en charge par cet instrument de recherche;
  • envoi de requêtes de test;
  • analyse des résultats de la recherche (par le numéro et la pertinence des références);
  • si nécessaire, ajustez la demande;
  • recherche;

Acceptation d'une recherche efficace

Sur la base de ce qui précède, vous pouvez sélectionner les techniques suivantes de la recherche efficace:

  • Rechercher des informations générales dans moteurs de recherche-catalogues. Dans les catalogues, vous trouvez généralement des serveurs spécialisés dans la zone souhaitée.
  • Recherchez des informations hautement spécialisées dans les moteurs de recherche. Pour effectuer une recherche plus étendue, il n'est clairement pas suffisant d'utiliser uniquement des catalogues avec nombre limité Ressources décrites. De plus, des informations étroites sur les annuaires peuvent simplement être manquantes. Par conséquent, il est nécessaire de rechercher de telles informations dans les moteurs de recherche avec de grands indices.
  • Utiliser des opérateurs ou un formulaire de demande étendu pour la zone de recherche de rétrécissement. Pour une recherche de haute qualité, vous devez vous familiariser avec la langue des demandes d'un moteur de recherche spécifique. Un moyen efficace et simple de résoudre le problème de la création d'une demande qualitative consiste à utiliser le mode de recherche étendu.
  • Utilisation de la fonction de recherche parmi les ressources trouvées. La plupart des moteurs de recherche prennent en charge la possibilité de rechercher à l'intérieur des résultats obtenus. En règle générale, pour cela, vous devez activer la recherche d'une case à cocher spéciale dans la recherche et entrez des mots supplémentaires pour rechercher la recherche parmi ceux trouvés sur demande.
  • Utilisation de la fonction de recherche pour des documents similaires pour la recherche pages pertinentes Par l'échantillon choisi.
  • Utilisation de systèmes de métapoik et de programmes de recherche d'informations accélérés. Pour obtenir un examen général des documents, il est conseillé d'utiliser les capacités des systèmes METAPOISK ou des programmes de recherche accélérés. Nous vous rappelons que ces outils de recherche envoient votre demande à plusieurs systèmes de recherche à la fois et chaque système reçoit plusieurs liens plus pertinents.
  • Voir Links Liens vers des sites spécialisés. Les auteurs de nombreux spécialistesLa toile. - Les fournitures accumulent leurs collections de liens sur le sujet du site. Souvent, vous arriverez à ces collections de nombreuses sources utiles, ce qui permettra de gagner du temps sur une recherche indépendante en utilisant les outils discutés ci-dessus.
  • Recherchez des réponses aux questions des groupes de nouvelles. Si vous le souhaitez, vous pouvez contacter un problème spécifique de l'aide dans un groupe de discussion spécialisé. Trouver groupe nécessaire Vous pouvez utiliser des outils de recherche spéciaux que nous examinerons plus loin.
  • Abonnez-vous à des listes de diffusion spécialisées. Après avoir effectué un abonnement à une liste de diffusion spécialisée, vous recevrez par email nouvelle information Selon les sujets choisis, ainsi que poser des questions à vos collègues par abonnement.

Recherche d'articles dans les groupes de nouvelles

Discutons du problème de la recherche d'articles dans des groupes de nouvelles. Les outils de recherche dans ce cas peuvent être certains moteurs de recherche www qui n'extrexent pas uniquement l'espace www, mais également des articles dans des téléconférences et ont un mode de recherche spécial dans cette ressource. La recherche de messages de groupes de discussion publiés au cours des six derniers mois, par exemple, le serveur de recherche Google est pris en charge. Rechercher systèmes www Très indicitaire des groupes de discussion indexés et contiennent des informations sur des articles qui existent vraiment sur le réseau. Pour chercher dans les archives de nouvelles existent systèmes spécialisésLe plus célèbre dont a été le système DEJA. En février 2001, Google Inc. a annoncé l'acquisition du service de discussion Usenet du système de Deja.com. Alors maintenant, les utilisateurs recherchent google Systems Chez http: // Groupes .Google .Com peut également rechercher également dans l'archive connectée du système DEJA, qui contient plus de 500 millions de messages indexés depuis 1995.

Fichiers de recherche

Envisagez maintenant les outils qui vous permettent de rechercher des fichiers. De nombreux moteurs de recherche www fournissent un service de recherche de fichiers multimédia (AltaVista, APORT, ...). Pour cela, il n'est pas nécessaire de connaître des opérateurs spéciaux, mais de passer suffisamment de la page d'accueil sur les liens de l'image (images), MP3 / Audio ou vidéo à un mode de recherche spécial. La recherche est effectuée en fonction du nom du fichier possible ou du texte dans le commentaire sur le lien vers le fichier multimédia. Vous pouvez prédire le nom du fichier, par exemple, un fichier image Eagle peut être appelé Eagle .gif. Ou devinez que les portes de la photo de la photo auront une signature appropriée.

Quant à la recherche logiciel, dans le World Wide Web, il existe des serveurs Web de recherche avec des collections de logiciels gratuits conditionnellement; Certains d'entre eux sont spécialisés dans la recherche de logiciels Internet, d'autres sont proposés pour trouver des applications pour un système opérateur. Ces systèmes vous mèneront éventuellement à un serveur FTP spécifique, à partir desquels vous pouvez télécharger le fichier souhaité. logiciel. Les serveurs d'archie doivent être mentionnés, fournissez également un service de recherche de fichiers sur FTP Server, mais il est beaucoup plus pratique d'utiliser des serveurs Web.

Adresses des serveurs populaires pour rechercher des fichiers logiciels et multimédia:

  • Collection Tucows;
  • Collection de CNET Shareware.com;
  • Système de recherche de différentes plates-formes CNET Download.com;
  • Logiciel de système de recherche jeux d'ordinateur et des fichiers multimédia jumbo;
  • Système de recherche de fichiers multimédia de recherche multimédia rapide;
  • Fichiers de recherche de fichiers russes.ru.

Rechercher des informations d'adresse sur les organisations et LADH

Envisagez des outils de recherche pour rechercher des informations d'adresse. Il y a deux façons de rechercher: blanche (blanc) et jaune (jaune).

White Search est la recherche d'informations d'adresse sur un nom de destinataire bien connu (nom de la personne ou nom de l'organisation).

Jaune-recherche - Recherchez ou Titres et adresse des informations sur des fonctionnalités supplémentaires (par la nature de l'activité, par base géographique).

Habituellement, les systèmes de pages jaunes comprennent immédiatement et les pages blanches - son téléphone est immédiatement visible à la destination et adresse postale. De plus, certaines pages jaunes vous permettent de rechercher simplement dans la liste alphabétique de leurs abonnés (recherche blanche). D'autre part, les pages blanches contiennent également des éléments de recherche jaune - en plus de la tâche de nom propre, ils vous permettent généralement de spécifier le nom de la ville, de l'état et d'autres données de recherche suspendant (ce qui est nécessaire dans le cas de nombreux noms) . Il est possible que c'est la raison pour laquelle de nombreux répertoires téléphoniques en ligne effectuant réellement une recherche blanche, appellent des pages jaunes.

Vous trouverez ci-dessous les adresses de certains systèmes Web pour rechercher des informations d'adresse sur les personnes et les organisations.

Recherche de personnes:

  • Recherche de personnes sur Yahoo
  • Système
  • Système de bigfoot

Recherche d'organisations:

  • section jaunes pages (pages jaunes) sur les moteurs de recherche;
  • http://www.yellowpages.com - Un serveur spécialisé pour la recherche aux États-Unis et dans d'autres pays.

Application de moteurs de recherche dans le processus éducatif

Les principales directions d'application de moteurs de recherche dans le processus éducatif:

  • recherche de portails éducatifs;
  • rechercher des adresses concernant les bureaux de représentation des établissements d'enseignement à www;
  • rechercher tutoriels, encyclopédie, livres de référence;
  • rechercher des formations sur la-ligne;
  • recherche de logiciels éducatifs.

Questions de contrôle :

  1. Définition de la tâche de recherche. Moteurs d'information et de recherche (IPS): Définition et tâches principales. Le concept de pertinence.
  2. Structure généralisée et composants principaux de l'IPS pour www. Indice de concept. Caractéristiques de la procédure d'indexation.
  3. Classification des périphériques de recherche. Acceptation du travail avec des catalogues thématiques.
  4. Moteurs de recherche (index automatiques). Modes de recherche simples et complexes.
  5. Possibilités généralisées pour former une demande utilisant des opérateurs.
  6. Mode de recherche complexe (étendue). Afficher et traiter les résultats de la recherche.
  7. METAPOISK SYSTEMS (Services de recherche).
  8. Définition et principales caractéristiques des programmes de recherche accélérés (agents de recherche).
  9. Paramètres d'efficacité de la recherche: complétude, précision, pertinence, vitesse. Facteurs affectant l'efficacité de la recherche. Capacités de moteurs de recherche comparatives.
  10. Technologie de recherche d'informations sur Internet. Techniques de recherche efficaces.
  11. Recherche d'articles dans des groupes de nouvelles. Fichiers de recherche. Recherche d'adresse Organisations d'information et personnes.
  12. Donnez des exemples d'appliquer des moteurs de recherche jusqu'à ce que.

Format: Document Web

12.07.2011 3948 0 0

Rechercher - le processus, au cours de laquelle, dans une ou plusieurs séquences, la corrélation est faite avec chaque objet stocké dans la matrice.

Du point de vue de l'utilisation de matériel informatique " recherche d'information «- Un ensemble d'opérations logiques et techniques avec l'objectif ultime de trouver des faits, des données, des documents pertinents pour la demande du consommateur.

Document pertinent - Ceci est un document contenant les informations souhaitées.

outils de recherche

  1. Moteurs de recherche (moteurs de recherche);
  2. Catalogues thématiques (rubriques);
  3. Catalogues spécialisés (encyclopédies en ligne etlivres de référence);
  4. METAPOISK SYSTEMS.

Catalogues thématiques

Les catalogues thématiques sont une collection systématique (sélection) de liens vers d'autres ressources Internet. Les liens sont organisés sous la forme d'un rubrique thématique, qui est structure hiérarchiqueEn passant sur lequel vous pouvez trouver les informations nécessaires.

Catalogues spécialisées

Des catalogues spécialisés ou des livres de référence sont créés dans des industries et des sujets individuels, selon les actualités, par des villes, aux adresses e-mail etc.

Méta-type

Lorsque vous utilisez les outils méta-papier, la demande est effectuée simultanément par plusieurs moteurs de recherche. Le résultat de la recherche est combiné dans le général, commandé par le degré de liste de pertinence.

Moteurs de recherche

Moteurs de recherche (l'outil de recherche de produit le plus développé) est systèmes automatiquesInterviewer des serveurs connectés à réseau mondialet maintenez des informations sur les données disponibles sur les serveurs de données.

Les moteurs de recherche sont composés de trois parties: programmes de traitement de robot, d'index et de requête.

Le robot (araignée, robot ou bot) est un programme qui visite des pages Web et se lit (en tout ou en partie) de leur contenu.

Indice - Il s'agit d'un entrepôt de données dans lequel des copies de toutes les pages visitées par des robots sont axées.

Programme de traitement des demandes - Il s'agit d'un programme selon lequel, conformément à la demande de l'utilisateur "Vues", un index de disponibilité information nécessaire Et renvoie des références aux documents trouvés.

Le travail des moteurs de recherche survient en quatre étapes:

1.Numérisation de l'espace Web

Système de recherche autour de l'horloge avec des robots parcourant l'espace Web disponible et copie toutes les pages rencontrées.

2. Ressources d'indexation

Détectée chercher des robots Les pages sont traitées par le programme de traitement de la demande et d'entre eux sont une base de données spéciale appelée par le pointeur. Le but de l'indexation est d'obtenir un fichier d'index avec lequel la demande du client est traitée presque instantanément.

3.Rechercher sur demande

Le moteur de recherche reçoit une demande de l'utilisateur en tant que mots-clés et n'est pas écrit sur le réseau, mais à sa base de données. Le nombre de pages trouvées peut être très volumineux, donc avant d'émettre des résultats au client, le classement des résultats de la recherche.

4.Formation de la page résultante.

Le système génère une page Web dynamique des résultats de la recherche.

Aujourd'hui, il est connu d'une grande quantité de moteurs de recherche.

http: //sight/uploads/posts/2013-11/1385453618_12.jpg

La plus grande et la première de la popularité du moteur de recherche, qui traite 42 milliards de demandes par mois, indexe de plus de 25 milliards de pages Web, peut trouver des informations sur 195. Soutient la recherche dans les documents formats PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint et autres.

La visualisation la plus rapide et la plus fiable de la recherche d'informations sur Internet est la recherche d'adresses URL (localisateur de ressources universelles - un pointeur de ressources universel).

Pour accès rapide Les ressources suffisent pour exécuter le programme de navigateur et composer une adresse d'URL familière dans la barre d'adresse.

Par exemple, lors de la frappe dans la barre d'adresse, l'adresse Bolohovomt.ru est accessible sur le site de l'école technique de Bolokhovsky Machine-Building

L'OIN des types de recherche les plus courants est une recherche par mot-clé. Considérez cette vue de recherche sur l'exemple du système de recherche Google (voir la vidéo de recherche vidéo. MP4).

Pour rechercher par mots-clés, vous devez entrer un mot ou quelques mots dans une fenêtre spéciale qui doit être signée et cliquer sur le bouton de recherche. Le moteur de recherche trouvera dans sa base de données et montrera les documents contenant ces mots.

La vitesse d'obtention du résultat dépend des caractéristiques des canaux de communication, des caractéristiques de l'organisation du moteur de recherche et de la "qualité" de la requête.

Si l'utilisateur ne peut pas affecter directement le travail des moteurs de recherche, la qualité de la recherche d'une recherche est pleinement dans sa compétence.

Réceptions de la recherche simple

1.Recherche d'un groupe de mots

Les mots "ouverts" ou "éducation" donneront un grand nombre de références diverses liées à des sujets complètement différents, et il est peu probable qu'il ait une relation à "l'éducation ouverte". Par conséquent, il est recommandé d'ajouter un ou deux mots-clés associés au sujet souhaité. Par exemple, l'éducation ouverte ou la technologie d'éducation ouverte. Il est également nécessaire de réduire la zone de la question. Si vous avez besoin de trouver des informations sur le système juridique, le garant, la demande "Système juridique Greant" donnera des documents plus appropriés que le simple "système juridique". Le nombre de mots du groupe n'est pas limité.

2.Recherche de WordForm

Dans la plupart des cas, le moteur de recherche par défaut recherche toutes les langues Wordworks. Toutefois, vous pouvez spécifier le moteur de recherche pour ne pas trier tous les spécifications de mots de la requête lors de la recherche. Dans de nombreux systèmes pour cela est utilisé point d'exclamation. Par exemple, la requête "! Ordinateur" trouvera des pages avec ce mot sans les formulaires de mots

3.Le rôle des lettres majuscules

Dans le cas où l'utilisateur est entré en tant que mot-clé de demande avec lettres majusculesLe moteur de recherche ne trouvera pas de pages, où il contient ce mot commençant par les lettres minuscules. donc lettres majuscules La demande est recommandée à utiliser uniquement dans vos propres noms. Par exemple, la ville de Moscou, Mark Tuly Cicero.

4.La valeur des caractères génériques

Lorsqu'il n'y a aucune confiance que le moteur de recherche traite correctement les formes Words (c'est-à-dire lorsqu'il s'agit, par exemple, sur les noms de propre ou de mots d'origine étrangère) Les moteurs de recherche vous permettent d'utiliser des caractères génériques. Le plus souvent, c'est un symbole "*" au lieu de n'importe quel nombre de caractères jusqu'à la fin du mot. Par exemple, si l'utilisateur souhaite trouver des pages contenant les mots "République de Tatarstan", mais la République Tatar arrangera, alors il est nécessaire de demander la "République de Tatars *".

5.Comptabilisation des mots réservés

Les mots réservés (mots d'arrêt) sont ces mots qui ne sont pas pris en compte lors de la recherche. Habituellement, ils incluent tous les mots courts dans lesquels moins de 4 lettres sont incluses (prépositions, syndicats, etc.). Par exemple, lors de la demande "Nous en Italie", des documents seront disponibles dans lesquels le mot "Italie" ou son formulaire de mot.

6.Outils de recherche contextuels

Si des mots-clés sont entre guillemets, le moteur de recherche doit trouver des documents dans lesquels cette phrase est littéralement présente (recherche de citations).

Recherche Avancée

Pour une recherche plus rapide et réussie dans les moteurs de recherche avec des mots-clés, divers opérateurs logiques sont utilisés. Pour cela, vous pouvez construire une demande de manière à ce qu'il n'y ait pas de sites sur le sujet d'intérêt, mais des pages spécifiques et même des documents individuels. Les règles de compilation de requêtes complexes sur un moteur de recherche peuvent différer de celles de l'autre, mais dans tous les cas, les principaux opérateurs suivants seront utilisés:

1.Opérateur et (et)

Avec cet opérateur, deux mots ou plus sont combinés de manière à ce qu'ils soient tous assistés dans le document artistique. Souvent plutôt et utilisez & ou +. Exemple: sur demande, un avocat et le programme trouveront des documents contenant à la fois le mot.

2Opérateur ou (ou)

Fournit une recherche de l'un des mots du groupe. Exemple: sur demande, l'éducation ou la formation se trouveront des documents contenant le mot éducation ou formation.

3.Supports logiques

Appliquez quand il est nécessaire de gérer la procédure pour suivre les opérateurs logiques suivants. Exemple: à la demande de Lomonosov ou (Mikhail et Vasilyevich), des documents contenant les mots de Lomonosov ou de Mikhail et de Vasilyevich seront trouvés.

4.Opérateur non (non)

Il est utilisé lorsque certains mots clés doivent être exclus des résultats de la recherche, par exemple à la demande de l'avocat, les avocats ne seront pas trouvés des informations sur les non-avocats.

Avez-vous aimé l'article? Partager avec des amis: