Méthodes et technologies de recherche d'informations. Techniques de recherche efficaces. Fonctionnalités et procédures d'indexation

Technologie de recherche d'informations sur Internet.

Chaque année, le volume d'Internet augmente considérablement, de sorte que la probabilité de trouver information nécessaire augmente fortement. Internet rassemble des millions d'ordinateurs, de nombreux réseaux différents, et le nombre d'utilisateurs augmente.

Pour trouver les informations dont vous avez besoin, vous devez trouver son adresse. Pour cela, il existe des serveurs de recherche spécialisés (robots d'indexation (moteurs de recherche), catalogues Internet thématiques, méta-systèmes de recherche, services de recherche de personnes, etc.). Cette master class révèle les principales technologies de recherche d'informations sur Internet, fournit les fonctionnalités générales des outils de recherche, examine la structure Requêtes de recherche pour les moteurs de recherche russophones et anglophones les plus populaires.

Les outils de recherche sont spéciaux Logiciel, dont l'objectif principal est de fournir aux internautes la recherche d'informations la plus optimale et la plus qualitative. Les outils de recherche sont hébergés sur des serveurs web dédiés.

Les méthodes de travail utilisées lors de l'utilisation de l'un ou l'autre outil de recherche sont pratiquement les mêmes. Avant de passer à leur discussion, considérez les concepts suivants : L'interface de l'outil de recherche se présente sous la forme d'une page avec des hyperliens, une chaîne de requête (barre de recherche) et des outils d'activation de requête. L'index du moteur de recherche est base d'informations contenant le résultat de l'analyse des pages Web, compilé selon certaines règles. La demande est mot-clé ou une phrase que l'utilisateur entre dans la barre de recherche. Pour former diverses requêtes, des caractères spéciaux ("", ~), des symboles mathématiques (*, +,?) sont utilisés.

Le schéma de recherche d'informations est simple. Les types d'utilisateurs phrase clé et active la recherche, obtenant ainsi une collection de documents pour la requête formulée (donnée). Cette liste de documents est classée selon certains critères de sorte qu'en tête de liste figurent les documents qui correspondent le plus à la demande de l'utilisateur. Chacun des outils de recherche utilise des critères différents pour classer les documents, à la fois dans l'analyse des résultats de recherche et dans la constitution de l'index (remplissage de la base de données d'index des pages Web).

Ainsi, si vous spécifiez la même requête dans la chaîne de recherche pour chaque outil de recherche, vous pouvez obtenir des résultats de recherche différents. Pour l'utilisateur, il est très important de savoir quels documents apparaîtront dans les deux ou trois premières douzaines de documents en fonction des résultats de la recherche et dans quelle mesure ces documents correspondent aux attentes de l'utilisateur.

Solution

Travail de laboratoire № 1

TECHNOLOGIE DE RECHERCHE D'INFORMATIONS

1. But du travail
Développement pratique de la technologie de recherche d'informations efficace.

2. informations générales
2.1. Outils de recherche d'informations
Presque toutes les informations dont vous avez besoin peuvent être trouvées sur Internet. Ressources d'information Internet se caractérise par une immense quantité de matériel accumulé au cours de décennies d'existence. systèmes informatiques... Ils contiennent fichiers texte, programmes, images, musique, films ; sont constamment mis à jour et grandissent comme une avalanche. Les ressources Internet sont largement utilisées dans presque toutes les sphères de l'activité humaine. Ils jouent également un rôle de plus en plus important dans l'apprentissage.
Les compétences professionnelles en technologie de recherche d'informations sont essentielles pour un professionnel des technologies de l'information, qui est incroyablement vaste et dynamique. La recherche professionnelle permet non seulement de minimiser la probabilité de manquer l'information requise, mais aussi de réduire considérablement le temps et les coûts financiers de sa recherche.
Pour rechercher des informations sur Internet sont utilisés : moteurs de recherche, méta outils de recherche, catalogues indexés, encyclopédies en ligne et ouvrages de référence. Les portails de recherche modernes contiennent non seulement un ensemble d'outils de recherche ci-dessus, mais fournissent également Des services supplémentaires comme les adresses gratuites E-mail, emplacements pour placer des pages Web d'accueil, etc. Pour effectuer une recherche efficace sur Internet, vous devez connaître les principes de fonctionnement des outils de recherche et être capable de formuler correctement une requête de recherche.
Les moteurs de recherche, effectuant une analyse continue des sites Internet disponibles, téléchargent les pages trouvées dans une base de données et forment une base de données spéciale qui stocke des informations indexées sur les pages téléchargées (voir, par exemple, les principes du moteur de recherche Rambler). Lorsqu'une demande est reçue, le moteur de recherche, en utilisant les informations indexées, produit une liste de documents classés par l'emplacement des mots-clés dans la requête de recherche, leur fréquence dans le texte et d'autres paramètres. Ayant un principe de fonctionnement similaire, les moteurs de recherche diffèrent cependant par les algorithmes et les principes de recherche utilisés, qui sont également constamment améliorés ; par conséquent, les résultats de la recherche diffèrent d'un véhicule à l'autre.
Il existe aujourd'hui un grand nombre de moteurs de recherche. Les plus populaires parmi plusieurs centaines de types de moteurs de recherche différents sont les outils de recherche des portails suivants.
Google ( http://www.google.com/) le leader mondial en termes de volume de documents indexés et de rapidité de traitement des demandes. Google le plus populaire système de recherche, permet une recherche quelle que soit la langue source, facile à utiliser, a bonne langue demandes et une interface simple.
Яndex (http://www.yandex.ru/) est le plus grand portail russe offrant aux utilisateurs de nombreux services, notamment recherche et informations(12 prestations). Le robot du moteur de recherche Yandex analyse en permanence Internet et suit automatiquement les modifications. les résultats de la recherche sont triés en fonction des critères de pertinence établis (le degré de correspondance entre la recherche et la recherche). Le moteur de recherche fournit une fonction de recherche avancée qui vous permet d'affiner plusieurs paramètres de recherche.
Rambler (http://www.rambler.ru/) est un portail de recherche russe. Rambler existe en tant que système professionnel de recherche d'informations depuis 1996. Fournit différents types de recherche, y compris la recherche avancée par une combinaison de divers paramètres, en tenant compte de la morphologie de la langue russe.
Un port! (http://aport.ru/) le portail de recherche russe Aport dispose de capacités avancées pour formuler des requêtes ; permet la recherche d'images graphiques et de fichiers multimédias.
Altavista (http://www.altavista.com/). Le moteur de recherche AltaVista est apparu fin 1995 et avant le triomphe de Google était le leader mondial de la recherche (l'index du système contenait déjà plus de 20 millions de pages). Conçu pour rechercher des informations sur Internet quelle que soit la région du monde ; fournit la recherche de fichiers graphiques, audio et vidéo, ainsi que la possibilité de traduire dans les principales langues européennes ; l'un des premiers à prendre en charge la recherche en russe.
Yahoo! (http://www.yahoo.com/). En tant que moteur de recherche, il s'agit du répertoire de ressources Internet faisant autorité. Problèmes par sujet de recherche quantité maximale sites étrangers; fournit une recherche en russe.
Les systèmes de méta-recherche sont également utilisés pour rechercher des informations. Le système metaposk permet de rechercher plusieurs moteurs de recherche à la fois (jusqu'à plusieurs dizaines). Cependant, il est judicieux d'utiliser la métarecherche principalement dans les cas de recherche d'un document spécifique ou sur un sujet très restreint.
2.2. Langage de requête de recherche
En général, une requête de recherche peut comprendre un ou plusieurs mots, Opérateurs logiques et des signes de ponctuation. Les requêtes simples ne nécessitent pas la connaissance de la langue des requêtes de recherche, donc si vous entrez dans chaîne de recherche plusieurs mots sans signes de ponctuation et sans opérateurs logiques, on trouvera alors des documents contenant tous ces mots, et à une distance arbitraire les uns des autres. La connaissance du langage de requête d'un moteur de recherche particulier et de son application correcte nous permet de rendre la recherche rapide et efficace.
Opérateurs de langage de requête
L'opérateur AND (ET logique ; abréviation "&") forme une requête complexe qui ne trouvera que les documents contenant simultanément les deux arguments de l'opérateur. Par exemple, une requête : « information ET technologie » ne trouvera que les documents contenant à la fois le mot « information » et le mot « technologie ». Un résultat similaire sera obtenu avec une telle requête : « information & technologie ».
Noter. L'opérateur AND est la valeur par défaut, la requête est donc : " informatique" Donnera le même résultat que la requête : " information AND technologie ".
L'opérateur OR (OR; abréviation "|") forme une requête qui trouvera tous les documents qui satisfont au moins un des arguments de l'opérateur. Pour la requête : « information OU technologie », on trouvera des documents contenant au moins un des mots « information » ou « technologie », ou les deux.
L'opérateur NOT (AND NOT, abréviation "&!") Forme une requête qui trouvera les documents qui satisfont le côté gauche de la requête et ne satisfont pas le côté droit. Sur demande : des documents « information NON technologie » seront trouvés contenant le mot « information » et ne contenant pas le mot « technologie ».
Noter. Si une requête complexe comprend plusieurs opérateurs, alors elle sera exécutée selon la priorité traditionnelle de ces opérateurs. Vous pouvez modifier l'ordre d'exécution en utilisant des parenthèses.
Devis
Vous pouvez utiliser des guillemets doubles pour rechercher des guillemets ou des mots sous une forme donnée. Les mots pour cette partie de la requête, qui est entouré de guillemets doubles, sont recherchés dans les documents exactement comme ils sont présentés dans ces guillemets. Par exemple, la requête « les technologies de l'information sont« appliquées » » est satisfaite par un document contenant le texte « ... les technologies de l'information seront appliquées... », mais ne satisfait pas un document contenant « ... les technologies de l'information sont appliqué...". Et pour la requête de recherche "" la technologie de l'information est appliquée " ", seuls les documents contenant exactement une telle combinaison de mots d'affilée seront renvoyés à la lettre, tandis que le nombre de documents sélectionnés sera fortement réduit.
Noter. C'est ainsi que les guillemets doubles sont interprétés par tous les moteurs de recherche mentionnés ci-dessus. portails de rechercheà l'exception d'Aport, pour lequel l'opérateur guillemets doubles (ou simples) permet de retrouver une phrase spécifiée dans ceux-ci, ou à proximité, de sorte qu'Aport dans une requête de recherche avec guillemets doubles ne fera pas de distinction entre les mots "appliquer" et "appliquer".
Supports
Les crochets peuvent être utilisés pour imbriquer des requêtes, modifier la portée des opérateurs et modifier la priorité par défaut des opérateurs logiques. Lorsque des parenthèses sont utilisées, la partie de la requête qui est entre parenthèses est interprétée comme une requête, de sorte qu'elle est soumise aux règles du langage de requête.
Par exemple, si vous recherchez « données ET informations OU signal », le moteur de recherche trouvera des documents contenant soit « données » et « informations » ou « signal ». Et pour la requête « données ET (information OU signal) », « données » et l'un des mots « information » ou « signal » seront trouvés.
Limitation de distance
À simple demande des documents seront trouvés dans lesquels se trouvent tous les mots de requête qui ne dépassent pas la limite de distance par défaut (par exemple, pour Rambler, elle est égale à une distance de 40 mots). Ainsi, pour la demande « information data », le document ne sera délivré que si les mots « information » et « data » sont séparés dans ce document par au plus 40 mots, dont ces deux mots.
La valeur de la limitation de distance peut être modifiée, par exemple, pour Rambler par la construction (n, requête), où n est un nombre positif, la requête est une requête de recherche valide. Par exemple, la requête « (2, données d'informations) » ne renverra que les documents dans lesquels les mots « informations » et « données » apparaissent côte à côte au moins une fois.
D'autres moteurs de recherche utilisent généralement des opérateurs de limitation de distance différents. Les moteurs de recherche peuvent également permettre de définir ce paramètre dans le menu de recherche avancée (voir, par exemple, l'aide de Yandex sur la recherche avancée).
Les éléments ci-dessus du langage des requêtes de recherche sont utilisés, en règle générale, par tous les moteurs de recherche. Cependant, les moteurs de recherche peuvent utiliser d'autres constructions, y compris des métacaractères et des opérateurs spéciaux, alors consultez système d'aide moteur de recherche spécifique.

3. L'ordre des travaux

3.1. Lisez le matériel décrit au paragraphe 2 de cet ouvrage.
3.2. Allumez l'ordinateur qui vous est attribué et obtenez une tâche individuelle de l'enseignant.
3.3. Familiarisez-vous, à l'aide d'hyperliens, avec les capacités des moteurs de recherche des portails spécifiés à la clause 2.1.
3.4. Conformément à la tâche reçue, composez les options de requête de recherche.
3.5. Recherchez les documents requis en fonction des options de votre requête de recherche.
3.6. Analysez vos résultats.
3.7. Complétez le rapport et défendez le laboratoire.
3.8. Éteignez votre ordinateur et rangez votre espace de travail.

5. Questions de contrôle
1. Comment le moteur de recherche Yandex interprétera-t-il la requête « technologie de l'information » ?
2. Aport retournera-t-il à la requête de recherche « technologie de l'information » les documents contenant les mots technologie de l'information, mais ne contenant pas le mot technologie de l'information ?
3. Comment modifier la portée des opérateurs logiques dans une requête de recherche ?
4. Répertoriez les principaux opérateurs logiques du langage de requête.
5. Quelle est la différence entre les métamoteurs de recherche et les moteurs de recherche ?

Technologie de recherche d'informations sur Internet. Types d'outils de recherche

1. Introduction

2. Technologies de recherche

2.1 outils de recherche

2.2 Moteurs de recherche

2.3 Annuaires

2.4 Collections de liens

2.5 Base de données d'adresses

2.6 Rechercher dans les archives Gopher (archives Gopher)

2.7 Système de recherche FTP

2.8 Moteur de recherche de conférence de presse Usenet

2.9 Méta-moteurs de recherche

2.10 Systèmes de recherche de personnes

3. Conclusion

Application . Information brève sur les moteurs de recherche

1. Introduction

Chaque année, le volume d'Internet augmente considérablement, de sorte que la probabilité de trouver les informations dont vous avez besoin augmente considérablement.

Internet réunit des millions d'ordinateurs, de nombreux réseaux différents, le nombre d'utilisateurs augmente de 15 à 80 % par an. Et, néanmoins, de plus en plus souvent lors de l'accès à Internet, le problème principal il s'avère non pas l'absence des informations requises, maisla capacité de la trouver... En règle générale, une personne ordinaire, en raison de diverses circonstances, ne peut ou ne veut pas passer plus de 15 à 20 minutes à chercher la réponse dont elle a besoin. Par conséquent, il est particulièrement important d'apprendre correctement et avec compétence une chose apparemment simple - où et comment chercher afin d'obtenir les réponses DÉSIRÉES.

Pour trouver les informations dont vous avez besoin, vous devez trouver son adresse. Pour cela, il existe des serveurs de recherche spécialisés (robots d'indexation (moteurs de recherche), annuaires Internet thématiques, systèmes de méta-recherche, services de recherche de personnes, etc.).

En outre, les principales technologies permettant de trouver des informations sur Internet sont divulguées, les caractéristiques générales des outils de recherche sont fournies et les structures des requêtes de recherche pour les moteurs de recherche les plus populaires en russe et en anglais sont prises en compte.

2. Technologies de recherche

Technologie Web mondiale Toile large(WWW) est considérée comme une technologie spéciale pour la préparation et la publication de documents sur Internet. Le WWW comprend à la fois des pages Web et bibliothèques numériques, des catalogues et même des musées virtuels ! Avec une telle abondance d'informations, la question se pose : « Comment naviguer dans un espace d'information aussi vaste et à grande échelle ? Ils viennent à la rescousse pour résoudre ce problème outils de recherche.

2.1 Outils de recherche

Les outils de recherche sont des logiciels spéciaux dont le but principal est de fournir aux internautes la recherche d'informations la plus optimale et la plus qualitative. Les outils de recherche sont hébergés sur des serveurs Web spéciaux, chacun remplissant une fonction spécifique :

1. Analyse des pages Web et saisie des résultats de l'analyse à l'un ou l'autre niveau de la base de données du moteur de recherche.

2. Rechercher des informations sur la demande de l'utilisateur.

3. Fournir une interface pratique pour rechercher des informations et afficher le résultat de la recherche par l'utilisateur.

Les méthodes de travail utilisées lors de l'utilisation de l'un ou l'autre outil de recherche sont pratiquement les mêmes.

Tout d'abord, considérons les concepts suivants :

1. L'interface de l'outil de recherche se présente sous la forme d'une page avec des hyperliens, une ligne de soumission de requête (barre de recherche) et des outils d'activation de requête.

2. Index des moteurs de recherche Est une base d'informations contenant le résultat de l'analyse des pages web, compilé selon certaines règles.

3. Une requête est un mot-clé ou une phrase que l'utilisateur entre dans la barre de recherche. Pour former diverses requêtes, des symboles spéciaux ("", ~) et mathématiques (*, +,?) sont utilisés.

Le schéma de recherche d'informations est simple... L'utilisateur tape une phrase clé et active la recherche, recevant ainsi une sélection de documents pour la demande formulée. Cette liste de documents est classée selon certains critères de sorte qu'en tête de liste figurent les documents qui correspondent le plus à la demande de l'utilisateur. Chacun des outils de recherche utilise des critères différents pour classer les documents, à la fois dans l'analyse des résultats de la recherche et dans la constitution de l'index (remplissage de la base de données d'index des pages Web).

Ainsi, si vous spécifiez la même requête dans la chaîne de recherche pour chaque outil de recherche, vous pouvez obtenir des résultats de recherche différents. Pour l'utilisateur, il est très important de savoir quels documents apparaîtront dans les deux ou trois premières douzaines de documents en fonction des résultats de la recherche et dans quelle mesure ces documents correspondent aux attentes de l'utilisateur.

La plupart des outils de recherche proposent deux méthodes de recherche : la recherche simple et la recherche avancée avec et sans formulaire de requête personnalisé. Considérons les deux types de recherche en utilisant l'exemple d'un moteur de recherche en anglais.

Par exemple, AltaVista est utile pour les requêtes ad hoc, « Quelque chose sur les diplômes en ligne en technologie de l'information», tandis que l'outil de recherche Yahoo vous permet de recevoir des nouvelles du monde, des informations sur le taux de change ou les prévisions météo.

La maîtrise des critères d'affinement d'une demande et des techniques de recherche avancées vous permet d'augmenter l'efficacité de la recherche et de trouver rapidement les informations dont vous avez besoin. Tout d'abord, vous pouvez augmenter l'efficacité de la recherche en utilisant des opérateurs logiques (opérations) Ou, Et, Près, Non, mathématiques et caractères spéciaux... A l'aide d'opérateurs et/ou de symboles, l'utilisateur associe des mots-clés dans l'ordre souhaité pour obtenir le résultat de recherche le plus approprié. Formulaires de demande en anglais. sont présentés dans le tableau 1.

Tableau 1

Requête simple

Requête étendue

Élargi

en utilisant les mathématiques

personnages

compte marchand internet et

Internet + commerçant + compte

compte marchand

internet ~ marchand ~ gouv *

compte marchand internet

marchand internet près du gouv *

internet ~ marchand ~ gouverneur

"compte marchand"

marchand internet près de l'éducation

Internet ~ marchand ~ (gouverneur

"compte marchand internet"

Une simple requête donne un certain nombre de liens vers des documents, car la liste comprend des documents contenant l'un des mots saisis lors de la requête, ou une simple phrase (voir tableau 1). L'opérateur et vous permet de spécifier que tous les mots-clés doivent être inclus dans le contenu du document. Cependant, le nombre de documents peut encore être important et leur examen prendra beaucoup de temps. Par conséquent, dans certains cas, il est beaucoup plus pratique d'utiliser l'opérateur de contexte near, qui indique que les mots doivent être situés dans le document à une proximité suffisante. L'utilisation de near réduit considérablement le nombre de documents trouvés. La présence du caractère "*" dans la chaîne de requête signifie qu'un mot sera recherché par son masque. Par exemple, nous obtenons une liste de documents contenant des mots commençant par "gov" si nous écrivons "gov *" dans la chaîne de requête. Il peut s'agir des mots gouvernement, gouverneur, etc.

Le service de recherche d'informations en russe le plus développé est fourni par le serveur de recherche Yandex.

Dans Yandex, vous pouvez simplement écrire en russe une phrase décrivant ce que vous voulez trouver, et le système analysera et traitera votre demande, puis essaiera de trouver tout ce qui concerne le sujet donné.

Vous pouvez, à l'aide d'opérateurs spéciaux, composer une chaîne expliquant au moteur de recherche ce que vos besoins doivent répondre aux informations qui vous intéressent. Certains des opérateurs de langage de requête Yndex peuvent être consultés ici : http://help.yandex.ru/search/?id=481939

Le moteur de recherche tout aussi populaire Rambler conserve des statistiques sur le trafic de liens à partir de sa propre base de données, les mêmes opérateurs logiques AND, OR, NOT, métacaractère * (similaire au caractère * élargissant la plage de requête dans AltaVista), les symboles de coefficient + et - sont pris en charge, pour augmenter ou diminuer les mots significatifs entrés dans la requête.

Jetons un coup d'œil aux technologies les plus populaires pour trouver des informations sur Internet.

2.2 moteurs de recherche

Les moteurs de recherche Web sont des serveurs avec base énorme des URL de données qui accèdent automatiquement aux pages WWW à toutes ces adresses, étudient le contenu de ces pages, forment et écrivent des mots-clés à partir des pages dans leur base de données (pages d'index).

De plus, les robots des moteurs de recherche suivent les liens trouvés sur les pages et les réindexent. Étant donné que presque toutes les pages WWW contiennent de nombreux liens vers d'autres pages, avec un tel travail, le moteur de recherche dans le résultat final peut théoriquement contourner tous les sites sur Internet.

Ce type d'outils de recherche est le plus connu et le plus populaire parmi tous les internautes. Tout le monde a entendu les noms de moteurs de recherche Web bien connus (moteurs de recherche) - Яindex,

Rambler, Aport.

Pour utiliser ce type d'outil de recherche, vous devez vous y rendre et taper dans la barre de recherche le mot-clé qui vous intéresse.

Pour rendre la recherche plus efficace, veuillez noter les points suivants à l'avance:

décider de l'objet de votre demande... Qu'est-ce que tu veux trouver exactement ?

attention au langage, à la grammaire, à l'utilisation de divers caractères non alphabétiques, à la morphologie ... Il est également important de formuler et de saisir correctement les mots-clés. Chaque moteur de recherche a sa propre forme d'écriture d'une requête - le principe est le même, mais les symboles ou opérateurs utilisés peuvent différer. Les formulaires d'enquête requis diffèrent également en fonction de la complexité du logiciel des moteurs de recherche et des services qu'ils fournissent. D'une manière ou d'une autre, chaque moteur de recherche a une section " Aider "("Aide"), où toutes les règles de syntaxe, ainsi que des recommandations et astuces pour la recherche, sont expliquées facilement (capture d'écran des pages du moteur de recherche).

utiliser les capacités des différents moteurs de recherche ... Si vous ne le trouvez pas sur Yandex, essayez-le sur Google. Utilisez les services de recherche avancée.

pour exclure les documents contenant certains termes, utilisez le "-" avant chacun de ces mots. Par exemple, si vous avez besoin d'informations sur les œuvres de Shakespeare, à l'exception de "Hamlet", saisissez une requête sous la forme : "Shakespeare-Hamlet". Et pour que certains liens soient inclus dans les résultats de la recherche, utilisez le symbole "+ " : liens sur la vente de voitures - la requête " vente + voiture ".

chaque lien dans la liste des résultats de recherche contient un extrait - plusieurs lignes du document trouvé, parmi lesquelles se trouvent vos mots-clés. Avant de cliquer sur le lien, évaluez la correspondance de l'extrait avec l'objet de la demande. Après avoir cliqué sur un lien vers un site spécifique, regardez attentivement la page principale. En règle générale, la première page suffit pour comprendre si vous êtes venu à l'adresse ou non. Si oui, d'autres recherches les informations dont vous avez besoin entrez sur le site sélectionné (dans les sections du site), sinon, retournez aux résultats de la recherche et essayez le lien suivant.

rappelez-vous que les moteurs de recherche ne produisent pas d'informations par eux-mêmes (sauf pour des clarifications sur eux-mêmes). Système de recherche

ce n'est qu'un intermédiaire entre le propriétaire de l'information (site Web) et vous. Les bases de données sont constamment mises à jour, de nouvelles adresses y sont ajoutées, mais le retard par rapport aux informations réellement existantes dans le monde persiste. C'est simplement parce que les moteurs de recherche ne fonctionnent pas à la vitesse de la lumière.

Les moteurs de recherche Web les plus connus sont Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Parmi les russophones figurent Yandex, Rambler, Aport.

Les moteurs de recherche sont les plus importants et les plus précieux, mais loin d'être les seules sources d'information sur le Web.

Technologies de recherche sur Internet

Chaque année, le volume d'Internet augmente considérablement, de sorte que la probabilité de trouver les informations dont vous avez besoin augmente considérablement. Internet réunit des millions d'ordinateurs, de nombreux réseaux différents, le nombre d'utilisateurs augmente de 15 à 80 % par an. Et, néanmoins, de plus en plus souvent lors de l'accès à Internet, le problème principal n'est pas le manque d'informations requises, mais la capacité de les trouver. En règle générale, une personne ordinaire, en raison de diverses circonstances, ne peut ou ne veut pas passer plus de 15 à 20 minutes à chercher la réponse dont elle a besoin. Par conséquent, il est particulièrement important d'apprendre correctement et avec compétence une chose apparemment simple - où et comment chercher pour obtenir la réponse SOUHAITÉE. Pour trouver les informations dont vous avez besoin, vous devez trouver son adresse. Pour cela, il existe des serveurs de recherche spécialisés (robots d'indexation (moteurs de recherche), annuaires Internet thématiques, systèmes de méta-recherche, services de recherche de personnes, etc.). Cette master class révèle les principales technologies de recherche d'informations sur Internet, fournit les fonctionnalités générales des outils de recherche, examine les structures des requêtes de recherche pour les moteurs de recherche russophones et anglophones les plus populaires.

Technologie Web Le World Wide Web (WWW) est considéré comme une technologie spéciale pour la préparation et la publication de documents sur Internet. Le WWW comprend des pages Web, des bibliothèques électroniques, des catalogues et même des musées virtuels ! Avec une telle abondance d'informations, la question se pose : « Comment naviguer dans un espace d'information aussi vaste et à grande échelle ? Les outils de recherche viennent à la rescousse pour résoudre ce problème. Les outils de recherche sont des logiciels spéciaux dont le but principal est de fournir aux internautes la recherche d'informations la plus optimale et la plus de haute qualité. Les outils de recherche sont hébergés sur des serveurs Web spéciaux, chacun remplissant une fonction spécifique :

Analyse des pages Web et saisie des résultats de l'analyse à l'un ou l'autre niveau de la base de données du moteur de recherche.

Rechercher des informations sur la demande de l'utilisateur.

Fournir une interface pratique pour rechercher des informations et afficher le résultat de la recherche par l'utilisateur.

Les méthodes de travail utilisées lors de l'utilisation de l'un ou l'autre outil de recherche sont pratiquement les mêmes. Avant de passer à leur discussion, considérez les concepts suivants :

L'interface de l'outil de recherche se présente sous la forme d'une page avec des hyperliens, une ligne de soumission de requête (barre de recherche) et des outils d'activation de requête.

L'index des moteurs de recherche est une base d'informations contenant le résultat de l'analyse des pages web, compilé selon certaines règles.

Une requête est un mot-clé ou une phrase qu'un utilisateur entre dans la barre de recherche. Pour former diverses requêtes, des caractères spéciaux ("", ~), des symboles mathématiques (*, +,?) sont utilisés.

Le schéma de recherche d'informations est simple. L'utilisateur tape une phrase clé et active la recherche, recevant ainsi une sélection de documents pour la requête formulée (spécifiée). Cette liste de documents est classée selon certains critères de sorte qu'en tête de liste figurent les documents qui correspondent le plus à la demande de l'utilisateur. Chacun des outils de recherche utilise des critères différents pour classer les documents, à la fois lors de l'analyse des résultats de la recherche et lors de la constitution d'un index (remplissage de la base de données d'index des pages Web) Ainsi, si vous spécifiez une requête dans la barre de recherche pour chaque outil de recherche du même design , vous pouvez obtenir différents résultats de recherche. Pour l'utilisateur, il est très important de savoir quels documents apparaîtront dans les deux ou trois premières douzaines de documents en fonction des résultats de la recherche et dans quelle mesure ces documents correspondent aux attentes de l'utilisateur. La plupart des outils de recherche proposent deux méthodes de recherche, la recherche simple et la recherche avancée, avec et sans formulaire de requête personnalisé. Considérons les deux types de recherche en utilisant l'exemple d'un moteur de recherche en anglais. Par exemple, AltaVista est pratique à utiliser pour des requêtes arbitraires, "Quelque chose sur les diplômes en ligne en technologie de l'information", tandis que l'outil de recherche Yahoo vous permet d'obtenir des nouvelles du monde, des informations sur les devises ou des prévisions météorologiques.

La maîtrise des critères d'affinement d'une demande et des techniques de recherche avancées vous permet d'augmenter l'efficacité de la recherche et de trouver rapidement les informations dont vous avez besoin. Tout d'abord, vous pouvez augmenter l'efficacité de la recherche en utilisant des opérateurs logiques (opérations) Ou, Et, Près, Non, des x mathématiques et des caractères spéciaux dans les requêtes. À l'aide d'opérateurs et/ou de symboles, l'utilisateur associe des mots-clés dans la séquence souhaitée pour obtenir le résultat de recherche le plus approprié. [ neuf ]

Il y a de plus en plus de ressources Internet sur le réseau mondial, et il devient de plus en plus difficile d'y trouver les informations nécessaires chaque jour. Par conséquent, tous les acteurs du marché des moteurs de recherche modernes ont déjà l'impression que les technologies de recherche d'aujourd'hui sont dépassées et qu'il est nécessaire de changer le concept même de recherche. V actuellement Google est toujours le leader incontesté de la recherche - 47% de tous les internautes choisissent ce service, suivi par Yahoo! et MSN - 21 et 13 % des demandes, respectivement, c'est-à-dire qu'en général, plus de 80 % des habitants du monde préfèrent ces moteurs de recherche particuliers. Cependant, aucun des trois principaux moteurs de recherche ne peut pas se prévaloir d'une grande fidélité de ses utilisateurs réguliers : près de 71% de ceux qui ont recherché sur Yahoo! visitent aussi occasionnellement l'un des deux autres services - Google ou MSN Search, 70% de ceux qui ont recherché sur MSN ont également tenté leur chance en un moteur de recherche concurrentiel particulier. Voyant une telle insatisfaction à l'égard des résultats de recherche, les fabricants de moteurs de recherche essaient d'améliorer leurs moteurs de recherche et essaient d'appliquer de nouvelles technologies de recherche. Par exemple, un soi-disant auto-constructeur a été lancé sur le portail Google, où les utilisateurs de ce moteur de recherche peuvent personnaliser le processus de recherche à leur guise. Par exemple, si l'utilisateur s'intéresse à la météo, il peut voir l'informateur météo de sa ville. Et la façon d'afficher les actualités, les rapports d'actions et bien d'autres choses utiles peut être personnalisée en fonction de vos intérêts. Naturellement tous paramètres similaires l'utilisateur ne pourra l'utiliser que tant qu'il est autorisé sur le site du moteur de recherche. Avec l'avènement de cette technologie, le site Google a largement devancé ses concurrents - les plus anciens portails Yahoo Internet! et MSN.

Chercher- un processus au cours duquel, dans une séquence ou une autre, le recherché est corrélé à chaque objet stocké dans le tableau.

Du point de vue de l'utilisation de la technologie informatique " recherche d'information "- un ensemble d'opérations logiques et techniques dans le but ultime de trouver des faits, des données, des documents pertinents à la demande du consommateur.

Document pertinent est un document contenant les informations que vous recherchez.

outils de recherche

  1. Moteurs de recherche (moteurs de recherche);
  2. Catalogues thématiques (rubriques) ;
  3. Catalogues spécialisés (encyclopédies en ligne et livres de référence);
  4. Systèmes de méta-recherche.

Catalogues thématiques

Les catalogues thématiques sont une collection (sélection) systématique de liens vers d'autres ressources Internet. Les liens sont organisés sous la forme d'un rubrificateur thématique, qui est structure hiérarchique, navigation à travers laquelle vous pouvez trouver les informations dont vous avez besoin.

Catalogues spécialisés

Des catalogues ou répertoires spécialisés sont créés pour des industries et des sujets spécifiques, des actualités, des villes, des adresses e-mail, etc.

Outils de métarecherche

Lors de l'utilisation d'outils de métarecherche, une requête est effectuée simultanément par plusieurs moteurs de recherche. Le résultat de la recherche est combiné dans une liste générale triée par pertinence.

Moteurs de recherche

Les moteurs de recherche (le moteur de recherche le plus avancé sur Internet) sont systèmes automatiques serveurs d'interrogation connectés à réseau mondial, et stockant dans leur base de données des informations sur les données disponibles sur les serveurs.

Les moteurs de recherche se composent de trois parties : un robot, un index et un programme de traitement des requêtes.

Un robot (Spider, Robot ou Bot) est un programme qui visite des pages Web et lit (en tout ou en partie) leur contenu.

Indice est un entrepôt de données qui contient des copies de toutes les pages visitées par les robots.

Gestionnaire de demandes est un programme qui, conformément à la demande de l'utilisateur, "recherche" dans l'index la présence des informations nécessaires et renvoie des liens vers les documents trouvés.

Les moteurs de recherche fonctionnent en quatre étapes :

1.Analyse de l'espace Web

Le moteur de recherche scanne l'espace Web disponible 24 heures sur 24 à l'aide de robots et se copie toutes les pages qu'il rencontre.

2. Indexation des ressources

Découvert recherche de robots les pages sont traitées par le programme de traitement des requêtes, et à partir d'elles, une base de données spéciale appelée le pointeur est compilée. Le but de l'indexation est d'obtenir un fichier d'index, à l'aide duquel la demande du client est traitée presque instantanément.

3.Recherche par demande

Le moteur de recherche accepte une requête de l'utilisateur sous forme de mots-clés et se tourne non pas vers le Web, mais vers sa base de données. Le nombre de pages trouvées peut être très important, de sorte que les résultats de la recherche sont classés avant que les résultats ne soient renvoyés au client.

4.Formation de la page résultante.

Le système génère une page Web dynamique des résultats de recherche formés.

Un assez grand nombre de moteurs de recherche sont connus aujourd'hui.

http://site/uploads/posts/2013-11/1385453618_12.jpg

Le moteur de recherche le plus important et le premier en termes de popularité, qui traite 42 milliards de requêtes par mois, indexe plus de 25 milliards de pages Web, peut trouver des informations dans 195 langues. Prend en charge la recherche dans les documents Format PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint et autres.

Le moyen le plus rapide et le plus fiable de trouver des informations sur Internet est de rechercher par URL (Universal Resours Locator).

Pour accès rapide tout ce que vous avez à faire pour accéder aux ressources est de lancer un programme de navigation et de taper l'URL familière dans la barre d'adresse.

Par exemple, en tapant l'adresse bolohovomt.ru dans la barre d'adresse, vous pouvez accéder au site Web du Bolokhov Engineering College

L'un des types de recherche les plus courants est la recherche par mot clé. Considérons ce type de recherche en utilisant un moteur de recherche comme exemple. systèmes google(voir la vidéo « Trouver des informations » .mp4).

Pour rechercher par mots-clés, vous devez entrer un ou plusieurs mots que vous souhaitez rechercher dans une fenêtre spéciale et cliquer sur le bouton Rechercher. Le moteur de recherche trouvera dans sa base de données et affichera les documents contenant ces mots.

La rapidité d'obtention du résultat dépend des caractéristiques des canaux de communication, des particularités de l'organisation du travail du moteur de recherche, et de la « qualité » de construction de la requête.

Si l'utilisateur ne peut pas influencer directement le travail des moteurs de recherche, alors la qualité de la compilation d'une requête de recherche est entièrement de sa compétence.

Techniques de recherche simples

1.Rechercher un groupe de mots

Les mots "ouvert" ou "éducation" donneront lors de la recherche un par un grand nombre une variété de références liées à des sujets complètement différents, et à peine liés à "l'éducation ouverte". Par conséquent, il est recommandé d'ajouter un ou deux mots-clés liés au sujet que vous recherchez. Par exemple, « éducation ouverte » ou « technologies d'éducation ouvertes ». Il est également nécessaire de restreindre la portée de la question. Si vous avez besoin de trouver des informations sur le système juridique Garant, la requête « système juridique Garant » vous donnera des documents plus appropriés que simplement « système juridique ». Le nombre de mots dans un groupe n'est pas limité.

2.Rechercher des formes de mots

Dans la plupart des cas, le moteur de recherche par défaut recherche toutes les formes de mots dans la langue. Cependant, vous pouvez dire au moteur de recherche de ne pas parcourir toutes les formes de mots de la requête lors de la recherche. De nombreux systèmes utilisent pour cela Point d'exclamation... Par exemple, la requête "! Ordinateur" trouvera les pages avec ce mot sans tenir compte des formes de mots

3.Rôle des majuscules

Si l'utilisateur a saisi un mot-clé avec lettre capitale, le moteur de recherche ne trouvera pas les pages contenant ce mot commençant par lettre minuscule... C'est pourquoi lettres majuscules dans une requête, il est recommandé de n'utiliser que des noms propres. Par exemple, "la ville de Moscou", "Mark Tulius Cicero".

4.Caractère générique

Lorsqu'il n'est pas certain que le moteur de recherche traite correctement les formes verbales (c'est-à-dire lorsqu'il s'agit, par exemple, de noms propres ou de mots d'origine étrangère), les moteurs de recherche autorisent l'utilisation de caractères génériques. Le plus souvent, il s'agit d'un caractère "*" au lieu d'un nombre quelconque de caractères jusqu'à la fin du mot. Par exemple, si un utilisateur souhaite trouver des pages contenant les mots « République du Tatarstan », mais que la République tatare est également d'accord, la demande « République des Tatars * » doit être soumise.

5.Comptabilisation des mots réservés

Les mots réservés (mots vides) sont les mots qui ne sont pas pris en compte dans la recherche. Habituellement, ils comprennent tous les mots courts qui contiennent moins de 4 lettres (prépositions, conjonctions, etc.). Par exemple, la requête « nous sommes en Italie » trouvera des documents qui incluent le mot « Italie » ou ses formes de mots.

6.Outils de recherche contextuels

Si les mots-clés sont mis entre guillemets, alors le moteur de recherche doit trouver les documents dans lesquels cette phrase est littéralement présente (recherche d'un devis).

Techniques de recherche avancées

Pour une recherche plus rapide et plus réussie dans moteurs de recherche divers opérateurs logiques sont utilisés en conjonction avec des mots-clés. Grâce à cela, il est possible de construire une requête de manière à ne pas trouver des sites sur le sujet d'intérêt, mais des pages spécifiques et même des documents individuels. Règles pour composer des requêtes complexes sur un moteur de recherche peuvent différer de ceux d'un autre, mais dans tous les cas, les opérateurs de base suivants seront utilisés :

1.ET opérateur

Cet opérateur concatène deux mots ou plus afin qu'ils soient tous présents dans le document souhaité. Souvent, & ou + est utilisé à la place de AND. Exemple : en demandant avocat ET programme, les documents contenant les deux mots seront trouvés.

2Opérateur .OR (OR)

Fournit une recherche pour l'un des mots du groupe. Exemple : si vous recherchez éducation OU formation, les documents contenant le mot éducation ou formation seront trouvés.

3.Parenthèses logiques

Ils sont utilisés lorsqu'il est nécessaire de contrôler la séquence d'opérateurs logiques. Exemple : par requête Lomonosov OR (Mikhail I Vasilievich), les documents contenant les mots Lomonosov ou Mikhail I Vasilievich seront trouvés.

4.PAS opérateur

Il est utilisé lorsqu'il est nécessaire d'exclure un mot-clé des résultats de la recherche, par exemple, en demandant des avocats PAS des avocats, des informations sur des avocats qui ne sont pas des avocats seront trouvées.

Vous avez aimé l'article ? A partager entre amis :