Méthodes de présentation visuelle des données. Méthodes de visualisation. Visualisation des données en science et technologie

Au cours des dernières décennies, des changements presque révolutionnaires ont eu lieu dans le domaine de la transmission d'informations visuelles :

le volume et la quantité d'informations transmises ont énormément augmenté ;

de nouveaux types d'informations visuelles et de méthodes de leur transmission se sont développés.

Les progrès technologiques et la formation d'une nouvelle culture visuelle marquent inévitablement l'ensemble des exigences des activités des enseignants.

L'un des moyens d'améliorer la formation professionnelle des futurs enseignants, capables d'innovations pédagogiques, au développement de technologies de conception efficaces activités d'apprentissageécoliers dans des conditions de domination de l'environnement visuel, il est considéré comme la formation de leurs compétences de visualisation spéciales informations pédagogiques... Le terme "visualisation" vient du latin visualis - perçu visuellement, visuel. Visualisation de l'information présentation d'informations numériques et textuelles sous forme de graphiques, diagrammes, schémas structurels, tableaux, cartes, etc. Cependant, une telle compréhension de la visualisation en tant que processus d'observation présuppose une activité mentale et cognitive minimale des étudiants, et les outils didactiques visuels ne remplissent qu'une fonction illustrative. Une définition différente de la visualisation est donnée dans les concepts pédagogiques bien connus (la théorie des schèmes - RS Anderson, F. Bartlett ; la théorie des cadres - Ch. Volker, M. Minsky, etc.), dans lesquels ce phénomène est interprété comme le déplacement dans le processus de l'activité cognitive du plan interne au plan externe des images mentales, dont la forme est spontanément déterminée par le mécanisme de la projection associative.

De même, le concept de visualisation est compris par A. Verbitsky : « Le processus de visualisation est le repliement de contenus mentaux en une image visuelle ; étant perçue, l'image peut être déployée et servir de support à une réflexion adéquate et action pratique". Cette définition permet de séparer les notions de "visuel", "moyen visuel" des notions de "visuel", "moyen visuel". Au sens pédagogique du concept "visuel" est toujours basé sur la démonstration d'objets, de processus, de phénomènes spécifiques, la présentation d'une image finie, donnée de l'extérieur, et non née et réalisée du plan interne de l'activité humaine. Le processus consistant à déployer une image mentale et à la "transférer" du plan interne au plan externe est une projection de l'image mentale. La projection est intégrée aux processus d'interaction entre le sujet et les objets du monde matériel, elle s'appuie sur les mécanismes de la pensée, couvre différents niveaux de réflexion et de réflexion, se manifeste dans diverses formes d'activité éducative.

Si nous considérons délibérément l'activité cognitive productive comme un processus d'interaction entre des plans externes et internes, comme le transfert de futurs produits d'activité du plan interne vers le plan externe, comme un ajustement et une mise en œuvre dans le plan externe des idées, alors la visualisation agit. comme le principal mécanisme qui assure un dialogue entre les plans d'activité externes et internes. Par conséquent, en fonction des propriétés des aides visuelles didactiques, dépend le niveau d'activation de l'activité mentale et cognitive des élèves.

À cet égard, le rôle des modèles visuels pour la présentation de l'information éducative augmente, permettant de surmonter les difficultés associées à l'apprentissage basé sur la pensée logique abstraite. Selon le type et le contenu de l'information pédagogique, des méthodes de compactage ou de déploiement étape par étape utilisant une variété de moyens visuels sont utilisées. Actuellement, l'utilisation de la visualisation cognitive d'objets didactiques semble prometteuse en éducation. Cette définition englobe en effet tous les types possibles de visualisation d'objets pédagogiques, fonctionnant sur les principes de concentration des connaissances, de généralisation des connaissances, d'élargissement des fonctions d'orientation et de présentation des outils didactiques visuels, d'algorithmique d'actions éducatives et cognitives, mises en œuvre dans des moyens visuels.

En pratique, plus d'une centaine de méthodes de structuration visuelle sont utilisées - des diagrammes et graphiques traditionnels aux cartes "stratégiques" (feuilles de route), en passant par les araignées et les chaînes causales. Cette diversité est due à des différences significatives dans la nature, les caractéristiques et les propriétés des connaissances dans divers domaines. À notre avis, les schémas de logique structurelle ont la plus grande capacité d'information, l'universalité et l'intégrabilité. Cette méthode de systématisation et d'affichage visuel de l'information éducative est basée sur l'identification de liens significatifs entre les éléments de connaissance et l'activité analytique-synthétique lors de la traduction d'informations verbales en non-verbales (figuratives), synthétisant un système intégral d'éléments de connaissances. Maîtriser les types énumérés de significations concrètes, dérouler une chaîne logique de pensée, décrire des images et leurs signes d'activité mentale, ainsi que des opérations utilisant des moyens verbaux d'échange d'informations, forment des modes de pensée productifs si nécessaires aux spécialistes au rythme moderne du développement de la science, de la technologie et de la technologie. Selon les acquis de la neuropsychologie, « l'apprentissage est efficace lorsque le potentiel du cerveau humain se développe en surmontant les difficultés intellectuelles dans la recherche de sens grâce à l'établissement de schémas ».

Les diagrammes structurels et logiques créent une clarté particulière en organisant les éléments de contenu sous une forme non linéaire et en mettant en évidence les connexions logiques et successives entre eux. Cette visibilité repose sur la structure et les connexions associatives caractéristiques de la mémoire à long terme d'une personne. D'une certaine manière, les schémas structuro-logiques agissent comme un lien intermédiaire entre le contenu linéaire externe (le texte du manuel) et le contenu non linéaire interne (dans l'esprit). Comme l'un des avantages des circuits logiques structurels A.V. Petrov souligne qu'"il remplit la fonction de combiner des concepts dans certains systèmes". En eux-mêmes, les concepts ne peuvent rien dire sur le contenu du sujet d'étude, mais étant connectés certain système, ils révèlent la structure du sujet, ses tâches et ses voies de développement. Comprendre et comprendre une nouvelle situation survient lorsque le cerveau trouve un soutien dans les connaissances et les idées antérieures.

Cela implique l'importance d'une mise à jour constante des expériences antérieures pour la maîtrise des nouvelles connaissances. Le processus d'apprentissage d'un nouveau matériel peut être représenté comme la perception et le traitement d'une nouvelle information en la corrélant avec les concepts et les méthodes d'action connus de l'étudiant, grâce à l'utilisation des opérations intellectuelles maîtrisées par lui. L'information entrant dans le cerveau par divers canaux est conceptualisée et structurée, formant des réseaux conceptuels dans la conscience. De nouvelles informations s'intègrent dans les schémas cognitifs existants, les transforment et forment de nouveaux schémas cognitifs et opérations intellectuelles. Dans le même temps, des connexions sont établies entre des concepts et des méthodes d'action connus et de nouvelles connaissances, et la structure de nouvelles connaissances émerge.

Selon les psychologues nouvelle information est appris et mieux mémorisé lorsque les connaissances et les compétences sont "imprimées" dans le système de mémoire visuo-spatiale. Par conséquent, la présentation de matériel pédagogique sous une forme structurée vous permet d'assimiler rapidement et mieux de nouveaux systèmes de concepts, méthodes d'action. Un exemple est un diagramme visuel : « Modèle de couleur RVB »(voir Fig. 2).



Figure. 2.

La visualisation du matériel pédagogique ouvre la possibilité non seulement de rassembler tous les calculs théoriques, ce qui vous permettra de reproduire rapidement le matériel, mais également d'appliquer des schémas pour évaluer le degré d'assimilation du sujet à l'étude. Dans la pratique, la méthode d'analyse d'un diagramme ou d'un tableau spécifique est également largement utilisée, dans laquelle les compétences de collecte et de traitement des informations sont développées. La méthode permet aux étudiants d'être activement impliqués dans l'application des informations théoriques dans les travaux pratiques. Une place particulière est réservée à la discussion commune, au cours de laquelle il est possible de recevoir rapidement Rétroaction, pour mieux se comprendre soi-même et les autres. En résumant ce qui vient d'être dit, on constate que, selon la place et la finalité des matériels didactiques visuels dans le processus de formation d'un concept (étude d'une théorie, d'un phénomène), le choix d'un certain modèle structurel et l'affichage visuel du contenu de la formation doit être présenté avec diverses exigences psychologiques et pédagogiques.

Lors de la visualisation de matériel pédagogique, il convient de garder à l'esprit que les images visuelles raccourcissent les chaînes du raisonnement verbal et peuvent synthétiser une image schématique d'une plus grande "capacité", condensant ainsi l'information. Dans le processus d'élaboration de matériels pédagogiques et méthodologiques, il est nécessaire de contrôler le degré de généralisation du contenu de la formation, de dupliquer les informations verbales du figuratif et vice versa, afin que, si nécessaire, les maillons de la chaîne logique soient entièrement restaurés par les étudiants.

Un autre aspect important de l'utilisation du matériel didactique visuel est de déterminer le rapport optimal entre les images visuelles et les informations verbales et symboliques. La pensée conceptuelle et visuelle dans la pratique sont en interaction constante. Ils se complètent et révèlent différents aspects du concept, du processus ou du phénomène étudié. La pensée verbale-logique nous donne une réflexion plus précise et plus généralisée de la réalité, mais cette réflexion est abstraite. À son tour, la pensée visuelle aide à organiser les images, les rend holistiques, généralisées, complètes.

La visualisation des informations pédagogiques permet de résoudre un certain nombre de problèmes pédagogiques :

fourniture d'une intensification de la formation;

améliorer les activités éducatives et cognitives;

formation et développement de la pensée critique et visuelle;

perception visuelle;

présentation figurative des connaissances et des activités d'apprentissage;

transfert de connaissances et reconnaissance de formes;

améliorer la littératie visuelle et la culture visuelle.

Le sujet de la visualisation de l'information et de l'infographie revient régulièrement pendant le travail, et en général, il est intéressant en tant que pratique du design et du design. Bien que nous, dans l'entreprise, travaillions sur des systèmes Web, où la plupart des tâches sont résolues par des outils de conception standard tels que des formulaires ou des blocs d'informations, il est parfois nécessaire de soumettre une grande quantité d'informations de manière volumineuse et compacte. Il s'agit souvent de tâches assez spécifiques, qui demandent beaucoup de temps pour réfléchir à l'interface. Certes, ce sont quelques-unes des tâches les plus intéressantes.

La pratique consistant à afficher des informations sous forme graphique a de nombreux synonymes, mais dans Dernièrement les deux plus couramment utilisés sont la visualisation de données et l'infographie. Ces approches existent depuis longtemps, beaucoup de littérature a été écrite à ce sujet. Les auteurs et designers célèbres incluent Edward Tufte, Stephen Few, Ben Fry. Mais avant tout, je me demande où et comment les infographies sont utilisées.

Application

Il existe aujourd'hui de nombreux exemples intéressants de visualisation, mais nombre d'entre eux sont des objets d'art plutôt que des supports pratiques. Je vois les domaines d'utilisation suivants :

  • Statistiques et rapports... Un genre autosuffisant, lorsque les données d'une certaine période de temps sont affichées ensemble. Par exemple, une image statique jointe à un rapport ou un graphique personnalisé dans un service de statistiques, avec la possibilité de modifier ses paramètres d'affichage.
  • Informations de référence... Ajout au texte principal, l'illustrant clairement avec les données référencées. Par exemple, pour donner une idée générale de la dynamique d'un des indicateurs, ou pour afficher un processus et ses étapes ; peut-être - pour montrer la structure d'un certain phénomène.
  • Services interactifs... Produits et projets dans lesquels l'infographie fait partie de la fonctionnalité. Par exemple, un diagramme de processus peut être utilisé comme outil de navigation pour les services avec des workflows complexes. Presque tout ce qui concerne le travail avec des cartes et se passe rarement d'un mélange d'infographie et d'interactivité, sans parler systèmes spécialisés comme les salles de contrôle et la plupart des jeux informatiques.
  • Illustrations... Pas tout à fait un genre pur - plutôt, l'utilisation de belles pratiques et approches d'affichage de données pour créer des auto-illustrations. Ils ont une certaine signification, mais ce n'est pas leur tâche principale - la valeur principale est la qualité de la performance.
  • Dessins et schémas... Documents spécialisés montrant la structure et le fonctionnement de l'ingénierie complexe et des systèmes naturels. En plus des diverses cartes, ce sont souvent des choses qui sont rarement utilisées dans la vie de tous les jours, comme les circuits imprimés.
  • Expériences et art... Visualisation de données sans grand sens pratique, plutôt que des expériences ou des installations. Le plus souvent, il s'agit d'images complexes et encombrantes difficiles à «lire» couramment - la quantité de données et les relations entre elles sont telles que vous devez traiter l'image en plusieurs parties ; ou simplement des images abstraites, générées automatiquement. Récemment, la direction est devenue de plus en plus populaire et dépasse périodiquement le cadre de l'infographie - par exemple, sous la forme de sculptures graphiques.

Classification

L'ensemble d'outils de visualisation est assez vaste - des graphiques linéaires les plus simples aux affichages complexes de nombreuses relations. Ils peuvent être décomposés en plusieurs types :

Graphiques

Montrez la dépendance des données les unes par rapport aux autres. Ils sont construits le long des axes X et Y, bien qu'ils puissent être tridimensionnels.


(graphique en courbes, graphique en aires). Le cas le plus courant. Combine avec une ligne un ensemble de points correspondant aux valeurs le long des axes. Par exemple, le trafic quotidien du site Web pendant un mois. Il peut afficher plusieurs ensembles de données à la fois - par exemple, afficher les statistiques des 3 pages les plus populaires.
Exemples : © BFM.ru, SmartMoney, TeleGeography Research
(nuage de points). Affiche la distribution d'un ensemble limité de points correspondant aux valeurs le long des axes. Une ligne de tendance est souvent tracée entre les points - elle montre clairement des modèles parmi les valeurs. Par exemple, la relation entre l'expérience de travail et la productivité du travail chez 50 employés de l'entreprise (il est impossible de simplement connecter les points obtenus sous la forme d'un graphique linéaire - et le sens sera déformé et la ligne sera agitée).
Exemples : © Statcon
Plus d'exemples dans la galerie de modèles

Tableaux comparatifs

Affiche les ratios de l'ensemble de données. Dans de nombreux cas, ils sont construits autour des axes, mais pas nécessairement.

(diagramme à bandes). Affiche un ou plusieurs ensembles de données en les comparant les uns aux autres. Il existe deux possibilités d'affichage dans le cas de plusieurs ensembles - soit sous la forme de plusieurs colonnes adjacentes, soit sous la forme d'une seule, mais divisée en interne selon les proportions des valeurs. Par exemple, le bénéfice annuel de trois entreprises au cours des 5 dernières années ou la part de marché de trois entreprises au cours de la même période.
Exemples : © SmartMoney
Plus d'exemples dans la galerie de modèles
(histogramme). Affiche la distribution d'un jeu de données dans une sélection sous forme de barres. Par exemple, le nombre d'employés de l'entreprise dans plusieurs tranches d'âge.
Exemples : © Art. Lebedev Studio, Great Soviet Encyclopedia
Plus d'exemples dans la galerie de modèles
(diagramme circulaire). Affiche le pourcentage occupé par chaque valeur dans l'ensemble de données sous la forme d'un cercle brisé. Par exemple, les parts de marché opérateurs de téléphonie mobile... Peut afficher plusieurs ensembles de données à la fois - dans ce cas, les graphiques sont superposés les uns aux autres et chacun d'eux est plus petit que le précédent. Par exemple, la part de marché des opérateurs cellulaires au cours des 3 dernières années.
Exemples : © Candy Chang, Density Design, GraphJam
Plus d'exemples dans la galerie de modèles
(graphique à bulles). Mélange de graphiques et de tableaux - un ensemble de points correspondant aux valeurs est placé le long de deux axes. Dans ce cas, les points eux-mêmes ne sont pas connectés et ont une valeur différente, qui est définie par le troisième paramètre. Par exemple, comparer le nombre d'articles achetés, le prix d'achat total et le budget total de l'acheteur.
Exemples : © (auteur inconnu), Secret of the Firm, Kommersant.Money
Plus d'exemples dans la galerie de modèles
(tableau des anneaux). Affiche le pourcentage de nombre maximal, qui occupe l'une des valeurs de l'ensemble de données, sous la forme d'un anneau partiellement rempli. Par exemple, le nombre de médailles remportées au championnat est relatif au maximum. Souvent, plusieurs de ces graphiques sont utilisés à la fois, comparant différentes valeurs.
Exemples : © Wired, New York Times
Plus d'exemples dans la galerie de modèles
(tableau de portée). Affiche l'amplitude minimale et maximale des valeurs d'un jeu de données dans un graphique à barres découpé. Le début de la barre ne se trouve pas sur l'axe horizontal, mais au point de la valeur minimale le long de la verticale. Par exemple, l'étalement du coût du mètre carré de logement dans différents quartiers de la ville.
Exemples : © Université des sciences appliquées de Potsdam
Plus d'exemples dans la galerie de modèles
(carte radar). Compare les magnitudes de plusieurs valeurs, chacune correspondant à un point sur un axe. Le nombre d'axes correspond au nombre de valeurs, et les points sont reliés par des lignes. Par exemple, comparer la rentabilité de chacun des 8 secteurs d'activité de l'entreprise.
Exemples : © Secret of the Firm, Pedro Monteiro, Main Library at Queen Mary (Université de Londres)
Plus d'exemples dans la galerie de modèles
(nuage de tags). Compare mots clés ou des phrases (valeurs) contenues dans un morceau de texte (ensemble de données), donnant à chacune sa propre taille de police. La taille de la police dépend de la valeur du paramètre. Par exemple, les 25 mots les plus fréquemment mentionnés dans les journaux en décembre 2008.
Exemples : © Flickr, Martin Ignacio Bereciartua
Plus d'exemples dans la galerie de modèles
(carte de chaleur). Compare les valeurs au sein d'un ensemble de données en les peignant avec l'une des couleurs d'un spectre présélectionné. La base est une image ou autre schéma sur lequel sont disposées les valeurs. La couleur dépend de la valeur du paramètre et se superpose le plus souvent sous forme de taches. Par exemple, les pays du monde avec la pression atmosphérique la plus élevée ou les éléments de la page d'accueil du site, sur lesquels les utilisateurs cliquent le plus souvent.
Exemples : © Dylan Vester, CrazyEgg
Plus d'exemples dans la galerie de modèles

Arbres et diagrammes de structure

Montrez la structure de l'ensemble de données et les relations entre ses éléments.

Graphique et arbre(graphique, arbre). Affiche une hiérarchie de jeux de données dans laquelle les membres sont parents ou enfants les uns des autres. Il est construit sous forme de nœuds reliés par des lignes soit de haut en bas, soit à partir du centre de la composition. Un nœud est généralement affiché sous la forme d'un cercle ou d'un rectangle. Par exemple, un plan du site.
Exemples : © Concept Draw, Karen Leech, (auteur inconnu)
Plus d'exemples dans la galerie de modèles
(carte mentale). Affiche la composition et la structure d'un phénomène ou d'un concept sous la forme d'un graphique, dans lequel chaque nœud a un ou plusieurs enfants. Il s'agit d'un cas particulier de graphe, à la différence près que les branches divergent généralement symétriquement à partir d'un nœud situé au centre de l'image. Par exemple, un synopsis d'un livre de gestion de projet qui reflète son contenu et ses concepts de base.
Exemples : © Adaptive Path, Ethan Hein, Comic vs Audience
Plus d'exemples dans la galerie de modèles
Schémas structurels formalisés... Ils montrent la composition et la structure du système ou de ses parties sous forme de cartes, qui sont décrites avec divers degrés de détail et sont liées les unes aux autres en tant que parent et enfant. Affiché de manière standardisée - par exemple, en utilisant UML (Unified Modeling Language) ou IDEF1X (Integration Definition for Information Modeling). Par exemple, toutes les entités nécessaires au fonctionnement d'un des modules du système logiciel.
Exemples : © Concept Draw, Wikipédia
Plus d'exemples dans la galerie de modèles
(Diagramme de Venn/Euler). Affiche la relation entre les valeurs d'un jeu de données sous forme de cercles qui se chevauchent (généralement trois). La zone où tous les cercles se croisent montre le commun entre eux. Par exemple, l'intersection du respect des délais, du budget et des objectifs est la réussite du projet.
Exemples : © Phil Glockner, Dan Saffer
Plus d'exemples dans la galerie de modèles
(carte arborescente). Affiche une hiérarchie de jeux de données dans laquelle les membres sont parents ou enfants les uns des autres. Il s'affiche sous la forme d'un ensemble de rectangles imbriqués, chacun étant une branche d'un arbre, et ceux qu'il contient sont des enfants et des branches. Les rectangles varient en taille selon le paramètre et ont une couleur qui est spécifiée par l'autre paramètre. Par exemple, une structure détaillée du budget d'une entreprise, qui montre en couleur le pourcentage de variation de chaque élément par rapport à l'année précédente.
Exemples : © Tableau Software, Panopticon, Panopticon
Plus d'exemples dans la galerie de modèles

Diagrammes de visualisation de processus

Montrez un processus consistant en une séquence d'actions. Il peut comprendre un ou plusieurs scénarios d'évolution d'événements.

(diagramme). Affiche les étapes clés du processus sous forme de blocs reliés entre eux par des flèches unidirectionnelles. Il est affiché dans un format standardisé, où le type du bloc dépend de son rôle dans le processus. Par exemple, un schéma du processus d'approbation et de publication d'un article au sein de la rédaction.
Exemples : © Density Design, Allen Holub, Concept Draw
Plus d'exemples dans la galerie de modèles
(diagramme). Affiche les étapes clés par lesquelles passe le processus sous la forme de blocs reliés les uns aux autres par des flèches. Affiché sous forme libre lorsque les étapes sont affichées avec des formes libres et que les flèches peuvent être bidirectionnelles ou n'avoir aucune direction. De plus, les blocs peuvent être combinés en groupes. Par exemple, un schéma simplifié pour le mouvement de fonds pour les paiements par SMS.
Exemples : © Tapulous, Le Secret de la Firme, David Armano
Plus d'exemples dans la galerie de modèles
... Affiche les étapes clés d'un processus qui contient un ensemble d'actions répétitives. La partie cyclique est affichée sous forme d'anneau, qui est formé d'étapes reliées par des flèches. Et le début et la fin du processus - entrer et sortir du cercle avec des flèches. Par exemple, la séquence d'un processus d'assurance qualité qui se déroule tout en travaillant sur un produit logiciel.
Exemples : © Fruitful, eStrara, Idiagramme
Plus d'exemples dans la galerie de modèles
(Schéma de Sankey). Montre les étapes clés du processus et l'intensité de son cours dans chacune des sections. Il est affiché sans nœuds, sous forme de lignes de connexion et de branchement d'épaisseur différente (selon la valeur du paramètre). A un certain nombre de points de départ et d'arrivée, et donc de nombreux scénarios de développement. Par exemple, le processus de transfert de chaleur d'une centrale de cogénération à une chaufferie, y compris ses pertes pour diverses raisons.
Exemples : ©, Sankey-diagrams.com, IBM
Plus d'exemples dans la galerie de modèles

Matrices

Ils comparent des valeurs au sein d'un ensemble de données sous la forme d'un tableau.

Tableau(matrice). Affiche un ensemble de données sous forme de cellules remplies de ses valeurs, qui forment des lignes et des colonnes. Chaque colonne et ligne a un paramètre correspondant qui définit une cellule spécifique pour la valeur. Par exemple, le budget des services de l'entreprise pour chaque année de son existence.
Exemples : © Izvestia, PresseBox, Elliance
Plus d'exemples dans la galerie de modèles
... Un cas particulier d'une table. Affiche le mois calendaire par nombres et jours de la semaine.
Exemples : © thenonhacker, Yahoo! Bibliothèque de modèles d'interface utilisateur
Plus d'exemples dans la galerie de modèles

Chronogrammes

Affiche la répartition des données dans le temps.

(chronologie). Affiche les valeurs d'un ensemble de données sur un axe horizontal qui correspond au temps. Les segments entre les valeurs peuvent être de n'importe quelle taille. Par exemple, la ligne des années du XXe siècle, sur laquelle sont marqués les grands conflits militaires.
Exemples : © Firm Secret, Rodrigo Ronda Leon, GOOD Magazine
Plus d'exemples dans la galerie de modèles
(diagramme de Gantt). Affiche la séquence, la durée et les heures de début et de fin des jalons et des tâches spécifiques requises pour terminer le projet. Il est affiché comme une « cascade » d'une ou plusieurs cascades - des blocs reliés par des flèches, disposés en diagonale de haut en bas, de gauche à droite (c'est-à-dire des « escaliers »). De plus, la longueur du bloc dépend du temps nécessaire à l'exécution. Par exemple, les tâches qui doivent être accomplies pour écrire, préparer l'impression et publier un livre. Le diagramme peut également être attribué au groupe de visualisation du processus, mais les deux parties (durée et séquence d'actions) sont également importantes, c'est donc une question de goût.
Exemples : © MS Project, Todd R. Warfel
Plus d'exemples dans la galerie de modèles

Cartes

Affiche des données qui dépendent de la géographie ou de l'architecture d'un certain objet.

... Affiche sous forme schématique la composition et l'emplacement des parties d'un objet géographique. Par exemple, le monde en général ou une île.
Exemples : © Google Maps, TeleGeography Research, Flux de données
Plus d'exemples dans la galerie de modèles
... Affiche un objet géographique sous la forme d'une photo satellite ou d'un avion. Par exemple, le monde en général ou la ville.
Exemples : © Google Maps, Yandex.Maps
Plus d'exemples dans la galerie de modèles
... Affiche dans une vue schématique les routes, autoroutes, voies ferrées et autres routes, superposées aux contours des objets géographiques. Par example, carte de voiture routes de la région.
Exemples : © MapQuest, Yandex.Maps
Plus d'exemples dans la galerie de modèles
... Affiche divers objets sous forme de marqueurs sur la carte du monde, le pays ou la ville. Les objets sont le plus souvent ceux qui ont été construits par l'homme : maisons, commerces, monuments, infrastructures, etc. sur le plan de la ville ; ou des villes sur la carte du pays ; ou pays sur la carte du monde. Presque n'importe quelle carte peut être utilisée comme base, mais généralement des cartes géographiques, photographiques, routières ou topographiques sont utilisées. Par exemple, l'emplacement des bureaux de l'entreprise sur un plan de la ville.
Exemples : © Yandex.Maps, Autokadabra
Plus d'exemples dans la galerie de modèles
(cartogramme). Affiche un jeu de données sous la forme d'une carte schématique, dont chacune des valeurs est liée à un objet géographique. Dans ce cas, la taille et la forme de l'objet dépendent de la valeur de la valeur. Par exemple, une carte du monde où la taille d'un pays dépend de la taille de sa population.
Exemples : © Density Design, (auteur inconnu), Manuel Marino
Plus d'exemples dans la galerie de modèles
(plan d'étage). Affiche sous forme schématique la forme et la structure interne de l'un des étages d'un bâtiment ou d'une autre structure architecturale. Il peut également montrer la disposition des meubles et autres éléments de remplissage de la pièce. Par exemple, un plan d'étage d'un appartement de deux pièces.
Exemples : © Christian’s of Bucks Point, (auteur inconnu), (auteur inconnu)
Plus d'exemples dans la galerie de modèles
... Affiche les arrêts de transports en commun sous forme d'une ou plusieurs lignes d'intersection couleur différente... La ligne correspond à l'avance une certaine séquence gares. Dans certains cas, il se superpose à une carte géographique simplifiée. Par exemple, un plan de métro.
Diagramme circulaire des connexions(schéma de réseau, schéma d'arc). Affiche les liens au sein d'un ensemble de données sous la forme d'un anneau, sur lesquels des valeurs sont placées. Les valeurs sont reliées par des arcs ou des lignes dans la zone intérieure du cercle. Avec un grand nombre de valeurs, elles peuvent aussi être à l'intérieur de l'anneau, bien que ce soit moins clair. Les liens peuvent également avoir une direction. Par exemple, sont membres d'un groupe sur un réseau social d'amis communs.
Exemples : © Ethan Hein, Ethan Hein, Josef Muller-Brockmann
Plus d'exemples dans la galerie de modèles
... Affiche les liens au sein de l'ensemble de données sous la forme d'une ligne sur laquelle les valeurs sont placées. Les valeurs sont reliées par des arcs en haut et en bas de la ligne. Les liens peuvent également avoir une direction. Il s'agit d'une autre façon de dessiner un diagramme circulaire des connexions - la signification et les tâches sont les mêmes.
Exemples : © Martin Dittus, Andreas Koller & Philipp Steinweber, TeleGeography Research
Plus d'exemples dans la galerie de modèles
... Affiche les relations au sein d'un jeu de données sous la forme d'un globe ou d'une carte géographique, sur laquelle les valeurs sont placées. Les valeurs sont reliées par des arcs si l'image est en 3D, ou par des lignes si la carte est plate. Les liens peuvent également avoir une direction. Par exemple, les routes de tous les aéronefs actuellement en vol.
Exemples : © National Science Foundation, Ensci, MIT Senseable City Lab
Plus d'exemples dans la galerie de modèles
(dendrogramme). Affiche la proximité des valeurs d'un jeu de données pour l'un des paramètres, en utilisant l'axe Y pour placer les valeurs elles-mêmes, et l'axe X - les valeurs des paramètres. Il s'affiche sous la forme d'un ensemble de lignes horizontales connectées les unes aux autres, qui sont connectées si les valeurs sont les mêmes dans le paramètre. De plus, plus la coïncidence des valeurs est précoce sur l'axe X, plus elles sont proches les unes des autres. Par exemple, comparer les revenus annuels de 30 entreprises.
Exemples : © GUI.ru, New York Times, Kate Jones
Plus d'exemples dans la galerie de modèles

Illustrations

Montrer un processus ou un phénomène sous une forme non formalisée.

... Affiche les étapes clés du processus sous la forme de l'intrigue représentée dans l'image. Ou la structure du phénomène sous la forme d'une métaphore visuelle. Essentiellement analogue à un graphique, un diagramme ou un organigramme informel. Par exemple, l'image du cycle de l'eau dans la nature dans un livre d'histoire naturelle.
Exemples : © Athletics NYC, Christian Montenegro, magazine Popular Finance
Plus d'exemples dans la galerie de modèles
... Montre les étapes clés d'un processus ou d'un phénomène séquentiel sous la forme d'un ensemble d'images, dont chacune montre une de ses étapes sous la forme d'un petit tracé. Par exemple, il y a trois étapes dans le processus de stationnement parallèle dans le manuel du conducteur.
Exemples : © École de conduite Scenic Valley, Elliance
Plus d'exemples dans la galerie de modèles

Cet article a été rédigé par un représentant de la société DevExpress et publié dans un blog sur HabraHabr.

Des chercheurs en médecine ont découvert que s'il n'y a que du texte dans les instructions d'un médicament, une personne n'assimile que 70 % des informations qu'il contient. Si vous ajoutez des images à l'instruction, la personne apprendra déjà 95%.

Il est évident qu'une personne est prédisposée à traiter uniquement des informations visuelles. En plus d'être parfaitement traitée par notre cerveau, la visualisation des données présente plusieurs avantages :

  • Se concentrer sur différents aspects des données


A l'aide de graphiques, vous pouvez facilement attirer l'attention du lecteur sur les indicateurs rouges.

  • Analyser un grand ensemble de données avec une structure complexe
  • Réduire la surcharge informationnelle d'une personne et garder son attention
  • Non-ambiguïté et clarté des données de sortie
  • Mettre en évidence les relations et les relations contenues dans l'information


Les données importantes sont facilement visibles sur le graphique.

Attrait esthétique


Des graphiques esthétiques rendent la présentation des données efficace et mémorable.

Edward Tufty, auteur de certains meilleurs livres sur la visualisation, le décrit comme un outil d'affichage de données ; encourager le spectateur à réfléchir à l'essence et non à la méthodologie ; éviter de déformer ce que les données sont censées dire ; afficher de nombreux nombres dans un petit espace ; montrer un grand ensemble de données dans un tout cohérent et cohérent ; inviter le spectateur à comparer des éléments de données ; servant des buts suffisamment clairs : description, recherche, ordonnancement ou décoration ().

Comment utiliser correctement la visualisation des données ?

Le succès de la visualisation dépend directement de l'exactitude de son application, à savoir du choix du type de graphique, de son utilisation et de sa conception correctes.


60% du succès de la visualisation dépend du choix du type de graphique, 30% de son utilisation correcte et 10% de sa conception correcte.

Type de graphique correct

Le graphique vous permet d'exprimer l'idée que les données portent de la manière la plus complète et la plus précise, il est donc très important de choisir le type de graphique approprié. Le choix peut être fait selon l'algorithme :

Objectifs de visualisation- c'est la mise en œuvre de l'idée principale de l'information, c'est ce dont vous avez besoin pour montrer les données sélectionnées, quel effet vous devez obtenir - identifier les relations dans l'information, montrer la distribution des données, la composition ou la comparaison des données.


La première ligne montre des graphiques avec les objectifs d'afficher les relations sur les données et la distribution des données, tandis que la deuxième ligne montre les objectifs d'afficher la composition et de comparer les données.

Relations de données- c'est ainsi qu'ils dépendent les uns des autres, la connexion entre eux. À l'aide de relations, vous pouvez identifier la présence ou l'absence de dépendances entre les variables. Si l'idée principale de l'information contient les phrases "fait référence à", "diminue / augmente avec", alors vous devez vous efforcer de montrer exactement la relation dans les données.
La distribution des données est la façon dont elles se situent par rapport à quelque chose, le nombre d'objets qui tombent dans certaines zones séquentielles de valeurs numériques. L'idée principale dans ce cas contiendra les phrases "dans la plage de x à y", "concentration", "fréquence", "distribution".

Composition des données- combiner des données dans le but d'analyser l'image globale dans son ensemble, en comparant les composants qui constituent un pourcentage d'un certain ensemble. Les phrases clés de la composition sont "représenté pour x%", "part", "pourcentage de l'ensemble".

Comparaison de données - combiner des données afin de comparer certains indicateurs, révélant comment les objets sont liés les uns aux autres. C'est aussi une comparaison des composants qui changent au fil du temps. Expressions-clés pour une idée lors de la comparaison - "plus / moins que", "égal", "change", "augmente / diminue".

Après avoir déterminé l'objectif de la visualisation, vous devez déterminer le type de données. Elles peuvent être très hétérogènes dans leur type et leur structure, mais dans le cas le plus simple elles distinguent les données numériques et temporelles continues, les données discrètes, les données géographiques et logiques. Les données numériques continues contiennent des informations sur la dépendance d'une valeur numérique à une autre, par exemple, des graphiques de fonctions telles que y = 2x. Les intervalles de temps continus contiennent des données sur des événements qui se produisent sur une certaine période de temps, comme un graphique de la température mesurée chaque jour. Les données discrètes peuvent contenir des dépendances de valeurs catégorielles, par exemple, un graphique du nombre de ventes de marchandises dans différents magasins. Les données géographiques contiennent diverses informations liées à l'emplacement, à la géologie et à d'autres indicateurs géographiques, un excellent exemple est une carte géographique ordinaire. Les données booléennes montrent l'arrangement logique des composants les uns par rapport aux autres, comme un arbre généalogique.


Graphiques de données numériques et temporelles continues, de données discrètes, de données géographiques et logiques.

En fonction de l'objectif et des données, vous pouvez choisir le calendrier le plus approprié pour eux. Il est préférable d'éviter la variété pour la variété et de choisir le plus simple, le mieux. Uniquement pour des données spécifiques, utilisez des types de graphiques spécifiques, dans d'autres cas, les graphiques les plus courants sont bien adaptés :

  • linéaire (ligne)
  • avec des zones
  • colonnes et histogrammes (barre)
  • camembert (tarte, beignet)
  • graphique polaire (radar)
  • dispersion, bulle
  • Plans
  • arbres (arbre, carte mentale, carte arborescente)
  • diagrammes temporels (ligne de temps, Gantt, cascade).

Les graphiques en courbes, les graphiques en aires et les histogrammes peuvent contenir plusieurs valeurs dans un seul argument pour une catégorie, qui peut être soit absolue (alors le préfixe empilé est ajouté à ces types de graphiques) ou relatif (entièrement empilé).


Graphique avec valeurs empilées et avec empilement complet

Lors du choix d'un horaire adapté, vous pouvez être guidé par le tableau suivant compilé à partir de ce schéma et :


Utilisation correcte du graphique

Il est important non seulement de choisir le bon type de graphique, mais aussi de l'utiliser correctement :

  • Il n'est pas nécessaire de charger le graphique avec beaucoup d'informations. Montant optimal différents types données, catégories - ce n'est pas plus de 4-5, sinon il est plus opportun de diviser un tel diagramme en plusieurs morceaux.


Un tel graphique peut être comparé à des spaghettis et il est préférable de le diviser en plusieurs graphiques.

Sélectionnez l'échelle et l'échelle correctes pour le graphique. Pour les histogrammes et les tracés avec aires, il est préférable de commencer l'échelle des valeurs à zéro. Essayez de ne pas utiliser d'échelles inversées - cela induit très souvent le spectateur en erreur sur les données.


Une échelle incorrecte affecte négativement la perception des données. Dans le premier cas, l'échelle est mal sélectionnée, dans le second l'échelle est inversée.

  • Pour camemberts et des graphiques montrant le pourcentage de la part totale, la somme des valeurs doit toujours être de 100 %.
  • Pour une meilleure perception des données, il est préférable de disposer les informations sur l'axe - soit par valeurs, soit par ordre alphabétique, soit par sens logique.

Conception correcte du calendrier

Rien n'est plus agréable à l'œil que des graphiques bien formés, et rien ne gâche plus les diagrammes que la présence de déchets graphiques. Principes de conception de base :

  • utilisez des palettes de couleurs similaires et non vives, et essayez de vous limiter à un ensemble de six pièces
  • les lignes auxiliaires et secondaires doivent être simples et non voyantes


Les lignes d'aide sur le graphique ne doivent pas détourner l'attention de l'idée principale des données.

  • dans la mesure du possible, n'utilisez que des étiquettes d'axe horizontal ;
  • pour les tracés avec zones, il est préférable d'utiliser une couleur avec transparence ;
  • utilisez une couleur différente pour chaque catégorie sur le tableau.

conclusions

Visualisation- un outil puissant pour transmettre des pensées et des idées à l'utilisateur final, un assistant pour la perception et l'analyse des données. Mais comme tous les outils, il doit être appliqué au bon moment et au bon endroit. Sinon, les informations peuvent être perçues lentement, voire de manière incorrecte.


Les graphiques montrent les mêmes données, les principales erreurs de visualisation sont affichées à gauche et elles sont corrigées à droite.

Lorsqu'elle est utilisée à bon escient, la visualisation des données peut rendre le contenu impressionnant, amusant et mémorable.

L'infographie est un domaine de l'informatique qui traite des algorithmes et des technologies de visualisation des données. Le développement de l'infographie est principalement déterminé par deux facteurs : les besoins réels des utilisateurs potentiels et les capacités du matériel et des Logiciel... Les besoins des consommateurs et les capacités de la technologie ne cessent de croître et, aujourd'hui, l'infographie est activement utilisée dans divers domaines. Les domaines d'application suivants de l'infographie peuvent être distingués:

  1. Visualisation des informations.
  2. Modélisation des processus et des phénomènes.
  3. Conception d'objets techniques.
  4. Organisation de l'interface utilisateur.

Visualisation des informations

La plupart des articles et rapports scientifiques ne peuvent se passer de la visualisation des données. Une forme décente de présentation des données est un tableau bien structuré avec les valeurs exactes d'une fonction en fonction de certaines variables. Mais souvent, une forme de visualisation des données plus visuelle et plus efficace est une forme graphique, et, par exemple, dans la modélisation et le traitement d'images, c'est la seule possible. Certains types d'affichage d'informations d'origines différentes sont répertoriés dans le tableau suivant :

De nombreux programmes de calculs financiers, scientifiques et techniques utilisent ces méthodes et d'autres de visualisation des données. La présentation visuelle de l'information est un excellent outil pour la recherche scientifique, un argument clair et convaincant dans les articles et discussions scientifiques.

Modélisation des processus et des phénomènes

Les systèmes graphiques modernes sont suffisamment puissants pour créer des animations complexes et des images dynamiques. Les systèmes de simulation, également appelés simulateurs, tentent d'obtenir et de visualiser une image des processus et des phénomènes qui se produisent ou pourraient se produire dans la réalité. L'exemple le plus célèbre et le plus complexe d'un tel système est un simulateur de vol, qui est utilisé pour simuler la situation et le processus de vol lors de la formation des pilotes. En optique, les simulateurs sont utilisés pour simuler des phénomènes complexes, coûteux ou dangereux. Par exemple, simulation d'imagerie ou simulation de processus dans des résonateurs laser.

Conception d'objets techniques

Le design est l'une des principales étapes de la création d'un produit en technologie. Les systèmes graphiques modernes vous permettent de visualiser visuellement l'objet conçu, ce qui contribue à l'identification et à la résolution précoces de nombreux problèmes. Le développeur juge son travail non seulement par des nombres et des paramètres indirects, il voit l'objet du design sur son propre écran. Systèmes informatiques permettent d'organiser une interaction interactive avec l'objet conçu et de simuler la fabrication d'un modèle à partir d'un matériau plastique. Les systèmes de CAO simplifient et accélèrent considérablement le travail de l'ingénieur de conception, le libérant du processus de rédaction de routine.

Organisation de l'interface utilisateur

Au cours des 5 à 7 dernières années, le paradigme visuel pour organiser l'interface entre l'ordinateur et l'utilisateur final est devenu dominant. L'interface graphique fenêtrée est intégrée à de nombreux systèmes d'exploitation modernes. L'ensemble des contrôles qui sont utilisés pour construire une telle interface est déjà assez standardisé. La plupart des utilisateurs sont déjà habitués à une telle organisation de l'interface, qui permet aux utilisateurs de se sentir plus à l'aise et d'augmenter l'efficacité de l'interaction.

Tout cela suggère que dans le système d'exploitation lui-même, un nombre suffisamment important de fonctions doit déjà être implémenté pour rendre les contrôles. Par example, système opérateur Windows fournit aux développeurs GDI (Graphics Device Interface). Comme le montre la pratique, pour certaines applications, les capacités fournies par l'API système sont largement suffisantes pour visualiser les données en cours de traitement (construction des graphiques les plus simples, représentation des objets et phénomènes modélisés). Mais des inconvénients tels que faible vitesse l'affichage, le manque de prise en charge des graphiques en trois dimensions ne contribuent pas à son utilisation pour la visualisation de données scientifiques et la modélisation informatique. Certains programmes scientifiques et techniques avec des sorties graphiques complexes nécessitent des fonctions pour une visualisation plus rapide, plus puissante et plus flexible des données calculées, des phénomènes simulés et des objets conçus.

Technologies de l'infographie

Dans les applications scientifiques et techniques modernes, le rendu graphique complexe est implémenté à l'aide de la bibliothèque OpenGL, qui est devenue la norme de facto dans le domaine du rendu 3D. La bibliothèque OpenGL est une interface logicielle très efficace avec le matériel graphique. Les plus grandes performances que cette bibliothèque vous permet d'atteindre dans les systèmes matériels fonctionnant sur la base d'accélérateurs graphiques modernes (matériel qui libère le processeur et effectue les calculs nécessaires au rendu).

L'architecture et les algorithmes de la bibliothèque ont été développés en 1992 par des spécialistes de Silicon Graphics, Inc. (SGI) pour le matériel de station de travail graphique propriétaire Iris. Quelques années plus tard, la bibliothèque a été portée sur de nombreuses plates-formes matérielles et logicielles (y compris Intel + Windows) et c'est aujourd'hui une bibliothèque multi-plateformes fiable.

La bibliothèque OpenGL est une distribution gratuite, ce qui est son avantage incontestable et la raison d'une utilisation si répandue.

OpenGL n'est pas une bibliothèque orientée objet, mais une bibliothèque procédurale (une centaine de commandes et fonctions), écrite en C. D'une part, c'est un inconvénient (l'infographie est un terrain fertile pour utiliser la programmation orientée objet), mais les programmeurs travaillant avec OpenGL peuvent travailler avec en C ++, Delphi, Fortran et même Java et Python.

Avec OpenGL, plusieurs bibliothèques auxiliaires sont généralement utilisées, ce qui permet de personnaliser le travail de la bibliothèque dans un environnement donné ou d'en exécuter des plus complexes, fonctions complexes visualisations qui sont implémentées via des fonctions OpenGL primitives. De plus, il existe un grand nombre de bibliothèques graphiques spécialisées qui utilisent la bibliothèque OpenGL comme base de bas niveau, une sorte d'assembleur, sur la base duquel sont construites des fonctions de sortie graphiques complexes (OpenInventor, vtk, IFL et bien d'autres) . La communauté d'utilisateurs d'OpenGL est disponible sur www.opengl.org

Microsoft a également développé et propose d'utiliser la bibliothèque multimédia DirectX à des fins similaires. Cette bibliothèque est largement utilisée dans les applications de jeux et multimédias, mais n'a pas été largement diffusée dans les applications scientifiques et techniques. La raison en est, très probablement, que DirectX ne fonctionne que sous Windows.

Avec une augmentation de la quantité de données accumulées, même en utilisant des algorithmes de Data Mining arbitrairement puissants et polyvalents, il devient de plus en plus difficile de « digérer » et d'interpréter les résultats obtenus. Et, comme vous le savez, l'une des dispositions du Data Mining est la recherche de modèles pratiquement utiles. Un modèle ne peut être utile en pratique que s'il peut être compris et compris.

En 1987, à l'initiative du comité technique de l'informatique graphique de l'ACM SIGGRAPH IEEE Computer Society, en lien avec la nécessité d'utiliser de nouvelles méthodes, outils et technologies de données, les tâches correspondantes de la direction de visualisation ont été formulées. Les méthodes de présentation visuelle ou graphique des données comprennent des graphiques, des diagrammes, des tableaux, des rapports, des listes, diagrammes structurels, cartes, etc. La visualisation est traditionnellement considérée comme aide lors de l'analyse des données, cependant, de plus en plus d'études parlent de son rôle indépendant.

Les techniques d'imagerie traditionnelles peuvent trouver les applications suivantes :

Ø présenter l'information à l'utilisateur sous une forme visuelle ;

Ø pour décrire de manière compacte les modèles inhérents à l'ensemble de données d'origine ;

Ø réduire la dimension ou compresser les informations ;

Ø réparer les lacunes dans l'ensemble de données ;

Ø trouver du bruit et des valeurs aberrantes dans un ensemble de données.

Visualisation de l'outil d'exploration de données

Chacun des algorithmes de Data Mining utilise une approche de visualisation spécifique. Au cours de l'utilisation de chacune des méthodes considérées ci-dessus, ou plutôt de leurs implémentations logicielles, nous avons reçu des visualiseurs à l'aide desquels il a été possible d'interpréter les résultats obtenus grâce au travail des méthodes et algorithmes correspondants.

Ø Pour les arbres de décision, il s'agit d'un visualiseur d'arbre de décision, une liste de règles, un tableau de contingence.

Ø Pour les cartes Kohonen : cartes d'entrées, sorties, autres cartes spécifiques.

Ø Pour la régression linéaire, la droite de régression agit comme un visualiseur.

Ø Pour le clustering : dendrogrammes, nuages ​​de points.

Les nuages ​​de points et les graphiques sont souvent utilisés pour évaluer les performances d'une méthode.

Toutes ces manières présentation visuelle ou les affichages de données peuvent remplir l'une des fonctions :

Ø sont une illustration de la construction d'un modèle (par exemple, représentant la structure (graphique) d'un réseau de neurones) ;

Ø aider à interpréter le résultat obtenu ;

Ø sont un moyen d'évaluer la qualité du modèle construit ;

Ø combiner les fonctions listées ci-dessus (arbre de décision, dendrogramme).

Visualisation des modèles d'exploration de données



La première fonction (illustration de la construction d'un modèle), en fait, est une visualisation du modèle de Data Mining. Il existe de nombreuses manières différentes de présenter les modèles, mais la représentation graphique donne à l'utilisateur la "valeur" maximale. L'utilisateur, dans la plupart des cas, n'est pas un spécialiste de la modélisation, le plus souvent il est un expert dans son domaine. Par conséquent, le modèle de Data Mining doit être présenté dans le langage le plus naturel pour lui, ou, au moins, contenir un nombre minimum de divers éléments mathématiques et techniques.

Ainsi, la disponibilité est l'une des principales caractéristiques du modèle de Data Mining. Malgré cela, il existe également une manière aussi répandue et la plus simple de représenter un modèle comme une "boîte noire". Dans ce cas, l'utilisateur ne comprend pas le comportement du modèle qu'il utilise. Cependant, malgré le malentendu, il obtient le résultat - les modèles révélés. Un exemple classique d'un tel modèle est le modèle de réseau de neurones.

Une autre façon de représenter le modèle est de le présenter de manière intuitive et compréhensible. Dans ce cas, l'utilisateur peut vraiment comprendre ce qui se passe « à l'intérieur » du modèle. Ainsi, il est possible d'assurer sa participation directe au processus. De tels modèles offrent à l'utilisateur la possibilité de discuter ou d'expliquer sa logique avec des collègues, des clients et d'autres utilisateurs.

Comprendre le modèle conduit à comprendre son contenu. Grâce à la compréhension, la confiance dans le modèle augmente. Un exemple classique est un arbre de décision. L'arbre de décision construit améliore réellement la compréhension du modèle, c'est-à-dire utilisé l'outil d'exploration de données.

En plus de la compréhension, ces modèles offrent à l'utilisateur la possibilité d'interagir avec le modèle, de lui poser des questions et d'obtenir des réponses. Un exemple de cette interaction est la fonction de simulation. Grâce au dialogue système-utilisateur, l'utilisateur peut acquérir une compréhension du modèle.

Des exemples d'outils de visualisation qui peuvent être utilisés pour évaluer la qualité d'un modèle sont un nuage de points, un tableau de contingence, un graphique de l'évolution de l'ampleur de l'erreur :

Ø Le nuage de points est un graphique de l'écart des valeurs prédites par le modèle par rapport aux valeurs réelles. Ces graphiques sont utilisés pour les valeurs continues. L'évaluation visuelle de la qualité du modèle construit n'est possible qu'à la fin du processus de construction du modèle.

Ø Le tableau de contingence est utilisé pour évaluer les résultats de la classification. Ces tableaux sont utilisés pour diverses méthodes de classification. L'évaluation de la qualité du modèle construit n'est possible qu'à la fin du processus de construction du modèle.

Ø Graphique de l'évolution de l'ampleur de l'erreur. Le graphique montre le changement de l'ampleur de l'erreur dans le processus de fonctionnement du modèle Par exemple, dans le cadre d'un travail les réseaux de neurones l'utilisateur peut observer l'évolution de l'erreur sur les ensembles d'entraînement et de test et arrêter l'entraînement pour éviter le "surapprentissage" du réseau. Ici, l'évaluation de la qualité du modèle et de ses changements peut être évaluée directement dans le processus de construction du modèle.

Des exemples de visualiseurs qui aident à interpréter le résultat sont : la ligne de tendance dans la régression linéaire, les cartes de Kohonen, le nuage de points dans l'analyse de cluster.

Techniques d'imagerie

Les méthodes de visualisation, selon le nombre de mesures utilisées, sont généralement classées en deux groupes :

1. Présentation des données en une, deux et trois dimensions

Ce groupe de méthodes comprend des méthodes bien connues d'affichage d'informations qui sont disponibles pour la perception par l'imagination humaine. Presque tous les outils d'exploration de données modernes incluent des méthodes de présentation visuelle de ce groupe.

Selon le nombre de dimensions de la vue, celles-ci peuvent être les suivantes :

Ø mesure unidimensionnelle, ou 1-D;

Ø mesure bidimensionnelle, ou 2-D;

Ø Mesure 3D ou projection, ou 3-D.

Il convient de noter que l'œil humain perçoit le plus naturellement les représentations bidimensionnelles de l'information.

Lorsqu'il utilise une présentation d'informations en deux et trois dimensions, l'utilisateur a la possibilité de voir les modèles de l'ensemble de données :

Ø sa structure en cluster et la répartition des objets en classes (par exemple, sur un nuage de points) ;

Ø caractéristiques topologiques ;

Ø présence de tendances;

Ø des informations sur l'arrangement mutuel des données ;

Ø l'existence d'autres dépendances inhérentes au jeu de données étudié.

Si l'ensemble de données a plus de trois dimensions, les options suivantes sont possibles :

ü l'utilisation de méthodes multidimensionnelles de présentation de l'information (elles sont discutées ci-dessous) ;

ü réduction de dimension à une représentation à une, deux ou trois dimensions. Il existe différentes manières de réduire la dimension. Les cartes de Kohonen auto-organisées sont utilisées pour réduire la dimensionnalité et visualiser simultanément les informations sur une carte en deux dimensions.

2. Présentation des données en 4+ dimensions

Les représentations de l'information en quatre dimensions et plus sont inaccessibles à la perception humaine. Cependant, des méthodes spéciales ont été développées pour la possibilité d'afficher et de percevoir de telles informations par une personne.

Vous avez aimé l'article ? A partager entre amis :