Способы визуального представления данных. Методы визуализации. Визуализация данных в науке и технике

В последние десятилетия в области передачи визуальной информации произошли почти революционные изменения:

колоссально возросли объем и количество передаваемой информации;

сложились новые виды визуальной информации и способы ее передачи.

Технический прогресс и формирование новой визуальной культуры неминуемо накладывает свой отпечаток на свод требований, предъявляемых к деятельности педагогов.

Одним из средств улучшения профессиональной подготовки будущих учителей, способных к педагогическим инновациям, к разработке технологий проектирования эффективной учебной деятельности школьника в условиях доминирования визуальной среды, считается формирование у них особых умений визуализации учебной информации. Термин «визуализация» происходит от латинского visualis - воспринимаемый зрительно, наглядный. Визуализация информации представление числовой и текстовой информации в виде графиков, диаграмм, структурных схем, таблиц, карт и т.д. Однако такое понимание визуализации как процесса наблюдения предполагает минимальную мыслительную и познавательную активность обучающихся, а визуальные дидактические средства выполняют лишь иллюстративную функцию. Иное определение визуализации дается в известных педагогических концепциях (теории схем - Р.С. Андерсон, Ф. Бартлетт; теории фреймов - Ч. Фолкер, М. Минский и др.), в которых этот феномен истолковывается как вынесение в процессе познавательной деятельности из внутреннего плана во внешний план мыслеобразов, форма которых стихийно определяется механизмом ассоциативной проекции .

Аналогичным образом понятие визуализации понимает Вербицкий А.А.: «Процесс визуализации - это свертывание мыслительных содержаний в наглядный образ; будучи воспринятым, образ может быть развернут и служить опорой адекватных мыслительных и практических действий» . Данное определение позволяет развести понятия «визуальный», «визуальные средства» от понятий «наглядный», «наглядные средства». В педагогическом значении понятия «наглядный» всегда основано на демонстрации конкретных предметов, процессов, явлений, представление готового образа, заданного извне, а не рождаемого и выносимого из внутреннего плана деятельности человека. Процесс разворачивания мыслеобраза и «вынесение» его из внутреннего плана во внешний план представляет собой проекцию психического образа. Проекция встроена в процессы взаимодействия субъекта и объектов материального мира, она опирается на механизмы мышления, охватывает различные уровни отражения и отображения, проявляется в различных формах учебной деятельности .

Если целенаправленно рассматривать продуктивную познавательную деятельность как процесс взаимодействия внешнего и внутреннего планов, как вынесение будущих продуктов деятельности из внутреннего плана во внешний, как корректировку и реализацию во внешнем плане замыслов, то визуализация выступает в качестве главного механизма, обеспечивающего диалог внешнего и внутреннего планов деятельности. Следовательно, в зависимости от свойств дидактических визуальных средств зависит уровень активизации мыслительной и познавательной деятельности обучающихся.

В связи с этим возрастает роль визуальных моделей представления учебной информации, позволяющие преодолеть затруднения, связанные с обучением, опирающимся на абстрактно-логическое мышление. В зависимости от вида и содержания учебной информации используются приемы ее уплотнения или пошагового развертывания с применением разнообразных визуальных средств. В настоящее время в образовании перспективной представляется применение когнитивной визуализации дидактических объектов . Под это определение фактически подпадают все возможные виды визуализации педагогических объектов, функционирующие на принципах концентрации знаний, генерализации знаний, расширения ориентировочно-презентационных функций наглядных дидактических средств, алгоритмизации учебно-познавательных действий, реализуемая в визуальных средств.

На практике, используются более сотни методов визуального структурирования - от традиционных диаграмм и графов до «стратегических» карт (roadmaps), лучевых схем-пауков (spiders) и каузальных цепей (causal chains). Такое многообразие обусловлено существенными различиями в природе, особенностях и свойствах знаний различных предметных областей. Наибольшей информационной емкостью, на наш взгляд, универсальностью и интегративностью обладают структурно-логические схемы. Такой способ систематизации и визуального отображения учебной информации основывается на выявлении существенных связей между элементами знания и аналитико-синтетической деятельности при переводе вербальной информации в невербальную (образную), синтезирование целостной системы элементов знаний. Освоение перечисленных видов по конкретизации смыслов, разворачиванию логической цепочки размышлений, описанию образов и их признаков мыслительной деятельности, а также операций с помощью вербальных средств обмена информацией формирует продуктивные способы мышления, столь необходимые специалистам при современных темпах развития науки, техники и технологий. Согласно достижениям нейропсихологии «обучение эффективно тогда, когда потенциал мозга человека развивается через преодоление интеллектуальных трудностей в условиях поиска смысла через установление закономерностей» .

Структурно-логические схемы создают особую наглядность, располагая элементы содержания в нелинейном виде и выделяя логические и преемственные связи между ними. Такая наглядность опирается на структуру и ассоциативные связи, характерные для долговременной памяти человека. В некотором роде структурно-логические схемы выступают в роли промежуточного звена между внешним линейным содержанием (текст учебника) и внутренним нелинейным содержанием (в сознании). В качестве одного из достоинств структурно-логических схем А.В. Петров выделяет то, что «она выполняет функцию объединения понятий в определенные системы» . Сами по себе понятия ничего не могут сказать о содержании предмета обучения, но будучи связанными определенной системой, они раскрывают структуру предмета, его задачи и пути развития. Понимание и осмысление новой ситуации возникает тогда, когда мозг находит опору в прежних знаниях и представлениях.

Отсюда вытекает важность постоянной актуализации прежнего опыта для овладения новыми знаниями. Процесс изучения нового материала можно представить как восприятие и обработку новой информации путем ее соотнесения с понятиями и способами действий, известными обучающемуся, посредством использования освоенных им интеллектуальных операций. Поступающая в мозг по различным каналам информация концептуализируется и структурируется, образуя в сознании концептуальные сети. Новая информация встраивается в существующие когнитивные схемы, преобразует их и формирует новые когнитивные схемы и интеллектуальные операции. При этом устанавливаются связи между известными понятиями и способами действий и новыми знаниями, возникает структура нового знания .

По данным психологов новая информация усваивается и запоминает лучше тогда, когда знания и умения «запечатлеваются» в системе визуально-пространственной памяти , следовательно представление учебного материала в структурированном виде позволяет быстрее и качественнее усваивать новые системы понятий, способы действий. В качестве примера можно привести визуальную схему: «Цветовая модель RGB» (см. рис. 2).



Рис. 2.

Визуализация учебного материала открывает возможность не только собрать воедино все теоретические выкладки, что позволит быстро воспроизвести материал, но и применять схемы для оценивания степени усвоения изучаемой темы. В практике также широко используется метод анализа конкретной схемы или таблицы, в котором вырабатывают навыки сбора и обработки информации. Метод позволяет включить обучаемых в активную работу по применению теоретической информации в практической работе. Особое место уделяется совместному обсуждению, в процессе которого есть возможность получать оперативную обратную связь, понимать лучше себя и других людей. Обобщая сказанное, заметим, что в зависимости от места и назначения визуальных дидактических материалов в процессе формирования понятия (изучении теории, явления) к выбору определенной структурной модели и наглядному отображению содержания обучения должны быть предъявлены различные психолого-педагогические требования.

При визуализации учебного материала следует учитывать, что наглядные образы сокращают цепи словесных рассуждений и могут синтезировать схематичный образ большей «емкости», уплотняя тем самым информацию. В процессе разработки учебно-методических материалов необходимо контролировать степень обобщения содержания обучения, дублировать вербальную информацию образной и наоборот, чтобы при необходимости звенья логической цепи были полностью восстановлены обучающимися.

Другим важным аспектом использования визуальных учебных материалов является определение оптимального соотношения наглядных образов и словесной, символьной информации. Понятийное и визуальное мышление на практике находятся в постоянном взаимодействии. Они, дополняя друг друга, раскрывают различные стороны изучаемого понятия, процесса или явления. Словесно-логическое мышление дает нам более точное и обобщенное отражение действительности, но это отражение абстрактно. В свою очередь, визуальное мышление помогает организовать образы, делает их целостными, обобщенными, полными.

Визуализация учебной информации позволяет решить целый ряд педагогических задач:

обеспечение интенсификации обучения;

активизации учебной и познавательной деятельности;

формирование и развитие критического и визуального мышления;

зрительного восприятия;

образного представления знаний и учебных действий;

передачи знаний и распознавания образов;

повышения визуальной грамотности и визуальной культуры.

Тема визуализации информации и инфографики регулярно всплывает при работе, да и в целом интересна как практика проектирования и дизайна. Хотя мы в компании работаем над веб-системами, где большинство задач решается стандартными средствами конструирования вроде форм или информационных блоков, иногда требуется емко и компактно подать большое количество информации. Часто это достаточно специфичные задачи, на продумывание интерфейса которых уходит немало времени. Правда, и задачи это одни из самых интересных.

У практики отображения информации в графическом виде много синонимов, но в последнее время чаще всего используются два — визуализация данных и инфографика. Существуют эти подходы уже достаточно давно , литературы по этому поводу написано много. Среди известных авторов и дизайнеров — Edward Tufte , Stephen Few , Ben Fry . Но в первую очередь интересно, где и как используется инфографика.

Применение

Сейчас существует множество интересных примеров визуализации, но многие из них скорее объекты искусства, чем практически полезные носители информации. Я вижу следующие области использования:

  • Статистика и отчеты . Самодостаточный жанр, когда данные за некий период времени показываются вместе. Например, статической картинкой в приложении к отчету или настраиваемым графиком в сервисе статистики, с возможностью изменения параметров его отображения.
  • Справочная информация . Дополнение к основному тексту, наглядно иллюстрирующее его упоминаемыми данными. Скажем, дать общее представление о динамике одного из показателей, либо отобразить какой-то процесс и его этапы; может быть — показать структуру некого явления.
  • Интерактивные сервисы . Продукты и проекты, в которых инфографика является частью функциональности. Так, в качестве средства навигации по сервисам со сложным workflow может являться диаграмма процесса. Почти все, что связано с работой с картами и вовсе редко обходится без микса инфографики и интерактивности, не говоря уже о специализированных системах вроде диспетчерских и большей части компьютерных игр.
  • Иллюстрации . Не совсем чистый жанр — скорее, использование практик и подходов красивого отображения данных для создания самостоятельных иллюстраций. Они несут некий смысл, но это не основная их задача — основной ценностью является качество исполнения.
  • Чертежи и схемы . Специализированные документы, показывающие структуру и процесс работы сложных инженерных и природных систем. Помимо различных карт, зачастую это редко использующиеся в повседневной жизни вещи вроде схем печатных плат.
  • Эксперименты и искусство . Визуализация данных без особого практического смысла, скорее в качестве экспериментов или инсталляций. Чаще всего это сложные и громоздкие изображения, которые сложно “прочитать” бегло — объем данных и взаимосвязей между ними таков, что нужно разбираться с картинкой по частям; либо просто абстрактные изображения, автоматически сгенерированные. В последнее время направление все более популярно и периодически выходит за рамки компьютерной графики — например, в виде графиков-скульптур.

Классификация

Набор инструментов визуализации достаточно обширен — от простейших линейных графиков до сложных отображений множества связей. Разбить их можно на несколько типов:

Графики

Показывают зависимость данных друг от друга. Строятся по осям X и Y, хотя могут быть и трехмерными.


(line chart, area chart). Наиболее распространенный случай. Объединяет линией набор точек, соответствующих значениям по осям. Например, ежедневная посещаемость сайта за месяц. Может показывать сразу несколько наборов данных — например, статистику просмотров для 3 наиболее популярных страниц.
Примеры: © BFM.ru , SmartMoney , TeleGeography Research
(scatterplot). Показывает распределение ограниченного набора точек, соответствующих значениям по осям. Между точек часто рисуется линия тренда — она наглядно показывает закономерности среди значений. Например, связь между стажем работы и производительностью труда среди 50 сотрудников компании (просто соединить полученные точки в виде линейного графика нельзя — и смысл искажается, и линия будет будет дерганой).
Примеры: © Statcon
Другие примеры в галерее паттернов

Диаграммы сравнения

Показывают соотношения набора данных. Во многих случаях строятся вокруг осей, хотя и необязательно.

(bar chart). Показывает один или несколько наборов данных, сравнивая их между собой. Существует два варианта отображения в случае нескольких наборов — либо в виде нескольких стоящих рядом столбиков, либо в виде одного, но поделенного внутри в соответствии с долями значений. Например, ежегодная прибыль трех компаний за последние 5 лет или доли рынка трех компаний за это же время.
Примеры: © SmartMoney
Другие примеры в галерее паттернов
(histogram). Показывает распределение набора данных внутри выборки в виде столбиков. Например, количество сотрудников компании в нескольких возрастных группах.
Примеры: © Студия Артемия Лебедева , Большая Советская Энциклопедия
Другие примеры в галерее паттернов
(pie chart). Отображает процент, занимаемый каждым значением внутри набора данных, в виде разбитого на части круга. Например, доли рынка сотовых операторов. Может отображать сразу несколько наборов данных — в этом случае диаграммы наложены друг на друга, причем каждая из них меньше предыдущей. Например, доли рынка сотовых операторов за последение 3 года.
Примеры: © Candy Chang , Density Design , GraphJam
Другие примеры в галерее паттернов
(bubble chart). Микс графика и диаграммы — по двум осям расставлен набор точек, соответствующий значениям. При этом сами точки не соединены и имеют различную величину, которая задается третьим параметром. Например, сравнение количества купленных товаров, общей стоимости покупки и величины общего бюджета покупателя.
Примеры: © (автор неизвестен), Секрет Фирмы , Коммерсантъ.Деньги
Другие примеры в галерее паттернов
(ring chart). Показывает процент от максимального количества, которое занимает одно из значений в наборе данных, в виде частично закрашенного кольца. Например, количество завоеванных на чемпионате медалей относительно максимального. Часто используется сразу несколько таких диаграмм, сравнивая разные значения.
Примеры: © Wired , New York Times
Другие примеры в галерее паттернов
(span chart). Показывает минимальную и максимальную величину значений внутри набора данных в виде урезанной столбиковой диаграммы. Начало столбика лежит не на горизонтальной оси, а в точке минимального значения по вертикали. Например, разброс стоимости квадратного метра жилья в разных районах города.
Примеры: © Potsdam University of Applied Sciences
Другие примеры в галерее паттернов
(radar chart). Сравнивает величины нескольких значений, каждая из которых соответствует точке на оси. Количество осей соответствует количеству значений, а точки объединены линями. Например, сравнение рентабельности каждого из 8 направлений деятельности компании.
Примеры: © Секрет Фирмы , Pedro Monteiro , Main Library at Queen Mary (University of London)
Другие примеры в галерее паттернов
(tag cloud). Сравнивает ключевые слова или фразы (значения), содержащиеся внутри фрагмента текста (набора данных), задавая каждому из них свой размер шрифта. Размер шрифта зависит от величины параметра. Например, 25 самых часто упоминаемых в газетах слов за декабрь 2008 года.
Примеры: © Flickr , Martin Ignacio Bereciartua
Другие примеры в галерее паттернов
(heat map). Сравнивает значения внутри набора данных, закрашивая их одним из цветов в заранее выбранном спектре. Основой является изображение или другая диаграмма, на которой расставлены значения. Цвет зависит от величины параметра и чаще всего накладывается в виде пятен. Например, страны мира с наиболее высоким атмосферным давлением или элементы главной страницы сайта, по которым пользователи кликают чаще всего.
Примеры: © Dylan Vester , CrazyEgg
Другие примеры в галерее паттернов

Деревья и структурные диаграммы

Показывают структуру набора данных и взаимосвязи между его элементами.

Граф и дерево (graph, tree). Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Выстраивается в виде соединенных линиями узлов либо сверху вниз, либо из центра композиции. Узел обычно отображается кругом или прямоугольником. Например, карта сайта.
Примеры: © Concept Draw , Karen Leech, (автор неизвестен)
Другие примеры в галерее паттернов
(mind map). Показывает состав и структуру явления или понятия в виде графа, в котором каждый узел имеет один или несколько дочерних элементов. Это частный случай графа, с той разницей что ветви обычно симметрично расходятся из узла, расположенного в центре изображения. Например, конспект книги по управлению проектами, который отражает ее содержание и основные понятия.
Примеры: © Adaptive Path , Ethan Hein , Comic vs Audience
Другие примеры в галерее паттернов
Формализованные структурные диаграммы . Показывают состав и структуру системы или ее части в виде карточек, которые описаны с разной степенью детализации и связаны друг с другом как родительские и дочерние. Отображается в стандартизованном виде — например, с помощью UML (Unified Modeling Language) или IDEF1X (Integration Definition for Information Modeling). Например, все сущности, необходимые для работы одного из модулей программной системы.
Примеры: © Concept Draw , Wikipedia
Другие примеры в галерее паттернов
(Venn/Euler diagram). Показывает отношения между значениями набора данных в виде накладывающихся друг на друга кругов (чаще всего трех). Область, в которой пересекаются все круги, показывает общее между ними. Например, пересечением соблюдения сроков, бюджета и поставленных задач является успех проекта.
Примеры: © Phil Glockner , Dan Saffer
Другие примеры в галерее паттернов
(tree map). Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Отображается в виде набора вложенных прямоугольников, каждый из которых является ветвью дерева, а находящиеся внутри него — дочерними элементами и ветвями. Прямоугольники различаются по размеру в зависимости от параметра и имеют цвет, который задается другим параметром. Например, детальная структура бюджета компании, в котором цветом показан процент изменения каждого пункта по сравнению с предыдущим годом.
Примеры: © Tableau Software , Panopticon , Panopticon
Другие примеры в галерее паттернов

Диаграммы визуализации процесса

Показывают процесс, состоящий из последовательности действий. Может включать один или несколько сценариев развития событий.

(block diagram). Показывает ключевые шаги, которые проходит процесс, в виде связанных друг с другом однонаправленными стрелками блоков. Отображается в стандартизированном формате, где вид блока зависит от его роли в процессе. Например, схема процесса утверждения и публикации статьи внутри редакции.
Примеры: © Density Design , Allen Holub , Concept Draw
Другие примеры в галерее паттернов
(block diagram). Показывает ключевые шаги, которые проходит процесс, в виде связанных друг с другом стрелками блоков. Отображается в свободной форме, когда шаги показаны произвольными фигурами, а стрелки могут быть двунаправленными или вообще не иметь направления. Кроме того, блоки могут быть объединены в группы. Например, упрощенная схема передвижения средств при SMS-платежах.
Примеры: © Tapulous , Секрет Фирмы , David Armano
Другие примеры в галерее паттернов
. Показывает ключевые шаги процесса, который содержит набор повторяющихся действий. Циклическая часть отображается в виде кольца, которое образуют соединенные стрелками шаги. А начало и окончание процесса — входящей и выходящей из круга стрелками. Например, последовательность процесса проверки качества, который проходит во время работы над программным продуктом.
Примеры: © Fruitful, eStrara, Idiagram
Другие примеры в галерее паттернов
(Sankey diagram). Показывает ключевые шаги процесса и интенсивность его протекания на каждом из участков. Отображается без узлов, в виде соединяющихся и разветвляющихся линий разной толщины (в зависимости от величины параметра). Имеет любое количество начальных и конечных точек, а значит и множество сценариев развития. Например, процесс передачи тепла от ТЭЦ к бойлерной станции, включая его потери по различным причинам.
Примеры: © , Sankey-diagrams.com , IBM
Другие примеры в галерее паттернов

Матрицы

Сопоставляют между собой значения внутри набора данных в виде таблицы.

Таблица (matrix). Показывает набор данных в виде заполненных его значениями ячеек, которые образуют собой строки и столбцы. Каждому столбцу и строке соответствует параметр, который определяет конкретную ячейку для значения. Например, бюджет отделов компании за каждый год ее существования.
Примеры: © Известия , PresseBox , Elliance
Другие примеры в галерее паттернов
. Частный случай таблицы. Показывает календарный месяц по номерам и дням недели.
Примеры: © thenonhacker , Yahoo! UI Patterns Library
Другие примеры в галерее паттернов

Диаграммы времени

Показывают распределение данных в зависимости от времени.

(timeline). Показывает значения из набора данных на горизонтальной оси, которая соответствует времени. Отрезки между значениями могут быть любой величины. Например, линия годов XX века, на которой отмечены крупные военные конфликты.
Примеры: © Секрет Фирмы , Rodrigo Ronda Leon , GOOD Magazine
Другие примеры в галерее паттернов
(Gantt diagram). Показывает последовательность, длительность, а также время начала и окончания этапов и конкретных задач, необходимых для выполнения проекта. Отображается в виде “водопада” из одного или нескольких каскадов — соединенных стрелками блоков, выстроенных по диагонали сверху вниз, слева направо (т.е. “лестницей”). Причем длина блока зависит от необходимого для выполнения времени. Например, задачи, которые нужно выполнить для написания, подготовки к печати и выпуска книги. Диаграмму можно также отнести и к группе визуализирующих процесс, но обе ее части (длительность и последовательность действий) одинаково важны, поэтому тут уже дело вкуса.
Примеры: © MS Project , Todd R. Warfel
Другие примеры в галерее паттернов

Карты

Показывают данные, зависимые от географии или архитектуры некого объекта.

. Показывает в схематичном виде состав и расположение частей географического объекта. Например, мир в целом или остров.
Примеры: © Google Maps , TeleGeography Research , Flowing Data
Другие примеры в галерее паттернов
. Показывает географический объект в виде фотографии со спутника или самолета. Например, мир в целом или город.
Примеры: © Google Maps , Яндекс.Карты
Другие примеры в галерее паттернов
. Показывает в схематичном виде трассы, магистрали, железные и другие дороги, наложенные на очертания географических объектов. Например, автомобильная карта дорог области.
Примеры: © MapQuest , Яндекс.Карты
Другие примеры в галерее паттернов
. Показывает различные объекты в виде маркеров на карте мира, страны или города. Объектами чаще всего являются те, что построены человеком: дома, магазины, памятники, объекты инфраструктуры и т.п. на карте города; либо города на карте страны; либо страны на карте мира. Основой может являться практически любая карта, но обычно используются географическая, фотографическая, дорожная или топографическая карты. Например, расположение офисов компании на карте города.
Примеры: © Яндекс.Карты , Автокадабра
Другие примеры в галерее паттернов
(cartogram). Показывает в виде схематичной карты набор данных, каждое из значений которого привязано к географическому объекту. При этом размер и форма объекта зависит от величины значения. Например, карта мира, на которой величина страны зависит от количества ее населения.
Примеры: © Density Design , (автор неизвестен), Manuel Marino
Другие примеры в галерее паттернов
(floor plan). Показывает в схематичном виде форму и внутреннее строение одного из этажей здания или другого архитектурного сооружения. Также может показывать расстановку мебели и других предметов наполнения помещений. Например, план помещений двухкомнатной квартиры.
Примеры: © Christian’s of Bucks Point , (автор неизвестен), (автор неизвестен)
Другие примеры в галерее паттернов
. Показывает остановки общественного транспорта в виде одной или нескольких пересекающихся линий разного цвета. Линия соответствует заранее определенной последовательности станций. В некоторых случаях накладывается на упрощенную географическую карту. Например, карта метро.
Круговая диаграмма связей (network diagram, arc diagram). Показывает связи внутри набора данных в виде кольца, на котором расставлены значения. Значения связаны дугами или линиями, находящимися во внутренней области круга. При большом количестве значений они могут находиться и внутри кольца, хотя это менее наглядно. Связи также могут иметь направление. Например, являются ли взаимными друзьями участники группы в социальной сети.
Примеры: © Ethan Hein , Ethan Hein , Josef Muller-Brockmann
Другие примеры в галерее паттернов
. Показывает связи внутри набора данных в виде линии, на которой расставлены значения. Значения связаны дугами, находящимися сверху и снизу линии. Связи также могут иметь направление. Это альтернативный вариант отрисовки круговой диаграммы связей — смысл и задачи у них одинаковые.
Примеры: © Martin Dittus , Andreas Koller & Philipp Steinweber , TeleGeography Research
Другие примеры в галерее паттернов
. Показывает связи внутри набора данных в виде земного шара или географической карты, на которой расставлены значения. Значения связаны дугами, если изображение трехмерное, или линиями, если карта плоская. Связи также могут иметь направление. Например, маршруты всех находящихся сейчас в воздухе самолетов.
Примеры: © National Science Foundation , Ensci , MIT Senseable City Lab
Другие примеры в галерее паттернов
(dendrogram). Показывает близость значений набора данных по одному из параметров, используя ось Y для расстановки самих значений, а ось X — величины параметра. Отображается в виде набора соединяющихся друг с другом горизонтальных линий, которые соединяются, если значения совпадают по параметру. Причем чем раньше совпадение значений находится по оси X, тем ближе они друг к другу. Например, сравнение годовой выручки 30 предприятий.
Примеры: © GUI.ru , New York Times , Kate Jones
Другие примеры в галерее паттернов

Иллюстрации

Показывают процесс или явление в неформализованном виде.

. Показывает ключевые шаги, которые проходит процесс, в виде изображенного на картинке сюжета. Либо структуру явления в виде визуальной метафоры. По сути является аналогом графика, диаграммы или неформальной блок-схемы. Например, изображение круговорота воды в природе в книге по природоведению.
Примеры: © Athletics NYC , Christian Montenegro , журнал «Популярные Финансы»
Другие примеры в галерее паттернов
. Показывает ключевые шаги последовательного процесса или явления в виде набора картинок, каждая из которых показывает один из его этапов в виде небольшого сюжета. Например, три этапа процесса параллельной парковки в инструкции для водителей.
Примеры: © Scenic Valley Driving School , Elliance
Другие примеры в галерее паттернов

Данная статья написана представителем компании DevExpress и опубликована в блоге на ХабраХабре.

Медицинские исследователи установили, что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.

Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим мозгом, визуализация данных имеет несколько преимуществ:

  • Акцентирование внимания на разных аспектах данных


С помощью графиков можно легко обратить внимание читателя на красные показатели.

  • Анализ большого набора данных со сложной структурой
  • Уменьшение информационной перегрузки человека и удерживание его внимания
  • Однозначность и ясность выводимых данных
  • Выделение взаимосвязей и отношений, содержащихся в информации


На графике легко можно заметить важные данные.

Эстетическая привлекательность


Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся.

Эдвард Тафти, автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению ().

Как правильно использовать визуализацию данных?

Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.


60% успеха визуализации зависит от выбора типа графика, 30% - от его правильного использования и 10% - от его верного оформления.

Правильный тип графика

График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:

Цели визуализации - это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться - выявления отношений в информации, показа распределения данных, композиции или сравнения данных.


В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных.

Отношения в данных - это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы «относится к», «снижается/повышается при», то нужно стремиться показать именно отношения в данных.
Распределение данных - то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы «в диапазоне от x до y», «концентрация», «частотность», «распределение».

Композиция данных - объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются «составило x%», «доля», «процент от целого».

Сравнение данных - объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении - «больше/меньше чем», «равно», «изменяется», «повышается/понижается».

После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример - это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.


Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных.

В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу «чем проще, тем лучше». Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:

  • линейный (line)
  • с областями (area)
  • колонки и гистограммы (bar)
  • круговая диаграмма (pie, doughnut)
  • полярный график (radar)
  • точечный график (scatter, bubble)
  • карты (map)
  • деревья (tree, mental map, tree map)
  • временные диаграммы (time line, gantt, waterfall).

Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).


График со stacked значениями и с full stacked

При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой диаграммы и :


Правильное использование графика

Важно не только верно выбрать тип графика, но и правильно его использовать:

  • Не нужно нагружать график большим количеством информации. Оптимальное количество разных типов данных, категорий - это не более 4-5, иначе же целесообразнее разделить такую диаграмму на несколько штук.


Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм.

Верно выбрать шкалу и ее масштаб для графика. Для гистограмм и графиков с областями предпочтительнее начинать шкалу значений с нуля. Постараться не использовать инвертированные шкалы - это очень часто вводит зрителя в заблуждение относительно данных.


Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована.

  • Для круговых диаграмм и графиков, где показан процент от общей доли, сумма значений всегда должна составлять 100%.
  • Для лучшего восприятия данных информацию на оси лучше упорядочить - либо по значениям, либо по алфавиту, либо по логическому смыслу.

Правильное оформление графика

Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического «мусора». Основные принципы оформления:

  • использовать палитры похожих, не ярких цветов, и постараться ограничиться набором из шести штук
  • вспомогательные и второстепенные линии должны быть простыми и не бросающимися в глаза


Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных.

  • там, где возможно, использовать только горизонтальные надписи на осях;
  • для графиков с областями предпочтительнее использовать цвет с прозрачностью;
  • для каждой категории на графике использовать свой цвет.

Выводы

Визуализация - мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.


На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены.

При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.

Компьютерная графика -- это область информатики, в которой рассматриваются алгоритмы и технологии визуализации данных. Развитие компьютерной графики определяется в основном двумя факторами: реальными потребностями потенциальных пользователей и возможностями аппаратного и программного обеспечения. Потребности потребителей и возможности техники неуклонно растут, и на сегодняшний день компьютерная графика активно используется в самых различных сферах. Можно выделить следующие области применения компьютерной графики:

  1. Визуализация информации.
  2. Моделирование процессов и явлений.
  3. Проектирование технических объектов.
  4. Организация пользовательского интерфеса.

Визуализация информации

В большинстве научных статей и отчетов не обойтись без визуализации данных. Достойная форма представления данных -- это хорошо структурированная таблица с точными значениями функции в зависимости от некоторых переменных. Но часто более наглядной и эффективной формой визуализации данных является графическая, а, например, при моделировании и обработке изображений -- единственно возможная. Некоторые виды отображения информации различного происхождения перечислены в следующей таблице:

Многие программы для финансовых, научных, технических расчётов используют эти и некоторые другие способы визуализации данных. Визуальное представление информации является прекрасным инструментом при проведении научных исследований, наглядным и веским аргументом в научных статьях и дискуссиях.

Моделирование процессов и явлений

Современные графические системы обладают достаточной производительностью для создания сложных анимационных и динамических изображений. В системах моделирования, которые также называются симуляторами, пытаются получить и визуализировать картину процессов и явлений, которые происходят или могли бы происходить в реальности. Самым известным и наиболее сложным примером такой системы является симулятор полётов, который используют для моделирования обстановки и процесса полёта при обучении пилотов. В оптике симуляторы используются для моделирования сложных, дорогостоящих или опасных явлений. Например, моделирование формирования изображения или моделирования процессов в лазерных резонаторах.

Проектирование технических объектов

Проектирование является одной из основных стадий создания изделия в технике. Современные графические системы позволяют наглядно визуализировать проектируемый объект, что способствует скорейшему выявлению и решению многих проблем. Разработчик судит о своей работе не только по цифрам и косвенным параметрам, он видит предмет проектирования на свойм экране. Компьютерные системы позволяют организовать интерактивное взаимодействие с проектируемым объектом и иммитировать изготовление макета из пластичного материала. CAD-системы существенно упрощают и ускоряют работу инженера-конструктора, освобождая его от рутинного процесса черчения.

Организация пользовательского интерфеса

В последние 5-7 лет визуальная парадигма при организации интерфеса между компьютером и конечным пользователем стала доминирующей. Оконный графический интерфейс встроен во многие современные операционные системы. Уже достаточно стандартизован набор элементов управления, которые используются при построении такого интерфейса. Большинство пользователей уже привыкло к такой организации интерфейса, который позволяет пользователям чувствовать себя более комфортно и повышать эффективность взаимодействия.

Всё это, говорит о том, что в самой операционной системе должны быть уже реализованы достаточно большое количество функций для визуализации элементов управления. Например, операционная система Windows предоставляет разработчикам GDI (Graphics Device Interface). Как показывает практика для некоторых приложений возможностей, предоставляемых системной API, вполне достаточно для визуализации обрабатываемых данных (построения простейших графиков, представления моделируемых объектов и явлений). Но такие недостатаки, как низкая скорость отображения, отсутствие поддержки трехмерной графики не способствуют ее использованию для визуализации научных данных и компьютерного моделирования. В некоторых научных и технических программах со сложным графическим выводом требуются функции для более быстрой, мощной и гибкой визуализации вычисленных данных, моделируемых явлений, проектируемых объектов.

Технологии компьютерной графики

В современных научных и технических приложениях сложный графическая вызуализация реализуется с использованием библиотеки OpenGL, которая стала стандартом de facto в области трёхмерной визуализации. Библиотека OpenGL представляет собой высокоэффективный программный интерфейс к графическому аппаратному обеспечению. Наибольшую призводительность эта библиотека позволяет достичь в аппаратных системах работающих на основе современных графических ускорителей (аппаратное обеспечение, освобождающее процессор и выполняющее вычисления, необходимые для визуализации).

Архитектура и алгоритмы были библиотеки разработаны в 1992 году специалистами фирмы Silicon Graphics, Inc. (SGI) для собственного аппаратного обеспечения графических рабочих станций Iris. Через несколько лет библиотека была портирована на многие аппаратно-программные платформы (в том числе Intel+Windows) и сегодня является надёжной многоплатформенной библиотекой.

Библиотека OpenGL является бесплатно распространяемой, что является ее несомненным достоинством и причиной столь широкого использования.

OpenGL является не объектно-ориентированной, а процедурной библиотекой (около сотни комманд и функций), написанная на языке С. С одной стороны - это недостаток (компьютерная графика - благодатная область использования объектно-ориентированного программирования), но зато работать с OpenGL могут программисты работающие на C++, Delphi, Fortran и даже Java и Python.

Совместно с OpenGL обычно используется несколько вспомогательных библиотек, которые помогают наcтроить работу библиотеки в данной среде или выполнить более сложные, комплексные функции визуализации, которые реализуются посредством примитивных функций OpenGL. Кроме того существует большое количество графических библиотек специализированного назначения, которые используют библиотеку OpenGL в качестве низкоуровневого базиса, своеобразного ассемблера, на основе которого строятся сложные функции графического вывода (OpenInventor, vtk, IFL и многие другие). С сообществом пользователей OpenGL можно познакомиться на сайте www.opengl.org

Фирма Microsoft тоже разработала и предлагает использовать для подобных целей мультимедийную библиотеку DirectX. Эта библиотека широко используется в игровых и мультимедийных приложениях, а в научных и технических приложениях распространения не получила. Причина заключатся, скорее всего в том, что DirectX работает только под Windows.

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации. К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д. Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

Ø представлять пользователю информацию в наглядном виде;

Ø компактно описывать закономерности, присущие исходному набору данных;

Ø снижать размерность или сжимать информацию;

Ø восстанавливать пробелы в наборе данных;

Ø находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В ходе использования каждого из методов, рассмотренных выше, а точнее, их программных реализаций, мы получали некие визуализаторы, при помощи которых удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

Ø Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

Ø Для карт Кохонена: карты входов, выходов, другие специфические карты.

Ø Для линейной регрессии в качестве визуализатора выступает линия регрессии.

Ø Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

Ø являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

Ø помогают интерпретировать полученный результат;

Ø являются средством оценки качества построенной модели;

Ø сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей



Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе. Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "система-пользователь" пользователь может получить понимание модели.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки:

Ø Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Ø Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

Ø График изменения величины ошибки. График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы:

1. Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

Ø одномерное измерение, или 1-D;

Ø двумерное измерение, или 2-D;

Ø трехмерное или проекционное измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

Ø его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

Ø топологические особенности;

Ø наличие трендов;

Ø информацию о взаимном расположении данных;

Ø существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

ü использование многомерных методов представления информации (они рассмотрены ниже);

ü снижение размерности до одно-, двух- или трехмерного представления. Существуют различные способы снижения размерности. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

2. Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.



Понравилась статья? Поделиться с друзьями: