Классификация гибридных систем. Большая энциклопедия нефти и газа

(HV) - это автомобиль, как минимум, с двумя различными преобразователями энергии и двумя различными системами накопления энергии (в автомобиле) для привода автомобиля.

С одной стороны, гибриды различаются по их конструкции (параллельный, последовательный, комбинированный или разветвленный гибрид) и, с другой стороны, по степени электрификации (микро, мягкий, полный гибрид).

Если автомобиль получает энергию не только от топлива, а и от электросети, то тогда его называют подключаемый гибрид (Plug-ln-Hybrid).

Классификация по конструкции

Рисунок. Параллельный гибрид

Топливный бак (Т)

Аккумуляторная батарея (В)

Электродвигатель (Е)

ДВС (V)

Коробка передач (G)

В параллельных гибридах ДВС и электродвигатель вместе воздействуют на трансмиссию. Оба двигателя могут быть меньшими по размеру, чем в том случае, если бы они устанавливались в автомобиль и работали по отдельности. Поскольку электродвигатель одновременно используется как генератор, то выработка энергии по время движения электродвигателем невозможна.

Рисунок. Последовательный гибрид

Топливный бак (Т)

Аккумуляторная батарея (В)

Электродвигатель (Е)

ДВС (V)

Генератор (Gen)

В последовательных гибридах на трансмиссию воздействует только электродвигатель. ДВС приводит в действие электрический генератор, который вращает электродвигатель и заряжает аккумуляторную батарею. Последовательный гибрид работает местами на чистом электричестве при заряженной аккумуляторной батарее и, таким образом, очень близок к электромобилю.

Поэтому он также называется электромобилем с увеличенным запасом хода (Range-Extender).

Рисунок. Комбинированный или разветвленный гибрид

Топливный бак (Т)

Аккумуляторная батарея (В)

Электродвигатель (Е)

ДВС (V)

Генератор (Gen)

Инвертор (L)

Комбинированный гибрид объединяет под капотом параллельный и последовательный гибрид. ДВС посредством генератора и аккумуляторной батареи подготавливает энергию для электродвигателя или непосредственно соединен с приводом. Переключение и соединение между двумя состояниями выполняется автоматически.

Рисунок. Подключаемый гибрид

Топливный бак (Т)

Аккумуляторная батарея (В)

Электродвигатель (Е)

ДВС (V)

Генератор (Gen)

Розетка (S)

В подключаемых гибридах аккумуляторная батарея заряжается не только от ДВС, а и от сети. Таким образом, подключаемый гибрид может проезжать длинные дистанции на чистом электричестве. Подключаемый гибрид представляет собой следующий этап развития электромобилей.

Классификация по степени электрификации

Микрогибрид

Несмотря на то, что так называемые микрогибриды с рекуперацией энергии торможения и автоматикой старт- стоп уже сегодня вносят значительный вклад в экономию топлива и снижение выброса вредных веществ в атмосферу, воздействия на привод они не оказывают. Поэтому в узком смысле слова они не являются гибридными автомобилями.

Пример микрогибридной системы

Система i-StARS от фирмы Valeo может остановить двигатель еще до полной остановки автомобиля, то есть как только скорость упадет ниже 8 км/ч (в случае автоматической коробки передач) и 20 км/ч (в случае механической коробки передач). Таким образом, оптимизируется расход топлива и упрощается вождение автомобиля. Регенеративная функция тормоза срабатывает, как только водитель снимает ногу с педали акселератора. Затем система отправляет электронный сигнал на стартер генератор, вследствие чего кинетическая энергия автомобиля преобразуется сразу же в электрическую энергию, заряд аккумуляторной батареи. Этим достигается значительное сокращение расхода топлива.

Мягкий гибрид

Мягкий гибрид не работает на чистом электричестве. Электродвигатель только поддерживает ДВС.

Энергия для электродвигателя поступает, например, от использования энергии торможения.

В обычных автомобилях энергия движения - или кинетическая энергия - преобразуется при торможении в тепло на тормозных дисках. Тепло просто безвозвратно выбрасывается в окружающую среду. В гибридных автомобилях кинетическая энергия улавливается генератором и накапливается в высоковольтной аккумуляторной батарее.

Пример для системы с мягким гибридным приводом: Honda IMA (встроенный ассист двигателя)

Стартер-генератор расположен между двигателем и коробкой вместо маховика.

Одним из преимуществ автомобилей с мягким гибридным приводом является тот факт, что ДВС, который реализует, по существу, свою мощность в зоне средних и высоких оборотов, комбинируется с преимуществами электродвигателя, который развивает свою силу на низких оборотах. Гибридная система, поэтому, может рассматриваться как усилитель мощности и эффективности.

В целом, можно сказать, что посредством «уменьшения» ДВС снижается расход бензина, а также выбросы в окружающую среду. Однако клиенты не готовы принять малую мощность. Автомобиль с гибридным приводом при помощи электродвигателя может компенсировать недостающую мощность, например, при разгоне или ускорении.

Рисунок. Характеристика мощности и крутящего момента Honda-IMA

Рисунок. Обзор системы Mercedes S400 HYBRID

12-В-генератор

Электродвигатель

7-ступенчатая автоматическая коробка передач

Модуль силовой электроники

Модуль высоковольтной аккумуляторной батареи

Модуль DC/DC-преобразователя

12-В-батарея

Другой пример мягких гибридов

Mercedes S 400 HYBRID имеет параллельный гибридный привод. При такой концепции привода как ДВС, так и электродвигатель механически соединены с ведущими колесами (параллельная схема двигателей). Мощности обоих двигателей могут суммироваться, в результате чего отдельные мощности двигателей могут быть меньшими. Движение на одном только электродвигателем невозможно.

Полный гибрид

Полный гибрид приводится в действие местами только электродвигателем. Технической основой полного гибрида является разветвленный, комбинированный или последовательный гибрид.

Рисунок. Audi А1 e-tron в качестве последовательного полного гибрида

Пример автомобиля с полным гибридным приводом

Audi А1 e-tron приводится в действие электродвигателем с максимальной мощностью 75 кВт/102 л.с. и максимальным крутящим моментом 240 Нм. Передача усилия происходит при помощи одноступенчатой коробки передач. Запас хода А1 при работе только на электричестве: 50 км. Если литийионный аккумулятор, установленный перед задним мостом, разряжен, то самая маленькая модель фирмы Audi приводится в действие, как и Opel Ampera или Chevrolet Volt, при помощи небольшого ДВС.

Литий-ионный аккумулятор расположен в основании кузова перед задним мостом, чтобы оптимизировать распределения веса и центр тяжести автомобиля А1 e-tron массой 1,2 т. Литий-ионный аккумулятор весом 150 кг имеет емкость 12 кВт/ч.

Рисунок. Коробка передач с двумя электродвигателями для привода

Другой пример

BMW Х6 ActiveHybrid

Мощные электромоторы (67 кВт/91 л.с. и 63 кВт/86 л.с.) компактно размещаются в активной, двух режимной трансмиссии, в корпусе размером с обычную автоматическую коробку передач.

В зависимости от дорожной ситуации привод осуществляется или посредством электродвигателей, или посредством ДВС, или попеременно обоими приводами.

В режиме 1 при малой скорости с использованием электромашин, прежде всего, обеспечивается значительное сокращение расхода топлива, а также создается дополнительная сила тяги.

В режиме 2, напротив, электрически передаваемая мощность на высокой скорости падает с одновременным увеличением КПД ДВС (благодаря коррекции точки нагрузки) и топливной эффективности.

И в этом режиме обе электромашины работают по разному и наряду с электрической поддержкой привода и функцией генератора, в частности, отвечают за эффективное переключение передач.

Рисунок. Расположение компонентов в автомобиле

Теплообменник охлаждающей жидкости трансмиссионного масла

Трубопроводы для трансмиссионного масла

Двухдисковый маховик

Высоковольтные провода

Корпус активной коробки передач

Гибридный механизм блокировки при парковке

Электрогидравлический модуль управления

Насос для трансмиссионного масла с электрическим/механическим приводом

Привод дополнительных агрегатов в автомобилях с полным гибридным приводом

Основной проблемой является привод дополнительных агрегатов, которые при остановке двигателя должны работать. Приводимые ранее в действие посредством ДВС компоненты теперь должны работать только на электричестве.

Электрический вакуумный насос

Функции вакуумного насоса:

обеспечение пониженного давления в усилителе тормозного усилия,
поддержание подачи пониженного давления в режиме старт/стоп.

Электрогидравлический усилитель рулевого управления

Для работы усилителя рулевого привода во время автоматической остановки двигателя необходимо разъединить усилитель и ДВС и обеспечить независимую поддержку рулевого управления. Благодаря такой поддержке по мере необходимости одновременно обеспечивается оптимизация расхода топлива.

Компрессор кондиционера с электроприводом

Для обеспечения достаточной мощности охлаждения салона автомобиля во время автоматической остановки двигателя необходимо разъединить привод компрессора кондиционера и ДВС и обеспечить независимое кондиционирование салона, а также независимое охлаждение высоковольтной батареи. Это выполняется при помощи компрессора кондиционера с электрическим приводом. Благодаря такому охлаждению одновременно обеспечивается оптимизация расхода топлива. Электрический компрессор кондиционера отвечает за всасывание, сжатие хладагента и прокачивания его через систему. Электрический компрессор кондиционера в зависимости от температуры испарения плавно регулируется блоком управления кондиционера в диапазоне от 800 до 9000 мин^-1.

Обычно основным вычислительным компонентом систем для высокопроизводительных вычислений, включая кластеры, является центральный процессор . Однако, уже начиная с процессоров Intel486DX в составе компьютеров появился такой элемент, как сопроцессор , что можно считать гибридизацией на аппаратном уровне.

Основная проблема состоит в том, чтобы найти способы выполнять вычислительные задачи с помощью графического процессора. Осознав спрос на подобные вычисления, компания NVIDIA в 2007 году представила программно-аппаратную платформу CUDA , позволяющую запускать произвольный код на GPU. До появления CUDA , программистам приходилось строить гибридные системы из обычных видеокарт и программировать их, используя сложнейшие графические API .

Компания ATI разработала свои аналоги CUDA для GPGPU применений. Это технологии ATI Stream и Close to Metal .

Ожидалось, что новая архитектура Intel Larrabee будет поддерживать технологии GPGPU . Однако фактически выпущенный в рамках линейки Intel MIC продукт, Xeon Phi поддерживал только вычисления общего назначения (совместим с x86_64), лишившись возможностей графического процессора. Последующие варианты Xeon Phi реализовывались не только в виде карт расширения PCI Express, но и в виде единственного центрального процессора.

Технические особенности

GPU

Высокая вычислительная мощность GPU объясняется особенностями архитектуры. Если современные CPU содержат несколько ядер (на большинстве современных систем от 2 до 8х, 2018 г., на северных может встречаться максимум до 64х), графический процессор изначально создавался как многоядерная структура, в которой количество ядер измеряется сотнями(пример - Nvidia 1070 имеет 1920 ядер). Разница в архитектуре обусловливает и разницу в принципах работы. Если архитектура CPU предполагает последовательную обработку информации, то GPU исторически предназначался для обработки компьютерной графики, поэтому рассчитан на массивно параллельные вычисления.

Каждая из этих двух архитектур имеет свои достоинства. CPU лучше работает с последовательными задачами. При большом объеме обрабатываемой информации очевидное преимущество имеет GPU. Условие только одно – в задаче должен наблюдаться параллелизм.

GPU уже достигли той точки развития, когда многие приложения реального мира могут с легкостью выполняться на них, причем быстрее, чем на многоядерных системах. Будущие вычислительные архитектуры станут гибридными системами с графическими процессорами, состоящими из параллельных ядер и работающими в связке с многоядреными CPU.

Оригинальный текст (англ.)

GPUs have evolved to the point where many real-world applications are easily implemented on them and run significantly faster than on multi-core systems. Future computing architectures will be hybrid systems with parallel-core GPUs working in tandem with multi-core CPUs.

Профессор Джек Донгарра (Jack Dongarra)
Директор Innovative Computing Laboratory
Университет штата Теннесси

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Гибридные системы

Раньше уже неоднократно высказывалась идея, что экспертная система может содержать не одну форму представления знаний. Даже в таких ранних системах, как MYCIN (см. главу 3), информация, специфическая для предметной области, хранилась в разных формах -- например, в виде порождающих правил и в виде таблиц медицинских параметров. Программы, аналогичные CENTAUR (см. главу 13), уже можно было считать гибридными в том смысле, что в них объединялись разные способы представления знаний, а затем эти знания использовались с разной целью -- для решения проблемы и формирования пояснений.

Поздние исследовательские системы, такие как XPLAN (см. главу 16), имели более сложную архитектуру, в которой для разработки и обслуживания экспертных систем объединялись разнообразные программные инструменты и модели. Такие системы можно рассматривать как очередной шаг вперед по сравнению с простейшей оболочкой, поддерживающей единственную парадигму программирования. В системах на базе доски объявлений (см. главу 18), подобных HEARSAY и ВВ, объединялись разнообразные источники знаний, которые могли иметь совершенно отличную внутреннюю структуру.

Системы, которые мы рассмотрим в этой главе, ознаменовали дальнейшее продвижение по этому пути -- в них объединяются традиционные программы решения проблем и компоненты самообучения и критического анализа. Система ODYSSEUS способна обучаться тому, как уточнять базу знаний. Для этого используются две разные методики: одна основана на анализе прецедентов, а вторая -- на анализе пояснений. Обе методики являются сравнительно новыми, и читатель сможет вкратце ознакомиться с ними в данной главе. Далее будет описана программа, в которой логический вывод на основе прецедентов используется для обработки исключений из правил, а основным инструментом решения проблем являются порождающие правила. Программа обладает потенциальными возможностями обучения новым правилам . В конце главы будет рассмотрена система извлечения информации SCALIR , в которой множество обычных символических методов комбинируется с подходом, основанным на сетях подключений.

Методы обучения в системе ODYSSEUS

Методы обучения, которые рассматривались в главе 20 (пространство версий и IDЗ), иногда называют методами, основанными на подобии (similarity-based). Реализация обучения на основе этих методов требует обработки больших объемов информации -- позитивных и негативных примеров, -- из которой извлекаются характерные свойства нового концепта.

Альтернативой таким методам являются методы, основанные на пояснениях (explanation-based), которые позволяют выполнить обобщение на осно.ве единственного обучающего экземпляра. Это становится возможным, поскольку в таких методах процессом обобщения "руководят" знания, специфические для конкретной предметной области. Обучение, основанное на пояснениях, является дедуктивным или аналитическим, а не эмпирическим или индуктивным . Иными словами, при такой методике описание нового концепта формируется в результате анализа предъявленного экземпляра в свете имеющихся фоновых знаний.

Методика логического вывода на основе прецедентов, которой была посвящена глава 22, позволяет решить новую проблему, адаптируя ранее полученные решения аналогичных проблем. Эта же методика может быть использована и для обучения, поскольку если уж ранее сформированное решение адаптировано применительно к новой проблеме, его можно добавить в базу прецедентов для использования в будущем.

Ниже будут более подробно рассмотрены методика обучения на основе пояснений и возможность использования прецедентов для машинного обучения.

Термином обобщение на основе пояснений (EBG -- explanation-based generalization) обозначается независимый от, предметной области метод использования знаний, специфических для предметной области, для контроля процесса обобщения по единственному обучающему экземпляру.

Использование метода EBG предполагает, что система располагает следующей информацией:

· позитивным экземпляром обучающей выборки;

· теорией предметной области;

· определением концепта, который система должна "изучить".

Для формализации этих идей обычно используется язык логического программирования (см. главу 8). В частности, концепт, как правило, представляется в форме предиката, который характеризует то подмножество пространства объектов, которое нас интересует. Например, предикат сuр(Х) может представлять понятие "cuphood" (чашкообразность), которое определено в стиле языка PROLOG как сосуд малого объема (small), обладающий свойствами open (открытый), stable (устойчивый). Напомним, что выражение

читается как "а истинно, если b истинно". Тогда:

cup(X) :- small(X), stable(X), open(X).

Знания о предметной области должны включать описания условий, выполнение которых необходимо для того, чтобы объект можно было считать "устойчивым" (stable), например указано, что объект должен иметь плоское дно, определение свойства "открытый" (open) -- например, объект должен иметь вогнутую форму, причем центр кривизны должен быть расположен выше основания.

В качестве экземпляра обучающей выборки укажем объект с плоским дном вогнутой формы, диаметр которого не превышает нескольких дюймов. Экземпляр должен "сопровождаться" пояснением, что указанные свойства вполне достаточны для представления понятия "cuphood". Образец обычно описывается некоторым количеством фундаментальных литералов (ground literals), например:

color(red, obj). diameter(4, obj).

flat(bottom, obj). concave(top, obj).

Эти литералы представляют определенный объект obj красного цвета (red) с плоским дном (flat bottom), вогнутый, причем центр кривизны располагается сверху (concave top). Знания о предметной области, представленные ниже, позволяют распознать этот экземпляр как представляющий концепт сир:

small(X) :- diameter(Y, X), Y < 5.

stable(X) :- flat(bottom, X).

open(X) :- concave(top, X).

Обратите внимание -- то, что объект obj является чашкой, логически следует из этого фрагмента знаний. Наше пояснение, почему obj является чашкой, фактически есть доказательство. Этим завершается фаза пояснений в EBG.

Далее начинается фаза обобщения-- вырабатывается набор достаточных условий, которые существовали при пояснении. Главное, что нужно при этом сделать, -- определить самые слабые условия, которых достаточно, чтобы на основании имеющихся знаний прийти к заключению, что obj -- это чашка. Полученное в результате обобщение концепта состоит в том, что чашкой является объект с плоским дном, вогнутый, с центром кривизны вверху и диаметром менее 5:

cup(X) :- flat (bottom, X), concaveftop, X), diameter(Y, X), Y < 5.

Обратите внимание на то, что это обобщение логически следует из исходного определения понятия "чашкообразности" и базовых знаний о том, что такое "малый объем", "устойчивость" и "открытость". В этом смысле новое обобщение уже было неявно представлено в ранее имевшихся знаниях. Анализ представленного образца позволил сделать это обобщение явным. Кроме того, использование сформированного заранее обобщенного определения "чашкообразности" позволило нам совершенно безболезненно проигнорировать несущественные характеристики, в данном случае -- цвет.

Обучение на основе прецедентов (CBL -- case-based learning) представляет собой подход к обучению, совершенно противоположный методу EBG. Как было показано в главе 22, извлечение информации при таком подходе базируется в основном на подобии аргументов, а не на их логическом анализе. Можно с полным правом утверждать, что процесс адаптации сформулированного ранее решения к новой проблеме не включает обобщения в смысле логического программирования. В качестве дополнительного средства, обеспечивающего использование знаний об отношениях между сущностями предметной области, можно использовать иерархию абстракций, в частности в форме семантической сети. Однако результатом будут не новые правила, включающие переменные, а скорее новые прецеденты, сформированные из старых подстановкой констант.

Рассуждения на основе прецедентов -- это, по сути, рассуждения по аналогии, а не логический вывод. Если некто придет к заключению, что Джон, владелец Порше, -- водитель, склонный к риску, поскольку имеется прецедент, что Джек, который ездит на Ферра-ри, тоже склонен к риску, то фактически по аналогии делается вывод-- Джон похож на Джека, так как автомобиль Порше имеет много общего с Феррари. Напрашивается заключение, что, когда строится такая аналогия, каждый прецедент неявно генерирует определенное правило. В нашем примере такое обобщенное правило состоит в том, что люди, которые ездят на спортивных автомобилях, склонны к риску. Но такое правило не является полным. Все ли водители спортивных машин склонны к риску, или только водители-мужчины, или молодежь? Программа, использующая методику рассуждений на основе прецедентов, не может ответить на такой вопрос. Она способна только отыскать прецедент, наиболее близкий к рассматриваемому случаю.

Между методами CBL и EBG есть и кое-что общее. Оба метода можно противопоставить индуктивным методам, рассмотренным в главе 20, поскольку ни тот ни другой не предполагает анализа большого количества данных. Мы уже показали, что методу EBG достаточно иметь один обучающий экземпляр, а метод CBL для формирования аналогии может обойтись одним подходящим прецедентом.

Но обучение -- это нечто большее, чем просто накопление сведений. Система, основанная на анализе прецедентов, должна обладать способностью выявить неподходящие прецеденты, которые не позволяют получить удовлетворительное решение насущной проблемы. В противном случае она будет накапливать прецеденты с ошибочными решениями.

Программа CHEF, описанная в главе 22, способна выявить ситуацию, в которой она формирует неудачный рецепт, и предпринимает попытку исправить его. Чтобы сделать это, программа должна объяснить, почему она полагает рецепт неудачным. Для этого программе требуется воспользоваться определенными знаниями из предметной области, которые в таком случае должны иметь форму правил причинной связи.

Например, модули извлечения и модификации могут предложить замариновать креветок, а потом уже их чистить. Но в этом случае креветки станут слишком влажными, и в рецепте не удастся реализовать заданное в заказе свойство "очищенные креветки". Программа обнаружит это, когда попытается смоделировать процесс приготовления блюда по созданному рецепту. Тогда другой модуль системы, ответственный за восстановление, обратится к знаниям о типах ошибок в рецептах, отыщет подходящую стратегию исправления ситуации и повторит этап составления рецепта. В новом рецепте сначала нужно очистить креветки, а уже потом их мариновать.

Даже после того, как будет получено решение для нового случая, программа не сможет его правильно индексировать до тех пор, пока не поймет, почему это решение считается успешным. Если пользователь заказывает легкое, нежирное блюдо и если программа, манипулируя прежними рецептами, сформировала новый, то этот результат можно использовать в будущем только после того, как с ним будут ассоциированы признаки "легкий" и "нежирный".

Системы ODYSSEUS и MINERVA

Программа ODYSSEUS обучается тому, как совершенствовать базы знаний экспертных систем, предназначенных для решения проблем эвристической классификации (см. главы 11 и 12). Она наблюдает за тем, как эксперт решает проблему, и формирует пояснение каждого действия эксперта (например, запрашивая эксперта, почему некоторому атрибуту присвоено то или иное значение). Формирование пояснений базируется на тех знаниях о проблемной области и стратегии решения проблем, которыми располагает программа. Если программе не удается сформировать пояснение, инициируется процесс коррекции базы знаний.

Оболочка экспертной системы MINERVA

MINERVA-- это оболочка экспертной системы, разработанная на базе EMYCIN и NEOMYCIN (см. главы 10-12). Система MINERVA обеспечивает ODYSSEUS базой знаний и методом решения проблем и разработана специально для поддержки метода обучения EBL. Одно из главных отличий системы MINERVA от EMYCIN состоит в том, что в ней представлены не только знания о предметной области, но и стратегические знания, отражающие способ мышления практикующего врача. Такие знания можно рассматривать как дальнейшее развитие метаправил систем MYCIN, EMYCIN и NEOMYCIN.

Главным компонентом этой системы является база медицинских знаний о диагностировании менингита и других неврологических заболеваний. MINERVA реализована на языке PROLOG, и знания о предметной области представлены в этой системе в виде фраз Хорна (см. главу 8), но правила по содержанию аналогичны тем, что использовались в MYCIN. Например, следующее выражение представляет тот факт, что фотофобия может быть связана с головной болью:

conclude(migraine-headache, yes)

:- finding(photophobia, yes).

Знания о состоянии проблемы записываются в виде выражений для фактов в процессе работы системы. Например, выражение

rule-applied(rulel63).

утверждает, что в процессе работы системы было активизировано правило 123 и что эта информация доступна программе в процессе дальнейшей работы. Другое простое выражение

differential(migraine-headache, tension-headache).

зафиксирует тот факт, что мигрень и повышенное давление -- текущие гипотезы, выдвинутые программой.

Очевидно, что такая информация может быть представлена и зарегистрирована любым способом, например установкой флагов или переменных, но наиболее целесообразно использовать такое же представление, какое принято в базе знаний предметной области.

Несложное метаправило может быть представлено в следующем виде: goal(findout(Р)) :- not(concluded(P)), ask-user(P).

Это правило утверждает, что если текущая цель системы -- найти значение параметра Р и если система не может прийти к заключению о значении этого параметра на основании имеющихся у нее знаний, то она должна запросить его у пользователя. Поскольку Р является переменной, то головная часть выражения goal (findout (Р)) сопоставляется с выражением цели системы, представленным в явном виде, например goal (f indout (temperature)). Подцели вроде not(concluded(P)) могут быть сопоставлены (успешно или нет) с системными данными, описывающими текущее состояние процесса вычислений, например concluded (temperature).

Такие стратегические знания используются для выработки суждения о текущем состоянии проблемы и принятия решения о том, располагает ли система в данном случае достаточными знаниями. Кроме того, наличие таких знаний упрощает программу обучения, которая может обращаться к структурам на метауровне экспертной системы.

Обучение в системе ODYSSEUS

Способ обучения, который используется в системе ODYSSEUS, существенно отличается от рассмотренных в главе 20. При разработке этой системы преследовалась цель наделить ее способностью расширять существующую неполную базу знаний, а не включать в базу знаний новые понятия на основании анализа обучающей выборки большого объема. Система обучается, "наблюдая" за тем, как эксперт решает задачу, примерно так, как прилежный ученик постигает таинства мастерства учителя, стоя у него за спиной.

Основной вид действий, которые выполняются экспертом в процессе решения проблемы диагностики, -- определение значений разнообразных переменных, т.е. характеристик пациента, таких как температура и т.п. Программа, наблюдая за работой эксперта, расширяет свои знания, пытаясь понять, почему эксперту понадобился ответ на тот или иной вопрос.

Таким образом, концепция процесса обучения в системе ODYSSEUS очень близка к формулированию пояснений. Фактически в контексте работы этой системы смысл термина "пояснение" отличается как от общепринятого, так и от того, какой мы придавали ему в главе 16. В ODYSSEUS пояснение -- это вид доказательства, которое несет информацию о том, почему эксперт задает определенный вопрос на конкретном этапе решения проблемы диагноза. Смысл определенного вопроса связан как с текущим состоянием проблемы, так и с той стратегией, которой пользуется эксперт. Поэтому, "уразумев", почему был задан вопрос, программа как бы постигает стратегию действий эксперта.

Если программа располагает исчерпывающими знаниями, она способна сформулировать вопрос (а точнее, высказывание, которое стоит за ним) как логическое следствие текущего состояния проблемы, стратегических знаний, заключенных в метаправилах, знаний о предметной области и одной из текущих целей.

Например, если задан вопрос askuser(temprature), то обратный просмотр приведет нас к ближайшей цели goal (f indout (temperature)).

Но эта цель, в свою очередь, сформирована целью более высокого уровня, например желанием применить определенное правило или произвести разделение гипотез. Наличие в текущей ситуации такой цели высокого уровня объясняет, почему была сформирована цель более низкого уровня, а следовательно, почему был задан определенный вопрос. Эта обратная цепочка рассуждений от подцелей к целям выполняется обычными средствами языка PROLOG или даже MYCIN, но обратите внимание -- эти рассуждения выполняются на метауровне, т.е. на уровне, который определяет, почему программа работает именно так, а не иначе. Применяемая в системе ODYSSEUS стратегия обучения "из-за спины" включает три основные фазы.

· Определение изъяна в базе знаний. Такой изъян обнаруживает себя, когда не удается сформировать объяснения действиям эксперта, используя описанный выше метод обратного просмотра. Неудача такого рода служит сигналом, что пора приступить к обучению.

· Формирование предложений для внесения изменения в базу знаний. Если не удалось сформировать доказательство (пояснение в терминологии ODYSSEUS), значит, можно предположить, что в знаниях о предметной области или о состоянии проблемы имеется какой-то изъян. Если это изъян в знаниях о предметной области, можно временно добавить в базу подходящую фразу и посмотреть, будет ли после этого сформировано доказательство. Если же изъян существует в знаниях о состоянии проблемы, программа должна поискать другое доказательство.

· Внесение изменения в базу знаний. Метод, который используется в системе ODYSSEUS для внесения изменений в базу знаний, называется "процедурой подтверждения принятого решения". Если не вдаваться в детали, то при этом требуется, чтобы разработчик системы сформировал процедуру, которая будет обрабатывать новые правила, определив, например, на сколько сократится количество конкурирующих гипотез в результате применения правила.

Детали реализации перечисленных фаз выходят за рамки обсуждения в данной книге, но основные принципы довольно очевидны. В применяемой методике экземпляр обучающей выборки представляет собой отдельную пару атрибут--значение, но в процессе сеанса обучения может возникнуть множество таких пар, так как программа пытается объяснить, почему она придает значение каждому из этих экземпляров. Если сформировать объяснение не удается, программа предпринимает попытку модифицировать базу знаний.

Для модификации правил или добавления новых правил в базу знаний программа ODYSSEUS использует также в примитивном виде и метод CBL. Программа располагает библиотекой прецедентов, каждый из которых содержит и соответствующий правильный диагноз. Эту библиотеку программа может использовать для тестирования. Если при тестировании окажется, что сформирован неверный диагноз, программа назначает использованным при этом правилам нечто вроде штрафов.

Предпосылки правил, которые привели к ошибочному заключению, "ослабляются", т.е. сужается зона их" применения. Если же применение правил подтвердило вынесенный ранее правильный диагноз, то соответствующие предпосылки "усиливаются". В этой процедуре есть много общего с тем методом, который используется в системе Meta-DENDRAL, описанной в главе 20. Конечно, этот метод модификации правил не гарантирует решения проблемы, но он может пригодиться для настройки новых правил.

Использование прецедентов для обработки исключений

В этом разделе мы рассмотрим способ совместного использования правил и прецедентов, отличный от того, какой применен в системе ODYSSEUS. Роль прецедентов при новом подходе состоит не в том, чтобы содействовать модификации правил, а в том, чтобы при обработке исключений служить дополнением тем знаниям, которые представлены в правилах. Таким образом, каждый из компонентов занимается тем, что у него лучше получается, -- правила имеют дело с обобщениями предметной области, а прецеденты -- с отдельными нетипичными случаями.

Как уже было не раз продемонстрировано в предыдущих главах (см., например, главы 10-15), построение набора правил для экспертной системы-- задача далеко не тривиальная. Помимо сложностей, сопряженных с извлечением и представлением знаний, существует еще и проблема полноты охвата предметной области набором правил. В идеале база правил должна быть корректной, непротиворечивой (по крайней мере, в рамках принятой стратегии разрешения конфликтов) и полной. Но по мере того, как количество правил расширяется, а сами правила усложняются, достичь такого идеального состояния становится все труднее.

Особенно сложно учесть в правилах все возможные исключения. Такая попытка приводит к чрезвычайному усложнению правил. Утверждение, что не бывает правил без исключений, давно уже стало общим местом. Иногда эту проблему пытаются решить включением в набор множества "мелких" правил, которые должны активизироваться в таких исключительных ситуациях. Но это означает возлагать на правила несвойственную им функцию -- обрабатывать не общий случай, а частный.

Голдинг и Розенблум предложили использовать в экспертных системах гибридную архитектуру, в которой при решении проблем методика использования порождающих правил сочетается с методикой использования прецедентов . Идея состояла в том, что механизм обработки прецедентов должен использоваться для критического анализа результатов применения правил. Это выполняется путем поиска прецедентов, аналогичных рассматриваемому случаю, если последний можно считать исключением из правила. Такой подход требует, чтобы база прецедентов была индексирована по применяемым правилам. Авторы предложили и соответствующую меру близости, которая позволяет оценить степень подобия текущего случая и прецедента (рис. 23.1).

Архитектура гибридной системы, использующей правила и прецеденты

Основная идея системы очень проста и элегантна. Сначала для решения текущей проблемы применяются правила, в результате чего формируется некоторое решение. Затем просматривается библиотека прецедентов на предмет выявления в ней ранее ветречавшегося случая исключения из использованных правил. Алгоритм работы системы приведен ниже.

Цикл, ПОКА не будет получено решение

1 . Для выбора следующей операции использовать правила.

2. Поиск в библиотеке "неотразимых" прецедентов, которые предлагают противоположный вариант выбора операции.

3. Если прецедент найден, использовать предлагаемый в нем вариант операции. Иначе использовать тот вариант, который предлагается правилами.

Обратите внимание на то, что обращение к правилам и прецедентам выполняется в каждом цикле. (Если программа не сможет найти ни правила, которое можно было бы применить, ни прецедента, она останавливается.)

Для того чтобы предложенная идея стала работоспособной, прецеденты в библиотеке должны быть проиндексированы по правилам, которым они противоречат. Рассмотрим, например, правило страховки водителей транспортных средств:

"Мужчины не старше 25 лет платят страховой взнос по повышенному тарифу".

Такое правило должно быть связано в библиотеке с прецедентом, в котором упоминается 18-летний юноша, успешно прошедший тесты повышенной сложности и выплачивающий взнос по сниженному тарифу.

На основании каких соображений принимается решение, является ли прецедент "неотразимым" или нет? Предложенное Голдингом решение состоит в следующем. Когда мы проводим аналогию между прецедентом и текущим случаем, мы тем самым формируем некое неявное правило, скрытое от посторонних глаз. Предположим, что в нашем примере речь идет о водителе-мужчине 20 лет, который имеет квалификацию повышенной категории, и мы обнаружили аналогичный прецедент, но в нем речь шла о 1 8-летнем водителе. "Мужчины не старше 25 лет, имеющие повышенную квалификационную категорию, платят страховой взнос по сниженному тарифу".

Предположим, что при оценке степени близости, которая необходима для извлечения и последующего анализа прецедентов, возраст водителей разделяется на диапазоны, скажем "до 25 лет", "от 25 до 65 лет" и "свыше 65 лет". Эта мера близости оценит рассматриваемый нами случай и прецедент как очень похожие, поскольку совпадают возрастная категория и пол.

Можно протестировать это правило и на остальных прецедентах в библиотеке и оценить, какой процент выявленных прецедентов оно накрывает. Любой прецедент с мужчиной-водителем повышенной квалификационной категории, чей возраст не превышает 25 лет и который выплачивает взнос по повышенному тарифу, будет считаться исключением и, следовательно, снижать рейтинг прецедента. Если же случаи достаточно похожи, а правило достаточно точное, то аналогия считается "неотразимой" и компонент обработки прецедентов "выигрывает". В противном случае выигрыш будет за применяемым правилом, и в окончательном решении будет использован вариант, следующий из правила.

Таким образом, "неотразимость" зависит от трех факторов:

· степени близости случаев, которая должна превышать определенный порог;

· точности неявного правила, сформулированного в результате выявленной аналогии; в качестве меры точности берется пропорция прецедентов, которые подтверждают применение этого правила;

4 достоверности оценки точности, которая определяется размером выборки, на которой эта оценка сформирована.

Авторы продемонстрировали возможности предложенной архитектуры на примере задачи определения произношения имен. Реализованная ими система, получившая название ANAPRON, содержит около 650 лингвистических правил и 5000 прецедентов. Результаты испытания системы показали, что она обладает более высокой производительностью, чем системы-аналоги, использующие либо только правила, либо только прецеденты.

Гибридный символический подход и нейронные сети

В этом разделе будет рассмотрена перспектива использования нейронных сетей в экспертных системах. Нейронные сети предполагают совершенно другую модель вычислительного процесса, принципиально отличную от той, которая традиционно используется в экспертных системах. В качестве примера будет рассмотрена система SCALIR (Symbolic and Connectionist Approach to Legal Information Retrieval) .

Эта система помогает пользователю отыскать правовые документы -- описания прецедентов или статьи законов, -- имеющие отношение к определенному делу. Поскольку юридическая практика охватывает все области жизни современного общества, использование традиционного подхода, основанного на обычных базах знаний, к поиску и извлечению правовой информации потребует представления в системе огромного объема знаний, в большинстве нетривиальных, представляющих такие сложные понятия, как права, разрешения, обязанности, соглашения и т.п. Проблема усугубляется использованием естественного языка при составлении запросов. Большинство поисковых систем, имеющих дело с запросами на естественном языке, которые используются для поиска в сети World Wide Web, основаны на статистическом подходе, а не на базах знаний.

В системе предпринята попытка решить эту проблему посредством сочетания статистического подхода к извлечению информации и подхода, основанного на базах знаний, в которых учитываются смысловые связи между документами.

Нейронные сети

В отношении систем искусственного интеллекта вообще и экспертных систем, в частности, иногда можно услышать следующие критические замечания.

· Такие системы слишком "хрупкие" в том смысле, что, встретившись с ситуацией, не предусмотренной разработчиком, они либо формируют сообщения об ошибках, либо дают неправильные результаты. Другими словами, эти программы довольно просто можно "поставить в тупик".

· Они не способны непрерывно самообучаться, как это делает человек в процессе решения возникающих проблем.

Еще в середине 1980-х годов многие исследователи рекомендовали использовать для преодоления этих (и других) недостатков нейронные сети.

В самом упрощенном виде нейронную сеть можно рассматривать как способ моделирования в технических системах принципов организации и механизмов функционирования головного мозга человека. Согласно современным представлениям, кора головного мозга человека представляет собой множество взаимосвязанных простейших ячеек -- нейронов, количество которых оценивается числом порядка 10 10 . Технические системы, в которых предпринимается попытка воспроизвести, пусть и в ограниченных масштабах, подобную структуру (аппаратно или программно), получили наименование нейронные сети.

Нейрон головного мозга получает входные сигналы от множества других нейронов, причем сигналы имеют вид электрических импульсов. Входы нейрона делятся на две категории -- возбуждающие и тормозящие. Сигнал, поступивший на возбуждающий вход, повышает возбудимость нейрона, которая при достижении определенного порога приводит к формированию импульса на выходе. Сигнал, поступающий на тормозящий вход, наоборот, снижает возбудимость нейрона. Каждый нейрон характеризуется внутренним состоянием и порогом возбудимости. Если сумма сигналов на возбуждающих и тормозящих входах нейрона превышает этот порог, нейрон формирует выходной сигнал, который поступает на входы связанных с ним других нейронов, т.е. происходит распространение возбуждения по нейронной сети. Типичный нейрон может иметь до 10 J связей с другими нейронами.

Было обнаружено, что время переключения отдельного нейрона головного мозга составляет порядка нескольких миллисекунд, т.е. процесс переключения идет достаточно медленно. Поэтому исследователи пришли к заключению, что высокую производительность обработки информации в мозге человека можно объяснить только параллельной работой множества относительно медленных нейронов и большим количеством взаимных связей между ними. Именно этим объясняется широкое распространение термина "массовый параллелизм" в литературе, касающейся нейронных сетей.

Подход, базирующийся на нейронных сетях, часто рассматривается как несимволический, или субсимволический (subsymbolic), поскольку основная информационная единица, подлежащая обработке, является не символом (как это определено в главе 4), а чем-то более примитивным. Например, символ в LISP-программе, скажем МУ LAPTOP, можно было бы представить схемой активности некоторого числа связанных нейронов в нейронной сети. Но, поскольку нейронные сети часто моделируются программно, сам нейрон представляется некоторой программной структурой, которая, в свою очередь, может быть реализована с использованием символов. Например, роль нейрона может исполнять объект данных, располагающий подходящими свойствами и методами и связанный указателями с другими объектами в сети. Таким образом, на концептуальном уровне в субсимволической системе, реализованной компьютерной программой, которая содержит символы, нет ничего парадоксального.

Независимо от способа реализации, нейронную сеть можно рассматривать как взвешенный ориентированный граф такого типа, который описан в главе 6. Узлы в этом графе соответствуют нейронам, а ребра -- связям между нейронами. С каждой связью ассоциирован вес -- рациональное число, -- который отображает оценку возбуждающего или тормозящего сигнала, передаваемого по этой связи на вход нейрона-реципиента, когда нейрон-передатчик возбуждается.

Поскольку нейронная сеть носит явно выраженный динамический характер, время является одним из основных факторов ее функционирования. При моделировании сети время изменяется дискретно, и состояние сети можно рассматривать как последовательность мгновенных снимков, причем каждое новое состояние зависит только от предыдущего цикла возбуждения нейронов.

Для выполнения обработки информации с помощью такой сети необходимо соблюдение определенных соглашений. Для того чтобы сеть стала активной, она должна получить некоторый входной сигнал. Поэтому некоторые узлы сети играют роль "сенсоров" и их активность зависит от внешних источников информации. Затем возбуждение передается от этих входных узлов к внутренним и таким образом распространяется по сети. Это обычно выполняется посредством установки высокого уровня активности входных узлов, которая поддерживается в течение нескольких циклов возбуждения, а затем уровень активности сбрасывается.

Часть узлов сети используется в качестве выходных, и их состояние активности считывается в конце процесса вычислений. Но часто интерес представляет и состояние всей сети после того, как вычисления закончатся, либо состояние узлов с высоким уровнем активности. В некоторых случаях интерес может представлять наблюдение за процессом установки сети в стабильное состояние, а в других -- запись уровня активизации определенных узлов перед тем, как процесс распространения активности завершится.

На рис. 23.2 показан фрагмент нейронной сети, состоящий из четырех сенсорных узлов S 1 --S 4 , возбуждение от которых передается другим узлам сети. Один узел, R, является выходным. Если веса связей в сети неизвестны, то узел R будет возбужден тогда, когда будут возбуждены узлы S 1 и S 4 Но если будут возбуждены также узлы S 2 и S 3 , это приведет к подавлению возбуждения R даже при возбужденных узлах 5) и S 4 . Будет ли узел R действительно возбужден при таком состоянии сигналов на входах сенсорных узлов, зависит от весов связей в сети.

Количество возможных конфигураций сети такого типа очень велико. Велико и количество способов вычисления состояния нейрона при заданной сумме состояний на его входах. Эти детали теории нейронных сетей выходят за рамки данной книги. Далее мы будем следовать идеям Роуза (Rose) и рассмотрим относительно простую модель нейронной сети, в которой любой узел может быть связан с любым другим узлом и в которой выходом узла является его состояние активности (т.е. не делается различия между активностью нейрона и сигналом на его выходе).

Фрагмент нейронной сети с возбуждающими и тормозящими связями

· Для более строгой формулировки такой модели введем следующие обозначения:

· w ij -- вес связи от узла j к узлу i,

· net i = Z j w ij -- состояние в текущий момент времени входов узла l, связанного с другими узлами сети.

При любом определении нейронной сети необходимо принимать во внимание и фактор времени, поскольку состояние любого нейрона в некоторый момент времени зависит от его предыдущего состояния и от предыдущего состояния нейронов, связанных с его входами.

Определение

Сеть связности (connectionist network) может рассматриваться как взвешенный ориентированный граф, в котором для каждого узла i выполняются следующие требования:

(1) состояние активности узла в любой момент времени t является действительным числом (будем обозначать его как a i (t));

(2) вес связи, которая связывает узел i с любым другим узлом у сети, является действительным числом w ij ,

(3) активность узла в момент t+1 является функцией от

· его активности в момент времени t, a i (t);

· взвешенной суммы сигналов на входах в момент времени t, net i {f);

· произвольного внешнего входного сигнала x i (t).

Простая функция вычисления состояния активности узла i, удовлетворяющая требованию (3) приведенного выше определения, имеет вид

a i (t+1) = Cумма j

Это, однако, не единственно возможный способ определения активности. Функции других видов включают добавление термов, соответствующих росту или спаду активности, или имеют вид нелинейных дифференциальных функций (см., например, ). В данной книге они рассматриваться не будут.

При конструировании сети веса связей могут быть назначены априори или изменяться со временем. В последнем случае изменение весов является одним из следствий активности сети. Веса можно рассматривать как отражение знаний, а процесс их настройки и уточнения -- как процесс обучения системы. Поскольку веса существенно влияют на распространение активности по сети, от них во многом зависит и поведение сети, а следовательно, изменяя веса, можно изменять поведение сети в желаемом направлении.

Как отмечено выше, знания в сети связности представлены неявно, поскольку нельзя выделить один определенный структурный элемент сети, который представлял бы отдельное правило или сущность предметной области. Знание отражено именно во взвешенных связях между мириадами отдельных элементов сети. Таким образом, в данном случае мы имеем дело с распределенными знаниями, которые нельзя представить в виде простого перечисления числовых или символических элементов. По этой причине часто можно встретить утверждение, что в нейронных сетях выполняется субсимволическая обработка информации.

В сетях связности знания сохраняются не в декларативном виде, а потому они не могут быть доступны для интерпретации со стороны какого-либо внешнего процессора . Доступ к знаниям и процесс логического вывода могут быть описаны только в терминах активности сети.

Конечно, ничто не препятствует конструктору сети ассоциировать отдельные ее узлы с определенными сущностями предметной области, как это сделал Роуз в системе SCALIR. Однако такое отражение понятий на узлы сети не противоречит ранее сделанному утверждению, что отношения между сущностями неявно представлены в виде связей между узлами и обычно не могут интерпретироваться в форме правил. Следовательно, хотя мы и частично приоткрыли завесу таинственности, скрывающую, что же стоит за узлами сети, сущность взвешенных связей между ними остается по-прежнему "субсимволической".

Даже в случае, если узлы представляют сущности предметной области, общая картина активности мириад узлов сети может скрывать понятия достаточно высокого уровня, объединяющие определенные аспекты сущностей, представленных узлами. Пусть, например, узлы представляют слова и пусть узлы "гонки", "машина", "водитель" возбуждены. Этим может быть представлено понятие "водитель гоночной машины" или, наоборот, факт вождения гоночной машины. В любом случае такое представление может расцениваться как субсимволическое, поскольку составляющие его узлы не могут быть оформлены в виде какой-нибудь синтаксической структуры, имеющей явно выраженный смысл. Точно так же нельзя выполнить и семантический анализ состояния мириад узлов с помощью какого-либо внешнего набора правил.

SCALIR -- гибридная система для извлечения правовой информации

Узлы в сетевой структуре системы SCALIR представляют прецеденты (дела, ранее рассмотренные судами), статьи правовых актов и важные (ключевые) слова, которые встречаются в подобных документах. Таким образом, структурно сеть разделена на три части (слоя), как показано на рис. 23.3. В этой сети слой прецедентов и слой законодательных актов разделены слоем узлов, представляющих ключевые слова (термины). Последние связаны с документами, в которых они встречаются.

Таким образом, в базовой структуре сети связь между узлами терминов и документов образует схему индексации с взвешенными связями. В результате массив терминов отображается как на массив прецедентов, так и на массив правовых актов.

Вместо того чтобы связывать каждый термин с каждым документом, в котором он встречается, в SCALIR вычисляется вес термина для каждого ключевого слова, связанного с документом, как функция от частоты упоминания этого термина в данном документе и частоты его упоминания во всем массиве документов. Интуитивно кажется, что термином, наиболее подходящим для индексации некоторого документа, будет такой, который часто появляется в этом документе, но редко во всех остальных. Полученное значение сравнивается с пороговым, в результате чего каждый документ индексируется примерно десятком ключевых слов. (Обращаю ваше внимание на тот факт, что на схеме сети системы SCALIR показаны двунаправленные связи. Фактически каждая из них представлена в системе парой однонаправленных связей, причем эти связи могут иметь разные веса. Таким образом, не только термин позволяет найти документ, но и по документу можно отыскать термин.)

Сеть связности в системе SCAUR ()

При конструировании сети в SCALIR сначала были организованы узлы для всех отобранных терминов, а затем они связывались с узлами документов, причем связям назначались веса в зависимости от значимости того или иного термина в контексте данного документа.

Такой тип связей (в документации они названы С-связями) не является единственным в SCALIR. Существуют и символические связи (S-связи), которые во многом напоминают связи в семантических сетях, поскольку маркированы и имеют постоянные веса. С помощью связей этого типа в сети представлены отношения между документами, например один документ цитирует другой, в одном судебном решении критикуется другое, один правовой акт ссылается на другой и т.д. Таким образом, S-связи представляют знания в явном виде.

В целом сеть сиетемы SCALIR содержит порядка 13 000 узлов терминов, около 4 000 узлов прецедентов и около 100 узлов законодательных актов. Между узлами терминов и прецедентов организовано приблизительно 75 000 связей, а между узлами терминов и законодательных актов -- около 2 000 связей. Кроме того, существует около 10 000 символических связей между узлами прецедентов. Роуз не счел нужным останавливаться на том, каких усилий потребовало создание подобной сети, но можно предположить, что такие ключевые задачи, как извлечение терминов и цитирование, были решены программно, а затем на основании этой информации автоматически сформированы узлы сети и связи между ними. Нужно принять во внимание и тот факт, что большинство горидических документов было уже ранее обработано публикаторами, которые составили достаточно полные индексы цитирования и ключевых слов.

Описанная сеть была затем использована в качестве базовой информационной структуры для извлечения документов. В основу функционирования системы положен принцип распространяющейся активности (spreading activation). Этот принцип не нов -- ранее он использовался Квиллианом для работы с семантическими сетями (см. об этом в главе 6). Использование этого формального аппарата позволяет выяснить, существует ли какое-либо отношение между узлами в сети. Для этого запускается процесс распространения маркеров от узлов, представляющих интерес, и анализируется, произошло ли где-либо в сети "пересечение" распространяющихся маркеров.

Основная идея, положенная в основу работы SCALIR, состоит в том, что уровень активности данного узла должен быть пропорционален его "уместности" в рассматриваемом контексте. Если в результате обработки запроса возбуждается некоторое число узлов слоя терминов, это должно привести к возбуждению узлов тех документов, которые касаются данного запроса, причем уровень возбуждения зависит от того, насколько тот или иной документ отвечает сути запроса. Узлы, воспринимающие запросы, являются, по сути, сенсорными узлами нейронной сети, от которых возбуждение по С-связям передается другим узлам. В процессе распространения возбуждения в дело включаются и S-связи, которые передают возбуждения от одних узлов документов другим, связанным с ними. Таким образом, символические связи отражают знания о том, что если определенный документ имеет отношение к полученному запросу, то, скорее всего, и связанный с ним другой документ также имеет отношение к этому запросу. Веса символических связей фиксированы, поскольку сила такой ассоциативной зависимости может быть оценена заранее.

Существуют два свойства функции активизации сети, которые представляются крайне желательными с точки зрения приложений, требующих ассоциативного поиска информации. Эти свойства влияют на выбор способа возбуждения сенсорных узлов, воспринимающих запросы пользователей, методики назначения весов связям и формы функции активизации.

(1) Количество активности, которое вносится в систему, не должно зависеть от размерности запроса.

(2) В каждом очередном цикле распространения активность не должна возрастать.

Если первое из указанных требований не будет выполняться, то запрос, состоящий из одного слова, приведет к меньшей активности сети, чем многословный. При этом окажется, что в ответ на более ограниченный многословный запрос система извлечет больше документов, чем в ответ на более свободный однословный, а это противоречит нашим интуитивным ожиданиям. Если же сеть не обладает вторым из сформулированных свойств, то будет извлечено слишком много документов, имеющих крайне слабое касательство к сути запроса, т.е. система будет производить много "информационного мусора".

Для того чтобы система обладала первым свойством, нужно на стадии предварительной обработки запроса распределить между входными узлами фиксированное количество активности. Вторым свойством система будет обладать в том случае, если сумма весов выходных связей не будет превышать единицы и, следовательно, значение функции активизации будет меньше или равно ее аргументу.

С-связи используют линейную функцию активизации, которая содержит константу сдерживания (retention constant) р, как показано в приведенном ниже выражении. Значение этой константы определяет, какая часть активности узла сохраняется в последующем цикле возбуждения, а какая распространяется дальше по сети.

a i (t + 1) = р а j (t) + (1 - p) Sum j

Совершенно очевидно, что приведенная функция активизации будет удовлетворять сформулированным требованиям, поскольку a i (t +1)=< a i (t) до тех пока, пока Sum j

Функция такого же вида использована и в работе . Роуз следует идеям, изложенным в этой работе, и в отношении организации управления активностью сети в SCALIR.

· Для выделения узлов, активность которых достаточна для участия в процессе извлечения информации, вводится параметр O s -- порог значимости (significance threshold). Значение этого порога уменьшается по мере распространения активности по сети.

· Для выделения узлов, активность которых слишком слаба и которые поэтому можно игнорировать в процессе извлечения информации, вводится параметр O q -- порог успокоения (quiescence threshold). Использование этого порога позволяет избежать непроизводительных затрат времени на анализ малоактивных узлов.

Эти параметры используются в алгоритме распространения активности по сети SCALIR, который в упрощенном виде представлен ниже. Этот алгоритм реализует метод поиска в ширину, начиная со входных узлов восприятия запроса (QUERY-NODES) и заканчивая всеми взвешенными связями.

Установить исходное значение O S .

Включить в множество ACTIVE-NODES узлы из множества QUERY-NODES.

Если имеется запрос, установить уровни активности узлов в QUERY-NODES.

Включить в множество RESPONSE-SET все узлы из ACTIVE-NODES, чья активность превышает O S .

Удалить из множества ACTIVE-NODES все узлы, чья активность ниже O q .

Добавить в множество ACTIVE-NODES все узлы, связанные с узлами, уже включенными в ACTIVE-NODES.

Обновить значение активности всех узлов множества ACTIVE-NODES, используя функцию активизации.

Рассортировать узлы в множестве ACTIVE-NODES по уровню активности. Уменьшить значение O s .

пока не будет выполнено (O S =< O q) или (ACTIVE-NODES = 0).

В упрощенном варианте не рассматривается использование параметра, ограничивающего ширину пространства поиска. Кроме того, мы опустили в этой формулировке алгоритма и анализ максимального размера множества выходных узлов. Ограничение множества выходных узлов прекращает выполнение поиска после того, как выделено предельное количество извлекаемых документов.

Значение большинства параметров, используемых в процессе управления активностью сети, устанавливается эмпирически. Настройка же весов связей между узлами сети W ij представляет собой, по сути, процесс обучения системы, который мы вкратце рассмотрим в следующем разделе.

обучения в системе SCALIR

Поскольку веса С-связей могут регулироваться системой в процессе работы, она способна таким образом самообучаться в соответствии с информацией, вводимой пользователем. Ниже мы опишем, как это делается в системе SCALIR, опуская несущественные детали.

Предположим, что один из входов узла i связан с выходом узла j, причем связь имеет вес W ij . Если узел i представляет документ, имеющий отношение к термину, представленному узлом j, то в процессе обучения нам может потребоваться усилить эту связь. Если же пользователь посчитает, что документ имеет мало общего с этим термином, то потребуется ослабить эту связь. Главный вопрос, который нужно при этом решить, -- в какой степени нужно менять значение веса. Одно из простых правил вычисления значения изменения веса W ij может быть выражено формулой

W i = nf i a j ,

где n| -- константа скорости обучения (learning rate), a f i -- коэффициент обратной связи от пользователя, который, например, может принимать значение +1 или--1.

Однако применение такого правила не настолько очевидно, как это может показаться с первого взгляда, по следующим причинам.

· Определить значения уровня активности а, не так просто, поскольку активизированный при возникновении запроса входной узел может снизить свою активность после того, как запрос будет снят.

· Соседи узлов, которые получают обратную связь, также должны, по-видимому, получать некоторую информацию обратной связи от пользователя, подтверждающую, что они представляют документы, имеющие отношение к запросу.

· Узел i может находиться в конце сети распространения активности, а следовательно, информация от пользователя (обратная связь) должна распространяться по сети в обратном направлении. Таким образом, получаемая от пользователя информация обратной связи должна распространяться по сети примерно так же, как активность. Максимальное значение обратной связи для каждого узла записывается и обновляется в процессе распространения, и эти значения в дальнейшем играют роль членов f i и а j в приведенном выше выражении. Далее полученные значения весов нормализуются таким образом, чтобы их сумма для каждого отдельного узла была равна 1.0. Конечно, в реальной системе SCALIR процесс самообучения несколько сложнее, поскольку в ней существуют связи разных типов. Читателям, интересующимся деталями этого процесса, следует познакомиться с работой , Но идея комбинированного использования символических и субсимволических методов заслуживает дальнейшего углубленного изучения. В системе SCALIR продемонстрирован довольно прагматический компромисс между чисто статистическим подходом к извлечению информации и традиционным подходом для экспертных систем, требующим большого объема знаний о предметной области.

Подобные документы

Кодеры формы, полосный вокодер. Кодирование с линейным предсказанием. Кодирование речи методом анализа через синтез. Векторное квантование и кодовые книги. Гибридные кодеры. Гибридные кодеры с частотным разбиением. Гибридные кодеры с временным разбиением.

реферат , добавлен 10.12.2008

Коды, обрабатывающие исключения, информация о причине их возникновения. Способы обработки исключений. Механизмы обработки исключений. Инициализация ссылки на объект. Конструкторы стандартных исключений. Автоматическая и программная генерации исключений.

презентация , добавлен 21.06.2014

Компьютерные обучающие системы. Принципы новых информационных технологий обучения. Типы обучающих программ. Активизация обучения. Компьютерное тестирование. Перспективные исследования в области компьютерного обучения. Интернет-технологии, мультимедиа.

контрольная работа , добавлен 10.09.2008

Анализ вариантов проектных решений и выбор на его основе оптимального решения. Синтез функциональной схемы микропроцессорной системы на основе анализа исходных данных. Процесс разработки аппаратного и программного обеспечения микропроцессорной системы.

курсовая работа , добавлен 20.05.2014

Обзор подхода к разработке системы управления персоналом. Формирование требований к системе, выбор методологии построения системы. Автоматизация работы алгоритма подсчета мощности. Практическая реализация подхода на примере компании ООО "Новая медицина".

дипломная работа , добавлен 03.07.2017

Методы решения задачи синтеза систепроцесса символьной регрессии. Генетический алгоритм с эволюционной стратегией. Разработка программы на языке Python версии 2.7 в среде Eclipse Juno с использование библиотеки для построения графиков Matplotlib.

дипломная работа , добавлен 17.09.2013

Разработка системы автоматизированного анализа сложных объектов образовательной системы. Построение диаграмм последовательности, кооперации, классов, состояний, компонентов, а также развертывания. Представление сгенерированных кодов клиента и сервера.

курсовая работа , добавлен 23.06.2014

Системы и задачи их анализа. Методы системного анализа: аналитические; математические. Сущность автоматизации управления в сложных системах. Структура системы с управлением, пути совершенствования. Цель автоматизации управления. Этапы приятия решений.

реферат , добавлен 25.07.2010

Разработка программы, моделирующей процессы обучения, работы и прогнозирования ИНС с использованием постоянного, а также адаптивного шага обучения. Исследование поведения системы в зависимости от количества входов при постоянном шаге самообучения.

контрольная работа , добавлен 16.10.2011

Установка операционной системы Windows Server 2003 SP-2 и драйверов. Запуск сетевых подключений. Использование, проверка и настройка различных программ MS Office 2007. Включение компонентов и программ, которые не устанавливаются во время установки ОС.

Cтраница 3

В гибридных системах с замещением берется главная модель, один из элементов которой замешается другой моделью, например, а) перерасчет весов в процедуре обратного распространения производится с помощью генетического алгоритма; б) подбор функций принадлежности в нечетком регуляторе осуществляется с использованием генетического алгоритма. В гибридных системах со взаимодействием используются независимые модули, которые обмениваются информацией и выполняют различные функции с целью получения общего решения. К примеру, если решаемая задача включает распознавание образов, вывод и оптимизацию, то эти функции берут на себя нейронные сети, экспертные системы и генетические алгоритмы. В полиморфных гибридных системах одна модель применяется для имитации функционирования другой модели.

График зависимости среднеквадратичного отклонения поля направлений, полученного в численном эксперименте (I и полученного в натурном эксперименте (2, от периода полос к размеру зоны одного.

Однако существующие гибридные системы идентификации дактилограмм несвободны от недостатков. Метод анализа дактилограмм по фурье-спектру будет интерпретировать изображения, отличающиеся перестановкой фрагментов, одинаковые. Кроме того, дактилоскопические изображения являются структурно избыточными.

В целом гибридная система АДТ является дальнейшим шагом в развитии аналоговой вычислительной техники.

Вопросам построения гибридных систем, включающих подсистемы эволюционного моделирования, блоки оптимизации, взаимодействующие с имитационными моделями, экспертными системами и другими системами поддержки принятия решений, посвящена пятая глава. Создание имитационных моделей выступает здесь как одно из направлений развития подходов интеллектуального имитационного моделирования. В данной главе описаны подходы и модели многоагентных систем, различного уровня интеллектуальности и их дальнейшая эволюционная форма - модели искусственной жизни. Как примеры гибридных систем с эволюцией приводятся моделирование развития популяции простейших автоматов и многомодельные системы.

Возможно применение гибридных систем, объединяющих элементы активных и пассивных систем.

При исследовании дискретных и гибридных систем встречаются параметры, которые нельзя описать функциями от зависимых или независимых переменных.

В случае гибридной системы работы ЭВМ ограничена арифметическими действиями, с помощью которых вычисляют площади пиков; при этом можно учесть чувствительность детектора, определить содержание веществ исходя из внутреннего стандарта и напечатать протокол заданного формата.

Введение в гибридную систему для автоматизации обработки данных, получаемых от всех голографических систем, блока сканирование - анализ, управляемого цифровой ЭВМ, к свойству системы выполнять разносторонние функции должно добавить высокую скорость, увеличение точности и объективности при анализе данных.

Во многих гибридных системах управления используются различные модификации протокола Ethernet на основе Carrier Sense Multiple Access with Collision Detection (CSMA / CD), соответствующие стандарту ISO 8802 - 3 / IEEE 802.3. Сущность его сводится к тому, что каждый узел сети отслеживает загрузку линии, и осуществляет передачу только тогда, когда определяет, что линия свободна. Если из-за того, что другой узел также требует линию для передачи, возникает коллизия, то оба узла прекращают передачу.

В iMAN используется гибридная система управления базами данных (СУБД) на базе Oracle V8, поддерживающая реляционную и объектно-ориентированную модели данных, осуществляются контроль доступа и вносимых изменений, формирование спецификаций изделий, интегрирование прикладных подсистем. Управление параллельными и последовательными бизнес-процессами и процессами проектирования возложено на модуль Workflow.

Рассматривается задача оптимизации линейных гибридных систем с обобщенным квадратичным критерием, когда к традиционным членам - штрафам на квадраты отклонений состояний и управлений добавлены члены, которые позволяют штрафовать отклонения в соответствии с их знаком. Задачи оптимального управления с такими предпочтениями, т.е. когда требуется, чтобы определенные компоненты управления (или состояния) были положительными или отрицательными большую часть времени, часто встречаются на практике.

В случае применения гибридной системы автоматического контроля и управления, состоящей из электрических и пневматических устройств, для связи этих устройств между собой необходимо преобразование электрического сигнала в давление воздуха.

Наряду с этими гибридными системами могут быть использованы и гибридные модели другого вида, в которых пассивные модели стыкуются с устройствами, работающими по принципам электронного моделирования. Такие модели позволяют использовать преимущества пассивных моделей (простота, большое количество узлов, быстродействие и др.) с возможностью осуществления ряда логических операций, необходимых при решении нелинейных задач теории поля, без участия в вычислительном процессе ЭЦВМ с многократным преобразованием информации из одного вида в другой, без оборудования, необходимого для этого преобразования. Стоимость таких систем значительно ниже стоимости гибридных машин, включающих ЭЦВМ.

Другими словами, комбинированный комплекс, состоящий из нескольких электронных вычислительных машин, применяющих различное представление величин (цифровое и аналоговое) и соединенных общей системой управления. В состав гибридной
вычислительной системы, помимо цифровых и аналоговых машин и системы управления, как правило, входят устройства внутрисистемной связи, преобразователи представления величин и внешнее оборудование. Гибридная вычислительная система - комплекс ЭВМ, в этом ее основное отличие от гибридной вычислительной машины, получившей такое название потому, что она базируется на гибридных решающих элементах либо с применением цифровых и аналоговых элементов.

В литературе часто к гибридным вычислительным системам относят АВМ с многократным применением решающих элементов, оснащенные запоминающим устройством, АВМ с цифровым программным управлением и АВМ с параллельной логикой. Подобного рода вычислительные машины, хотя и имеют элементы, применяемые в ЦВМ, но все также сохраняют аналоговый способ представления величин и все специфические отличия и свойства АВМ. Появление гибридных вычислительных систем объясняется тем, что для решения большинства новых задач, связанных с управлением перемещающимися объектами, созданием комплексных тренажеров, оптимизацией и моделированием систем управления и др., возможности отдельно взятых ЦВМ и АВМ являются уже недостаточными.

Разделение в ходе решения задачи вычислительного процесса на отдельные операции, которые выполняются ЦВМ и АВМ в комплексе, сокращает объем вычислительных операций, решаемых на ЦВМ, что при других равных условиях сильно повышает общее быстродействие гибридных вычислительных систем.

Существуют сбалансированные, циф-ро-ориентированные и аналого-ориентированные гибридные вычислительные системы.

В системах первого вида ЦВМ применяются как дополнительное внешнее устройство к АВМ, которое необходимо для образования сложных нелинейных зависимостей, запоминания итоговых результатов и для выполнения программного управления АВМ. В системах второго вида АВМ применяется как дополнительное внешнее устройство ЦВМ, которое предназначено для моделирования частей реальной аппаратуры, многократного осуществления небольших подпрограмм.

Изобретение эффективных гибридных комплексов требует в первую очередь уточнения главных областей их использования и тщательного анализа стандартных задач из данных областей.

В итоге устанавливают целесообразную структуру гибридного комплекса и предъявляют требования к его отдельным частям.

Задачи, которые успешно решаются с помощью гибридных вычислительных систем, можно разделить на следующие главные группы: моделирование автоматических систем управления в реальном времени, состоящих как из цифровых, так и из аналоговых устройств; воспроизведение в реальном времени действий, которые содержат высокочастотные компоненты и переменные, которые изменяются в обширном диапазоне; моделирование биологических систем; статистическое моделирование; оптимизация систем управления; решение уравнений в частных производных.

Образцом задачи первой группы может являться моделирование системы управления прокатного стана. Динамика процессов, происходящих в нем, воссоздается на аналоговой машине, а на универсальной ЦВМ среднего класса моделируется специализированная управляющая станом машина. Вследствие непродолжительности переходных процессов в приводах прокатных станов, общее моделирование подобных процессов в реальном времени потребовало бы использования сверхбыстродействующих ЦВМ. Подобные задачи довольно часто встречаются в системах управления военными объектами.
Стандартными для второй группы являются задачи управления перемещающимися объектами, в том числе и задачи самонаведения, а также задачи, которые возникают при создании вычислительного элемента комплексных тренажеров. Для задач самонаведения свойственно формирование траектории перемещения непосредственно в процессе движения. Большая скорость варьирования некоторых параметров при приближении предмета к цели требует высокого быстродействия управляющей системы, которое превышает возможности нынешних ЦВМ, и в то же время большой динамический диапазон требует высокой точности, которую трудно достигнуть на АВМ. При решении такой задачи на гибридных вычислительных системах целесообразно поручить моделирование уравнений движения вокруг центра тяжести на аналоговую часть системы, а движение самого центра тяжести и кинематические параметры - на цифровую часть вычислительной системы.

К третьей группе можно отнести задачи, решение которых образуется в результате обработки многих результатов случайного процесса, например решение многомерных уравнений в частных производных с помощью метода Монте-Карло, нахождение экстремума функций нескольких переменных, решение задач стохастического программирования. Многократное повторение случайного процесса поручается быстродействующей АВМ, которая работает в режиме многократного повторения решения, а обработка итогов, вычисление функционалов, воспроизведение функций на границах области - на ЦВМ. Помимо этого, ЦВМ определяет момент окончания вычислений. Применение гибридных вычислительных систем позволяет сократить время решения задач подобного вида на несколько порядков в сравнении с использованием только цифровой машины.

Подобный эффект достигается при применении гибридных вычислительных систем для моделирования процессов распространения воздействия в биологических системах.

Особенность этого процесса состоит в том, что даже в элементарных случаях необходимо воспроизводить сложную нелинейную систему уравнений в частных производных.

Поиск решения задачи рационального управления для задач выше третьего порядка, как правило, связан с большими, непреодолимыми препятствиями. Еще сильнее они проявляются, если необходимо найти оптимальное управление в процессе работы системы.

Гибридные вычислительные системы в значительной степени способствуют устранению подобных трудностей и применению таких сложных в вычислительном плане средств, как принцип максимума Понтрягина.

Применение гибридных вычислительных систем эффективно в том числе при решении нелинейных уравнений в частных производных. При этом можно решать как задачи анализа, гак и задачи оптимизации и идентификации объектов. В качестве примера задачи оптимизации можно привести: подбор нелинейности теплопроводного материала, предназначенного для заданного распределения температур; распределение толщины испаряющегося слоя, который предохраняет космические корабли от чрезмерного нагрева при входе в плотные слои атмосферы; расчет геометрии летательных аппаратов для получения необходимых аэродинамических характеристик; изобретение оптимальной системы подогрева летательных аппаратов для защиты их от обледенения при минимальном использовании энергии на подогрев; расчет сети оросительных каналов, определение оптимального расхода в них и т. п. При решении данных задач ЦВМ объединяется с сеточной моделью, многократно применяемой в процессе решения.

Развитие гибридных вычислительных систем возможно в двух направлениях: построение специализированных гибридных вычислительных систем, которые рассчитаны на решение только какого-либо одного класса задач, и построение всеохватывающих гибридных вычислительных систем, которые позволяют решать довольно широкий класс задач. Структура подобного универсального гибридного комплекса состоит из АВМ однократного действия, сеточной модели, АВМ с повторением решения, специального оборудования, предназначенного для решения задач статистического моделирования, устройств связи между машинами и периферийного оборудования. Кроме стандартного математического обеспечения ЭВМ, входящих в комплект, в гибридных вычислительных системах необходимо использовать специальные программы, которые обслуживают систему связи машин и автоматизирующие процесс постановки и подготовки задач на АВМ, а также универсальный язык программирования для комплекта в целом.

Параллельно с новыми вычислительными возможностями в гибридных вычислительных системах появляются специфические особенности, например, возникают погрешности, которые в отдельных ЭВМ отсутствуют. Первоисточниками погрешностей могут быть временная задержка аналого-цифрового преобразователя, цифро-аналогового преобразователя и ЦВМ; ошибка от неодновременной подачи аналоговых сигналов на аналого-цифровой преобразователь и неодновременной выдачи цифровых сигналов на цифро-аналоговый преобразователь; ошибка округления в цифро-аналоговом и аналого-цифровом преобразователях; ошибки, которые связаны с дискретным характером получения результатов с выхода ЦВМ. При независимой работе ЦВМ с преобразователями временная задержка не дает погрешности, а в гибридных вычислительных системах она не только может дать существенные погрешности, но и дезорганизовать работоспособность всей системы.