АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Радиальные нейронные сети

Читайте также:
  1. Нероторные многопоршневые радиальные гидромашины

Многослойные нейронные сети, рассмотренные ранее и использующие сигмоидальную функцию активации, по своему характеру осуществляют аппроксимацию глобального типа [10]. В результате ее нейрон, который был однажды «включен» (после превышения суммарным сигналом определенного порогового значения), остается в этом состоянии при любом значении сигнала, превышающем данный порог. Поэтому преобразование значения функции в произвольной точке пространства выполняется усилиями многих нейронов, что и объясняет название глобальная аппроксимация.

Другой способ отображения входного множества в выходное заключается в преобразовании путем адаптации нескольких одиночных аппроксимирующих функций к ожидаемым значениям, причем эта адаптация проводится только в ограниченной области многомерного пространства. При таком подходе отображение всего множества данных представляет собой сумму локальных преобразований. С учетом роли, которую играют скрытые нейроны, преобразования составляют множество базисных функций локального типа. Выполнение одиночных функций (при ненулевых значениях) регистрируется только в ограниченной области пространства данных – отсюда и название локальная аппроксимация.

Особое семейство образуют сети с радиальной базисной функцией, в которых нейроны реализуют функции, радиально изменяющиеся вокруг выбранного центра и принимающие ненулевые значения только в окрестности этого центра. Подобные функции, определяемые в виде , будем называть радиальными базисными функциями. В таких сетях роль нейрона заключается в отображении радиального пространства вокруг одиночной заданной точки (центра) либо вокруг группы таких точек, образующих кластер. Суперпозиция сигналов, поступающих от всех таких нейронов, которая выполняется выходным нейроном, позволяет получить отображение всего многомерного пространства.

 

 

Рисунок 27 – Иллюстрация способов разделения пространства данных: а) сигмоидальным нейроном; б) радиальным нейроном

 

Сети радиального типа представляют собой естественное дополнение сигмоидальных сетей. Сигмоидальный нейрон представляется в многомерном пространстве гиперплоскостью, разделяющей это пространство на две категории, в которых выполняется одно из двух условий: либо , либо . Такой подход продемонстрирован на рисунке 27а.

Радиальный нейрон представляет собой гиперсферу, которая осуществляет шаровое разделение пространства вокруг центральной точки (рисунок 27б). Структура типичной радиальной сети включает входной слой, на который подаются сигналы, описываемые входным вектором x, скрытый слой с нейронами радиального типа и выходной слой, состоящий, как правило, из одного или нескольких линейных нейронов. Функция выходного нейрона сводится к взвешенному суммированию сигналов, генерируемых скрытыми нейронами.

Математическую основу функционирования радиальных сетей составляет теорема Т.Ковера [8] о распознаваемости образов, в соответствии с которой нелинейные проекции образов в некоторое многомерное пространство могут быть линейно разделены с большей вероятностью, чем при проекции в пространство с меньшей размерностью.

Если вектор радиальных функций в N -мерном входном пространстве обозначить , то это пространство является нелинейно - разделяемым на два пространственных класса и тогда, когда существует такой вектор весов , что

(57)

Граница между этими классами определяется уравнением
.

Применение достаточно большого количества скрытых нейронов, реализующих радиальные функции , гарантирует решение задачи классификации при построении всего лишь двухслойной сети: скрытый слой должен реализовать вектор , а выходной слой может состоять из единственного линейного нейрона, который выполняет суммирование выходных сигналов от скрытых нейронов весовыми коэффициентами, заданными вектором .

Простейшая нейронная сеть радиального типа функционирует по принципу многомерной интерполяции, состоящей в отображении p различных входных векторов из входного N -мерного пространства во множество из р чисел . Для реализации этого процесса необходимо использовать р скрытых нейронов радиального типа и задать такую функцию отображения , для которой выполняется условие интерполяции

(58)

Использование р скрытых нейронов, соединяемых связями с весами с выходными линейными нейронами, означает формирование выходных сигналов сети путем суммирования взвешенных значений соответствующих базисных функций. Рассмотрим радиальную сеть с одним выходом и р обучающими парами . Примем, что координаты каждого из р центров узлов сети определяются одним из векторов , т.е. . В этом случае взаимосвязь между входными и выходными сигналами сети может быть определена системой уравнений, линейных относительно весов, которая в матричной форме имеет вид:

(59)

где определяет радиальную функцию с центром в точке и вынужденным вектором , и .

В [8] доказано, что для ряда радиальных функций в случае существует решение уравнения (59) в виде , что позволяет получить вектор весов выходного нейрона сети.

Однако при очень большом количестве обучающих выборок и равном ему количестве радиальных функций проблема с математической точки зрения становится плохо структурированной, поскольку количество уравнений становится слишком большим. Поэтому отыскивается субоптимальное решение в пространстве меньшей размерности, которое с достаточной точностью аппроксимирует точное решение. Если ограничиться K базисными функциями, то аппроксимирующее решение можно представить в виде

(60)

где , а - множество центров, которые необходимо определить. Чаще всего в качестве радиальной функции применяется функция Гаусса. При размещении ее центра в точке она может быть определена в сокращенной форме как

(61)

В этом выражении - параметр, от значения которого зависит ширина функции.

Рассмотрим сеть с двухслойной структурой (рисунок 28), в которой только скрытый слой выполняет нелинейное отображение, реализуемое нейронами с базисными радиальными функциями. Выходной нейрон линеен.

 

 

Рисунок 28 – Обобщенная структура радиальной сети

 

У используемых радиальных функций может быть весьма разнообразная структура. Нелинейная радиальная функция каждого скрытого нейрона имеет свои значения параметров и . Аргументом радиальной функции является эвклидово расстояние образца x от центра .

Радиальные нейронные сети относятся к категории сетей, обучаемых с учителем. С их помощью решают такие классификационные задачи, как обнаружение повреждений в различных системах, распознавание образов.

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)