birmaga.ru
добавить свой файл

1

ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2


А.И. САМАРИН, И.Е. ШЕПЕЛЕВ

НИИ нейрокибернетики им. А.Б. Когана ростовского госуниверситета

shepelev@krinc.ru
НЕЙРОСЕТЕВОЙ ПОДХОД

К ЗАДАЧЕ ИНТЕРПРЕТАЦИИ СЕНСОРНЫХ ДАННЫХ
Аннотация

Рассматривается задача интерпретации неоднозначной сенсорной информации, являющейся следствием активного поведения робота в изменяющейся внешней среде. Снятие неоднозначности основано на идентификации части сенсорного сигнала, индуцированного собственным движением. Для решения задачи предлагается динамическая модель нейронной сети с преднастройкой. На примере силового сигнала очувствленного запястья робота-мапипулятора показано, что аппроксимация динамических компонент сенсорного сигнала достигается настройкой постоянной времени нейросети как функция комбинации вытормаживания её вставочных нейронов.


Введение

Организация активного поведения робота в изменяющейся внешней среде требует наличия у робота сенсорных органов разной модальности [1]. Сенсорная обратная связь дает системе управления робота возможность выработать моторные команды, адекватные текущей ситуации. Однако в силу активности поведения и изменчивости среды текущая сенсорная картина неоднозначно интерпретируема – она является как следствием собственного движения робота, так и следствием воздействия со стороны окружающих объектов. Способность разделять «эго» и «экзо» компоненты сенсорного сигнала является, таким образом, принципиальной для управляемости робота. Исследования в области физиологии развития человека показывают [2], что мозг новорожденного несёт в себе программу, которая направлена на развитие способности отделения на сенсорном уровне себя от внешнего мира, и которая реализуется в первые годы жизни. Определенные нейронные образования, ответственные за научение такого разделения были обнаружены в различных областях мозга. Так в моторной коре были найдены [3] нейроны, которые кодируют положение собственной руки в поле зрения. При формализации данного явления вводятся понятия внутренних моделей [4], или подсистем афферентного синтеза [5], способных воспроизводить сенсорный образ совершаемого движения.

Представляется важным моделирование такого механизма в системе управления активным поведением робота. Для задачи активного зрительного восприятия робота построение подобных моделей позволяет правильно интерпретировать зрительную сцену как стабильную на фоне непрерывно изменяющегося сенсорного потока в силу собственного движения робота [6], сегментировать в общей сенсорной картине возмущения, вызываемые движениями в поле зрения собственных частей тела, от остального мира [7]. Использование в каждом из случаев искусственных нейронных сетей, обучающихся в процессе функционирования, позволило получить приемлемые результаты для реалистичных сред, нежели применение расчетных моделей [8].

В данной работе в качестве источника сенсорного сигнала рассматривается силовой датчик в запястье схвата двухзвенного плоского робота-манипулятора. При движениях робота изменение сенсорного сигнала обусловлено действием силы тяжести на схват с нагрузкой, действием динамических компонент в силу инерционности схвата и характеристик упругости запястья, а также действием внешних возмущающих сил. Решение задачи интерпретации сенсорных данных предлагается провести на основе ранее разработанной модели нейронной сети с преднастройкой [9, 10]. В рамках предварительного исследования модификации модели нейронной сети для рассматриваемой задачи используется программная модель робота-манипулятора.

Модель сенсорного сигнала собственного движения
Обычно баллистичекое движение руки в окрестность целевой точки направляется зрительной системой, однако непосредственные манипуляции с объектом требуют более точной регуляции и совершаются под контролем сенсоров развиваемых усилий в запястье руки. Силовой сигнал с датчика при этом является суперпозицией сил, индуцированных собственным движением, и внешних сил: . Снятие неоднозначности в интерпретации сенсорного сигнала возможно при идентификации детерминированной части сенсорного сигнала – сенсорного сигнала собственного движения – подсистемой сенсорного прогнозирования (афферентного синтеза) и основано на решении прямой задачи динамики манипулятора для показаний сенсора на конце исполнительного органа при кинематическом управлении: , где - суставные углы манипулятора. Силовой сигнал описывается следующим обобщенным уравнением:

,

где – статическая часть сигнала, которая отражает действие силы тяжести, – динамическая часть, которая отражает действие сил инерции и упругих сил с трением.

Р

а b c

Рис.1. Выходной сигнал силового датчика, отражающий действие: а) статической гравитационной компоненты, b) инерционной компоненты, c) колебательной компоненты, при нарастающей сложности движения


ассматриваемый манипулятор имеет две степени свободы, поэтому для отражения действующих сил датчик в запястье является двухкомпонентным . Рис. 1а демонстрирует показания датчика при медленных движениях манипулятора по некоторой произвольно заданной траектории так, что вкладом динамической части можно пренебречь. На рис. 1b и 1c показан силовой сигнал для случая, когда динамическая компонента имеет существенный вклад, причем на рис. 1с движение носит отчетливый баллистический характер, что проявляется в наличии колебательной составляющей в начале и конце перемещения.

Модель нейронной сети
В соответствии с общим планом синтеза системы управления активным поведением робота-манипулятора постепенное усложнение модели движений робота от медленных, имеющих смысл поисковых, до целенаправленных, имеющих баллистический характер, приводит к необходимости пошагового усложнения модели сенсорного сигнала, которая строится подсистемой сенсорного прогноза. Поэтому для последовательного обучения прогнозированию показаний сенсора естественным является применение нейронных сетей.

Ранее было проведено моделирование действия силы тяжести на схват манипулятора с использованием разработанной нейронной сети с преднастройкой [9]. Ряд общих свойств нейронной сети с преднастройкой делают её предпочтительной задачам сенсомоторной координации роботов-манипуляторов:



  • локальная аппроксимация в модели позволяет проводить непрерывное дообучение нейронной сети без полного переобучения;

  • двухмодульная организация – нейросетевой модуль функциональных преобразований и обучающийся нейросетевой модуль – приводит к полифункциональным свойствам модели, являющихся необходимыми при освоении различных поведенческих сценариев;
  • действие обучающегося модуля нейросети на модуль функциональных преобразований имеет смысл преднастройки и заключается в комбинаторном вытормаживании таких вставочных нейронов этого модуля, чтобы выходная функция нейросети удовлетворяла некоторой целевой функции; при этом существенным является то, что целевая функция может задаваться как на входных, так и выходных сенсорных переменных нейросети.

В данной работе рассматривается нейросетевой модуль функциональных преобразований и для моделирования динамической части сенсорного сигнала предлагается следующий способ введения динамики в его активность. Организация архитектуры нейросети с центральным нейронным элементом и множеством вставочных нейронов, воздействующих на центральный нейрон слабыми тормозными связями, позволяет говорить о том, что локально аппроксимирующую выходную функцию получают посредством вытормаживания «лишних» вставочных нейронов для данного участка области определения, а сумма весовых коэффициентов оставшихся активных формируют выходную функцию нейросети.

Аналогично, с переходом к динамической модели нейрона основная идея состоит в том, что динамическая часть идентифицируемой системы будут аппроксимироваться посредством настройки инерционной обратной связи в нейронной сети, определяемой постоянной времени активных вставочных нейронов, получающих возбуждение от центрального нейрона и осуществляющих возвратное торможение. Известно, что обратная связь позволяет получить передаточную характеристику всего передаточного звена, определяемую в значительной степени передаточной функцией звена обратной связи и в известной степени независимо от характеристики звена прямой связи при возможных ее изменениях. Поэтому вслед за идеей комбинаторного вытормаживания вставочных нейронов предполагается посредством комбинаторного вытормаживания вставочных нейронов, формирующих звено обратной связи, получать необходимые временные характеристики нейросети, определяемые суммарным эффектом активных нейронов.

Рассмотрим зависимость динамических режимов нейросети с возвратным торможением от параметров обратной связи: постоянной времени вставочных нейронов и весовых коэффициентов тормозных связей. Динамика нейросети описывается следующей системой уравнений:

(1)

где x, win – вектор входного сигнала сети и его весовые коэффициенты, hid, w hid и int , w int – постоянные времени и весовые коэффициенты центрального и вставочных нейронов соответственно, оператор дифференцирования, uhid и yhid – мембранный потенциал и активационная функция центрального нейрона, uint и yint – мембранный потенциал и активационная функция вставочных нейронов, p – сигнал преднастройки на соответствующий вставочный нейрон, – количество вставочных нейронов, – нелинейная активационная функция мембранного потенциала:

(u)= ,

где k – коэффициент усиления (k=1). Анализ решений системы уравнений (1) позволяет построить в плоскости ее параметров кривые, разбивающие на области, соответствующие возможным динамическим режима, или типам точек равновесия. На рис. 2 представлено пространство параметров системы уравнений (1), где , – усредненное произведение возбуждающей и тормозной пары весов сети; =hid/int. Для каждого область справа от кривой соответствует устойчивому узлу, слева – устойчивому фокусу. Показано поведение кривой при увеличении количества вставочных нейронов. Видно, что при увеличении числа вставочных нейронов, область устойчивого узла с


Рис. 2. Пронстранство параметров системы дифференциальных уравнений, описывающих нейросеть
двигается в сторону больших значений . Это позволяет выбрать параметр в качестве управляющего динамическими режимами нейросети, используя для аппроксимации инерционных и колебательных компонент сенсорного сигнала соответственно режимы устойчивого узла и устойчивого фокуса. Текущее положение нейросети на оси О будет определятся отношением постоянной времени центрального нейрона к постоянным времени невыторможенных в данный момент вставочных нейронов. Следуя методике инициализации весовых коэффициентов тормозных связей случайными значениями для получения широкого диапазона функциональных преобразований [10], широкий диапазон постоянной времени нейросети получаем при инициализации случайными значениями постоянной времени вставочных нейронов с возвратным торможением. Подстройка постоянной времени нейросети реализуется поиском вытормаживающей комбинации в пространстве данных вставочных нейронов.
Заключение

Среди нейросетевых реализаций идеи получения необходимой динамики сети из нейронов с произвольными постоянными времени и весовыми коэффициентами, известны модели дыхательного центра [11]. Они представляют собой ритмообразующие нейронные сети с циклическими рекуррентными тормозными связями с характерным периодом активности больше, чем периоды активности отдельных нейронов, формируемых эту сеть. В данной работе предлагается способ введения в нейросеть с преднастройкой динамической активности добавлением вставочных нейронов с возвратным торможением и настройки динамики нейросети посредством поиска комбинации вытормаживания данных вставочных нейронов. Изложенный подход является естественным расширением статической модели нейросети с преднастройкой, базирующейся на тех же принципах организации архитектуры и реализации механизма адаптации.


Список литературы


  1. Самарин А.И. Формирование сенсомоторных отношений при активном взаимодействии автономной системы с внешней средой // В сб. научных трудов Всероссийской научно-технической конференции «Нейроинформатика – 99». М.:МИФИ. 1999. Ч.2. c.172 – 180.

  2. Rochat P. Self-perception and action in infancy // Experimental Brain Research. 1998. v.123. pp. 102-109.

  3. Graziano, M.S.A., Cooke, D.F. and Taylor, C.S.R., Coding the location of the arm by sight. Sience, 2000. 290. pp. 1782-1786.

  4. Kawato М. Internal models for motor control and trajectory planning. // Current Opinion in Neurobiology, 1999. v.9. pp. 718–727.

  5. Анохин П.К. Принципиальные вопросы общей теории функциональных систем // В кн.: Принципы системной организации функций. М.: Наука. 1973. с.5-61.

  6. Gross, H.-M., Heinze, A, Seiler, T, and Stephan, V. A neural architecture for sensorimotor anticipation // Neural Networks , 1999. v.12. pp. 1101-1129.

  7. Yoshikawa, Y., Tsuji, Y., Hosoda, K., and Asada, M. Is it my body? Body extraction from uninterpreted sensory data based on the invariance of multiple sensory attributes // In Proceedings of the 2004 IEEE/RSJ International Conference on Intelligent Robots and Systems. 2004.

  8. Edsinger-Gonzales, A. Developmentally Guided Ego-Exo Force Discrimination for a Humanoid Robot // Fifth International Workshop on Epigenetic Robotics. Nara, Japan, 2005.

  9. Самарин А.И., Шепелев И.Е. Нейронные сети с преднастройкой в задачах интерпретации сенсорной информации и управления поведением роботов в динамической среде // Нейрокомпьютеры: разработка и применение. 2004, №11.

  10. Шепелев И.Е. Модель нейронной сети с преднастройкой для решения задач формирования сенсомоторной координации робота-манипулятора. Автореферат дисс. на соискание ученой степени канд. техн. наук. Ростов-на-Дону, 2004. 22с.


  11. Сафонов В.А., Ефимов В.Н., Чумаченко А.А. Нейрофизиология дыхания. М.: Медицина, 1980, 224 с.




УДК 004.032.26(06) Нейронные сети