RoboFob  Лаборатория "Робототехника"
 ФНБИК МФТИ, МИЭМ НИУ ВШЭ, МГТУ им. Н.Э. Баумана

Главная Галерея Проекты Робоспорт Материалы СМИ О нас

ИССЛЕДОВАНИЕ И МОДЕЛИРОВАНИЕ МЕХАНИЗМОВ РЕГУЛЯЦИИ СОЦИАЛЬНОГО ПОВЕДЕНИЯ И ОБУЧЕНИЯ ДЛЯ ГРУППЫ АВТОНОМНЫХ РОБОТОВ // 2017 - 2019

Проект выполнен при поддержке РФФИ (проект № 7-29-07083 офи_м).


Коллектив

Когнитивный блок

  • Величковский Б.М.
  • Шишкин С.Л.
  • Дубынин И.А.

Этологический блок

  • Бургов Е.В.

Нейрофизиологический блок

  • Ивашкина О.И.
  • Торопова К.А.
  • Груздева А.М.

Робототехнический блок

  • Карпов В.Э.
  • Ровбо М.А.
  • Сорокоумов П.С.

2018-2019 гг

Основным итогом исследований стало то, что результаты естественно-научных исследований позволили получить конструктивные модели и методы управления поведением социумом искусственных агентов, причем в виде, пригодном для реализации на имитационном и натурном уровнях робототехнического блока. Так, этологические исследования позволили сформулировать задачи и создать модели управления поведением искусственных агентов на макроуровне. Результаты нейробиологических исследований позволили получить и реализовать такие важнейшие механизмы, как подражательное поведение и социальное обучение, а также создать модель ассоциативной памяти искусственного агента (робота). Когнитивные исследования позволили определить особенности человеко-машинного взаимодействия (оператор-группа роботов и оператор-робот) и создать специфический интерфейс на основе виртуальной реальности.

1. ЭТОЛОГИЧЕСКИЙ БЛОК

Для выявления и уточнения ряда характеристик модельных видов муравьев проведены полевые исследования. Получены новые данные по функциональным различиям видов рода Formica, расширен перечень модельных видов. Выделено две функциональные группы внутри рода. Показано, что в смешанных семьях F. sanguinea и F. cinerea происходит совмещение функций представителей обеих групп.

Определены качественные и количественные характеристики лабораторного полигона и модельной группы. Выполнена трехмерная модель полигона, включающая «гнездо», «кормовой участок» и «дорожно-тоннельную систему». На основании предложенных формальных моделей в дальнейшем были созданы модели зрительного анализатора, системы взаимодействия индивидов при моделировании киноптических реакций, системы фуражировки (в среде kvorum). На основе трехмерной модели выполнена разметка полигона и протестировано функционирование роботов YARP-2 с ее использованием.

2. КОГНИТИВНЫЙ БЛОК

Была проведена серия экспериментов с участием 23 испытуемых, которые отдавали команды движущимся на экране объектам, изображающим мобильных роботов, сочетанием взгляда и короткой голосовой команды: взгляд, отслеживаемый айтрекером, указывал робота, а голос использовался для ее подтверждения. Испытуемому надо было последовательно активировать десять роботов сначала по порядку их номеров, и сразу после этого в обратном порядке. Все испытуемые успешно справились с заданием. На поиск робота среди десяти роботов, движущихся в поле зрения испытуемого с угловой скоростью 6 градусов в секунду, и подачу команды уходило в среднем 1,6-1,7 с. Предполагается, что легкости овладения этим способом управления способствуют имеющиеся у подавляющего большинства людей навыки взаимодействия с другими людьми с использованием сочетания взгляда и вокализации. В отличие от ранее описанных в литературе методик человеко-машинного взаимодействия с помощью такого сочетания, в нашем эксперименте использовался наиболее простой способ подтверждения – его можно было осуществить с помощью любой вокализации, что ускоряло распознавание команды и упрощало задачу пользователя. Представляется перспективным использовать такой гибридный способ взаимодействия человека и роботов, когда обычные способы управления с использованием рук недоступны или неэффективны (занятые руки, инвалидность и др.).

3. НЕЙРОБИОЛОГИЧЕСКИЙ БЛОК

Проведено исследование нейрональных основ социальной и индивидуальной памяти у мышей в задаче социальной передачи вкусового предпочтения. Было показано, что животные успешно обучаются социальной передаче вкусового предпочтения, и данное обучение приводит к формированию кратковременной (при оценке через 1 час), а также долговременной памяти, сохранявшейся не менее 24 часов. Кроме того, впервые в мире нами было проанализировано поведение мышей-демонстраторов через 24 часа после ознакомления с целевым кормом. Животные-демонстраторы запоминали ранее съеденный ими корм, однако, в отличие от наблюдателей, у демонстраторов эта память проявлялась в устойчивом предпочтении нового, а не целевого корма. Таким образом, нами впервые было показано, что как индивидуальное, так и социальное обучение одной и той же ситуации внешней среды приводит к формированию устойчивой долговременной памяти, однако эта память совершенно по-разному проявляется в поведении в зависимости от того, была ли она сформирована в результате индивидуального опыта или наблюдательного обучения. Нами впервые в мире было проведено сопоставление активности мозга при извлечении индивидуально сформированной и социально усвоенной памяти, а также продемонстрированы общие и специфические свойства таких форм памяти. Было показано, что орбитальная и пириформная области коры одинаково активны при индивидуальном и социальном обучении, в то время как передние обонятельные области вовлекаются в извлечение только индивидуально сформированной памяти, а гиппокамп – только при социальной передаче вкусового предпочтения. Коннектомный анализ показал, что наблюдательное обучение отличает высокая функциональная связанность различных областей мозга в целом и гиппокампа в частности, тогда как индивидуальное обучение вкусовому предпочтению приводит только к формированию локальных сетей областей мозга, связанных с анализом вкусовых данных.

4. РОБОТОТЕХНИЧЕСКИЙ БЛОК

Был рассмотрен ряд моделей и архитектур, которые позволяют создавать высокоуровневый каркас для базовых механизмов социального поведения. Были рассмотрены вопросы группового управления обучающихся агентов на примере задачи фуражировки. Формулировка метода обменов была адаптирована для BDI модели, а также рассмотрены модификации, позволяющие агентам взаимодействовать за счет виртуального ресурса. Сравнение и анализ было проведено, в том числе, с методами на основе BDI архитектуры и досок объявлений, а также проведено его сравнение с формулировкой STRIPS.

Была разработана архитектура управления для робототехнических систем с обучением, позволяющая комбинировать различные алгоритмы целенаправленного поведения, а также предложен алгоритм управления верхнего уровня, переключающий управление между базовыми алгоритмами. Был проведен его анализ для задачи, сформулированной в терминах обучения с подкреплением.

В плане развития интерфейсов была разработана подсистема взаимодействия человека с группой роботов с помощью средств виртуальной реальности, позволяющая оператору воспринимать окружение с точки зрения выбранных роботов из группы, получать данные о состоянии робота и ходе выполнения им задачи, а также корректировать рабочий процесс. Тестирование показало, что показатели качества управления для разработанного интерфейса несколько выше, чем у традиционного графического. Для практической отработки предложенных механизмов была создана модель группы мобильных агентов, позволяющая выполнять задачу поиска нужной точки в лабиринте путём сочетания нескольких подходов к планированию действий агентов, в том числе методов машинного обучения и логического вывода на основе знаковых моделей. Исследовано поведение группы агентов при различных вариантах постановки задачи и комбинирования поведений.

В развитие базисных методов социального взаимодействия между искусственными агентами на основе результатов нейробиологического блока исследований были разработаны модели подражательного поведения и социального обучения. Кроме того, была создана модель ассоциативной памяти анимата, решающую задачу ориентации в пространстве.

ВАЖНЕЙШИЕ НАУЧНЫЕ РЕЗУЛЬТАТЫ

1. ЭТОЛОГИЧЕСКИЙ БЛОК

1.1. Определение параметров особей. Получены новые данные по функциональным различиям видов рода Formica, скоростям движения рабочих по различным поверхностям, расширен перечень модельных видов. Внутри рода можно выделить две экологические группы: муравьи, способные к самостоятельному движению и переносу грузов по тонкой траве, и муравьи, вынужденные двигаться по свободному от травы пространству (Рис. E1). К первой относятся представители подродов Formica s.str. (F. polyctena и F. pratensis) и Raptiformica (F. sanguinea), ко второй – Serviformica (F. cunicularia, F. cinerea) и Coptoformica (F. exsecta, F. pressilabris). Данные по скорости движения муравьев использованы при расчете параметров модельной группы роботов.

1.2. Исследование функциональной дифференциации. В смешанных семьях, образованных путем временного социального паразитизма, сочетаются функции представителей обеих групп (показано на модели смешанной семьи F. sanguinea и F. cinerea). Такое сочетание обеспечивает смешанной семье возможность более полного и эффективного использования ресурсов среды. Принцип функционального разделения внутри смешанной семьи используется и при организации гетерогенной группы роботов.

1.3. Модель фуражировки. Описана организация фуражировки в группе искусственных агентов. Определены основные характеристики группы. На основе расчетов качественных и количественных характеристик группы выполнена трехмерная модель полигона (Рис. Е2). В среде Kvorum отработан механизм неспецифической активации фуражиров [Бургов, Малышев, 2019]. Выполнена виртуальная модель полигона в среде Kvorum, протестировано функционирование группы аниматов (пассивных и активных фуражиров) при различных соотношениях численности особей (Рис. Е3). Предложенная инфраструктура реализована на полигоне лаборатории робототехники НИЦ «Курчатовский институт» (Рис. Е4): отработано использование роботами искусственных элементов инфраструктуры: «гнезда» и «дорожно-тоннельной» системы.

2. КОГНИТИВНЫЙ БЛОК

Экспериментальные исследования эффективности и удобства выбора мобильного робота из группировки с помощью сочетания прослеживающих движений глаз и коротких голосовых команд. В ходе исследований с учетом ранее полученных предварительных результатов была подготовлена и проведена полноценная серия экспериментов с участием 23 испытуемых (подробнее см. Дополнительные материалы; по этому исследованию в настоящее время готовится статья, которая будет представлена в The Journal of Eye Movement Research, индексируемый в WoS и Scopus). В этом экспериментальном исследовании оценивалась возможность взаимодействия с движущимися на экране объектами, изображающими мобильных роботов, с помощью сочетания взгляда и короткой вокализации: взглядом нужно было указать одного из роботов, а вокализация выполняла роль подтверждения команды.

Все испытуемые успешно справились с заданием. На поиск робота и подачу команды уходило в среднем 1712 +-348 мс, когда испытуемые использовали для подтверждения слово «ты», 1626 +- 331 мс, когда они в качестве подтверждения называли номер робота, и 1581 +- 305 мс – когда использовали выбранное ими самими слово (этот режим, в отличие от других, всегда предлагался испытуемым на фиксированном месте – в самом конце эксперимента, поэтому тенденция увеличения скорости выбора могла быть связана с постепенным освоением технологии взаимодействия с помощью взгляда и голоса). Выбор робота с помощью сочетания взгляда и более стандартного подтверждающего действия – нажатия на клавишу – осуществлялся еще быстрее: на него уходило всего 1269 +- 265 мс, причем лишь этот режим демонстрировал статистические значимые отличия от остальных (p=0,00015 для сравнений этого режима со всеми остальными, post-hoc критерий Тьюки). Большинство испытуемых (16 из 23) сочли подтверждение отдаваемой взглядом команды моторным действием наиболее удобным, однако высоко оценили и подтверждение с помощью вокализации. Следует иметь в виду, что подтверждение подаваемой взглядом команды с помощью моторного действия не всегда возможно: оно может быть недоступно тяжелым инвалидам, а также в случае, когда обе руки у оператора заняты выполнением других операций.

Большой интерес представляют ответы испытуемых на вопросы опросника, предлагавшегося им после эксперимента. Подтверждение называнием номера выбрали как наиболее удобный среди режимов с подтверждением вокализацией 17 из 23 участников эксперимента, и количественные оценки удобства этого метода были значимо выше, чем подтверждения с помощью слова «ты» (p=0,0004 по критерию Вилкоксона). По-видимому, весьма нежелательно использовать для подтверждения одно и то же слово, если команды надо давать часто (половина испытуемых отметила, что это им мешало при использовании слова «ты»). Как уже наблюдалось ранее в предварительной серии, использование слова «ты» отвлекало от выполнения задачи выбора роботов в соответствии с их нумерацией (у шести испытуемых даже были случаи, когда они сбивались со счета), тогда как произнесение номера робота, напротив, способствовало ее выполнению. Нельзя исключить, что такая «интерференция» может исчезнуть с автоматизацией подачи команды при достаточно продолжительной практике. Интересно, что при свободном выборе некоторые испытуемые выбрали слово «да» и сочли его использование удобным, тогда как именно это слово в предварительных экспериментах вызвало резко отрицательную реакцию у части испытуемых. Испытуемые, исходя из своего опыта свободного выбора слова для подтверждения, отмечали важность его удачного подбора.

Результаты опроса в целом указывают на желательность использования для подтверждения слова, естественным образом ассоциирующегося с роботом, например, его номера (как в эксперименте) или имени (что, по-видимому, может дать не худшие или даже существенно лучшие результаты, но в эксперименте не использовалось, поскольку потребовало бы много дополнительного времени на запоминание имен роботов, существенного уменьшения «группировки» и других нежелательных модификаций эксперимента). По-видимому, для подтверждения отдаваемой взглядом команды с помощью короткой вокализации оптимальным является использование либо слова, естественным образом ассоциирующегося с командой или номером/именем робота, либо (при нечастой подаче команд) слова, выбранного самим оператором. Важно, чтобы выбранные слова были достаточно короткие, поскольку длинные слова могут вызвать повторные срабатывания, либо существенно замедлить распознавание команды (что неудобно при использовании взгляда), либо потребовать удлинения периодов нечувствительности, из-за которых, в свою очередь, станет невозможным частая подача команд тогда, когда это будет требоваться.

Следует также отметить, что хотя произнесение слова «ты» оказалось сравнительно неудобным способом подтверждения команды, отдаваемой взглядом, это могло быть связано с особенностями эксперимента – одно и то же слово требовалось произносить слишком часто и слишком много раз. Не исключено, что если бы его требовалось произносить существенно реже (например, только при обращении к роботам, имена которых неизвестны, либо когда их трудно вспомнить), с ним также было бы удобно работать.

Как и в предварительных экспериментах, испытуемые быстро и легко осваивали новый для них способ взаимодействия с техникой – это касалось и десяти испытуемых, у которых до эксперимента не было вообще какого-либо опыта использования управления на основе айтрекинга. Мы считаем вероятным, что в основе овладения этим способом управления лежат имеющиеся у подавляющего большинства людей навыки взаимодействия с другими людьми с использованием сочетания взгляда и вокализации. Как мы уже отмечали в отчете по первому этапу проекта, не исключено, что такого рода взаимодействие может оказаться еще более эффективным, если операторы будут иметь достаточно времени на обучение ему (в наших экспериментах такие условия пока не удавалось воспроизвести из-за временных ограничений). Однако и без продолжительного обучения, как показали результаты экспериментальной серии, использование сочетания взгляда и вокализации весьма эффективно, и представляется перспективным использовать его в различных человеко-машинных системах, когда по тем или иным причинам нельзя использовать обычные способы управления с использованием рук (занятые руки, инвалидность и др.) [Величковский, Величковский, Ушаков, 2019]

3. НЕЙРОБИОЛОГИЧЕСКИЙ БЛОК

3.1. Отработка модели социальной передачи вкусового предпочтения. В связи с тем, что в задаче социальной передачи страха, использованной для выполнения работ по проекту в 2018 году, у животных-наблюдателей формируется слабая ассоциативная память, и при этом индивидуальная вариабельность поведения мышей оказывается очень высокой, что затрудняет изучение нейрональных основ социальной памяти, в отчетном году для выполнения задач проекта было принято решение использовать другую широко применяемую задачу наблюдательного обучения – социальную передачу вкусового предпочтения [Wrenn, 2004], [Ross, Eichenbaum, 2006], [Smith, East, Colombo, 2010], [Cintoli и др., 2018]. Нами была проведена отработка модели социальной передачи вкусового предпочтения у мышей линии С57Bl/6. Для этого был использован протокол обучения, предложенный, Wrenn и соавторами [Wrenn, 2004], в которой животное-наблюдатель обучается употреблению пиши, имеющей новый незнакомый вкус и запах, через взаимодействие с животным-демонстратором, ранее уже питавшимся такой пищей. Было показано, что часового взаимодействия с демонстратором, непосредственно перед этим употреблявшим в пищу новый корм, достаточно для формирования устойчивой ассоциативной памяти в отношении вкуса и запаха этого корма у мышей-наблюдателей. Так, мыши-наблюдатели демонстрировали выраженное предпочтение целевого корма по сравнению с контрольным как через 1 час после окончания взаимодействия с демонстратором, так и через 24 часа (Рис. N1). Таким образом, нами было показано, что животные успешно обучались социальной передаче вкусового предпочтения, и данное обучение приводило к формированию кратковременной, а также долговременной памяти, сохранявшейся не менее 24 часов.

Кроме того, впервые в мире нами было проанализировано поведение мышей-демонстраторов по отношению к ранее знакомому им и новому корму через 24 часа после ознакомления с целевым кормом. Было показано, что животные-демонстраторы запоминали ранее съеденный ими корм, однако, в отличие от наблюдателей, у демонстраторов эта память проявлялась в устойчивом предпочтение нового, а не целевого корма (Рис. N2). Ранее подобный феномен предпочтения нового стимула по сравнению с знакомым был неоднократно показан у мышей в задаче распознавания объектов. Таким образом, нами впервые было показано, что как индивидуальное, так и социальное обучение одной и той же ситуации внешней среды (пище, имеющей новый вкус) приводит к формированию устойчивой долговременной памяти, однако эта память совершенно по-разному проявляется в поведении в зависимости от того, была ли она сформирована в результате индивидуального опыта или наблюдательного обучения [Toropova, 2019], [Плюснин и др., 2019].

3.2. Выявление структур мозга мышей, вовлекающихся в индивидуальное и наблюдательное обучение. Для того, чтобы установить, какие области мозга участвуют в социальном и индивидуальном обучении вкусовому предпочтению, а также выявить паттерны структур, общие для этих двух форм обучения и специфичные для каждой из них, нами было проведено картирование активности мозга мышей-наблюдателей и демонстраторов при помощи выявления белка-продукта немедленного раннего гена с-fos при извлечении ранее сформированной памяти о новом вкусе. Было показано, что при извлечении памяти о наблюдательном обучении в задаче социальной передачи вкусового предпочтения происходит специфическая активация орбитальной и пириформной областей коры, а также гиппокамп. При этом, извлечение индивидуально сформированной памяти о новом вкусе пищи приводило к активации передних обонятельных областей, орбитальной и пириформной областей коры, но не гиппокампа (Рис. N3). Таким образом, активация орбитальной и пириформной зон коры наблюдалась как при социальном, так и при индивидуальном обучении и, по-видимому, отражает сходство этих двух форм памяти. Тогда как активация гиппокампа являлась специфической для наблюдательного обучения, а активация передних обонятельных областей наблюдалась только при индивидуальном обучении. Таким образом, нами впервые в мире было проведено сопоставление активности мозга при извлечении индивидуально сформированной и социально усвоенной памяти, а также продемонстрированы общие и специфические свойства таких форм памяти [Toropova, 2019].

3.3. Анализ функциональной связанности областей мозга мышей при наблюдательном и индивидуальном обучении. Для выявления функциональной связанности областей мозга мышей при социальной передаче вкусового предпочтения и индивидуальном обучении употреблению пищи с новым вкусом нами были проанализированы попарные корреляции активности различных областей мозга по с-fos и на основе значимых положительных корреляций построены коннектограммы социального и индивидуального вкусового предпочтения (Рис. 4). Было показано, что функциональная связанность в коннектоме социальной памяти в целом выше, чем в коннектоме индивидуальной памяти, что выражается в большем количестве связей между различными областями мозга мышей, обучавшихся наблюдательно. При этом хабом сети социального обучения является гиппокамп, для которого наблюдалось наибольшее количество функциональных связей с другими проанализированными областями. В индивидуальном обучении количество связей гиппокампа и других областей мозга было низким, и функциональная связанность была наибольшей для передних обонятельных областей. Таким образом, наблюдательное обучение отличает высокая функциональная связанность различных областей мозга в целом и гиппокампа в частности, тогда как индивидуальное обучение вкусовому предпочтению приводит только к формированию локальных сетей областей мозга, связанных с анализом вкусовых данных.

4. РОБОТОТЕХНИЧЕСКИЙ БЛОК

4.1. Подсистема взаимодействия человека с группой роботов. Разработанная подсистема взаимодействия человека с группой роботов средствами виртуальной и дополненной реальности состоит из двух частей – драйвера шлема виртуальной реальности (т.е. системы визуализации) и обработчика данных, взаимодействующего с этим драйвером. Система обеспечивает работу как с реальными, так и с моделируемыми роботами, созданными в среде симуляции Gazebo. Программная часть системы управления включает в себя набор отдельных программ, работающих под управлением фреймворка ROS; система визуализации создана с использованием игрового движка Unreal Engine 4 (Рис. R3). Эффективность предложенного решения измерена на тестовой задаче; оказалось, что среднее время верной реакции на события интерфейса виртуальной реальности (2.7 с) ниже аналогичного времени для традиционного графического интерфейса (3.0 с), причём это различие статистически значимо (p = 0.006) (Рис. R4). Другим результатом стало различие между субъективным восприятием опыта работы пользователем и объективными показателями (задача, указанная пользователями как более сложная, в действительности была решена с меньшим числом ошибок, чем указанная как более лёгкая). Результаты экспериментов показывают, что эффективность использования интерфейса виртуальной реальности для модельной задачи сравнима с результатами на традиционных видах интерфейсов – консольном и графическом (Рис. R5), при этом такой интерфейс по сравнению с обычным графическим может обеспечить небольшой выигрыш по скорости.

4.2. Система управления групповым поведением. Концепция социального управления групповыми робототехническими системами включает наличие различных базовых механизмов, объединение которых в систему позволяет реализовывать гибкое и эффективное управление группой. В рамках данной работы был рассмотрен ряд моделей и архитектур, которые позволяют создавать высокоуровневый каркас для базовых механизмов социального поведения. При этом семиотическое управление, использующее модель из множества семантических сетей и специальных связей между ними, образующих знаки, представляется наиболее подходящим способом реализации такой системы управления, поскольку создает условия для объединения коммуникативных возможностей и управляющих алгоритмов в единую структуру. Поэтому основное внимание в проекте было уделено исследованию иерархических и сетевых архитектур управления и их адаптивным свойствам.

  • Был рассмотрен ряд моделей и архитектур, которые позволяют создавать высокоуровневый каркас для базовых механизмов социального поведения. Были рассмотрены вопросы группового управления обучающихся агентов на примере задачи фуражировки [Vorobiev, Rovbo, 2019] (Рис. R1). В ней обучающиеся индивидуально агенты на основе модификации алгоритма семантического вероятностного вывода, собирали пищу на квадратном поле без препятствий, образуя систему с неявным взаимодействием через среду. Эксперименты показали, что кривая обучения агентов больше зависела от типа и параметров алгоритма, чем от индивидуального опыта: агенты с одними настройками отличались гораздо сильнее от агентов с другими настройками по эффективности, чем между собой в силу индивидуальных различий в истории работы в среде, а усредненная скорость сбора пищи по агентам не сильно отличалась от работы одного агента в среде, поэтому при достаточно малом числе агентов в группе, индивидуальное обучение, в основном, происходит так же, как и без группы.
  • Были рассмотрены и предложены некоторые модификации различных алгоритмов управления агентами с BDI архитектурой на основе досок объявлений и метода обменов (Рис. R2). Был рассмотрен вопрос взаимодействия группы агентов на основе планирования с помощью локальных досок, позволяющее планировать достижение цели агентам, ограниченным в расстоянии возможной коммуникации [Ровбо, Овсянникова, 2019]. Формулировка метода обменов, оригинально описанного в [Карпов, Мещерякова, 2004], была адаптирована для BDI модели, а также рассмотрены модификации, позволяющие агентам взаимодействовать за счет виртуального ресурса. Было проведено его сравнение с формулировкой STRIPS, которая показала, что задачи метода обменов могут быть рассмотрены в виде STRIPS задачи соответствующими методами, однако сам метод может приводить к ускорению нахождения решения за счет рассмотрения меньшего графа поиска.
  • Была разработана архитектура управления для робототехнических систем с обучением, позволяющая комбинировать различные алгоритмы целенаправленного поведения, а также предложен алгоритм управления верхнего уровня, переключающий управление между базовыми алгоритмами. Моделирование показало, что предложенный метод ведет себя более стабильно для различных вариантов задачи, чем каждый из базовых по отдельности, хотя и не дает наилучшего результата для каждого отдельного случая, для задачи, сформулированной в терминах обучения с подкреплением. Были продемонстрированы преимущества использования алгоритмов управления, основываемых на базовых алгоритмах, организованных в структуру управления верхнего уровня [Rovbo, Moscowsky, Sorokoumov, 2019]. Разработанная система управления группой мобильных агентов обеспечивает сочетание различных поведенческих алгоритмов для поиска наилучшим образом проявляющей себя в заданных условиях комбинации этих поведений. Каждое из поведений определяет, какие действия и в каких условиях будет выбирать агент; при этом разные виды поведений обеспечивают различных подход к решению задачи: на основе априорных знаний (планирование путём логического вывода), на основе прецедентов (алгоритм машинного обучения Q-learning) либо без предположений о природе задачи (случайный выбор); допустимо также добавление, например, специализированного исследовательского поведения или других вариантов действий. Благодаря тому, что переключение между поведениями возможно только в периодически наступающие моменты, каждое из них потенциально способно за предоставленный отрезок времени проявить свои характерные свойства. Благодаря собираемой статистике об успешности решения поставленной задачи оказывается возможной адаптация агента к конкретным условиям среды, что и было показано экспериментально. Вместе с тем необходимо в дальнейшем дополнительно исследовать изменение ранее сложившегося поведения агента при попадании в новую среду, а также дать интерпретацию результатов в виде классификации сред по предпочтительным видам поведений и методику априорной оценки эффективности поведенческих алгоритмов в конкретной среде.

    4.4. Модели поведения. Были разработаны модели подражательного поведения и социального обучения. В основе этих моделей – семиотический подход, в котором в модели мира анимата имеется знак "Я". Этот знак используется для сопоставления наблюдаемого контрспецифика с субъектом поведения – агентом [Карпов, 2019a], [Карпов, 2019b], [Карпов, Ивашкина, 2019]. Модель подражательного поведения и модель социального обучения были разработаны на основе результатов исследований, проведенных в нейробиологическом блоке, и относятся к уровню стимул-реактивного поведения, см Рис.R6, R7. Для реализации более сложных форм поведения была разработана модель ассоциативной памяти, отработка которой проводилась на задаче ориентации анимата в пространстве [Карпов, Карпова, 2019], [Карпов, 2019c], Рис.R8.


    2017-2018 гг

    Исследования методов управления социумом искусственных агентов – роботов велись по четырем направлениям – блокам: этологическому (внешняя феноменология поведения), нейробиологическому (внутренние механизмы социального взаимодействия), робототехническому (отработка формальных моделей и практическая апробация) и когнитивному (реализация управляющих интерфейсов).

    Этологический блок. Была обоснована необходимость моделирования пространственно-функциональных структур для социума роботов (гнезда, дороги, тоннели). В итоге были определены и согласованы с робототехническим блоком основные технические требования для моделирования дорожной (тоннельной) инфраструктуры. В рамках исследований поведения была предложена организация фуражировки по механизмам массовой мобилизации и общего вторичного деления территории, а также разработаны алгоритмы действий активных и пассивных фуражиров. Одним из важных вопросов являются индивидуальные когнитивные способности индивида-робота. Исходя из этого, была подготовлена поведенческая основа для создания мобильной системы технического зрения и показана возможность использования разработанного зрительного анализатора для моделирования киноптических реакций. Следующим важным вопросом являлось изучение влияния функциональных особенностей индивида на формирование и функционирование элементов инфраструктуры. Для изучения этого были собраны данные по экологической дифференциации видов на основе различий в способности к перемещению по траве. Была показана функциональная предрасположенность представителей подродов Serviformica и Coptoformica к использованию травостоя для перемещения, фуражировки и транспортировки грузов. Неспособность муравьев Formica s. str. быстро перемещаться по тонкой траве создает для них необходимость расчистки путей передвижения или углубления полотна дорог на участках, покрытых густой растительностью. Данные о дифференциации потоков фуражиров рабочих разных видов в совокупности с данными об организации смешанных семей (на примере семей муравьев-рабовладельцев) необходимы для создания моделей разделения функций в гетерогенной группе роботов.

    Когнитивный блок. В плане работ этого блока основной акцент делался на уточнении ранее предложенных методов и подходов взаимодействия оператора и роботов с использованием взгляда, в особенности на расширении понимания такого взаимодействия как коммуникативного акта, используемого для управления поведением автономного агента. В исследовании с участием 16 испытуемых было подтверждено предположение, что в случае, когда выбираемый с помощью взгляда объект находится в движении, его выбор с помощью взгляда может быть более эффективен, чем при использовании компьютерной мыши. В другом исследовании 12 испытуемых сравнительно быстро и легкость освоили использование сочетания взгляда и голоса – по-видимому, опираясь на уже имеющиеся у них навыки коммуникативного взаимодействия, но не с роботами, а с другими людьми. Данный подход (вероятно, в связи с рядом технических недоработок методики) не продемонстрировал статистически значимых преимуществ по сравнению с традиционными методами. Мы предполагаем, однако, что при доработке методики и предоставлении испытуемым более продолжительного времени на освоение нового способа взаимодействия он также может оказаться эффективным и практически ценным.

    Нейробиологический блок. Изучалась мотивация поведения на модели социальной передачи страха у лабораторных мышей. Был проведен анализ свойств такого обучения и формирующейся на его основе социальной памяти в сравнении с памятью, формирующейся в результате индивидуального опыта мыши при обучении условно-рефлекторному замиранию. Было показано, что мыши успешно обучаются социальной передаче страха, наблюдая за поведением партнера-демонстратора, который получает электрокожное раздражение лап каждые 10 сек в течение 5 мин. Социальная память, формирующаяся в результате такого обучения, является долговременной и сохраняется в течение более 24 часов. Социальное обучение, как и индивидуальное, приводит к формированию ассоциативной памяти, специфической относительно используемого условного стимула и не генерализующейся на другие похожие условные стимулы. Тем не менее, память, сформировавшаяся в результате наблюдательного обучения, является более слабой, чем при индивидуальном обучении, и не все животные способны к наблюдательному обучению в использованной нами модели. При этом способность к социальному обучению у мышей-наблюдателей не зависит от соотношения социальных статусов в паре наблюдатель-демонстратор. Было показано, что наличие прошлого опыта индивидуального обучения в сходной задаче способно значительно усилить новое наблюдательное обучение у мышей.

    Робототехнический блок. Разработана архитектура параметрического управления индивидуальным агентом на основе семиотической сети, пригодная для социального управления. Для данной архитектуры был предложен метод адаптации и внешнего управления. В рамках задачи создания инфраструктуры в соответствии с результатами этологического блока была разработана серия виртуальных полигонов для решения задачи фуражировки в расширенной постановке с динамическими элементами (восполнение целей, энергетические затраты и восполнение), на его основе проведена апробация предложенных методов. Кроме того, был разработан метод одновременного решения конфликтующих задач (поведений), что позволяет в ряде случаев устранить необходимость построения управляющего алгоритма с коллизиями. В основе метода разрешения коллизии параллельно работающих автоматов лежит общий список ресурсов. Развитие сенсорных способностей агентов (роботов) также осуществлялось на основе знаковой (семиотической) модели. Разработанная модель позволяет объединять сенсорные данные различной природы в рамках программной части комплексного сенсора, формирующего картину мира примитивного агента на основе текущих восприятий множества простых сенсорных устройств. Кроме того, были проведены исследования по регуляции сложного поведения группы агентов (роботов) на основе использования таких базовых механизмов, как память (узнавание), агрессия и доминирование. В этих исследования, в частности, были предложены модели инициации агрессивного поведения.

    ВАЖНЕЙШИЕ НАУЧНЫЕ РЕЗУЛЬТАТЫ

    1. ЭТОЛОГИЧЕСКИЙ БЛОК

    1.1. Мониторинг комплексов муравейников модельных видов. Собраны данные по комплексам муравейников, включающим модельные виды. Продолжены многолетние мониторинговые исследования комплексов муравейников Рязанской области. Внутри описанного комплекса гнезд F. cinerea обнаружено поселение муравья-рабовладельца F. sanguinea.

    1.2. Обнаружение новой для вида пространственно-функциональной структуры. Выявлено поселение F.cinerea (песчаного муравья), имеющее высокую мощность и структуру, не описанную ранее в литературе.

    1.3. Исследования функциональных основ экологической дифференциации муравьев Formica в сообществах. Показана функциональная предрасположенность представителей подродов Serviformica и Coptoformica к использованию травостоя для перемещения, фуражировки и транспортировки грузов. Неспособность муравьев Formica s. str. быстро перемещаться по тонкой траве создает для них необходимость расчистки путей передвижения или углубления полотна дорог на участках, покрытых густой растительностью (Бургов, 2018). Данные о дифференциации потоков фуражиров рабочих разных видов в совокупности с данными об организации смешанных семей (на примере семей муравьев-рабовладельцев) будут использования для разделения функций в гетерогенной группе роботов.

    2. КОГНИТИВНЫЙ БЛОК

    2.1. Уточнение и расширение спектра моделей взаимодействия. Были уточнены ранее предложенные методы и подходы к взаимодействию оператора и роботов с использованием взгляда, в особенности на расширении понимания такого взаимодействия как коммуникативного акта на взаимодействие с группировкой мобильных роботов. Для этого был проведен ряд экспериментальных исследований пилотного типа, в которых оператор взаимодействовал с моделью группировки мобильных роботов, демонстрируемых на компьютерном экране, с помощью движений глаз, выбирая нужных роботов в субгруппировку путем прослеживания их движений. При этом выяснилось, что циклический способ выбора не создавал явных преимуществ перед выбором каждого робота по отдельности – возможно, вследствие невозможности быстро (в пределах эксперимента) автоматизировать навык перевода взгляда на очередного робота. Также оказалось, что поскольку в текущей версии системы корректность распознавания команды можно контролировать только визуально, использование взгляда для подачи команд имеет существенные временные ограничения: его быстрый перевод на новый объект приводит к потере возможности отследить, удалось ли выбрать предыдущий объект. Возможно, эту проблему удастся решить в будущем с помощью добавления вибротактильной обратной связи.

    2.2. Исследование механизмов комплексного взаимодействия. Предварительные эксперименты показали перспективность другой формы коммуникативного взаимодействия с использованием взгляда: подачу команды сочетанием прослеживающих движений глаз с голосовым сигналом. В связи с этим основной акцент на данном этапе работы был сделан на экспериментальную оценку возможностей такого гибридного (взгляд + голос) управления, а также на доработку базовой методики выбора движущегося робота с помощью прослеживающих движений глаз.

    2.3. Уточнение методик и экспериментальные исследования. Детали уточненной методики выбора движущегося объекта с помощью прослеживающих движений глаз описаны в публикации (Isachenko и др., 2018). Они были реализованы в компонентах ПО в составе экспериментального стенда, имитирующего на компьютерном экране группировку мобильных роботов и позволяющего взаимодействовать с ними с помощью взгляда, отслеживаемого айтрекером, голоса и с использованием стандартной компьютерной мыши. Были проведены два экспериментальных исследования. В первом из них, проведенном с участием 16 испытуемых, было подтверждено предположение, что в случае, когда выбираемый с помощью взгляда объект находится в движении, его выбор с помощью взгляда может быть более эффективен, чем при использовании компьютерной мыши (подробнее см. (Isachenko и др., 2018)). По-видимому, этого удалось достичь как с помощью оптимизации алгоритма выбора, так и в связи с тем, что мы впервые для такой задачи рассматривали особый вариант этой задачи – выбор подвижного объекта. Во втором исследовании (12 испытуемых) выбор движущегося робота с помощью сочетания прослеживания его взглядом и подачи короткого голосового сигнала такого результата достичь не удалось – выбор сочетанием взгляда и голоса делался в среднем приблизительно с той же скоростью, как и с помощью клика мыши, а оценки комфортности взаимодействия оказались даже ниже. Это исследование носило предварительный характер. В нем использовалась простейшая версия детектора голосовой команды, из-за чего испытуемым приходилось тратить дополнительное внимание на генерацию распознаваемой голосовой команды, а выбор голосовых команд был оптимизирован лишь частично. Последнее обстоятельство, судя по результатам опросов испытуемых, могло повлиять весьма существенно. Так, использование в качестве голосовой команды «имени» робота – названия буквы алфавита, которой он был помечен – вызывало у многих испытуемых затруднения в связи с их неуверенностью в точности используемых названий букв, а использование слово «ты» мешало выполнять задание выбирать роботов в алфавитном порядке, поскольку это задание требовало перебирать слова, обозначающие буквы, и возникала своего рода интерференция с произносимым словом «ты». В то же время представляет интерес быстрота освоения и легкость использования испытуемыми сочетания взгляда и голоса – при том, что такого рода способ подачи команд никогда не использовался ими ранее во взаимодействии с техникой. Это может свидетельствовать о том, что испытуемые опирались на уже имеющиеся у них навыки коммуникативного взаимодействия – но не с роботами, а с другими людьми, ведь сочетание направления взгляда на другого человека и речевого обращения к нему является обычной формой инициации коммуникативного взаимодействия. Предполагается, что при доработке методики и предоставлении испытуемым дополнительного времени на освоение нового метода взаимодействия он может оказаться эффективным и практически ценным.

    3. НЕЙРОБИОЛОГИЧЕСКИЙ БЛОК

    3.1. Отработка модели социальной передачи страха в задаче условно-рефлекторного замирания у линии лабораторных мышей.

    Была проведена отработка модели социальной передачи страха у мышей линии С57Bl/6. Для этого была использована модель, предложенная Jeon и соавторами в 2010 году (Jeon и др., 2010), (Jeon & Shin, 2011), в которой животное-наблюдатель обучается условно-рефлекторному замиранию на данную обстановку за счет наблюдения за аверсивным поведением животного-демонстратора. Было показано, что при более частом нанесении ЭКР обучение наблюдателей происходит более эффективно: в ходе социального обучения животные группы «Наблюдатели, 10 с» демонстрировали значимо более высокий уровень замирания, чем контрольные животные, не получавшие ЭКР и не наблюдавшие за его получением демонстратором, тогда как мыши группы «Наблюдатели, 20 с» замирали на уровне контрольных наивных животных (Рис. 1.1. А, Б). Таким образом, только при более интенсивном социальном обучении происходила социальная передача страха, приводившая к формированию долговременной ассоциативной памяти об обстановке у животных-наблюдателей. На основании полученных результатов, для дальнейшего использования в данном проекте было выбрано обучение социальной передаче страха при подаче животным-демонстраторам ЭКР с интервалом 10 сек.

    3.2. Исследование свойств памяти, формирующейся при социальном обучении, в сравнении с индивидуальным обучением.

    При отработке модели социальной передачи страха было показано, что наблюдательное обучение, в отличие от индивидуального, существенным образом зависит от интенсивности полученного опыта. Кроме того, память, формирующаяся при социальном обучении, в среднем была слабее, чем при индивидуальном: животные-наблюдатели замирали при тестировании на обстановку значимо меньше, чем мыши-демонстраторы (Рис. 1.2, А). Кроме того, была показана гетерогенность мышей по их способности к наблюдательному обучению: у большинства животных память, формирующаяся при социальной передаче страха, оказывается слабее, чем при индивидуальном обучении, однако приблизительно треть мышей обучается наблюдательно так же хорошо, как и индивидуально (Plusnin, Toropova, & Ivashkina, 2018).

    3.3. Особенности памяти при социальной передаче страха. Проверка специфичности формирующейся памяти относительно обстановки обучения.

    Для оценки специфичности памяти, сформированной при социальном и индивидуальном обучении, относительно обстановки обучения мышей-наблюдателей и демонстраторов тестировали в новой незнакомой обстановке В (Рис. 1.2, Б). Было показано, что как животные-демонстраторы, так и наблюдатели, показывают крайне низкий уровень замирания в новой обстановке. В связи с этим, был сделан вывод о том, что память, формирующаяся при социальной передаче страха, как и при индивидуальном обучении является ассоциативной памятью, специфической относительно условного стимула – обстановки. Ни индивидуальное, ни наблюдательное обучение не приводит к генерализации страха.

    3.4. Проверка влияния собственного прошлого опыта обучения в задаче условно-рефлекторного замирания на силу и длительность хранения памяти, формирующейся при социальной передаче страха.

    Было обнаружено, что наличие опыта индивидуального обучения значительно усиливает социальную передачу страха: мыши-наблюдатели, имевшие предварительный опыт обучения УРЗ, замирали при тестировании социально обусловленной памяти значимо больше, чем мыши-наблюдатели, не имевшие такого предварительного опыта, и не отличались по этому показателю от животных-демонстраторов (Рис. 1.3, А). Было показано, что предварительный опыт животного имеет критическое значение для дальнейшего наблюдательного обучения – наличие у мыши-наблюдателя опыта обучения в сходной задаче делает память, формирующуюся при социальной передаче страха, столь же сильной, как и при индивидуальном обучении, и снижает гетерогенность животных по способности к наблюдательному обучению. Кроме того, было показано, что память, формирующаяся при социальной передаче страха у мышей-наблюдателей, имеющих предварительный опыт обучения, является устойчивой и не подвержена спонтанному угасанию со временем (Рис. 1.3, Б).

    3.5. Отсутствие зависимости наблюдательного обучения от социального статуса.

    Была обнаружена гетерогенность мышей по их способности к наблюдательному обучению. В связи с этим, было проведено сопоставление относительного социального статуса мышей-наблюдателей и их способности к наблюдательному обучению (Рис. 1.4, Б). Было обнаружено, что у мышей соотношение социальных статусов в паре наблюдатель-демонстратор никак не влияет на способность к социальному обучению, так как при тестировании социальной передачи страха наблюдатели-доминанты, наблюдатели-субординаты и наблюдатели-равные по статусу демонстраторам не различались ни по уровню замирания, ни по дисперсии уровня замирания. Таким образом, было показано, что у мышей наблюдательное обучение не зависит от социального положения демонстраторов и наблюдателей, а гетерогенность мышей по их способности к социальному усвоению страха возникает в связи с индивидуальными чертами каждого животного, а не его положением в социальной иерархии. При этом, независимость наблюдательного обучения агентов от социальной иерархии очевидно способствует наиболее широкому распространению навыков в популяции, тогда как способность к социальному обучению только от доминанта к субординату (как это было ранее показано для крыс) ограничивает распространение навыков и дает большие возможности для контроля за навыками в популяции. Таким образом, для человека-оператора искусственных агентов возможность переключения группы между состояниями статус-зависимого и статус-независимого социального обучения дает возможность гибкого контроля над поведением и знаниями группы в целом.

    3.6. Оценка социального поведения у мышей-наблюдателей и мышей-демонстраторов после социальной передачи страха в задаче условно-рефлекторного замирания.

    Было показано, что у естественных социальных агентов – грызунов социальное обучение является специфическим, но тем не менее значительно более слабым, чем индивидуальное обучение. Тем не менее, наличие прошлого опыта индивидуального обучения в сходной задаче способно значительно усилить наблюдательное обучение. Этот результат открывает новые возможности для управления поведением социума, представляющего собой группу искусственных агентов, поскольку, при условии биологоподобия таких агентов, дает возможность для самопроизвольного или направляемого разделения исходно гомогенной группы агентов на подгруппы «специалистов» в определенных типах деятельности. Такие агенты в любой момент времени имеют больший опыт в знакомой им деятельности, а также больший потенциал для обучения друг друга новым формам этой деятельности, что приводит к еще большей специализации.

    4. РОБОТОТЕХНИЧЕСКИЙ БЛОК

    4.1. Создание комплексных активных сенсоров.

    Для построения биоподобных агентов, способных воспроизводить характерные особенности поведения насекомых, могут быть использованы сенсоры, объединяющие восприятие гетерогенной информации – зрительной и дальномерной. Такие сенсоры позволяют агенту формировать наблюдаемую картину мира сравнительно простыми техническими средствами без значительного ущерба для полноты картины при использовании фасеточного принципа восприятия. Задача по созданию комплексных активных сенсоров, объединяющих восприятие зрительной и дальномерной информации, в основном решена. Создано алгоритмическое и программное обеспечение, позволяющее работать с данными различной природы на единой основе. Для этого все виды данных, поступающих в систему, представляются как фрагменты семантической сети, построенной по определяемым типом агента и предметной областью правилам, и интегрируются в модель мира в виде семиотической сети, имеющейся у агента (Ровбо & Сорокоумов, 2018). Полученное программное решение в дальнейшем будет доработано и протестировано на реальных роботах. Эта разработка значима для развития междисциплинарных исследований, так как переносит понятийный аппарат семиотики и лингвистики на область исследований социального управления и позволяет интегрировать модели этологических и нейробиологических исследований в единую структуру.

    4.2. Разработка виртуальной модели активного полигона, реализующего различные динамические среды.

    Для тестирования возможностей управления агентом на основе социальных механизмов, инфраструктуры или его поведенческих параметров, необходим полигон, который отражает характерные задачи, ставящиеся перед таким агентом или коллективом из агентов. Одной из таких задач является фуражировка и ее различные модификации. В этой задаче важную роль играет изменчивость мира: возобновление источников пищи, энергетические ограничения на работу агента и т.п. Исходя из результатов этологических исследований, была создана серия виртуальных полигонов в виде имитационных моделей для задачи фуражировки. На полигонах было определено множество таких динамических элементов, как восполняемые цели и энергоресурсы. На базе полигона была проведена апробация предложенных методов. См. Рис.2.1 – Рис.2.3 в Приложении.

    4.3. Создание алгоритмов, реализующих устранение коллизий при параллельном выполнении поведенческих программ индивида.

    Предложена концепция решения проблемы коллизии параллельно работающих автоматов за счет общего списка ресурсов, разработан и протестирован на модельной задаче соответствующий алгоритм. В основе метода – использование знаковой (семиотической) модели. Это подход был использован для управления работой поведенческих программ, решающих разные подзадачи. Описанная семиотическая сеть способна определить допустимые в текущий момент действия агента путём анализа своего текущего состояния. Таким образом, предложенный метод управления, позволяющий организовать последовательную работу конфликтующих поведений, снижает остроту проблемы коллизий. Однако в частях системы, допускающих параллельное выполнение разных управляющих воздействий на один объект, коллизии всё ещё могут возникать. Кроме того, предложенный алгоритм требует исследований не только на модельном примере, но и на реальных роботах.

    4.4. Разработка архитектуры системы управления социальным агентом на основе семиотической сети.

    Были разработаны архитектура и способ управления агентом на основе семиотической сети, использующие идеи из нейробиологии (теория функциональных систем Анохина (Анохин, 1973)). В том числе – идею иерархического строения структуры управления, что выражается в связях между знаками и их связью с перцептивными алгоритмами и действиями агента, и из искусственного интеллекта (семиотическая сеть). Такой подход позволяет построить систему управления на основе управления агентом через его параметры, вместо постановки задач напрямую, что является важным элементом для реализации механизмов социального управления в смысле (Карпов, Карпова, & Кулинич, 2019) Также это позволяет связать алгоритмы нижнего, «физиологического» уровня агента, которые могут быть реализованы различными методами, в том числе перцепцией с помощью нейросетей, реализацией действий с помощью конечных автоматов и др., и верхнего, «когнитивного» уровня, который традиционно изучается в контексте проблемы представления и обработки знаний и планирования в искусственном интеллекте. Предложенная сетевая архитектура также позволяет в некоторой степени адаптировать ее под другие модели, которые могут быть получены в результате нейробиологических и этологических исследований.

    4.5. Исследование механизмов регуляции поведением индивида и социума.

    Были предложены архитектура системы управления и алгоритмы, позволяющие решать сложные поведенческие задачи, основываясь на таких базовых механизмах, как память, агрессия и доминирование. В качестве примера была выбрана задача пищевого поведения агентов. Кроме того, были исследованы механизмы инициации агрессивного поведения агента, основанные на принципах манипуляции параметрами его системы управления, сходных с механизмом паразитического управления (Karpova & Karpov, 2018), (Карпова & Карпов, 2018). В рамках исследований по человеко-машинным интерфейсам был предложен метод управления индивидуальным роботом на основе оценки эмоций (Карпова & Ровбо, 2018).


    Некоторые публикации

    1. Isachenko, A. V., Zhao, D. G., Melnichuk, E. V., Dubynin, I. A., Velichkovsky, B. M., Shishkin, S. L. (2018). The Pursuing Gaze Beats Mouse in Non-Pop-Out Target Selection. в The 2018 IEEE international conference on systems, man, and cybernetics (SMC2018). Miyazaki, Japan, October 7-10, 2018. http://www.smc2018.org/
    2. Karpova I., Karpov V. (2018). Some Mechanisms for Managing Aggressive Behavior in Group Robotics. в 29th DAAAM International Symposium on Intelligent Manufacturing and Automation, Zadar, Croatia, EU, 24h-27th October 2018.
    3. Plusnin V., Toropova K., Ivashkina O. (2018). Social transmission of fear in mice: the role of dominance status. в 17th Annual Molecular and Cellular Cognition Society Symposium, November 1-2, 2018, San Diego, USA.
    4. Rovbo, M., Moscowsky, A., Sorokoumov, P. (2019). Hierarchical Control Architecture for a Learning Robot Based on Heterogenic Behaviors. //RCAI 2019 (17th Russian Conference on Artificial Intelligence), pp. 44-55. https://doi.org/10.1007/978-3-030-30763-9_4
    5. Sergei L. Shishkin (2019). Combining the eye gaze, EEG and MEG for creating new modes of human-computer interaction // The 5th International Conference BCI: Science and Practice. 3-5 октября 2019 г., Cамара, Россия
    6. Sergei L. Shishkin et al. (2019). Contrasting gaze-based interaction vs. spontaneous gaze behavior: EEG, MEG and fMRI studies //The 20th European Conference on Eye Movements, ECEM 2019, August 18-22, Alicante, Spain
    7. Vorobiev V., Rovbo M. (2019). Analysis of Semantic Probabilistic Inference Control Method in Multiagent Foraging Task. // Open Semantic Technologies for Intelligent Systems. Research Papers Collection (pp. 237-242). Minsk
    8. Бургов Е.В. (2018) Функциональные основы экологической сегрегации видов у муравьев: предварительные данные. // Муравьи и защита леса. Материалы XV Всероссийского мирмекологического симпозиума, Екатеринбург, 20-24 августа 2018 (сс. 25-31). Екатеринбург: УГЛТУ.
    9. Бургов Е.В. (2019) Доминирование у муравьев // Московский этологический семинар, Москва, ИПЭЭ РАН, 16 мая 2019 г. Ссылка на видеозапись
    10. Бургов Е.В. Московский А.Д. (2018). Разработка системы автоматического распознавания объектов на видеозаписи для мирмекологических исследований // Муравьи и защита леса. Материалы XV Всероссийского мирмекологического симпозиума, Екатеринбург, 20-24 августа 2018 (сс. 32-35). Екатеринбург: УГЛТУ.
    11. Бургов Е.В., Малышев А.А. (2019). Качественные и количественные характеристики биоинспирированных моделей групповой робототехники // V Всероссийский научно-практический семинар Беспилотные транспортные средства с элементами искусственного интеллекта. 2019. С. 139-148.
    12. Бургов Е.В., Московский А.Д. (2018).Разработка системы автоматического распознавания объектов на видеозаписи для мирмекологических исследований // Муравьи и защита леса. Материалы XV Всероссийского мирмекологического симпозиума, Екатеринбург, 20-24 августа 2018. Екатеринбург: УГЛТУ, 2018. С. 32-35.
    13. Велихов Е.П., Котов А.А., Лекторский В.А., Величковский Б.М. (2018). Междисциплинарные исследования сознания: 30 лет спустя. Вопросы философии, (12).
    14. Величковский Б.М., Величковский Б.Б., Ушаков В.Л. (2019). Амбьентная и фокальная обработка в зрении: эксперимент с фиксациями как событиями и сверхбыстрой фМРТ примеряет соперничающие взгляды // Современные технологии в медицине. 2019. № 4.
    15. Карпов В.Э., Карпова И.П. (2019). О некоторых моделях ориентации аниматов // II научная конференция -Ориентация и навигация животных-, Москва, 2-4 октября 2019. М.: Товарищество научных изданий КМК, 2019. С. 40.
    16. Карпов В.Э., Карпова И.П., Кулинич А.А. (2019). Социальные сообщества роботов. М.: УРСС. http://urss.ru/cgi-bin/db.pl-lang=Ru&blang=ru&page=Book&id=241571
    17. Карпов В.Э. (2019). Социальные сообщества роботов: от реактивных к когнитивным агентам // Мягкие измерения и вычисления, 2019, 15(2), с. 61-77.
    18. Карпова И.П., Карпов В.Э. (2018). Агрессия в мире аниматов, или О некоторых механизмах управления агрессивным поведением в групповой робототехнике // Управление большими системами.
    19. Карпова И.П., Ровбо М.А. (2018). К вопросу об использовании эмоциональной окрашенности команды при голосовом управлении роботом. // Шестнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2018 (24-27 сентября 2018 г., Москва, Россия). Труды конференции. В 2-х томах. (Т. 1, сс. 116-123). М.: НИУ ВШЭ.
    20. Лескова Н. Нравственный императив для анимата. (2019). Интервью с В.Э.Карповым // В мире науки / Sci. Am. 2018. № 11. С. 12-17 https://scientificrussia.ru/interviews/nravstvennyj-imperativ-dlya-animata-v-mire-nauki-11-2018-g
    21. Мамедьяров З. От роя к социуму роботов (2019). (интервью с В.Карповым). Эксперт, 2019, 1139(43). Retrieved from https://expert.ru/expert/2019/43/ot-roya-k-sotsiumu-robotov/
    22. Московский А.Д., Бургов Е.В., Овсянникова Е.Е. (2018). Зрительный анализатор анимата как основа семантики сенсорной системы робота. Мехатроника, автоматизация, управление, 5(19), 336-345. http://doi.org/10.17587/mau.19.336-345
    23. Ровбо М.А., Овсянникова Е.Е. (2019). Методы локального планирования поведения агентов с BDI архитектурой // Искусственный интеллект и принятие решений, 2019, № 1, с.76-84. https://doi.org/10.14357/20718594190107
    24. Ровбо М.А., Сорокоумов П.С. (2018). Архитектура системы управления интеллектуальным агентом на основе семиотической сети. // Открытое образование, 2018, №22(5), с. 84-93. https://doi.org/https://doi.org/10.21686/1818-4243-2018-5-84-93
    25. Торопова К.А., Трошев Д.В., Ивашкина О.И., Анохин К.В. (2018). Активация экспрессии c-Fos в ретросплениальной коре, но не гиппокампе, сопровождает формирование ассоциации между обстановкой и безусловным стимулом и ее последующее извлечение у мышей. Журнал высшей нервной деятельности, 68(6), 756-770.

    Дополнительные материалы, 2019
  • Поиск с Яндексом  
    Лаборатория "Робототехника", ФНБИК МФТИ, МИЭМ НИУ ВШЭ, МГТУ им. Н.Э. Баумана
            e-mail: user@robofob.ru