Российские исследователи предложили новую архитектуру памяти для искусственного интеллекта, которая повторяет принципы функционирования человеческого мозга. В процессе обучения нейросети постоянно утрачивают ранее полученные данные. Такая «деменция» остается ключевым препятствием при разработке беспилотных автомобилей и пожизненных медицинских ассистентов, которым требуется непрерывно подстраиваться под меняющиеся условия. Специалисты позаимствовали один из механизмов работы мозга и воспроизвели его в виде компьютерной модели, что позволило получить у ИИ более стабильные воспоминания. По мнению экспертов, эту технологию можно будет применять при создании беспилотников, роботов и дронов.
Память ИИ, как в мозге человекаИсследователи МФТИ предложили нестандартный метод борьбы с так называемой деменцией искусственного интеллекта — типичной проблемой, при которой ИИ, осваивая новые задачи, «стирает» ранее изученную информацию. Для борьбы с ней ими разработана новая архитектура памяти, механизм которой они «подсмотрели» в мозге человека. На данный момент решение реализовано в форме компьютерной модели, а параллельно идут работы по созданию нейроморфных процессоров для физической реализации этого подхода.
— Возможно, мы нашли ответ на одну из главных загадок мозга: как он умудряется учиться новому, не стирая при этом старые «файлы». Всё дело в постоянной перестройке нейронных связей — ревайринге. Именно он превращает хрупкую кратковременную память в прочные долговременные воспоминания, — сказал ведущий научный сотрудник лаборатории нейробиоморфных технологий МФТИ Сергей Лобов.
Ученые пояснили, что нейронная сеть мозга, как и искусственная нейросеть, функционирует по принципу карты. В ходе обучения в ней остаются «следы памяти», похожие на протоптанные тропинки в лесу. Если проложить новые пути, старая тропа быстро размажется и станет незаметной. Подобное происходит и в нейросетях: при поглощении новой информации параметры сети переписываются, и прежние данные теряются. Этот эффект, когда адаптация к новым условиям делает память нестабильной, называют «катастрофическим забыванием».
Чтобы избавить ИИ от этого явления, специалисты вуза взяли за основу принцип работы человеческого мозга. В центре подхода — механизм перестройки нейронных связей, или ревайринг, который действует совместно с обычными процессами обучения, позволяя системе сохранять старую информацию и одновременно осваивать новое.
— Сначала сеть учится под воздействием внешних сигналов: связи между нейронами укрепляются, формируется кратковременная память. После этого внешний сигнал выключается и ИИ остается наедине с собой. В этот момент включается ревайринг. Система самостоятельно перестраивает структуру сети, буквально «впечатывая» этот паттерн в карту связей. Этот процесс мы назвали самоорганизованной консолидацией памяти: кратковременная память трансформируется в долговременную, закрепляясь как устойчивое структурное изменение архитектуры нейросети, — объяснил Сергей Лобов.
Для проверки эффективности новой архитектуры памяти ученые смоделировали процесс обучения и отслеживали, сколько всплесков активности нейросеть выдерживает до потери информации. Обычная сеть теряла данные уже после 1 тыс. всплесков, тогда как сеть с перестройкой связей сохраняла информацию до 170 млн всплесков.
Для чего нужна новая память в data-технологияхКак пояснил «Известиям» ведущий эксперт в области ИИ «Университета 2035» Ярослав Селиверстов, проблема забывания ИИ особенно критична для автономных роботов, которым необходимо накапливать опыт взаимодействия с объектами, и для беспилотных автомобилей, которые сталкиваются с новыми дорожными ситуациями. Это основной барьер на пути создания по-настоящему гибких и самостоятельных машин, способных эволюционировать подобно живым системам.
— Вместо того чтобы равномерно обновлять все связи нейросети при обучении, новая архитектура избирательно модифицирует только те синапсы, которые имеют слабый вес и не несут критически важной информации. Это напоминает механизм работы нашей памяти, где новые воспоминания формируются, не разрушая старые. Заявленное увеличение продолжительности хранения информации в сотни тысяч раз выглядит революционным, поскольку на несколько порядков превосходит возможности существующих аналогов, — сказал специалист.
В промышленной робототехнике такие решения позволят создавать универсальных манипуляторов, которые будут осваивать новые операции с деталями, не теряя предыдущих навыков сборки. Для беспилотных автомобилей и дронов это даст возможность постоянно адаптироваться к уникальным дорожным условиям и ландшафтам, накапливая специфический опыт без постоянного вмешательства инженеров. Перспективно также применение в персонализированных медицинских диагностических системах, которые будут эволюционировать вместе с историей болезни пациента, или в умных домах, гибко подстраивающихся под поведение жильцов, отметил Ярослав Селиверстов.
Нейросеть при обучении новой задаче иногда теряет до 90–99% точности в решении старых, рассказал эксперт рынка TechNet НТИ, гендиректор группы компаний ST IT Антон Аверьянов.
— Эксперименты на простых задачах дают практически 100%-ное сохранение старых знаний при использовании новой памяти. Однако есть опасения, связанные с тем, что сегодня ни один из биологически вдохновленных механизмов не масштабируется на современные большие языковые или мультимодальные модели размером в сотни миллиардов – триллионы параметров. Но уже в ближайшие 5–10 лет это, в теории, можно интегрировать в малые автономные дроны и рои дронов, которым необходимо работать годами без переобучения, — сказал Антон Аверьянов.
Данные о работе нейросетей сейчас активно применяются в медицине, в том числе при нейропротезировании, рассказала «Известиям» клинический психолог и руководитель программ развития МГУ им. М.В. Ломоносова Ольга Валаева. Идут работы по вмешательству в работу глубинных структур мозга при заболеваниях, таких как болезнь Паркинсона. В подобных случаях имплантируемые устройства на базе спайковых нейронных сетей способны регулировать электрическую активность отдельных участков мозга, что ведет к значительному снижению симптомов и улучшению качества жизни пациентов.
— При симуляции таких сложных функций головного мозга формирование импульсных нейронных сетей с долгосрочной памятью становится жизненно необходимым. Долгосрочная память позволяет системам запоминать и адаптироваться к новым данным, что критически важно для успешной симуляции сложных психических процессов. Эти сети могут обучаться на основе опыта, что делает их более гибкими и способными к самообучению, — сказала Ольга Валаева.
Новый подход может применяться в тех сценариях, где от ИИ требуется длительное автономное обучение. Системы с «суперпамятью» смогут постоянно адаптироваться к меняющемуся окружению. Это важно, например, для роботов-экспедиторов, умных помощников или систем безопасности, уверен генеральный директор компании ГТИ, эксперт НТИ Кирилл Раппа.