AI Journey — на ПМЭФ-2023: эксперты рассказали о трендах и технологиях в области искусственного интеллекта и машинного обучения

В ходе сессии «AI Journey: путешествие в мир искусственного интеллекта» на ПМЭФ-2023 спикеры Сбера, Института искусственного интеллекта AIRI и Сколтеха рассказали о последних трендах в области AI/ML, применении технологий искусственного интеллекта (ИИ) в жизни, а также о пути к общему ИИ (AGI).

Семён Будённый, к. ф.-м. н., управляющий директор, начальник Управления развития перспективных технологий AI Сбера, руководитель группы «Дизайн новых материалов» Института AIRI, рассказал аудитории, как использовать генеративный ИИ для поиска новых функциональных материалов. Он отметил, что с момента синтеза нового функционального материала до внедрения его в промышленность может пройти до 20 лет. Поэтому сейчас крайне важно совершенствовать существующие производственные технологии и подходы к синтезу материалов за счёт применения генеративного ИИ. В своём выступлении Семён рассказал о цикле поиска и использования ИИ для открытия новых материалов, привёл реальные примеры применения возможностей нейросетей в таких областях, как электрокатализаторы, солнечная энергетика, экзотические кристаллы. Результаты работы Института AIRI в этом направлении опубликованы в одних из ведущих мировых научных журналов. Также спикер упомянул о самой большой базе данных по квантовой химии — nablaDFT, — разработанной Институтом AIRI. В конце отметил важность энергоэффективных подходов к обучению больших моделей ИИ.

Денис Димитров, исполнительный директор по исследованию данных Сбера, в своём выступлении отметил, что путь к AGI лежит через использование фундаментальных и мультимодальных моделей. В качестве примера он привёл нейросеть Kandinsky 2.1, рассказал о принципах работы, архитектуре и функционале модели, о планах по её развитию. Kandinsky 2.1 способна создавать уникальные изображения по текстовому запросу. Модель всего за четыре дня набрала один миллион уникальных пользователей, что стало быстрее показателя ChatGPT. Сегодня Kandinsky 2.1 имеет более 68 млн запросов более чем от 5 млн пользователей. Модель унаследовала веса предыдущей версии, обученной на один миллиард пар «текст — изображение», и была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. Такие параметры позволяют модели оставаться в топе лучших открытых сетей для генерации изображений.

Ольга Кардымон, научный сотрудник, руководитель группы «Биоинформатика» Института AIRI, в ходе выступления рассказала о нейросетевой модели GENA-LM, обученной на полной сборке генома человека. Так, геном человека состоит из 3,3 млрд пар оснований, но только 1,5% последовательности генома кодирует белки. В некодирующей белки области расположены различные функциональные элементы, регулирующие работу наших генов. Для определения этих элементов генома существуют различные генетические подходы. Однако все они время- и финансово затратны. Последние несколько лет в работе с последовательностью ДНК стали использовать методы обработки естественного языка (NLP). Они показали высокую эффективность, но в открытом доступе была только одна языковая модель ДНК. Ольга представила обзор на разработанное Институтом AIRI семейство моделей GENA-LM, провела сравнительный анализ его архитектуры с DNA-Bert и сравнение на валидационных задачах, а также рассказала о дальнейших планах развития.

Александр Панов, доцент, ведущий научный сотрудник Института AIRI, рассказал, что дальнейшее развитие робототехники невозможно без использования интеллектуальных систем, в том числе больших языковых моделей. По его мнению, во многих приложениях системы управления роботами сильно ограниченны, и ручное программирование уже не способствует повышению автономности. Большие языковые модели стремительно развивались в последние годы: от BERT к GPT-4. В ходе выступления Александр Панов рассказал о применении больших языковых моделей в задачах по навигации в помещениях и манипуляции объектами, а также об опыте с экспериментальной установкой, собранной в AIRI для тестирования предобученных больших языковых моделей для задачи перестановки объектов.

Евгений Бурнаев, профессор, ведущий научный сотрудник Института AIRI, руководитель Центра прикладного ИИ Сколтеха, посвятил выступление применению методов ИИ для решения задач устойчивого развития. Глобальные климатические изменения вследствие антропогенных факторов требуют реализации энергоперехода. ИИ — это естественный инструмент оценки ESG-рисков, которые позволяют проверить соответствие траектории энергоперехода принципам устойчивого развития. В докладе Евгения проведена классификация эффективно решаемых с помощью ИИ инженерных задач, а также представлены примеры уже реализованных проектов. В частности, применение ИИ необходимо для мониторинга и сбора данных, построения предиктивных моделей оценки ESG-рисков и оптимизации управленческих решений для их снижения. Евгений привёл примеры использования ИИ в индустриальных проектах, таких как моделирование вероятности чрезвычайных ситуаций, прогнозирование ледовой обстановки в Арктике, обнаружение источников загрязнения и снижение экологических рисков. Докладчик рассказал о принципе работы физически информированных нейросетей, об их архитектуре, функционале, особенностях и применении на примере моделирования распространения загрязнений.

AI Journey — ежегодная конференция Сбера для обсуждения вопросов развития технологий искусственного интеллекта и машинного обучения. В 2022 конференция набрала более 55 млн просмотров, второй год подряд став одним из крупнейших профильных событий. Её смотрели из более чем 190 стран мира, а на мероприятии выступили более 150 спикеров из 50 научных и бизнес-организаций. С 2020 года Сбер, в рамках конференции, проводит отдельный трек для школьников — AIJ Junior.