«Наша цель — стать передовым российским центром в сфере ИИ. Министерству цифрового развития совместно с ассоциацией содействия цифровому развитию, Академией наук необходимо генерировать предложения и координировать работу», — поставил задачу раис Татарстана Рустам Минниханов на очередном заседании ассоциации. Судя по тому, что накануне показывали и рассказывали в КФУ, все шансы у республики на это есть: ИИ-разработки серьезного уровня ведут самые разные компании, порой вкладывая миллионы в оборудование и технологии. О том, когда в РТ появится первая в России роботизированная больница, для чего понадобится новый ЦОД «Таттелекома» и чем лечить галлюцинации искусственного интеллекта, — в репортаже «БИЗНЕС Online».
«Цель — стать передовым российским центром в сфере ИИ»
Первое в 2025 году заседание ассоциации содействия цифровому развитию выдалось одновременно и самым масштабным за всю историю организации. В Императорском зале Казанского университета под насмешливое одобрение Александра I с монументального портрета во всю стену и внимательные взгляды доброй половины татарстанского правительства и членов IT-комитета Госдумы шел разговор о том, как превратить Татарстан в передовой центр в сфере искусственного интеллекта.
Заделы тому есть — многие были выставлены уже в коридоре на подходе к залу. Артем Лопатин из «Сотки Высоток» демонстрировал доверенную среду «Акыллы», которая содержит в себе все данные об организации и с помощью ИИ предоставляет точные ответы на основе реальных документов и отчетов. Например, какой должен быть уровень ДТП в Москве в 2024 году согласно БКАД (национальному проекту «Безопасные качественные дороги»)?
По соседству Виктор Классен в амплуа предправления ООО «ФтизисБиоМед» рассказывал об обработке с помощью ИИ медизображений. «Получено регудостоверение, все необходимые патенты. Работает система качественно, объемные медицинские испытания проведены. 13 типов патологии обнаруживает ИИ в легких, мы это все демонстрировали перед выборами Владимиру Владимировичу на Петровке. Естественно, это широко внедряется, в 30 субъектах уже активно применяется», — говорил он делегации высоких гостей во главе с раисом РТ Рустамом Миннихановым.
Ректор Университета Иннополис Александр Гасников рассказывал о программе «Математические основы искусственного интеллекта»
Ректор Университета Иннополис Александр Гасников рассказывал о программе «Математические основы искусственного интеллекта». Но это было предсказуемо. А вот ICL представила в качестве главного IT-продукта многофункциональную систему анализа текста, которая может анализировать общественное мнение, бороться с дезинформацией, помогать с персонализацией ответов, а для коммерческих организаций — выявлять утечки информации, предотвращать нарушения прав клиентов, оценивать потенциально недобросовестных плательщиков и проверять контрагентов. Актуальный проект — систему антиплагиата на татарском языке — представил КФУ. Она оснащена даже поиском перефразирования текста. Свой стенд был и у «Атома», который презентовал продвинутые системы помощи водителю.
«От внедрения технологий во многом зависит наше будущее, — давал установку Минниханов. — Как отметил президент страны Владимир Владимирович Путин, разработки в области искусственного интеллекта — необходимое условие для развития научного и технологического суверенитета нашей страны. Данные инструменты должны использоваться во всех отраслях экономики и социальной сферы, включая госуправление».
Рифкат Минниханов с удовлетворением сообщил, что 93% протокольных поручений по итогам прошлых заседаний исполнены
«Наша цель — стать передовым российским центром в сфере ИИ. Министерству цифрового развития совместно с ассоциацией содействия цифровому развитию, Академией наук необходимо генерировать предложения и координировать работу», — добавил раис РТ.
Президент Академии наук РТ – председатель совета ассоциации содействия цифровому развитию Рифкат Минниханов с удовлетворением сообщил, что 93% протокольных поручений по итогам прошлых заседаний исполнены.
И чтобы дать представление присутствующим, обозначил ключевые тренды развития ИИ к 2030 году. Так, мировой рынок ИИ достигнет $830 млрд с темпом роста более 28% в год, что повысит глобальный ВВП на $15,7 триллиона. В России внедрение ИИ добавит к ВВП 11 трлн рублей. «Вероятность создания общего искусственного интеллекта к 2030 году оценивается в 25 процентов — системы смогут решать задачи без обучения на узких данных. Сильный ИИ, понимающий эмоции и мысли человека, станет основой для человекоцентричных технологий. Они будут персонализировать обучение и автоматизировать создание контента. Ключевые отрасли внедрения — ретейл, здравоохранение, транспорт, цифровые двойники. В то же время основные угрозы связаны с криминальным использованием ИИ, такие как фейки и манипуляции, и, конечно, нарушением приватности», — широкими мазками нарисовал он ИИ-будущее. И анонсировал основные доклады, предупредив, что они будут носить «просветительски-образовательный характер». Так и было, причем почти все докладчики, не сговариваясь, демонстрировали ролики последних выступлений главы Nvidia Дженсена Хуанга, так что было полное ощущение, что он полноправный спикер.
Как и куда развивается искусственный интеллект?
Наиболее развернутый доклад был у гендиректора «Таттелекома» Айрата Нурутдинова. Он сосредоточился на основных свойствах существующих вариаций ИИ и принципах их работы, поэтому сумел за какие-то 20 минут провести ликбез для слушателей — с чем неизбежно в ближайшем будущем все будут иметь дело. Выбор спикера неслучаен: «Таттелеком» во многом благодаря ИИ стал самым экономически успешным оператором с самыми низкими тарифами на интернет. В компании научились обрабатывать 60% цифровых данных, генерировать больше 500 рекламных макетов в год, а каждый 10-й сотрудник работает с большими языковыми моделями. В общем, Нурутдинову явно было чем поделиться.
Тезисно доклад выглядел так:
Физический ИИ изменит все. Судя по исследованиям корпорации Nvidia, которая изготавливает 90% аппаратных решений для ИИ, хронология выстраивается четкая. В 2012 году начался этап распознавания — изображений, звука, текста, всего подряд. Но он оказал почти несущественное влияние на экономику, которое Нурутдинов оценил в 3%. 2017-й ознаменован рождением генеративного ИИ, а также больших языковых моделей, которые позволяют генерировать текст и знания. И все равно примерное влияние на экономику получилось не более 5–7%. В 2022 году появляется агентный ИИ, и тут рост экономики оценивается максимум в 10–20%. Наконец, к 2030-му, верит Хуанг, появится physical AI, физический искусственный интеллект, который приведет к непосредственной замене рабочих рук и кратному приросту экономики — 100%.
ИИ уже сейчас повышает производительность программистов в 2–3 раза. Модели ИИ генерируют ответы на вопросы и составляют текст, предсказывая каждое следующее слово. Качество генерации оценивается через бенчмарки, результаты которых впечатляют. Так, точность ответов на 16 тыс. вопросов по 57 академическим предметам у моделей доходит до 91% (О1 от OpenAI). Правильность ответов на 448 сложнейших экспертных вопросов в области биологии, физики и химии — до 67% (причем 65% уже показатель доктора наук). Задачи на уровне средней школы О1 решает на 85 баллов из 100, а точность генерации кода на основе текста достигает 95%.
ИИ не признается, если чего-то не знает. Проблему галлюцинаций больших языковых моделей Нурутдинов наглядно продемонстрировал на фактологическом тесте SimpleQA. Так, GPT-4o Mini в 90% случаев неверно отвечает на конкретный вопрос (какой голландский игрок забил гол в матче Нидерланды – Аргентина в 2022 году на ЧМ среди мужчин), но не признается, что не знает ответа. Топовая модель о1 дала правильный ответ в 40% случаев, ошиблась в 49% и только в 11% сообщила, что не может ответить. «Если у моделей нет каких-то знаний, они соединяют то, что знают, и отвечают неверно. Это создает очень большую проблему, усложняет задачу, поэтому фактчекинг крайне важен», — обратил внимание спикер.
ИИ понятия не имеет о реальном содержании нашей жизни. Еще одна интересная статистика: из всего объема информации, которая нас окружает, 10% — общие знания, а 60% — локальные знания, которые составляют главное содержание нашей деятельности. И если в общих знаниях ИИ неплохо ориентируется, то локальными знаниями — кто тебя окружает, где и как ты живешь, что у тебя происходит на работе — языковые модели не обладают. А у людей все наоборот: человек может иметь чуть меньше общих знаний, но локальными обладают все без исключения. И в этом принципиальное отличие. Есть еще 30% неявных знаний, но это уже из области physical AI.
«Мозг» модели сложнее мозга мухи, но нерешительнее. Большие языковые модели отличаются количеством параметров, которые могут обрабатывать, и контекстным окном. Так, у модели Llama, которая умеет анализировать и генерировать текстовую информацию, но не принимает решения, — 70 млрд параметров, а в мозгу мухи-дрозофилы, которая управляет процессами анализа сенсорных данных и принимает решения, — всего 50 млн синаптических связей. «Слава богу, что у нас такого нет, иначе все дроны станут осмысленными. Но теоретически это возможно», — предупредил Нурутдинов.
Есть три типа или три этапа развития агентного ИИ в организациях. Первый — подписка. ChatGPT, Perplexity, OpenAI — все эти решения доступны, дают широкие возможности, но у них малый размер RAG и есть опасность утечки информации — данные-то отправляются на сторону. Собственные решения безопасные, но имеют более ограниченные возможности или требуют очень дорогого оборудования и высоких требований к квалификации специалистов.
Ильдар Нургалеев напомнил, что «Таттелеком» запустил строительство собственного ЦОДа
Стоимость флагманского ускорителя — 3,5 млн рублей: зачем и на чем обучать ИИ
Вадим Яковлев, директор департамента анализа коммерческой деятельности ПАО «Таттелеком», привел более прикладные кейсы. Он предупредил, что сегодня легко выдавать за ценное то, что уже есть в открытом доступе. Так, сайт Ollama.com предлагает скачать более 160 моделей, а на Github лежит более сотни оболочек чата. Так, можно скачать сами языковые модели, поднять виртуальный сервер и… все это открывает голубой океан для псевдоэкспертов. Отсюда и размножившиеся ChatGPT в соцсетях за три копейки.
Важно вот что. Для того чтобы большая языковая модель была по-настоящему эффективна на предприятиях, ее нужно адаптировать под локальные знания. Иначе ИИ будет галлюцинировать: без дообучения модель придумает несуществующую должность Яковлеву в несуществующей компании. В самом «Таттелекоме», по словам спикера, с помощью ИИ реализована метапоисковая система, система проверки паспорта клиентов и т. д. «У нас 2 тысячи рабочих писем были загружены в систему, и теперь, когда мы задаем вопрос, какие письма направлялись в ту или иную организацию, мы получаем краткую сводку этих писем», — привел пример он. Но данные необходимо правильно подготовить, это требует глубокого изучения и больших вычислительных ресурсов.
Масштаб требуемых ресурсов как раз проиллюстрировал Ильдар Нургалеев, замгендиректора «Таттелекома». «В Татарстане в 2019 году был открыт первый суперкомпьютер, занимается обработкой больших данных на GPU V100 (ускоритель Nvidia, разработанный в 2017 году, — прим. ред.). Мы именно на этом суперкомпьютере создавали свои первые решения. А сегодня флагман — карта H100 (в 3 раза больше Cuda ядер, в 4 раза выше скорость инференса, то есть применения обученных моделей для предсказаний или выводов). Ее стоимость — 3,5 миллиона рублей, и при этом ее не очень просто найти, Рустам Нургалиевич», — передал Нургалеев ускоритель раису. Для понимания: представленная в конце февраля Илоном Маском модель Grok3 была разработана на суперкомпьютере Colossus, который содержит 200 тыс. таких ускорителей Н100. «Этот ЦОД строился только под эту модель. Это 150 МВт электрической мощности; чтобы его охлаждать, требуется примерно 5 миллионов литров воды. Объем инвестиций оценивается примерно в 8 миллиардов долларов», — подчеркнул спикер.
Нургалеев напомнил, что «Таттелеком» запустил строительство собственного ЦОДа. «Планируем развернуть специальный кластер на ускорителях вычислительной мощности В200 (еще более мощное GPU) для нужд ассоциации и Академии наук РТ в целом», — заключил он.
Первая в России роботизированная больница и виртуальный совет экспертов
Были и другие доклады. Евгений Магид, завкафедрой интеллектуальной робототехники КФУ, рассказал, что на базе медсанчасти университета будет создана первая в России роботизированная умная больница. «Чаще всего медработники сталкиваются с нерациональным использованием времени медперсонала, проблемами безопасности, и вследствие последних событий, в том числе ковида, большой проблемой является контакт между пациентами и персоналом. Мы предлагаем как решение делегировать первую часть задач роботам, а задачи безопасности — искусственному интеллекту, который обеспечит контроль доступа в помещения и видеонаблюдение», — говорил он.
Прототип робота уже создан. Он представляет собой всенаправленное устройство, которое может ехать с места в любую сторону и попадать в самые труднодоступные места клиники. А за безопасность будет отвечать система распознавания лиц и роботов, причем уже идут тесты, сможет ли устройство оперативно проехать через распахнувшуюся перед ним дверь до того, как она автоматически закроется. Магид ожидает, что первые роботы появятся в клинике уже в 2027 году. Окончание проекта намечено на 2036-й, а после успешных испытаний можно будет технологию масштабировать на поликлиники и больницы республики.
Второй проект нацелен на безопасность использования промышленных роботов. «Реальные промышленные роботы представляют для человека большую опасность. Чтобы нивелировать эту проблему, мы их запираем в клетки безопасности, куда человек не входит, и роботы работают самостоятельно. Понятно, что в идеале мы хотели бы, чтобы на заводах не было никаких людей, но, к сожалению, на текущем уровне развития технологий это невозможно», — рассуждал он.
Вывод — создавать коботов, коллаборативных роботов, работающих вместе с человеком. Магид с командой протестировал систему, в которой человек жестами управляет роботом и они вдвоем собирают маленького робота. На следующем этапе робот, управляемый движениями пальцев, совместно с человеком собирал спиннер. Почему нельзя автоматизировать этот процесс, ученый не раскрыл; видимо, подразумевается, что такой алгоритм будет использоваться на более сложных производственных процессах, полная автоматизация которых невозможна.
Поделилась своими разработками и «Татнефть». Константин Кучукбаев, руководитель центра компетенций искусственного интеллекта ПАО «Татнефть», рассказал об охвате ИИ внутренних процессов компании. «Инвестиции „Татнефти“ в аппаратное обеспечение искусственного интеллекта обоснованы. Мы ориентируемся на передовые тренды, учитываем зрелость технологий, возможности максимальной оптимизации алгоритмов и уровень подготовки наших специалистов. Наш рискориентированный подход направлен на обеспечение устойчивого развития и предотвращение финансовых потерь», — подчеркивал он, демонстрируя слайд со всем необходимым железом.
Пока один из флагманских проектов — мультиагентное насыщение виртуального совета экспертов. Т. е. с пользователем говорит не абстрактная модель, а множество экспертов — по IT, химии, физике, истории компании, разработке и добыче, охране труда и даже поиску в интернете. Если один агент не сможет ответить, он переадресует вопрос своему «коллеге», который даст правильный ответ. И никаких галлюцинаций! Это только один пример, а продуктовый портфель за год пополнился 13 решениями, некоторые из которых могут быть интересны и сторонним компаниям.
«Многие из нас в самом начале пути познания вот этих возможностей. И 98 процентов из нас будут пользователями, а не разработчиками. Мы должны быть вашими клиентами, но, прежде чем быть вашими клиентами, мы должны понимать, какие у нас есть возможности. Как мы видим, возможностей у нас много, — подвел итоги услышанному Рустам Минниханов. — Айрат (Хайруллин, министр цифрового развития РТ, — прим. ред.) нам показывал, как можно тексты готовить, как анализировать, уже наши многие госслужащие этим пользуются. Но это только начало пути. Я считаю, что нам надо консолидировать все. Мощная работа идет в „Таттелекоме“, в компании „Татнефть“, в ICL, и много таких. Нам надо консолидировать наши усилия, чтобы друг друга дополнять и не тратить деньги. Ну и перенимать лучшие практики».