GigaChat 2.0 от «Сбера» стал доступен 14 апреля в базовой и расширенной версиях. Разработчики ИИ-бота отметили, что в 2.0 существенно повысился уровень всех навыков модели благодаря новому подходу к обучению. В частности, искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объем текста и распознавать изображения. Отдельно отмечается, что все возможности GigaChat доступны в одном продукте и на любом совместимом устройстве — таким образом пользователю не нужно переключаться между разными сервисами.
В пресс-службе MAX «Известиям» сообщили, что одной из первых площадок, где появился GigaChat 2.0, стала российская цифровая платформа МАХ от VK. Это приложение со встроенным мессенджером, мини-аппами, конструкторами чат-ботов, системой онлайн-записи и платежным сервисом. С помощью нейросетевого помощника пользователи МАХ могут писать тексты — ИИ-бот, например, поможет придумать поздравление или ответ на любое сообщение. Также он способен создавать изображения: от аватарки до открытки на день рождения, умеет расшифровывать длинные аудиосообщения и предоставляет варианты ответа на них, позволяет получать краткие пересказы видео, статей и ответов на многие вопросы.
В модельный ряд для бизнеса вошли две API-версии на выбор пользователя — GigaChat 2 Pro и GigaChat 2 MAX.
— Наш сервис сделал важный шаг вперед как с точки зрения технологий, так и пользовательского опыта. В новой версии мы существенно расширили функциональность и улучшили качество. Безусловно, мы ожидаем роста аудитории и стремимся сделать GigaChat ИИ-платформой первого выбора у пользователей, — заявил CPO GigaСhat B2C Антон Горшков.
Бот поддерживает в одном диалоге работу с несколькими файлами, в том числе в чат можно загрузить документ объемом до 200 страниц текста формата А4. Он умеет работать с актуальными данными из интернета в реальном времени, глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. ИИ найдет информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками — по ним можно будет перейти, если пользователю понадобится дополнительная информация. В числе прочего может проанализировать любую картинку, например квитанцию ЖКХ, и объяснить, за что и сколько платит пользователь.
GigaChat 2.0 также научился работать с анализом голосовых сообщений и аудиофайлов. ИИ-модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет ей точнее выделять главное и отвечать на вопросы по содержанию — достаточно приложить запись и сформулировать запрос, например: «Послушай аудиозапись и скажи, что в моих словах могло не понравиться коллеге» или «Выпиши список лекарств и рекомендаций из голосового от моего врача». Также бот поможет музыкантам для генерации как песен, так и музыки по текстовому запросу. Можно либо выбрать из существующих жанров, либо придумать микс из разных задач: например, попросить создать «трек в стиле современной молодежной поп-музыки, используя пульсирующий бас, яркие синтезаторы и плотный бит».
Нынешняя версия GigaChat хороша «механически», она подходит для рутинной работы, но с креативными задачами пока справляется не так хорошо. Впрочем, этим страдают и другие отечественные решения, полагает автор профильного Telegram-канала «Неискусственный интеллект» Илья Склюев.
— Новая версия GigaChat явно получит распространение как минимум в виде чат-бота. «Сбер» активно интегрирует в него новые фишки, включая генерацию музыки, пересказ видео и другие, делая сервис универсальным «швейцарским ножом» под любые задачи. Но ему не хватает более глубокой интеграции с российскими СМИ и площадками. Было бы крайне удобно, если бы к GigaChat «прикрутили» поиск по крупным российским медиа и интегрировали фактчекинг — сразу получился бы хороший инструмент, погруженный в российскую действительность, — считает Илья Склюев.
По словам эксперта, чат-боту также нужна работа с контекстом о пользователе, как это сейчас реализовано у ChatGPT, который может запоминать отдельные факты и использовать их при генерации ответа. Персонализация дает пользователю ощущение ценности — главное, чтобы разработчик не забыл встроить кнопку «забвения».
По мнению главы отдела исследований в области ИИ Университета 2035 Ярослава Селиверстова, MAX — это не просто мессенджер, а тест-драйв для российской цифровой экосистемы. Он предлагает интуитивно понятный интерфейс, унаследованный от «VK Мессенджера», что упрощает переход для аудитории соцсети. Платформа выделяется функционалом: отправка файлов до 4 ГБ (это вдвое больше, чем в Telegram), интеграция мини-приложений для заказа еды и оплаты счетов через СБП, поддержка анимированных стикеров и улучшенных голосовых сообщений.
— Для повседневного общения мессенджер удобен, но потенциальная интеграция с госуслугами и финансовыми операциями потребует внедрения дополнительных мер, например биометрии или аппаратных ключей. Пока пользователям стоит осторожно подходить к синхронизации чувствительных данных, включая запросы к чат-боту, — предостерег Ярослав Селиверстов.
Как отмечает преподаватель факультета игровой индустрии и киберспорта университета «Синергия» Даниил Аржаков, действующий функционал MAX вполне предсказуем и включает базовые возможности любого мессенджера: текстовые сообщения, звонки и контакты, при этом интерфейс пока избыточно дублирует информацию в разных вкладках. При этом появление GigaChat в качестве бота MAX способно сделать национальный мессенджер более привлекательным для продвинутой аудитории, которая активно пользуется функциями нейросетей и чат-ботов.
Антон Белый