Таинственная ИИ-модель оказалась разработкой Xiaomi, хотя ранее ее подозревали в связи с DeepSeek V4

Мощная модель искусственного интеллекта, которая на прошлой неделе анонимно появилась на платформе для разработчиков, в среду была раскрыта как разработка китайского производителя смартфонов и электромобилей Xiaomi. До этого ее появление вызвало спекуляции о том, что стартап DeepSeek тайно тестирует свою систему следующего поколения в преддверии запуска.

Выход недорогих моделей DeepSeek-V3 и R1 в прошлом году спровоцировал глобальную распродажу технологических акций, заставив инвесторов усомниться в том, что американским ИИ-компаниям действительно необходимо тратить миллиарды долларов на вычислительные мощности. С тех пор рынок с большим интересом ожидает DeepSeek-V4, модель следующего поколения, которая пока не была представлена.

Загадочная бесплатная модель под названием Hunter Alpha появилась 11 марта на платформе ИИ-шлюза OpenRouter без указания разработчика. Позднее платформа охарактеризовала ее как «скрытую модель».

В среду команда Xiaomi по разработке ИИ-моделей MiMo, которую возглавляет бывший исследователь DeepSeek Ло Фули, сообщила, что Hunter Alpha представляет собой «раннюю внутреннюю тестовую сборку MiMo-V2-Pro» — флагманской модели, задуманной как «мозг» ИИ-агентов. Речь идет об инструментах, позволяющих пользователям выполнять сложные задачи с меньшим количеством подсказок и контроля со стороны человека по сравнению с обычным чат-ботом.

Новая модель Xiaomi выходит в момент, когда OpenClaw, фреймворк для агентов с открытым исходным кодом, быстро набирает популярность среди самых разных пользователей в Китае.

«Я называю это тихой засадой — не потому, что мы это планировали, а потому, что переход от парадигмы чат-ботов к парадигме агентов произошел так быстро, что даже нам самим в это едва верилось», — написала Ло в X в четверг.

«Люди спрашивают, почему мы движемся так быстро. Я видела это изнутри, когда участвовала в создании DeepSeek R1», — добавила она.

По словам Xiaomi, MiMo-V2-Pro будет работать в партнерстве с пятью крупными агентными фреймворками, включая OpenClaw, и предоставит разработчикам по всему миру неделю бесплатного доступа.

Акции Xiaomi, торгующиеся в Гонконге, в четверг подскакивали на 5,8%.

Таинственная китайская модель

Во время проведенных Reuters на прошлой неделе тестов чат-бот Hunter Alpha описывал себя как «китайскую ИИ-модель, обученную преимущественно на китайском языке» и заявлял, что его данные охватывают период до мая 2025 года — такой же предел знаний ранее указывался и у чат-бота DeepSeek.

Однако на вопрос о создателе система отказалась называть разработчика.

«Я знаю только свое имя, масштаб параметров и длину контекстного окна», — ответил чат-бот.

На странице профиля Hunter Alpha говорится, что это модель с 1 трлн параметров, то есть она была обучена с использованием примерно триллиона настраиваемых значений, определяющих обработку языка и генерацию ответов.

Система также заявляет о контекстном окне до 1 млн токенов — это показатель объема текста, который ИИ-модель может обработать или удерживать в памяти в рамках одного взаимодействия. Один токен примерно соответствует короткому фрагменту текста, например части слова.

«Выделялась комбинация из контекстного окна на 1 млн токенов, способности к рассуждению и бесплатного доступа», — отметил инженер Набиль Хауам, занимающийся созданием ИИ-агентных систем.

«Большинство передовых моделей с таким контекстным окном стоят заметных денег при масштабном использовании», — добавил он.

Эти характеристики напоминали ожидания, описанные в местных СМИ, относительно модели DeepSeek V4 следующего поколения, запуск которой, по данным китайских изданий, может состояться уже в апреле.

Умур Озкул, который проводит независимые бенчмарки ИИ-моделей, заявил, что предположения о связи этой системы с DeepSeek были вполне понятны, учитывая время ее появления и заявленные возможности.

Скрытое тестирование

Запуски скрытых моделей не являются редкостью, поскольку платформы вроде OpenRouter позволяют разработчикам отправлять запросы десяткам ИИ-моделей через единый интерфейс. Это делает их популярной площадкой для тестирования новых систем.

В феврале на OpenRouter появилась анонимная модель Pony Alpha, а спустя пять дней китайская компания Zhipu AI подтвердила, что она является частью ее системы GLM-5.

Уведомление на странице Hunter Alpha предупреждало, что все запросы и ответы модели «записываются поставщиком и могут использоваться для улучшения модели», что подчеркивает распространенную в отрасли практику использования скрытых запусков для получения непредвзятой обратной связи.

По данным MiMo, после появления на платформе модель быстро набрала популярность, превысив 1 трлн токенов по совокупному использованию и возглавив рейтинги OpenRouter.