Мощная модель искусственного интеллекта, которая на прошлой неделе анонимно появилась на платформе для разработчиков, в среду была раскрыта как разработка китайского производителя смартфонов и электромобилей Xiaomi. До этого ее появление вызвало спекуляции о том, что стартап DeepSeek тайно тестирует свою систему следующего поколения в преддверии запуска.
Выход недорогих моделей DeepSeek-V3 и R1 в прошлом году спровоцировал глобальную распродажу технологических акций, заставив инвесторов усомниться в том, что американским ИИ-компаниям действительно необходимо тратить миллиарды долларов на вычислительные мощности. С тех пор рынок с большим интересом ожидает DeepSeek-V4, модель следующего поколения, которая пока не была представлена.
Загадочная бесплатная модель под названием Hunter Alpha появилась 11 марта на платформе ИИ-шлюза OpenRouter без указания разработчика. Позднее платформа охарактеризовала ее как «скрытую модель».
В среду команда Xiaomi по разработке ИИ-моделей MiMo, которую возглавляет бывший исследователь DeepSeek Ло Фули, сообщила, что Hunter Alpha представляет собой «раннюю внутреннюю тестовую сборку MiMo-V2-Pro» — флагманской модели, задуманной как «мозг» ИИ-агентов. Речь идет об инструментах, позволяющих пользователям выполнять сложные задачи с меньшим количеством подсказок и контроля со стороны человека по сравнению с обычным чат-ботом.
Новая модель Xiaomi выходит в момент, когда OpenClaw, фреймворк для агентов с открытым исходным кодом, быстро набирает популярность среди самых разных пользователей в Китае.
«Я называю это тихой засадой — не потому, что мы это планировали, а потому, что переход от парадигмы чат-ботов к парадигме агентов произошел так быстро, что даже нам самим в это едва верилось», — написала Ло в X в четверг.
«Люди спрашивают, почему мы движемся так быстро. Я видела это изнутри, когда участвовала в создании DeepSeek R1», — добавила она.
По словам Xiaomi, MiMo-V2-Pro будет работать в партнерстве с пятью крупными агентными фреймворками, включая OpenClaw, и предоставит разработчикам по всему миру неделю бесплатного доступа.
Акции Xiaomi, торгующиеся в Гонконге, в четверг подскакивали на 5,8%.
Таинственная китайская модель
Во время проведенных Reuters на прошлой неделе тестов чат-бот Hunter Alpha описывал себя как «китайскую ИИ-модель, обученную преимущественно на китайском языке» и заявлял, что его данные охватывают период до мая 2025 года — такой же предел знаний ранее указывался и у чат-бота DeepSeek.
Однако на вопрос о создателе система отказалась называть разработчика.
«Я знаю только свое имя, масштаб параметров и длину контекстного окна», — ответил чат-бот.
На странице профиля Hunter Alpha говорится, что это модель с 1 трлн параметров, то есть она была обучена с использованием примерно триллиона настраиваемых значений, определяющих обработку языка и генерацию ответов.
Система также заявляет о контекстном окне до 1 млн токенов — это показатель объема текста, который ИИ-модель может обработать или удерживать в памяти в рамках одного взаимодействия. Один токен примерно соответствует короткому фрагменту текста, например части слова.
«Выделялась комбинация из контекстного окна на 1 млн токенов, способности к рассуждению и бесплатного доступа», — отметил инженер Набиль Хауам, занимающийся созданием ИИ-агентных систем.
«Большинство передовых моделей с таким контекстным окном стоят заметных денег при масштабном использовании», — добавил он.
Эти характеристики напоминали ожидания, описанные в местных СМИ, относительно модели DeepSeek V4 следующего поколения, запуск которой, по данным китайских изданий, может состояться уже в апреле.
Умур Озкул, который проводит независимые бенчмарки ИИ-моделей, заявил, что предположения о связи этой системы с DeepSeek были вполне понятны, учитывая время ее появления и заявленные возможности.
Скрытое тестирование
Запуски скрытых моделей не являются редкостью, поскольку платформы вроде OpenRouter позволяют разработчикам отправлять запросы десяткам ИИ-моделей через единый интерфейс. Это делает их популярной площадкой для тестирования новых систем.
В феврале на OpenRouter появилась анонимная модель Pony Alpha, а спустя пять дней китайская компания Zhipu AI подтвердила, что она является частью ее системы GLM-5.
Уведомление на странице Hunter Alpha предупреждало, что все запросы и ответы модели «записываются поставщиком и могут использоваться для улучшения модели», что подчеркивает распространенную в отрасли практику использования скрытых запусков для получения непредвзятой обратной связи.
По данным MiMo, после появления на платформе модель быстро набрала популярность, превысив 1 трлн токенов по совокупному использованию и возглавив рейтинги OpenRouter.