Пекин, 18 марта. На платформе для разработчиков на прошлой неделе анонимно появилась мощная модель искусственного интеллекта, что спровоцировало волну предположений о возможной причастности китайского стартапа DeepSeek. По мнению части участников рынка, компания может в закрытом режиме тестировать систему следующего поколения перед официальным запуском.
Бесплатная модель под названием Hunter Alpha появилась 11 марта на платформе OpenRouter, при этом информация о разработчике указана не была. Позднее сама платформа охарактеризовала ее как «stealth model» — модель, запущенную без раскрытия происхождения.
В ходе тестов, проведенных Reuters, чат-бот Hunter Alpha сообщил, что представляет собой «китайскую ИИ-модель, обученную преимущественно на китайском языке», а его обучающие данные охватывают период до мая 2025 года. Такой же срок отсечения знаний ранее указывался и для чат-бота DeepSeek. При этом на вопрос о создателе системы модель отказалась раскрывать разработчика.
«Я знаю только свое имя, масштаб параметров и длину контекстного окна», — ответил чат-бот.
Ни DeepSeek, ни OpenRouter пока не раскрыли происхождение модели и не ответили на запросы о комментарии.
Согласно описанию на странице Hunter Alpha, речь идет о модели с 1 трлн параметров, то есть с примерно одним триллионом настраиваемых значений, определяющих, как система обрабатывает язык и формирует ответы. Как правило, модели такого масштаба требуют существенно больших вычислительных ресурсов.
Еще одна заявленная характеристика — контекстное окно до 1 млн токенов, то есть объем текста, который модель способна обрабатывать или удерживать в рамках одного взаимодействия. Токен обычно соответствует короткому фрагменту текста, например части слова.
По словам инженера Набиля Хауама, занимающегося созданием ИИ-агентов, именно сочетание контекстного окна в 1 млн токенов, способности к рассуждению и бесплатного доступа стало главным фактором, привлекшим внимание сообщества.
«Большинство передовых моделей с таким контекстным окном обходятся дорого при масштабном использовании», — отметил он.
Указанные параметры совпадают с ожиданиями, которые китайские СМИ связывают с будущей моделью DeepSeek V4. Ряд местных изданий ранее сообщал, что ее запуск может состояться уже в апреле. DeepSeek, как и многие китайские конкуренты, располагает значительным финансированием, хотя структура компании считается нетипичной: ее материнская организация — не технологический холдинг, а квантовый хедж-фонд.
Хотя само по себе совпадение характеристик не доказывает связь Hunter Alpha с DeepSeek, оно усилило спекуляции среди разработчиков о том, что анонимная система может быть ранней тестовой версией нового продукта компании.
Инженер в сфере ИИ Дэниел Дьюхерст, проанализировавший модель после ее появления, считает, что одним из наиболее заметных сигналов стал характер ее рассуждений.
«Паттерн chain-of-thought, вероятно, является самым сильным признаком. Стиль рассуждения трудно замаскировать, и он обычно отражает то, как именно обучалась модель», — сказал он.
По его оценке, масштаб Hunter Alpha и объем ее памяти также соответствуют спецификациям, которые циркулируют в отношении DeepSeek V4 с начала года.
В то же время часть специалистов призывает не делать преждевременных выводов. Так, Умур Озкул, занимающийся независимым тестированием ИИ-моделей, заявил, что имеющихся данных недостаточно, чтобы уверенно связать Hunter Alpha с DeepSeek.
«Мой анализ показывает, что Hunter Alpha, вероятно, не является DeepSeek V4», — отметил он, указав на различия в поведении, связанном с обработкой токенов, а также на архитектурные отличия по сравнению с существующими системами DeepSeek.
При этом, по его словам, интерес к такой версии событий вполне объясним с учетом времени появления модели и заявленных возможностей.