11 березня на ШІ-платформі OpenRouter з’явилася безплатна модель під назвою Hunter Alpha без жодної інформації про розробника. Пізніше платформа схарактеризувала її як приховану модель, пише Reuters.

Читайте также: Стартував прийом заявок на премію «Вчасно.Кращі» для цифрових бізнес-кейсів

Під час тестів, проведених агентством Reuters, чат-бот Hunter Alpha назвав себе «китайською моделлю ШІ, переважно навченою китайською мовою» та зазначив, що його навчальні дані актуальні станом на травень 2025 року, що збігається з показниками моделі DeepSeek. 

При цьому система ухилилася від прямої відповіді на питання про розробника. «Мені відомі лише моє ім’я, кількість параметрів та розмір контекстного вікна», — заявив бот».

Ані DeepSeek, ані OpenRouter не назвали творця моделі й не відповіли на запити про коментарі. На сторінці профілю Hunter Alpha описується як модель з 1 трлн параметрів. Це означає, що вона була навчена з використанням приблизно одного трильйона регульованих значень, які визначають, як система обробляє мову та генерує відповіді. Моделі з більшою кількістю параметрів зазвичай потребують значно більше обчислювальних потужностей для роботи. Система також заявляє про контекстне вікно розміром до одного мільйона токенів.

«Поєднанням, яке вразило найбільше, стали контекст Hunter Alpha в 1 мільйон токенів у парі зі здатністю до міркування та безплатним доступом», — зазначив Набіль Хауам, інженер, який розробляє системи ШІ-агентів. — «Більшість передових моделей із таким контекстним вікном коштують чимало при масштабуванні».

Ці характеристики збігаються з очікуваннями місцевих ЗМІ щодо моделі DeepSeek наступного покоління — V4, реліз якої, за даними китайських видань, може відбутися вже у квітні. DeepSeek, як і багато її китайських конкурентів, має солідне фінансування, хоча й вирізняється нетиповою структурою: її материнською компанією є кількісний хедж-фонд, а не технологічний конгломерат.

Хоча такі збіги не доводять прямого зв’язку, вони посилили припущення серед розробників, що анонімна система може бути ранньою тестовою версією майбутнього релізу DeepSeek.

«Найбільше модель видає характерний ланцюжок міркувань», — пояснює ШІ-інженер Деніел Дьюхерст, наголошуючи на специфічній логіці відповідей бота. — «Стиль міркування важко приховати, і він зазвичай відображає те, як саме навчалася модель».

Читайте также: Українські дрони Pegasus Arms модифікують німецькими розвідувальними системами Rohde & Schwarz

Масштаб і обсяг пам’яті Hunter Alpha також відповідають характеристикам DeepSeek V4. Проте деякі розробники застерігають, що докази зв’язку моделі з DeepSeek залишаються непереконливими.

«Мій аналіз свідчить про те, що Hunter Alpha, найімовірніше, не є DeepSeek V4», — зазначив Умур Озкул, який проводить незалежні бенчмарк-тести ШІ, посилаючись на відмінності в роботі з токенами та архітектурних патернах порівняно з наявними системами DeepSeek.

Він зазначив, що припущення про зв’язок моделі з DeepSeek цілком зрозумілі, враховуючи час її появи та заявлені можливості.

Анонімні запуски моделей не є рідкістю, оскільки такі платформи, як OpenRouter, дозволяють розробникам надсилати запити до десятків моделей ШІ через єдиний інтерфейс, що робить їх популярним полігоном для випробування нових систем.

Наприклад, анонімна модель під назвою Pony Alpha з’явилася на OpenRouter у лютому, а вже за п’ять днів китайська компанія Zhipu AI підтвердила, що та була частиною її системи GLM-5.

У профілі Hunter Alpha зазначено, що всі промпти та відповіді моделі «реєструються провайдером і можуть бути використані для її вдосконалення». Це підкреслює поширену в індустрії практику використання прихованих запусків для отримання неупередженого зворотного зв’язку. 

Читайте также: «Які часи – такі й співбесіди». Team Lead виявив, що під час інтерв’ю троє з семи кандидатів на Software Engineer використовували ШІ. Чи вбачають айтівці в цьому проблему — дискусія в LinkedIn

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *