Empero випустила нецензуровану модель Qwythos-9B — і заявила, що навчала її на даних закритої Claude Mythos

Що таке Qwythos

Qwythos-9B — це повністю файн-тюнінгована версія Qwen3.5-9B, пост-натренована на понад 500 мільйонах токенів із chain-of-thought трейсами, які Empero генерувала власним інструментом rethink. Головні технічні характеристики:

Контекстне вікно 1 048 576 токенів (~1M) — завдяки YaRN rope-scaling із коефіцієнтом ×4 відносно нативної архітектури. Одне з найдовших вікон серед відкритих 9B-моделей, що дозволяє тримати в контексті цілі кодові бази, десятки наукових статей або довгі агентні сесії.
Нативний function calling за специфікацією Qwen3.5 — без додаткового файн-тюнінгу під інструменти.
Самокорекція з інструментами — у власних тестах Empero на 7 складних промптах (математика, кібербезпека, клінічна фармакологія, біохімія) модель коректно відповіла на всі 7, використовуючи Python-executor і web search та наводячи джерела.
Бенчмарки проти базової Qwen3.5-9B: +34.3 бали MMLU, +30 gsm8k-strict, +19 gsm8k-flex. Втім, на gpqa_diamond модель показала −5 балів відносно бази — що важливо не замовчувати.

Для роботи з повним 1M-контекстом потрібна розподілена інфраструктура: один H100/H200 впевнено тримає 256k–512k токенів, але мільйон вимагає tensor-parallel multi-GPU або агресивного KV-cache offload.

Головна суперечність — дані Claude Mythos

Empero відкрито заявляє, що модель «пост-натренована на трейсах Claude Mythos і Claude Fable». Тут є принципова проблема.

Claude Mythos — це закрита frontier-модель Anthropic, яка не виходила у відкритий доступ. Anthropic не публікувала ні модель, ні датасети на її основі. Це означає, що Empero, найімовірніше, отримала «трейси» одним із двох способів: або через масову генерацію синтетичних даних через API (тобто фактично дистиляцію закритої моделі), або через якийсь несанкціонований доступ.

Перший варіант — пряме порушення Terms of Service Anthropic, які забороняють використовувати відповіді моделей для навчання конкуруючих систем. Саме через це OpenAI подавала позов проти компаній, що займались дистиляцією GPT-4. Empero поки що не прокоментувала, яким саме чином отримала ці дані.

«Intentionally uncensored» — для кого і навіщо

Empero позиціонує відсутність обмежень як ключову перевагу для дослідників і розробників, що працюють у кібербезпеці, біомедицині та фармакології — тобто в областях, де «надмірно вирівняні» моделі часто відмовляють або видають беззмістовні disclaimers замість реальної відповіді.

Це реальна проблема: надмірна цензура в AI-моделях дійсно обмежує їхню корисність для легітимних завдань — пентестерів, медичних дослідників, токсикологів. Але повна відсутність будь-яких обмежень — це вже інший полюс із власними ризиками, особливо якщо модель доступна для завантаження будь-ким без верифікації.

Де доступна

Qwythos-9B вже доступна на HuggingFace під повністю відкритою ліцензією без обмежень на комерційне використання. Harness для відтворення тестів на tool use Empero обіцяє опублікувати на GitHub.

Empero випустила нецензуровану модель Qwythos-9B — і заявила, що навчала її на даних закритої Claude Mythos

Відadmin

Що таке Qwythos

Головна суперечність — дані Claude Mythos

«Intentionally uncensored» — для кого і навіщо

Де доступна

Від admin

Пов’язаний запис

Спецслужби росії намагаються отруїти дані штучного інтелекту та Google за допомогою фейкових «Вікіпедій»

У Раді готують нові штрафи за перевищення швидкості: до 17 000 грн для системних порушників

Тестувальник IT-компанії замовив канабіс через Telegram і отримав штраф 17 000 грн

Залишити відповідь Скасувати коментар

Ви пропустили

Спецслужби росії намагаються отруїти дані штучного інтелекту та Google за допомогою фейкових «Вікіпедій»

Притула Діти: биография, личная жизнь и творческий путь

У Раді готують нові штрафи за перевищення швидкості: до 17 000 грн для системних порушників

Тестувальник IT-компанії замовив канабіс через Telegram і отримав штраф 17 000 грн