ZAI запустила флагманскую модель на 754B параметров, заточенную под агентную инженерию и долгие кодинг-сессии. Не очередной чат-бот — это модель, которую имеет смысл запускать на задачи, которые занимают часы.
Цифры: — SWE-Bench Pro: 58,4 — обходит Claude Opus и GPT-5.4 — Terminal-Bench 2.0: 63,5 (в связке с Claude Code — 66,5) — CyberGym: 68,7 против 48,3 у предыдущей версии
Фишка в том, что чем дольше она работает — тем лучше результат. Сотни итераций, тысячи вызовов инструментов — модель не теряет фокус.
ZAI запустила флагманскую модель на 754B параметров, заточенную под агентную инженерию и долгие кодинг-сессии. Не очередной чат-бот — это модель, которую имеет смысл запускать на задачи, которые занимают часы.
Цифры: — SWE-Bench Pro: 58,4 — обходит Claude Opus и GPT-5.4 — Terminal-Bench 2.0: 63,5 (в связке с Claude Code — 66,5) — CyberGym: 68,7 против 48,3 у предыдущей версии
Фишка в том, что чем дольше она работает — тем лучше результат. Сотни итераций, тысячи вызовов инструментов — модель не теряет фокус.
Веса открыты на Hugging Face под MIT. Поддержка SGLang, vLLM, KTransformers.