🤖 Китайцы выпустили GLM-5.1 — и это серьёзно.

ZAI запустила флагманскую модель на 754B параметров, заточенную под агентную инженерию и долгие кодинг-сессии. Не очередной чат-бот — это модель, которую имеет смысл запускать на задачи, которые занимают часы.

Цифры:
— SWE-Bench Pro: 58,4 — обходит Claude Opus и GPT-5.4
— Terminal-Bench 2.0: 63,5 (в связке с Claude Code — 66,5)
— CyberGym: 68,7 против 48,3 у предыдущей версии

Фишка в том, что чем дольше она работает — тем лучше результат. Сотни итераций, тысячи вызовов инструментов — модель не теряет фокус.

Веса открыты на Hugging Face под MIT. Подробности в блоге ZAI, попробовать можно на chat.z.ai.

MUSIN PRO

#ИИ #GLM #агенты #кодинг