🤖 Китайская open-source модель вышла на уровень GPT-5.4 и Claude Opus 4.6

Z.ai выложила GLM-5.1 — open-source модель, которая на бенчмарке SWE-Bench Pro набрала 54.9.

Для сравнения: GPT-5.4 — 58.0, Claude Opus 4.6 — 57.5. Цифры близкие, и это самоотчёт Z.ai без независимой верификации. На комплексных кодинг-тестах Claude пока впереди. Но сам факт, что open-source модель играет в одной лиге с топами — это уже событие.

Главная фишка — не бенчмарки, а длительность автономной работы. Обычные модели выдыхаются через 20-50 шагов. GLM-5.1 работает сотнями итераций. В демо она за 8 часов построила десктоп-окружение на Linux с файловым менеджером, терминалом, редактором и играми. 655 итераций без участия человека.

Теперь нюансы. Модель — 754 млрд параметров (активных 40 млрд). Весит она соответственно. На ноутбук не скачаешь, для локального запуска нужен кластер из 8 GPU.

Так что «open-source и бесплатная» — это про лицензию (MIT), а не про доступность. Для большинства людей это всё равно означает API через провайдера: $1.40 за миллион входных токенов, $4.40 за выходные. Дешевле аналогов, но не бесплатно.

Зато совместима с Claude Code — можно подставить как провайдера и работать в привычном окружении.

🔗 Глянуть можно тут — github.com/zai-org/GLM-5?tab=readme-ov-file

🤖 В эпоху AI