Опенсорсная моделька рефакторит легаси 13 часов автономно 🤌

Опенсорсная моделька рефакторит легаси 13 часов автономно 🤌

Moonshot AI дропнули в опенсорс Kimi K2.6.

Чего интересного в этом релизе:

1️⃣ Long-Horizon Execution
В блогпосте описали показательных кейса. Первый: модель заставили оптимизировать инференс локального Qwen на маке. K2.6 сделал 4000+ вызовов тулзов за 12 часов и переписал бэкенд на Zig (Zig, Карл!), подняв пропускную способность на 20% выше, чем у LM Studio.
Второй: рефакторинг 8-летнего финансового движка exchange-core. Моделька 13 часов автономно анализировала флеймграфы CPU и аллокации памяти, сделала больше 1000 вызовов тулзов, переписала 4000 строк кода и изменила топологию потоков. Итог: пропускная способность выросла на 185%.

2️⃣ Agent Swarms на стероидах
Архитектура теперь горизонтально масштабируется до 300 саб-агентов, которые могут параллельно выполнять до 4000 шагов. Они сами декомпозируют задачу.

3️⃣ Proactive Agents
Внутренняя команда RL-инфры Moonshot оставила агента на базе K2.6 на 5 дней автономно менеджить мониторинг, реагировать на инциденты и править систему. Без участия кожаных мешков. DevOps-инженеры, как дела?

🛠 Модель бьет GPT-5.4 (в режиме xhigh) и Claude Opus 4.6 (max effort) на SWE-Bench Pro и HLE (Humanity's Last Exam).
Контекстное окно — 262k токенов.
Есть нативная INT4 квантизация, заводится через vLLM, SGLang или KTransformers.

Веса доступны на HF: huggingface.co/moonshotai/Kimi-K2.6

Комментарии