🤖 Mistral Medium 3.5 — 128B в одиночестве своей весовой категории.

Mistral выкатили новую мультимодальную dense-модель на 128B параметров с контекстом 256k токенов. По бенчмаркам обходит предыдущие модели Mistral, но до топовых открытых гигантов не дотягивает.

Главная фишка — уникальность позиции: ближайшие конкуренты в разы тяжелее. Kimi K2.5 — 1000B, GLM 5.1 — 744B, Qwen3.5 — 397B. На фоне них 128B выглядит как спорткар среди грузовиков — быстрее разгоняется, меньше жрёт.

Для локального деплоя — интересный вариант. Чтобы не тормозила, выпустили отдельную голову для спекулятивного декодинга.

За API просят $1.5/$7.5 за миллион токенов — в облаке смысла мало. Лицензия открытая, но компаниям с выручкой больше $20M/мес придётся покупать коммерческую.

MUSIN PRO | Веса на HuggingFace

#Mistral #нейросети #опенсорс #ИИ