
🤖 Mistral Medium 3.5 — 128B в одиночестве своей весовой категории.
Mistral выкатили новую мультимодальную dense-модель на 128B параметров с контекстом 256k токенов. По бенчмаркам обходит предыдущие модели Mistral, но до топовых открытых гигантов не дотягивает.
Главная фишка — уникальность позиции: ближайшие конкуренты в разы тяжелее. Kimi K2.5 — 1000B, GLM 5.1 — 744B, Qwen3.5 — 397B. На фоне них 128B выглядит как спорткар среди грузовиков — быстрее разгоняется, меньше жрёт.
Для локального деплоя — интересный вариант. Чтобы не тормозила, выпустили отдельную голову для спекулятивного декодинга.
За API просят $1.5/$7.5 за миллион токенов — в облаке смысла мало. Лицензия открытая, но компаниям с выручкой больше $20M/мес придётся покупать коммерческую.
MUSIN PRO | Веса на HuggingFace
#Mistral #нейросети #опенсорс #ИИ
Комментарии
0Комментариев пока нет.
Войдите, чтобы участвовать в обсуждении.