Новая image-модель от Alibaba. Главная фишка — текст внутри картинки на разных языках. Та самая боль, на которой ломаются почти все генераторы.
Инфографика, постеры, рекламные креативы, интерфейсы — всё это требует читаемого текста прямо на изображении. Большинство моделей здесь до сих пор выдают кашу. Qwen целенаправленно это фиксят.
В рейтинге Text-to-Image на Arena — #9 место. Выше flux-2-max и grok-imagine, ниже GPT-image-2, который пока недосягаем.
Новая image-модель от Alibaba. Главная фишка — текст внутри картинки на разных языках. Та самая боль, на которой ломаются почти все генераторы.
Инфографика, постеры, рекламные креативы, интерфейсы — всё это требует читаемого текста прямо на изображении. Большинство моделей здесь до сих пор выдают кашу. Qwen целенаправленно это фиксят.
В рейтинге Text-to-Image на Arena — #9 место. Выше flux-2-max и grok-imagine, ниже GPT-image-2, который пока недосягаем.
Alibaba выкатили Qwen3.6-27B. И эта моделька уничтожает их предыдущего опенсорс-монстра Qwen3.5-397B-A17B по всем бенчмаркам агентского программирования. Модель, которая суммарно меньше в 15 раз, выбивает 77.2 на SWE-bench Verified (против 76.2 у 397B) и 59.3 на Terminal-Bench 2.0.
Что по фичам: ▫️ Под капотом осталась нативная мультимодальность (понимает картинки и видео) ▫️ Поддерживает как thinking, так и non-thinking режимы ▫️ Их API теперь поддерживает протокол Anthropic.
Последний пункт означает, что вы можете прямо сейчас прокинуть ANTHROPIC_BASE_URL на их эндпоинт и использовать Qwen3.6-27B под капотом утилиты Claude Code в терминале. Либо засунуть в OpenClaw / Qwen Code и получить полноценного coding-агента.
Google выпустил Gemma 4 — семейство из четырёх открытых моделей. Главное что все модели опенсорсные. Можно скачать себе на комп.
При чём есть даже версии для смартфонов. Не понятно пока зачем такие модели нужны, ведь версии для смартфонов сильно урезанные, это даже не Яндекс GPT.
Я загрузил себе на ноут Gemma4: 26b, которая умнее и быстрее Qwen 3.5 9b Которую я скачивал ранее. Скачать можно через Ollama.
В общем, помимо топовых и дорогих моделей, развиваются открытые модели, которыми можно пользоваться бесплатно и без интернета на своём ноуте и даже телефоне ого 🔥
Alibaba тихо выкатила Qwen 3.6 Plusи раздаёт его бесплатно
Без громких анонсов, просто новая модель появилась на OpenRouter 30 марта — и за два дня через неё прогнали больше 400 миллионов токенов.
Что внутри:
⏺контекст на 1 миллион токенов, до 65 536 токенов на выходе ⏺chain-of-thought включён по умолчанию, отключить нельзя. Модель думает на каждый запрос ⏺нативный function calling и tool use
Главный фокус — агентское кодирование. Qwen 3.6 не просто дописывает функции, а умеет планировать задачи, дебажить собственный код и вызывать внешние инструменты. По заявлению разработчиков, она стабильнее и точнее предыдущей 3.5, которая грешила «передумыванием» на простых задачах.
Конкретных независимых бенчмарков пока нет. Alibaba говорит, что результаты «на уровне или выше ведущих моделей». Сообщество только начинает тестировать — но первые отзывы позитивные: быстрее, экономнее по токенам, меньше ломает tool calls в многошаговых сценариях.
⚡️ ИИ-модель Qwen 3.5-Omni пишет код по видеогайдам
Alibaba выпустила Qwen 3.5-Omni - новую версию мультимодальной LLM. Нейросеть умеет одновременно обрабатывать текстовые, графические, аудио- и видеоданные.
Главное отличие Qwen 3.5-Omni - 256 тысяч токенов контекстного окна. Благодаря этому ИИ способен разом обработать более 10 часов аудио или примерно 400 секунд видео в разрешении 720p. Распознавание речи охватывает 113 языков и диалектов. Модель была обучена на более чем 100 миллионах часов аудио- и видеоданных.
Модель «смотрит» запись экрана с аудиоинструкциями и пишет по этим данным работающий код без текстовых подсказок.
⁉️ Эта способность возникла случайно без тренировок)
Анализирует ваше железо прямо в браузере и говорит, какие локальные LLM (нейронки) вы сможете запустить на своей машине.
Пишет что Qwen 3.5 9B для моего ноута это "Tight fit", то есть еле запустится. Но у меня работает нормально.
В общем, всё что отмечено зелёным и жёлтым, можно пробовать. А вот большинство доступных, бесплатных моделей, по иронии — не доступны большинству людям, потому что требуют мощных видеокарт. 💳
Представлен Arduino Ventuno Q с мощным процессором и графическим процессором, а также производительностью искусственного интеллекта 40 TOPS
▶️ В прошлом году Qualcomm приобрела Arduino, компанию, известную своими наборами микроконтроллеров и одноплатных компьютеров (SBC) для самостоятельной сборки. Первым продуктом стал Uno Q, достаточно мощный, чтобы запускать Linux. Теперь компания выпускает гораздо более функциональное устройство, предназначенное для применения в сфере искусственного интеллекта, робототехники, безопасности, образования и научных исследований.
▶️ Uno Q был оснащен четырехъядерным процессором Cortex-A53 и графическим процессором Adreno 702 с общим объемом оперативной памяти 4 ГБ. На центральном и графическом процессорах можно было выполнять несложные задачи искусственного интеллекта.
▶️ Новый Arduino Ventuno Q — совсем другое дело. Во-первых, он работает на чипсете Dragonwing IQ-8275 (PDF). Он оснащен 8-ядерным процессором Kryo (2 ядра Gold Prime с тактовой частотой 2,35 ГГц + 2 ядра Gold с тактовой частотой 2,1 ГГц + 4 ядра Silver с тактовой частотой 1,95 ГГц) и видеопроцессором Adreno 623. По этим параметрам он близок к Snapdragon 765G. Ventuno Q оснащен оперативной памятью до 16 ГБ и накопителем eMMC до 64 ГБ, а также разъемом M.2 NVMe Gen 4 для твердотельных накопителей.
▶️ Более того, чип Dragonwing обеспечивает производительность искусственного интеллекта на уровне 40 тераопераций в секунду — это сопоставимо с Intel Panther Lake (50 тераопераций в секунду) и вдвое меньше, чем у премиальных чипов Snapdragon X2 Elite (80 тераопераций в секунду).
▶️ Этот одноплатный компьютер может работать с моделями YOLO-X для отслеживания объектов, PoseNet для определения поз, MediaPipe для распознавания жестов, локальными языковыми моделями, такими как Qwen, моделями преобразования текста в речь и речи в текст, такими как Melo TTS и Whisper, и т. д.
▶️ Чипсет Dragonwing работает под управлением Linux (Ubuntu или Debian) для решения задач высокого уровня. Также поддерживается операционная система для роботов 2 (ROS 2). Кроме того, имеется микроконтроллер STM32H5, который обеспечивает взаимодействие с периферийными устройствами в режиме реального времени.
▶️ Одноплатная система Ventuno Q оснащена 40-контактным разъемом GPIO в стиле Raspberry Pi. Она также поддерживает модули расширения Arduino Uno для простого подключения таких устройств, как контроллеры двигателей, датчики и многое другое. На плате также есть разъемы Qwiic без пайки.
▶️ Плата поддерживает три камеры MIPI CSI, что обеспечивает обзор на 360°. Есть порт дисплея HDMI и MIPI DSI, а также режим DP Alt через разъем USB-C. Порт Ethernet 2,5 Гбит/с обеспечивает быстрое проводное подключение, а Wi-Fi 6 (ax) и Bluetooth 5.3 — беспроводное. Для промышленного применения также поддерживается CAN-FD.
В Alibaba произошли кадровые изменения в ключевом подразделении ИИ. Цзюньян Линь, занимавший пост технического лидера команды, разрабатывающей модель Qwen, покинул свою должность. Его уход последовал сразу за крупным и успешным запуском новой версии модели, что стало неожиданностью для коллег. Это событие вызвало живую реакцию и обсуждения в коллективе, хотя точные причины решения не раскрываются. Ситуация highlights внутреннюю динамику в крупных tech-компаниях после достижения значимых вех.