Skip Navigation
Telegram
🎥 CoInteract — видеогенератор от Alibaba, где руки наконец не проваливаются в объекты


🎥 CoInteract — видеогенератор от Alibaba, где руки наконец не проваливаются в объекты.

Фундаментальная проблема всех видеогенераторов — нарушение физики при касании. Alibaba решила её через двойной поток генерации.

CoInteract одновременно создаёт RGB-видео и отдельный канал с данными о взаимодействии человека и объекта (HOI). Плюс — архитектура Human-Aware MoE: разные эксперты отвечают за голову, руки и тело. Каждая часть генерируется со своей физикой и движением.


Практически это означает: человек берёт продукт, открывает, использует — всё выглядит реально. Идеально для продуктовой рекламы и виртуальных примерочных.

MUSIN PRO | Демо | GitHub | Hugging Face

#CoInteract #Alibaba #ИИ #генерациявидео #нейросети
Telegram
Alibaba тихо выкатила Qwen 3


Alibaba тихо выкатила Qwen 3.6 Plus и раздаёт его бесплатно

Без громких анонсов, просто новая модель появилась на OpenRouter 30 марта — и за два дня через неё прогнали больше 400 миллионов токенов.

Что внутри:

⏺контекст на 1 миллион токенов, до 65 536 токенов на выходе
⏺chain-of-thought включён по умолчанию, отключить нельзя. Модель думает на каждый запрос
⏺нативный function calling и tool use

Главный фокус — агентское кодирование. Qwen 3.6 не просто дописывает функции, а умеет планировать задачи, дебажить собственный код и вызывать внешние инструменты. По заявлению разработчиков, она стабильнее и точнее предыдущей 3.5, которая грешила «передумыванием» на простых задачах.

Конкретных независимых бенчмарков пока нет. Alibaba говорит, что результаты «на уровне или выше ведущих моделей». Сообщество только начинает тестировать — но первые отзывы позитивные: быстрее, экономнее по токенам, меньше ломает tool calls в многошаговых сценариях.

И самое приятное — пока бесплатно.

🔗 Попробовать: chat.qwen.ai
🔗 Использовать в своих проектах, можно через openrouter.ai

Одно «но» — в период preview модель собирает данные из промптов и ответов для обучения. Так что конфиденциальные вещи туда лучше не отправлять.

🤖 В эпоху AI
Telegram
Как ИИ-агенты генерируют технический долг в промышленных масштабах 😬


Как ИИ-агенты генерируют технический долг в промышленных масштабах 😬

Все носятся с бенчмарками вроде SWE-bench и HumanEval, доказывая, что нейронки вот-вот заменят разработчиков. Проблема в том, что эти метрики оценивают исключительно snapshot-программирование. Дали таску -> ИИ выплюнул PR -> тесты зеленые -> триумф, расходимся.
Но в реальном продакшене написать код, который разово пройдет пайплайн — это даже не половина дела. Настоящая инженерия — это когда ваш код можно будет без боли модифицировать через год. И вот тут ИИ начинает жидко сыпаться.

Ребята из Alibaba и Sun Yat-sen University выкатили пейпер, в котором описывают, как заставили агентов не просто закрывать одиночные изолированные issue, а сопровождать реальные кодовые базы на длинной дистанции (в бенчмарке в среднем 233 дня истории и 71 коммит на проект).

Они создали SWE-CI — первый бенчмарк, который оценивает не способность ИИ высрать кусок кода для закрытия одного issue, а его способность именно поддерживать проект.
Вместо тупого "pass/fail" ввели метрику EvoScore. Она штрафует за технический долг. Если твой фикс на 3-й итерации сделал так, что на 10-й итерации добавление новой фичи стало невозможным — твой скор летит в бездну.

Для этого они подняли CI-loop на двух агентах:
1️⃣ Architect: смотрит на упавшие тесты (test gaps) и пишет высокоуровневую спеку.
2️⃣ Programmer: пытается написать код, чтобы спека выполнилась.
И так по кругу.

Какие результаты?
🟠Zero-regression rate на дне. Главный показатель стабильности. Если тест раньше проходил, а после твоего коммита упал — это регрессия. Так вот, большинство хваленых LLM имеют показатель отсутствия регрессий ниже 25%. Иными словами, пытаясь починить одно, они в 3 случаях из 4 ломают то, что уже работало. Только Claude Opus смог перешагнуть порог в 50%.
🟠Стратегическое планирование отсутствует. Модели Kimi и GLM (да, китайцы активно пушат свои LLM) заточены на быстрый результат — они выдают отличный код в моменте, но быстро тонут в собственном легаси на длинной дистанции. Модели DeepSeek и GPT пытаются играть в долгую, но всё равно спотыкаются.

В общем, пока нейронки пока не умеют в "осознанные усилия". Они оперируют вероятностями, а не архитектурным видением. Дайте агенту поддерживать прод-проект полгода, и он превратит его в спагетти-монстра, к которому страшно прикасаться.
Telegram
🏴‍☠️ Перевод текстов: бесплатно, сердито и без API-ключей
🏴‍☠️ Перевод текстов: бесплатно, сердито и без API-ключей

Если вы хоть раз пытались прикрутить перевод текста к своему пет-проекту или парсеру, то знаете эту боль. Официальный Google Cloud Translation требует привязку карты и квоты, DeepL API — прекрасен, но дорог (и сложен в оплате из РФ), а писать свой скрапер для веб-морды переводчика — это гарантированный ад с генерацией токенов (tk), подписью запросов и постоянными отвалами верстки.
Но есть translators — библиотека, которая делает эту работу за вас.
Это агрегатор, который (по сути, методом реверс-инжиниринга) стучится в веб-интерфейсы более 30 переводческих сервисов.

Что под капотом:

1️⃣ Ассортимент. Кроме банальных Google/Bing/Yandex, там есть DeepL (лучшее качество для европейских языков), Baidu/Alibaba (для китайщины) и даже специфические штуки типа VolcEngine.

2️⃣ HTML-friendly. Функция translate_html умеет переводить контент, не ломая структуру тегов.

3️⃣ Умный обход. Есть поддержка разных HTTP-клиентов: requests, httpx, niquests и даже cloudscraper. Если один метод блокируют по фингерпринту, можно переключиться на другой прямо в аргументах.

4️⃣ JS-магия. Библиотека сама выполняет нужный JavaScript (через exejs) для генерации подписей запросов. Да, для этого в системе должен быть Node.js, но это малая плата за халяву.

🧑‍💻 Как это выглядит в коде:

import translators as ts

text = "Python is a language for rebels."

# Используем движок Alibaba
print(ts.translate_text(text, translator='alibaba', to_language='ru'))
# Вывод: Python - это язык для повстанцев.

# Или DeepL (если IP не в бане)
print(ts.translate_text(text, translator='deepl', to_language='ru'))


⚠️ Ложка дегтя (куда же без неё):
Это не решение для High-Load продакшена. Это скрапинг.
Вас будут банить по IP, если начнете долбить тысячи запросов в секунду (хотя в либе есть кэширование сессий preaccelerate).
API веб-интерфейсов могут меняться без предупреждения, и придется ждать обновления пакета.

Но для дата-аналитики, сбора датасетов, ботов или личных тулзов — хороший инструмент, который сэкономит кучу денег.

#годный_опенсорс
Telegram
💥 Китай раздаёт ИИ-агентов бесплатно


💥 Китай раздаёт ИИ-агентов бесплатно. Китай подсаживает страну на OpenClaw

Китай взял курс на тотальное внедрение ИИ-агентов - и теперь переводит на них буквально всё население.

OpenClaw стал основой для национальной стратегии: власти выделяют миллионы долларов субсидий, дают бесплатное жильё разработчикам, а облачные гиганты вроде Alibaba и Tencent предлагают установку в один клик.
В Шэньчжэне у офиса Tencent выстроилась очередь из тысячи человек - студенты, домохозяйки, пенсионеры - все хотят получить бесплатного "цифрового сотрудника".

🤕 ГЛАВНОЕ: ИИ-агент потребляет в десятки раз больше токенов, чем обычный чат-бот, а значит, загружает дата-центры, в которые уже вбухали $60 млрд.

Всё началось с открытого кода парня из Австрии, который теперь работает в OpenAI)

🤩 OpenClaw - AI-ассистент уже в Telegram: для вас по ссылке
Telegram
🤖 Технический лидер Alibaba Qwen покидает пост после крупного прорыва в ИИ


В Alibaba произошли кадровые изменения в ключевом подразделении ИИ. Цзюньян Линь, занимавший пост технического лидера команды, разрабатывающей модель Qwen, покинул свою должность. Его уход последовал сразу за крупным и успешным запуском новой версии модели, что стало неожиданностью для коллег. Это событие вызвало живую реакцию и обсуждения в коллективе, хотя точные причины решения не раскрываются. Ситуация highlights внутреннюю динамику в крупных tech-компаниях после достижения значимых вех.

#Alibaba #Qwen #КадрыВИТ