Зачем ИИ учат симулировать мир
Зачем ИИ учат симулировать мир
Odyssey представила Odyssey-2 Max, свою крупнейшую модель мира. Формально это родственник видеогенераторов, но логика другая: система не собирает готовый ролик по промпту, а шаг за шагом предсказывает следующее состояние сцены и позволяет продолжать симуляцию в реальном времени.
Компания продает не «красивое видео», а управляемую среду, где будущее кадра зависит от предыдущего состояния и действия пользователя. Для игр это звучит как интерактивная сцена. Для робототехники как тренировочная среда. Для обороны и медицины как повод внимательно смотреть на качество проверки, потому что красивая физика на демо ещё не равна надежной модели причинно-следственных связей.
В релизе есть несколько конкретных чисел. 2 Max примерно в 3 раза крупнее 2 Pro и обучалась с 10-кратным ростом вычислений. На физическом разделе VBench 2 результат вырос с 49,67 до 58,52. На PAI-Bench Physics с 91,67 до 93,02. Компания также утверждает, что все показанные симуляции работали в реальном времени и могли продолжаться более 120 секунд.
Технически модель построена как авторегрессионный диффузионный трансформер. Важные детали: длинный контекст, каузальное внимание, управление действиями через латентные представления, сопоставление потоков в непрерывном латентном пространстве и сокращение числа шагов подавления шума. Обучение шло на нескольких сотнях NVIDIA B200.
Наиболее интересная часть здесь не картинка. Создатели проводят аналогию с языковыми моделями: предсказание следующего токена дало системам способность имитировать рассуждение, а предсказание следующего состояния мира должно дать физическую интуицию. Это амбициозная гипотеза, и она хорошо объясняет, почему вокруг моделей мира сейчас столько инвесторского и исследовательского интереса.
Но проверять всё это нужно осторожно. VBench и PAI-Bench оценивают согласованность сгенерированного видео, а не пригодность системы для реальной робототехники или научного моделирования. Стабильный фон, гладкое движение и правдоподобная механика полезны, но они не доказывают, что модель понимает причинные связи в строгом смысле.
Сравнение с Sora, Veo, Kling и Runway тоже устроено выгодно для разработчиков 2 Max. Эти системы исключены из таблицы как двунаправленные видеомодели, потому что они не рассчитаны на интерактивное предсказание будущих состояний. Аргумент логичный, но поле сравнения получается меньше: речь идет о категории, которую сама компания и пытается закрепить как отдельную.
Еще один момент: модель доступна в частной бете для партнеров. Значит, независимая проверка пока ограничена. Главные вопросы будут в длинных сценариях, где пользователь делает странные действия, сцена постепенно накапливает ошибки, а физическая правдоподобность начинает конфликтовать с управляемостью.
Релиз всё равно значимый. Генеративное видео постепенно делится на две линии: производство готового визуального контента и интерактивные симуляторы среды. Первая линия обслуживает медиа. Вторая может стать основой для тренажеров, игр, агентов, робототехники и систем планирования.
Гонка за моделями мира стала отдельным направлением. Там конкурирует не столько красота кадров, сколько устойчивость причинности, горизонт симуляции, управляемость и цена генерации в реальном времени.
❗️❗️❗️❗️❗️❗️❗️❗️ / Не запрещена в РФ
Наука и Технологии вчера
SubStudio — субтитры для видео за секунды
Нашёл полезный сервис. Загружаешь видео и оно автоматически генерирует субтитры. Можно выбрать разные стили.
Дают бесплатные токены, затем подключаешь АПИ TogetherAI и платишь за использование. А тут открытый репозиторий.
🤖 В эпоху AI
После 2022 года, ежегодно стараюсь попробовать себя в чём-то новом, запускать хотя бы один сторонний проект
2023: продажа башкирского мёда
Продукт высочайшего качества от знакомого (земляка) пасечника. Не сложилось, т.к. дедушка не любит ритейл и маркетплейсы - только выездные ярмарки, оффлайн-рынок и "приезжайте ко мне".
2024: ютуб-канал на испанском языке про книги
Нравится испанский язык (но ленюсь в изучении) + хочу читать больше книг. Делать видео на ютубе о заметках и пересказах - сразу убить трёх зайцев. Было прикольно, выпустил около 25 видео, но хороший контент и монтаж - дело трудоёмкое. Не могу себе позволить. Самые популярные ролики набирали 5-10 тысяч просмотров.
2025: детская площадка-городок и детская музыка
Мне как отцу эта идея показалась перспективной, но уже на стадии поиска места под аренду постепенно интерес пропал. Музыкальный альбом всё же вышел, и он собрал по прослушиваниям в 6 (!) раз больше, чем в среднем на Label Cantroll. В этом году альбом тоже выйдет (не успел выпустить в прошлом), но в целом стало неинтересно двигаться в этом направлении.
2025: ЖКХ
Сильно погружен как активный гражданин - пытаюсь заставить работать тех, кто работать не хочет. Самая удивительная сфера, в которой: бардак, мошенничество, бездействие контролирующих органов. Кто хочет сделать свою УК и настроен работать - достигнет успеха и получит хорошие деньги при несложной посреднической работе.
2026: запуск IT-стартапа по медицинской тематике
Продукт готов и рассчитан на B2B сегмент. Ниша сложная и ответственная. Детали не рассказываю, работаю.
Новый топ-канал маркетинга

Недавно заново открыл для себя Threads* — соц сеть, в основе которой лежат короткие посты (ветки). И, если честно, для меня этот канал выглядит намного привлекательнее рилсов и длинных видео.
Вся проблема роликов в том, что на них нужно тратить уйму времени и денег: КП, съемка, монтаж, аренда студии. Часть костов можно конечно сократить, но тогда шансы, что твой ролик залетит кратно падают.
А в тредс все наоборот: 20% усилий дают 80% результата. Я трачу на эту соц сеть 2-3 минуты в день, и за последний месяц она дала мне 100к органических просмотров. Главное удобство в том, что на площадке лучше всего залетают именно короткие и ёмкие ветки.
Продаж пока оттуда не делал, но лиды были + нашел компанию-партнера на митапы Опоры, и в целом вижу, что довольно много платёжеспособной аудитории там сидит. Поэтому очень советую присмотреться к этой еще нераспиаренной соц сети.
Поделитесь в комментариях: тестировали уже эту соц сеть? Какие были результаты?
*Threads, Meta — организации, признанные экстремистскими на территории РФ.
Мой канал: Илья Крамник