Конец эпохи 3D: Google учит ИИ видеть время
Пока все спорят о текстовых моделях, DeepMind тихо совершил революцию в компьютерном зрении. D4RT — это не просто апдейт, это новый способ восприятия реальности.

Пока индустрия завороженно следит за битвой чат-ботов, в лабораториях DeepMind происходит нечто куда более пугающее и грандиозное. Google представил D4RT — модель, которая фундаментально меняет принцип того, как искусственный интеллект воспринимает окружающий мир. И это не просто очередное улучшение графики.
До сегодняшнего дня компьютерное зрение страдало от шизофрении. Алгоритмы либо пытались построить статичную 3D-карту пространства, либо пытались отследить движение объектов внутри него. Это были два разных процесса, которые часто конфликтовали друг с другом, создавая ошибки, «артефакты» и задержки. Роботы видели мир как серию слайдов, а не как непрерывный поток.
D4RT (Distributed 4D Ray Tracing) стирает эту грань. Эта модель не разделяет пространство и время. Она воспринимает мир сразу в четырех измерениях. Представьте, что вы снимаете видео, и в тот же момент, в реальном времени, получаете идеальную цифровую копию сцены, где каждый объект понятен, отслежен и имеет физический объем. Это унифицированный подход: реконструкция сцены и трекинг объектов теперь происходят одновременно.
Почему это критически важно? Потому что это «недостающее звено» для настоящих автономных роботов. Если вы посмотрите на шквал анонсов Google — Gemini Robotics 1.5, Veo 3.1, Genie 3 — становится очевиден масштабный план. Они не просто делают ИИ умнее в диалогах. Они создают «мозг», способный полноценно функционировать в физической реальности.
D4RT решает проблему скорости и точности. Традиционные методы требовали огромных вычислительных мощностей для обработки каждого кадра. Новый подход DeepMind оптимизирует этот процесс, делая его пригодным для реальных задач, а не только для красивых демо-роликов в лабораторных условиях.
Мы стоим на пороге момента, когда виртуальное моделирование перестанет быть «моделированием» и станет точным цифровым двойником реальности. Если OpenAI стремится создать идеального собеседника, то Google, похоже, строит Матрицу, в которой этот собеседник сможет жить. И с появлением D4RT у них наконец-то появились глаза, способные видеть этот новый мир.
TL;DR
Главное
Google переходит от статического 3D к динамическому 4D-зрению, что является критическим шагом для создания полноценных автономных роботов.
Ключевые факты
- /Модель: D4RT (Distributed 4D Ray Tracing)
- /Инновация: одновременная реконструкция сцены и трекинг объектов
- /Контекст: релиз идет в связке с Gemini Robotics и Genie 3
Инсайт
Пока конкуренты фокусируются на генерации текста и картинок, Google монополизирует технологии для физического взаимодействия ИИ с реальным миром.



