NVIDIA представила Cosmos 3 — открытую фундаментальную модель мира (world foundation model), разработанную специально для физического искусственного интеллекта. Главная задача этой системы — позволить роботам, автономным автомобилям и агентам компьютерного зрения анализировать обстановку и прогнозировать последствия своих действий до того, как они будут совершены в реальном мире.
NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale
Долгое время развитие робототехники тормозилось из-за узкой специализации алгоритмов. Робот, обученный поднимать один конкретный тип деталей, оказывался бесполезен при малейшем изменении формы объекта или освещения. Индустрия нуждалась в переходе от жестко запрограммированных инструкций к системам, способным понимать контекст. Появление больших языковых моделей (LLM) показало потенциал универсальных систем, и теперь этот подход переносится в физический мир.
Cosmos 3 объединяет в себе сразу несколько ключевых технологий: визуальное мышление, мультимодальную генерацию и предсказание действий. Это означает, что система не просто распознает объекты с камеры, но и понимает их физические свойства и взаимосвязи. Параллельно NVIDIA обновляет свою аппаратную и программную экосистему. Платформа для встраиваемых систем NVIDIA Jetson получила обновление JetPack 7.2, которое приносит поддержку агентного ИИ (agentic AI) и интеграцию с NemoClaw. Для промышленного сектора компания представила Factory Operations Blueprint — решение, объединяющее сигналы от станков, системы контроля качества и рабочие инструкции в единый центр принятия решений.
NVIDIA Enables the Next Era Of Physical AI Research With Agent Skills For Autonomous Vehicles, Robotics And Vision AI
Для индустрии этот анонс означает важный сдвиг. NVIDIA последовательно выстраивает инфраструктуру, в которой она выступает не только поставщиком графических процессоров (GPU), но и создателем базового программного обеспечения для робототехники. Предоставляя открытую модель мира, компания снижает порог входа для исследователей и разработчиков. Им больше не нужно создавать базовые алгоритмы восприятия с нуля — они могут сосредоточиться на тонкой настройке ИИ под конкретные задачи.
В ближайшие годы мы увидим, как подобные модели начнут активно тестироваться на заводах, складах и дорогах общего пользования. Способность ИИ "думать перед действием" критически важна для безопасности автономных систем. Пока рано судить, насколько безупречно Cosmos 3 справится с хаосом непредсказуемой реальной среды, но направление задано четко: будущее робототехники за универсальными моделями, способными к адаптации.