Uber объявил о масштабном внедрении технологий OpenAI в свою платформу. Компания использует большие языковые модели (LLM) для создания интеллектуальных помощников для водителей и внедрения голосового управления для пассажиров. Это решение направлено на упрощение взаимодействия с приложением и оптимизацию заработка в условиях динамично меняющегося рынка.
Платформа Uber представляет собой сложнейший рынок, работающий в реальном времени. Ежедневно в системе совершается около 40 миллионов поездок, а экосистема охватывает 10 миллионов водителей и курьеров в 15 тысячах городов по всему миру. На спрос и предложение влияют погода, пробки, расписание авиарейсов и локальные события. Традиционное машинное обучение давно используется компанией, но именно интеграция современных языковых моделей позволила системе быстрее анализировать разрозненные сигналы и выдавать пользователям понятные рекомендации.
A still image of a mobile Uber app voice booking experience with natural-language ride recommendations.
Для водителей компания разработала Uber Assistant — аналитический инструмент, помогающий принимать решения на основе данных. Главная проблема водителей заключается в необходимости постоянно оценивать ситуацию: стоит ли ехать в аэропорт, где сейчас повышенный спрос, и почему изменился уровень дохода. Ассистент переводит сложные данные, такие как тепловые карты и тренды заработка, в простые текстовые советы. Это снижает когнитивную нагрузку, позволяя водителю сосредоточиться на дороге, а не на интерпретации графиков.
Интересно, что архитектура системы построена на базе мультиагентного подхода. Инженерные команды Uber создали систему маршрутизации запросов: простые задачи обрабатываются быстрыми и легкими моделями (nano/mini), а сложные аналитические вопросы направляются к более крупным моделям, способным к глубокому рассуждению. Для обеспечения безопасности и соблюдения политик компании был внедрен внутренний слой управления AI Guard.
На стороне пассажиров Uber внедряет голосовое бронирование на базе OpenAI Realtime API. Вместо того чтобы пробираться через меню приложения, пользователь может сформулировать сложный запрос естественным языком. Например, указать количество пассажиров, наличие багажа и желаемый уровень комфорта в одном предложении. Система самостоятельно распознает намерение, сопоставит его с сохраненными локациями и предложит подходящий тариф, например, UberXL.
С точки зрения индустрии, этот кейс демонстрирует важный сдвиг в корпоративной разработке. Инструменты на базе искусственного интеллекта больше не являются прерогативой изолированных исследовательских отделов. В Uber инженеры из разных команд работают с промптами, системами поиска информации и оркестрацией моделей, тесно сотрудничая с юристами и дизайнерами.
В ближайшем будущем мы увидим, как голосовые интерфейсы будут все чаще заменять традиционные многошаговые сценарии в мобильных приложениях. Использование LLM в качестве связующего звена между сложной логистикой и конечным пользователем делает технологии доступнее, а работу платформы — более прозрачной для всех участников процесса.