OpenAI и Broadcom представили Jalapeño: собственный чип д...

Суть

Компания OpenAI совместно с Broadcom официально представила Jalapeño — свой первый специализированный процессор (accelerator), спроектированный специально для вывода (inference) больших языковых моделей (LLM). Это событие знаменует переход OpenAI от статуса исключительно разработчика программного обеспечения и ИИ-моделей к компании, контролирующей полный технологический стек, включая аппаратное обеспечение.

Контекст

Долгое время индустрия искусственного интеллекта опиралась на универсальные графические процессоры (GPU) для решения всех задач: от обучения гигантских нейросетей до их повседневного использования клиентами. Однако по мере того, как продукты вроде ChatGPT и различные API-интеграции масштабируются, затраты на вывод моделей становятся колоссальными.

Специализированные чипы (ASIC), заточенные под конкретный тип математических операций, могут предложить значительно лучшую энергоэффективность и скорость. Понимая это, OpenAI решила не адаптировать свои модели под существующее на рынке железо, а создать архитектуру с чистого листа, опираясь на глубокое понимание собственных алгоритмов.

OpenAI and Broadcom leaders display the Jalapeño inference chip.

Детали

Проект Jalapeño примечателен несколькими техническими и организационными достижениями:

Во-первых, цикл разработки от начального проектирования до отправки на производство (tape-out) занял всего девять месяцев. По заявлениям компаний, это один из самых быстрых показателей в индустрии сложных полупроводников. Ускорить процесс помогло использование собственных ИИ-моделей OpenAI для проектирования и оптимизации компонентов.

Во-вторых, чип создан исключительно для вывода, а не для обучения. Архитектура сбалансирована таким образом, чтобы минимизировать перемещение данных между вычислительными ядрами и памятью. В разработке также участвовала компания Celestica, отвечающая за интеграцию плат и серверных стоек, а сетевая инфраструктура базируется на решениях Broadcom (включая чипы Tomahawk).

В-третьих, инженерные образцы уже тестируются в лабораториях на реальных рабочих нагрузках, включая неанонсированную модель GPT-5.3-Codex-Spark. Ранние тесты показывают существенное превосходство в производительности на ватт по сравнению с текущими рыночными стандартами.

Expanding Daybreak Art Card

Анализ

Что это означает для индустрии? Переход к стратегии полного стека (full-stack) дает OpenAI фундаментальное преимущество. Когда компания контролирует архитектуру чипа, сетевое оборудование, программные ядра, системы распределения памяти и сам конечный продукт, она может оптимизировать каждый слой под единую цель.

Это запускает мощный цикл: более эффективная инфраструктура снижает стоимость вычислений, что позволяет обслуживать более сложные модели быстрее и дешевле. Снижение издержек делает передовой ИИ доступнее для бизнеса и обычных пользователей, что генерирует больше выручки для реинвестирования в следующие поколения оборудования. Кроме того, планы по развертыванию дата-центров гигаваттного класса совместно с Microsoft указывают на беспрецедентные масштабы грядущей инфраструктуры.

Перспектива

Полноценное развертывание платформы первого поколения намечено на конец 2026 года. Если заявленные характеристики производительности и энергоэффективности подтвердятся на практике, это может изменить баланс сил на рынке ИИ-оборудования, снизив зависимость индустрии от традиционных поставщиков универсальных ускорителей.

Пока рано судить о финальных метриках — подробный технический отчет OpenAI обещает опубликовать в ближайшие месяцы. Однако сам факт того, что искусственный интеллект уже помогает проектировать аппаратное обеспечение для следующего поколения искусственного интеллекта, говорит о том, что скорость технологического прогресса в этой сфере будет только возрастать. Время покажет, насколько гладко пройдет масштабирование этих систем до уровня глобальных дата-центров.