Один сервер на всех: безумная архитектура ChatGPT, которая работает
Пока все строят сложные микросервисы, OpenAI обслуживает 800 миллионов пользователей на одной инстанции PostgreSQL. Узнай, как они нарушили главные правила DevOps.
Пока все строят сложные микросервисы, OpenAI обслуживает 800 миллионов пользователей на одной инстанции PostgreSQL. Узнай, как они нарушили главные правила DevOps.
2 мин

Представьте себе нагрузку: 800 миллионов пользователей. Миллионы запросов в секунду. Глобальный трафик, который растет в 10 раз за год. Любой системный архитектор скажет вам, что для этого нужна сложнейшая сеть из сотен шардированных баз данных и микросервисов. OpenAI доказала обратное.
В своем свежем техническом отчете Бохан Чжан из OpenAI раскрыл шокирующую деталь внутренней кухни ChatGPT: вся эта махина работает на одной основной инстанции PostgreSQL (Azure Flexible Server). Да, вы не ослышались. Один Primary-сервер для записи.
Как это вообще возможно физически?
Команда инженеров OpenAI пошла против течения. Вместо того чтобы тратить месяцы или годы на сложнейшее шардирование (разделение базы на части), они решили выжать из старого доброго Postgres всё, на что он способен. И выяснилось, что способен он на многое, если у вас прямые руки.
Главный секрет кроется в безжалостной оптимизации. OpenAI использует одну пишущую инстанцию, но окружает ее армией из 50 читающих реплик по всему миру. Весь трафик на чтение уходит туда, разгружая «мозг» системы. Но одной балансировки мало.
Они столкнулись с классическими проблемами роста: «шумные соседи», когда один тяжелый запрос вешает весь сервис, и исчерпание подключений. Решение? Изоляция рабочих нагрузок и использование PgBouncer для пулинга соединений. Время подключения сократилось с 50 мс до 5 мс. Это колоссальная разница на таких объемах.
Но самое интересное — это отказ от «священных коров» разработки. OpenAI сознательно не шардирует Postgres. Они понимают: переписывание кода под шардинг займет слишком много времени. Вместо этого они просто запретили создание новых таблиц в старой базе и переносят самые тяжелые операции записи в Azure Cosmos DB. Это прагматизм высшего уровня: работает — не трогай, просто оптимизируй.
Эта история — пощечина всем, кто усложняет архитектуру стартапов раньше времени. Если OpenAI может держать мир на одной базе данных, возможно, вашему проекту пока рано думать о Kubernetes и микросервисах.
Вертикальное масштабирование живо: OpenAI доказала, что грамотная оптимизация классической SQL-базы эффективнее преждевременного усложнения архитектуры.
Главный актив OpenAI — не только нейросети, но и умение избегать «инженерного перфекционизма» ради скорости бизнеса.