Какую базу данных использует ChatGPT для своей работы?

Основная архитектура ChatGPT для записи данных базируется на одной инстанции PostgreSQL (Azure Flexible Server), а для обработки наиболее интенсивных операций записи используется Azure Cosmos DB.

Как OpenAI справляется с миллионами пользователей на одной базе данных?

OpenAI использует одну пишущую инстанцию PostgreSQL, но окружает ее армией из 50 читающих реплик по всему миру, которые обрабатывают большую часть трафика, значительно разгружая основную базу.

Какие методы оптимизации применил OpenAI для PostgreSQL?

Для оптимизации OpenAI внедрила изоляцию рабочих нагрузок, использовала PgBouncer для пулинга соединений, сократив время подключения до 5 мс, и перенесла самые тяжелые операции записи в Azure Cosmos DB.

Почему OpenAI не шардирует свою основную базу данных PostgreSQL?

OpenAI сознательно отказалась от шардирования основной базы данных PostgreSQL, чтобы избежать длительной переработки кода, сосредоточившись вместо этого на максимальной оптимизации существующей архитектуры.

Один сервер на всех: безумная архитектура ChatGPT, котора...

Представьте себе нагрузку: 800 миллионов пользователей. Миллионы запросов в секунду. Глобальный трафик, который растет в 10 раз за год. Любой системный архитектор скажет вам, что для этого нужна сложнейшая сеть из сотен шардированных баз данных и микросервисов. OpenAI доказала обратное.

В своем свежем техническом отчете Бохан Чжан из OpenAI раскрыл шокирующую деталь внутренней кухни ChatGPT: вся эта махина работает на одной основной инстанции PostgreSQL (Azure Flexible Server). Да, вы не ослышались. Один Primary-сервер для записи.

Как это вообще возможно физически?

Команда инженеров OpenAI пошла против течения. Вместо того чтобы тратить месяцы или годы на сложнейшее шардирование (разделение базы на части), они решили выжать из старого доброго Postgres всё, на что он способен. И выяснилось, что способен он на многое, если у вас прямые руки.

Главный секрет кроется в безжалостной оптимизации. OpenAI использует одну пишущую инстанцию, но окружает ее армией из 50 читающих реплик по всему миру. Весь трафик на чтение уходит туда, разгружая «мозг» системы. Но одной балансировки мало.

Они столкнулись с классическими проблемами роста: «шумные соседи», когда один тяжелый запрос вешает весь сервис, и исчерпание подключений. Решение? Изоляция рабочих нагрузок и использование PgBouncer для пулинга соединений. Время подключения сократилось с 50 мс до 5 мс. Это колоссальная разница на таких объемах.

Но самое интересное — это отказ от «священных коров» разработки. OpenAI сознательно не шардирует Postgres. Они понимают: переписывание кода под шардинг займет слишком много времени. Вместо этого они просто запретили создание новых таблиц в старой базе и переносят самые тяжелые операции записи в Azure Cosmos DB. Это прагматизм высшего уровня: работает — не трогай, просто оптимизируй.

Эта история — пощечина всем, кто усложняет архитектуру стартапов раньше времени. Если OpenAI может держать мир на одной базе данных, возможно, вашему проекту пока рано думать о Kubernetes и микросервисах.

Один сервер на всех: безумная архитектура ChatGPT, которая работает

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Трансформация ChatGPT: как OpenAI превращает чат-бота в вычислительную платформу

Экономика автономных агентов: почему стоимость токенов падает, а бюджеты на ИИ растут

Модели OpenAI GPT-5.6 стали доступны в Amazon Bedrock: новые уровни производительности и безопасности

Гайды по теме