Эволюция цен на языковые модели: почему эпоха субсидий подходит к концу
Анализ изменения стоимости API ведущих языковых моделей и причины перехода от демпинга к повышению цен ради защиты маржинальности.
Анализ изменения стоимости API ведущих языковых моделей и причины перехода от демпинга к повышению цен ради защиты маржинальности.
3 мин

Индустрия искусственного интеллекта проходит через важный экономический рубеж. Данные о ценообразовании на большие языковые модели (LLM) за последние годы показывают смену тенденции: период агрессивного снижения цен сменяется их ростом. Компании-разработчики постепенно отказываются от практики субсидирования стоимости доступа к своим API, возвращаясь к реальной экономике.
На ранних этапах развития рынка генеративного AI ключевой задачей для ведущих игроков было привлечение разработчиков и формирование экосистемы вокруг своих продуктов. Когда на рынке присутствует избыток капитала, а главная метрика успеха — это доля рынка, провайдеры могут позволить себе работать в убыток.
Компании искусственно занижали стоимость обработки токенов, чтобы стимулировать создание новых приложений и сервисов. Однако этот период не мог длиться вечно. Беспрецедентный рост капитальных затрат на вычислительную инфраструктуру начал диктовать новые правила игры.
Если взглянуть на срез стоимости флагманских моделей, вырисовывается четкая картина распределения ролей на рынке.
Google позиционирует себя как наиболее доступный вариант. Стоимость их флагманского решения составляет 2 доллара за миллион входных токенов и 12 долларов за миллион выходных. Несмотря на то, что компания также повышает цены, она остается вдвое дешевле конкурентов.

Google Gemini: Flash and Pro Pricing
Anthropic, долгое время придерживавшаяся премиального ценообразования, скорректировала свой подход для самых мощных моделей. Сейчас их тарифы составляют 5 долларов за миллион токенов на входе и 25 долларов на выходе.
OpenAI установила цены на сопоставимом уровне: 5 долларов за миллион входных токенов и 30 долларов за миллион выходных. Это свидетельствует о том, что период первоначального субсидирования флагманской модели завершен.
Эти изменения отражают фундаментальный сдвиг в бизнес-моделях AI-компаний. Динамика цен напрямую зависит от макроэкономических факторов и доступности финансирования.
Когда наличных средств много, компании снижают цены ради захвата доли рынка. Когда же капитал становится дороже, а инвесторы начинают требовать финансовой дисциплины, фокус неизбежно смещается на маржинальность. Рекордные инвестиции в серверные мощности и дата-центры требуют окупаемости, что делает невозможным дальнейшее предоставление вычислительных ресурсов ниже себестоимости.
Важно отметить, что повышение эффективности токенизаторов несколько смягчает удар для конечных пользователей, однако реальная стоимость вычислений неуклонно растет.
Для разработчиков и бизнеса, строящего свои продукты на базе API сторонних языковых моделей, это означает необходимость пересмотра юнит-экономики.
Время, когда можно было не задумываться о стоимости каждого запроса к нейросети, уходит в прошлое. В ближайшие годы конкурентным преимуществом станут не только сами идеи AI-приложений, но и умение эффективно управлять расходом токенов, маршрутизировать запросы между моделями разного уровня и оптимизировать архитектуру под растущую стоимость машинного интеллекта. Время покажет, приведет ли это к ускоренному развитию более компактных и дешевых локальных моделей.
Провайдеры больших языковых моделей переходят от агрессивного захвата рынка через низкие цены к защите маржинальности из-за растущих затрат на инфраструктуру.
Скрытая инфляция в AI-индустрии означает, что разработчикам придется пересмотреть экономику своих приложений, так как базовая стоимость машинного интеллекта больше не будет искусственно занижаться.