Шкалирование
Определение
Шкалирование (масштабирование) — увеличение мощности AI-системы для обработки большего объёма запросов и данных.
Простое объяснение
Это когда систему увеличивают, чтобы она могла обслуживать больше пользователей — как расширить ресторан для большего числа гостей.
Подробнее
Типы масштабирования:
- Вертикальное — более мощный сервер
- Горизонтальное — больше серверов
- Auto-scaling — автоматическое по нагрузке
Для AI важно: GPU-кластеры, distributed training, model parallelism.
Связанные термины
Whisper
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Latency
Латентность — время задержки между отправкой запроса к AI-системе и получением ответа, критичный показатель для пользовательского опыта.
LangChain
LangChain — популярный open-source фреймворк для создания приложений на базе LLM, предоставляющий абстракции для chains, agents, RAG и memory.
Perplexity AI
Perplexity AI — поисковая система на базе AI, которая отвечает на вопросы с указанием источников вместо списка ссылок.
