Kubernetes
Определение
Kubernetes (K8s) — платформа оркестрации контейнеров, ставшая стандартом для развёртывания и масштабирования ML-инфраструктуры.
Простое объяснение
Это как умный диспетчер, который управляет множеством программ и распределяет ресурсы компьютеров, чтобы AI работал стабильно.
Подробнее
K8s для ML/AI:
- Kubeflow — ML-пайплайны
- Автоскейлинг — под нагрузку инференса
- GPU scheduling — распределение GPU
- Model serving — KServe, Seldon
Используется крупными AI-компаниями для production ML.
Связанные термины
MLOps
MLOps — практики и инструменты для управления жизненным циклом ML-моделей: от разработки до deployment и мониторинга в production.
Voice AI
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
Ollama
Ollama — инструмент для простого локального запуска больших языковых моделей одной командой, с поддержкой популярных моделей и API, совместимым с OpenAI.
Webhook
Вебхук — механизм автоматической отправки данных от одного сервиса другому при наступлении определённого события.
