Whisper
Определение
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Простое объяснение
Whisper — это программа от OpenAI, которая слушает аудио и записывает всё, что там говорят, в текст. Работает на многих языках.
Подробнее
Возможности Whisper:
- Транскрипция — речь в текст
- Перевод — в английский с любого языка
- Timestamps — временные метки
- Language detection — определение языка
Размеры: tiny, base, small, medium, large. Open source.
Связанные термины
Webhook
Вебхук — механизм автоматической отправки данных от одного сервиса другому при наступлении определённого события.
Kubernetes
Kubernetes (K8s) — платформа оркестрации контейнеров, ставшая стандартом для развёртывания и масштабирования ML-инфраструктуры.
Stable Diffusion
Stable Diffusion — открытая модель генерации изображений по текстовому описанию, ставшая основой экосистемы AI-инструментов для творчества.
GPU
Graphics Processing Unit — специализированный процессор, изначально созданный для графики, но оказавшийся идеальным для обучения нейросетей благодаря способности выполнять тысячи параллельных вычислений.
