Whisper
Определение
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Простое объяснение
Whisper — это программа от OpenAI, которая слушает аудио и записывает всё, что там говорят, в текст. Работает на многих языках.
Подробнее
Возможности Whisper:
- Транскрипция — речь в текст
- Перевод — в английский с любого языка
- Timestamps — временные метки
- Language detection — определение языка
Размеры: tiny, base, small, medium, large. Open source.
Связанные термины
Kubernetes
Kubernetes (K8s) — платформа оркестрации контейнеров, ставшая стандартом для развёртывания и масштабирования ML-инфраструктуры.
Stable Diffusion
Stable Diffusion — открытая модель генерации изображений по текстовому описанию, ставшая основой экосистемы AI-инструментов для творчества.
Safetensors
Safetensors — безопасный формат хранения тензоров (весов нейросетей), защищённый от выполнения произвольного кода при загрузке.
OpenAI
OpenAI — американская AI-компания, создатель ChatGPT, GPT-4, DALL-E и других прорывных AI-систем, лидер индустрии генеративного AI.
