Whisper
Определение
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Простое объяснение
Whisper — это программа от OpenAI, которая слушает аудио и записывает всё, что там говорят, в текст. Работает на многих языках.
Подробнее
Возможности Whisper:
- Транскрипция — речь в текст
- Перевод — в английский с любого языка
- Timestamps — временные метки
- Language detection — определение языка
Размеры: tiny, base, small, medium, large. Open source.
Связанные термины
Шкалирование
Шкалирование (масштабирование) — увеличение мощности AI-системы для обработки большего объёма запросов и данных.
Webhook
Вебхук — механизм автоматической отправки данных от одного сервиса другому при наступлении определённого события.
Voice AI
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
JSON
JSON (JavaScript Object Notation) — лёгкий текстовый формат обмена данными, стандарт для API и интеграций AI-сервисов.
