Whisper
Определение
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Простое объяснение
Whisper — это программа от OpenAI, которая слушает аудио и записывает всё, что там говорят, в текст. Работает на многих языках.
Подробнее
Возможности Whisper:
- Транскрипция — речь в текст
- Перевод — в английский с любого языка
- Timestamps — временные метки
- Language detection — определение языка
Размеры: tiny, base, small, medium, large. Open source.
Связанные термины
Vector Database
Векторная база данных — специализированное хранилище для эмбеддингов, оптимизированное для семантического поиска по сходству векторов.
Voice AI
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
Perplexity AI
Perplexity AI — поисковая система на базе AI, которая отвечает на вопросы с указанием источников вместо списка ссылок.
Виртуальный ассистент
Виртуальный ассистент — AI-программа для автоматизации задач и помощи пользователям через текстовый или голосовой интерфейс.
