Voice AI
Определение
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
Простое объяснение
Это AI, который умеет слушать и говорить: понимает твои слова и отвечает голосом, как живой собеседник.
Подробнее
Компоненты Voice AI:
- ASR — распознавание речи (Whisper)
- TTS — синтез голоса (ElevenLabs)
- Voice cloning — клонирование голоса
- Voice assistants — Siri, Alexa, Google Assistant
Применение: колл-центры, озвучка, доступность.
Связанные термины
Ollama
Ollama — инструмент для простого локального запуска больших языковых моделей одной командой, с поддержкой популярных моделей и API, совместимым с OpenAI.
Шкалирование
Шкалирование (масштабирование) — увеличение мощности AI-системы для обработки большего объёма запросов и данных.
OpenAI
OpenAI — американская AI-компания, создатель ChatGPT, GPT-4, DALL-E и других прорывных AI-систем, лидер индустрии генеративного AI.
Latency
Латентность — время задержки между отправкой запроса к AI-системе и получением ответа, критичный показатель для пользовательского опыта.
