Voice AI
Определение
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
Простое объяснение
Это AI, который умеет слушать и говорить: понимает твои слова и отвечает голосом, как живой собеседник.
Подробнее
Компоненты Voice AI:
- ASR — распознавание речи (Whisper)
- TTS — синтез голоса (ElevenLabs)
- Voice cloning — клонирование голоса
- Voice assistants — Siri, Alexa, Google Assistant
Применение: колл-центры, озвучка, доступность.
Связанные термины
ChatGPT
ChatGPT — разговорный AI-ассистент от OpenAI на базе моделей GPT, способный вести диалог, отвечать на вопросы, писать тексты и код.
Чат-бот
Чат-бот — программа для автоматизации общения с пользователями через текстовые сообщения, часто с использованием NLP и LLM.
GPU
Graphics Processing Unit — специализированный процессор, изначально созданный для графики, но оказавшийся идеальным для обучения нейросетей благодаря способности выполнять тысячи параллельных вычислений.
vLLM
vLLM — высокопроизводительная библиотека для inference больших языковых моделей, использующая PagedAttention для эффективного управления памятью GPU.
