Text-to-Speech
Определение
Text-to-Speech (TTS) — технология преобразования текста в естественно звучащую речь с помощью нейронных сетей.
Простое объяснение
TTS — как профессиональный диктор, который может прочитать любой текст естественным голосом. Только этот диктор — искусственный интеллект.
Подробнее
Связанные термины
GPT
GPT (Generative Pre-trained Transformer) — семейство языковых моделей OpenAI, основанных на архитектуре Transformer, ставших стандартом в генеративном AI.
Gemini
Gemini — мультимодальное семейство AI-моделей от Google DeepMind, объединяющее понимание текста, изображений, аудио и видео.
Sora
Sora — модель генерации видео от OpenAI, способная создавать реалистичные видеоролики до минуты по текстовому описанию.
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
