Text-to-Speech
Определение
Text-to-Speech (TTS) — технология преобразования текста в естественно звучащую речь с помощью нейронных сетей.
Простое объяснение
TTS — как профессиональный диктор, который может прочитать любой текст естественным голосом. Только этот диктор — искусственный интеллект.
Подробнее
Связанные термины
Foundation Model
Фундаментальная модель — большая AI-модель, предобученная на огромных объёмах данных, которая может быть адаптирована для множества различных задач.
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
Multimodal AI
Мультимодальный AI — системы, способные обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео — одновременно.
Upscaling
Upscaling — увеличение разрешения изображения с помощью AI, добавляющего реалистичные детали, которых не было в оригинале.
