Speech-to-Text
Определение
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Простое объяснение
STT — как стенографист, который мгновенно записывает всё, что вы говорите. Только работает 24/7, не устаёт и понимает сотню языков.
Подробнее
Связанные термины
Multimodal AI
Мультимодальный AI — системы, способные обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео — одновременно.
Generative AI
Генеративный AI — системы искусственного интеллекта, способные создавать новый контент: тексты, изображения, музыку, видео, код.
Multimodal
Multimodal — способность AI-системы обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео.
Большая языковая модель
Нейросеть с миллиардами параметров, обученная на огромных текстовых данных для понимания и генерации текста.
