Speech-to-Text
Определение
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Простое объяснение
STT — как стенографист, который мгновенно записывает всё, что вы говорите. Только работает 24/7, не устаёт и понимает сотню языков.
Подробнее
Связанные термины
Gemini
Gemini — мультимодальное семейство AI-моделей от Google DeepMind, объединяющее понимание текста, изображений, аудио и видео.
Generative AI
Генеративный AI — системы искусственного интеллекта, способные создавать новый контент: тексты, изображения, музыку, видео, код.
Diffusion Models
Диффузионные модели — класс генеративных моделей, которые учатся создавать данные путём постепенного удаления шума из случайного входа.
Mistral
Mistral AI — французская компания, создающая высокоэффективные open-source языковые модели, конкурирующие с закрытыми решениями.
