Распознавание речи
Определение
Распознавание речи (ASR) — технология AI для преобразования устной речи в текст, основа голосовых ассистентов и транскрипции.
Простое объяснение
Это когда программа слушает голос и записывает всё в текст — как если бы кто-то очень быстро печатал за говорящим.
Подробнее
Современные ASR-системы:
- Whisper — OpenAI, открытый, многоязычный
- Google Speech-to-Text — облачный сервис
- AWS Transcribe — Amazon
- AssemblyAI — API для разработчиков
Точность современных систем превышает 95%.
Связанные термины
AI Coding Assistant
AI Coding Assistant — инструмент на базе LLM, помогающий программистам писать, отлаживать и объяснять код.
Safetensors
Safetensors — безопасный формат хранения тензоров (весов нейросетей), защищённый от выполнения произвольного кода при загрузке.
Replicate
Replicate — платформа для запуска open-source AI-моделей через API без необходимости управления инфраструктурой.
Voice AI
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
