Распознавание речи
Определение
Распознавание речи (ASR) — технология AI для преобразования устной речи в текст, основа голосовых ассистентов и транскрипции.
Простое объяснение
Это когда программа слушает голос и записывает всё в текст — как если бы кто-то очень быстро печатал за говорящим.
Подробнее
Современные ASR-системы:
- Whisper — OpenAI, открытый, многоязычный
- Google Speech-to-Text — облачный сервис
- AWS Transcribe — Amazon
- AssemblyAI — API для разработчиков
Точность современных систем превышает 95%.
Связанные термины
Jupyter Notebook
Jupyter Notebook — интерактивная среда разработки для анализа данных и машинного обучения, позволяющая комбинировать код, визуализации и текст.
API (Application Programming Interface)
Интерфейс программирования приложений — набор правил и протоколов для взаимодействия между различными программами и сервисами.
Webhook
Вебхук — механизм автоматической отправки данных от одного сервиса другому при наступлении определённого события.
Voice AI
Голосовой AI — технологии распознавания речи (Speech-to-Text), синтеза речи (Text-to-Speech) и голосовых ассистентов.
