Распознавание речи
Определение
Распознавание речи (ASR) — технология AI для преобразования устной речи в текст, основа голосовых ассистентов и транскрипции.
Простое объяснение
Это когда программа слушает голос и записывает всё в текст — как если бы кто-то очень быстро печатал за говорящим.
Подробнее
Современные ASR-системы:
- Whisper — OpenAI, открытый, многоязычный
- Google Speech-to-Text — облачный сервис
- AWS Transcribe — Amazon
- AssemblyAI — API для разработчиков
Точность современных систем превышает 95%.
Связанные термины
Stable Diffusion
Stable Diffusion — открытая модель генерации изображений по текстовому описанию, ставшая основой экосистемы AI-инструментов для творчества.
AI Coding Assistant
AI Coding Assistant — инструмент на базе LLM, помогающий программистам писать, отлаживать и объяснять код.
Jupyter Notebook
Jupyter Notebook — интерактивная среда разработки для анализа данных и машинного обучения, позволяющая комбинировать код, визуализации и текст.
TPU
TPU (Tensor Processing Unit) — специализированный AI-ускоритель, разработанный Google для обучения и inference нейронных сетей.
