OCR
Определение
Оптическое распознавание символов (OCR) — технология AI для преобразования изображений текста (сканов, фото) в редактируемый цифровой текст.
Простое объяснение
Это когда программа может прочитать текст с картинки или фотографии и превратить его в обычный текст, который можно копировать.
Подробнее
Современный OCR включает:
- Детекция текста — поиск областей с текстом
- Распознавание — преобразование в символы
- Layout analysis — понимание структуры документа
- Handwriting recognition — рукописный текст
Инструменты: Tesseract, Google Vision, AWS Textract.
Связанные термины
Latency
Латентность — время задержки между отправкой запроса к AI-системе и получением ответа, критичный показатель для пользовательского опыта.
Чат-бот
Чат-бот — программа для автоматизации общения с пользователями через текстовые сообщения, часто с использованием NLP и LLM.
ElevenLabs
ElevenLabs — платформа для синтеза речи и клонирования голоса с помощью AI, создающая наиболее реалистичное звучание.
AI Coding Assistant
AI Coding Assistant — инструмент на базе LLM, помогающий программистам писать, отлаживать и объяснять код.
