OCR
Определение
Оптическое распознавание символов (OCR) — технология AI для преобразования изображений текста (сканов, фото) в редактируемый цифровой текст.
Простое объяснение
Это когда программа может прочитать текст с картинки или фотографии и превратить его в обычный текст, который можно копировать.
Подробнее
Современный OCR включает:
- Детекция текста — поиск областей с текстом
- Распознавание — преобразование в символы
- Layout analysis — понимание структуры документа
- Handwriting recognition — рукописный текст
Инструменты: Tesseract, Google Vision, AWS Textract.
Связанные термины
Stable Diffusion
Stable Diffusion — открытая модель генерации изображений по текстовому описанию, ставшая основой экосистемы AI-инструментов для творчества.
ChatGPT
ChatGPT — разговорный AI-ассистент от OpenAI на базе моделей GPT, способный вести диалог, отвечать на вопросы, писать тексты и код.
AI Coding Assistant
AI Coding Assistant — инструмент на базе LLM, помогающий программистам писать, отлаживать и объяснять код.
Распознавание речи
Распознавание речи (ASR) — технология AI для преобразования устной речи в текст, основа голосовых ассистентов и транскрипции.
