OCR
Определение
Оптическое распознавание символов (OCR) — технология AI для преобразования изображений текста (сканов, фото) в редактируемый цифровой текст.
Простое объяснение
Это когда программа может прочитать текст с картинки или фотографии и превратить его в обычный текст, который можно копировать.
Подробнее
Современный OCR включает:
- Детекция текста — поиск областей с текстом
- Распознавание — преобразование в символы
- Layout analysis — понимание структуры документа
- Handwriting recognition — рукописный текст
Инструменты: Tesseract, Google Vision, AWS Textract.
Связанные термины
ChatGPT
ChatGPT — разговорный AI-ассистент от OpenAI на базе моделей GPT, способный вести диалог, отвечать на вопросы, писать тексты и код.
Jupyter Notebook
Jupyter Notebook — интерактивная среда разработки для анализа данных и машинного обучения, позволяющая комбинировать код, визуализации и текст.
Whisper
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Kubernetes
Kubernetes (K8s) — платформа оркестрации контейнеров, ставшая стандартом для развёртывания и масштабирования ML-инфраструктуры.
