Vector Database
Определение
Векторная база данных — специализированное хранилище для эмбеддингов, оптимизированное для семантического поиска по сходству векторов.
Простое объяснение
Это специальное хранилище для «смысловых отпечатков» текстов, которое позволяет быстро находить похожие по смыслу документы.
Подробнее
Популярные vector databases:
- Pinecone — managed, простой старт
- Weaviate — open source, hybrid search
- Milvus — масштабируемый
- Chroma — лёгкий, для прототипов
- pgvector — расширение PostgreSQL
Основа RAG-систем и семантического поиска.
Связанные термины
Latency
Латентность — время задержки между отправкой запроса к AI-системе и получением ответа, критичный показатель для пользовательского опыта.
Whisper
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
vLLM
vLLM — высокопроизводительная библиотека для inference больших языковых моделей, использующая PagedAttention для эффективного управления памятью GPU.
Edge AI
Edge AI — выполнение AI-алгоритмов непосредственно на конечных устройствах (смартфонах, камерах, датчиках) без отправки данных в облако.
