На платформе Hugging Face состоялся релиз семейства моделей Ettin Reranker. Это масштабная коллекция открытых алгоритмов, предназначенных для задачи переранжирования текстов (text reranking). Выпуск этих моделей — важный шаг в сторону демократизации технологий информационного поиска и развития систем генерации с дополненной выборкой (RAG).
В основе современных поисковых систем и RAG-приложений лежит двухэтапный процесс. На первом этапе быстрые алгоритмы извлекают сотни потенциально подходящих документов из огромной базы данных. На втором этапе в дело вступают реранкеры — более тяжелые и точные модели, которые оценивают релевантность каждого найденного документа запросу пользователя и выстраивают их в финальный список.
Долгое время качественные реранкеры оставались либо проприетарными, либо требовали значительных вычислительных мощностей. Семейство Ettin Reranker меняет эту парадигму, предлагая разработчикам широкий спектр открытых инструментов.
Ключевая особенность новой линейки — вариативность размеров. В коллекцию входят модели с количеством параметров 17, 32, 68, 150, 400 миллионов и 1 миллиард. Это позволяет инженерам подбирать идеальный баланс между скоростью работы и точностью результатов в зависимости от их инфраструктуры.
Самая компактная модель на 17 миллионов параметров может работать практически на любом устройстве, обеспечивая базовое улучшение поиска при минимальных задержках. В то же время флагманская версия на 1 миллиард параметров предназначена для сложных корпоративных систем, где максимальная точность критически важна.
Все модели Ettin построены на архитектуре перекрестных энкодеров (cross-encoders). В отличие от моделей, которые кодируют запрос и документ по отдельности, перекрестные энкодеры обрабатывают их совместно. Это позволяет алгоритму улавливать сложные смысловые связи между словами в запросе и тексте, что значительно повышает качество ранжирования.
Вместе с моделями исследователи представили коллекцию «Encoders vs Decoders». Она включает парные модели на базе архитектур энкодеров и декодеров, обученные на открытых данных. Этот исследовательский проект направлен на изучение того, какая архитектура лучше справляется со специфическими задачами понимания текста.
В последние годы индустрия искусственного интеллекта сосредоточилась на архитектуре декодеров, которая лежит в основе больших языковых моделей (LLM). Однако для задач классификации, поиска и ранжирования энкодеры зачастую показывают большую эффективность при меньших затратах ресурсов.
Проект Ettin Reranker также сопровождается открытыми наборами данных, такими как NanoBEIR. Это специализированные выборки, дополненные оценками классических алгоритмов поиска вроде BM25. Открытый доступ к таким данным позволяет научному сообществу прозрачно оценивать и улучшать существующие методы.
Для индустрии появление подобных семейств моделей означает снижение порога входа. Разработчикам больше не нужно полагаться исключительно на платные программные интерфейсы (API) для создания качественных поисковых систем. Теперь мощные инструменты доступны для локального развертывания.
В перспективе мы, вероятно, увидим дальнейшую специализацию малых моделей. В то время как гигантские универсальные нейросети продолжат расти, задачи вроде маршрутизации запросов, фильтрации и ранжирования будут передаваться компактным, узконаправленным инструментам вроде Ettin Reranker. Это сделает архитектуру интеллектуальных систем более модульной, быстрой и экономически эффективной.