Elo-рейтинг 90+ LLM - краудсорсинговая оценка качества моделей
Пошаговая инструкция для подключения к вашему AI-агенту
Без авторизации
Полностью бесплатно - открытые данные
Без ограничений
Еженедельно
API доступен без ключа и регистрации
LMSYS Chatbot Arena - крупнейший краудсорсинговый бенчмарк LLM. 800K+ голосов, 90+ моделей, Elo-рейтинги. Золотой стандарт оценки качества языковых моделей.
Данные доступны через Hugging Face datasets. Полезно для выбора оптимальной модели.
800K+ моделей, 200K+ датасетов - крупнейший хаб AI-ресурсов
Граф знаний для долговременной памяти AI-агента
Научные статьи + код + SOTA бенчмарки - связь теории и практики
Бенчмарки LLM: скорость, цены, качество - сравнение провайдеров