Новости, обновления инструментов и кейсы в реальном времени
Компания NVIDIA представила интеграцию своего фреймворка NeMo с экосистемой Hugging Face, что позволяет значительно ускорить процесс дообучения гигантских языковых моделей.
Использование квантованных локальных языковых моделей для бесплатной автоматизации управления репозиториями на примере OpenClaw и DeepSeek.
Команда PaddlePaddle представила шестую версию своей системы оптического распознавания символов. Модели размером до 34.5 миллионов параметров обходят миллиардные VLM в задачах чтения текста.
Ведущие технологические компании представили открытый стандарт ARD, который позволяет ИИ-агентам динамически находить и подключать необходимые инструменты без предварительной ручной настройки.
Компания Cohere представила свою первую модель, ориентированную на написание кода. Разбираем характеристики новинки и ее значение для экосистемы корпоративного искусственного интеллекта.
Hugging Face и ведущие ИИ-компании передают управление проектом OpenEnv комитету, чтобы создать единый протокол для обучения ИИ-агентов с открытым исходным кодом.
Командный интерфейс Hugging Face теперь автоматически адаптируется под ИИ-агентов, снижая расход токенов в шесть раз и повышая точность выполнения задач.
Разбор нового поколения моделей и наборов данных NVIDIA, предназначенных для контроля безопасности и фильтрации контента в мультимодальных ИИ-системах.
Компания JetBrains представила новую модель Mellum2 на 12 миллиардов параметров. Разбираем, как архитектура MoE помогает оптимизировать работу искусственного интеллекта для разработчиков.
Компания NVIDIA опубликовала на платформе Hugging Face новые коллекции моделей и наборов данных Nemotron-Labs, исследуя применение диффузионного подхода для сверхбыстрой генерации текста.
На платформе Hugging Face представлено семейство открытых моделей Ettin Reranker. Разбираем, как линейка от 17 миллионов до 1 миллиарда параметров меняет подход к текстовому поиску.
IBM представила новые мультиязычные модели для создания векторных представлений текста с контекстным окном в 32 тысячи токенов и свободной лицензией Apache 2.0.
Анализ новой линейки моделей от NVIDIA, предназначенной для создания агентов с длинным контекстом, способных обрабатывать текст, звук и видео в едином потоке.
Разбор открытой модели privacy-filter на 1 миллиард параметров и ее роли в создании безопасных масштабируемых веб-приложений.
Платформа Hugging Face представила концепцию Ecom-RLVE — проверяемой среды с каталогом на 2 миллиона товаров для обучения надежных диалоговых агентов в онлайн-ритейле.
Разбор архитектуры и принципов обучения новой модели Nemotron-OCR-v2, которая решает проблему нехватки данных для распознавания текста с помощью генерации синтетических наборов.
NVIDIA опубликовала на Hugging Face открытую модель Isaac GR00T N1.7 класса «зрение-язык-действие» (VLA), предназначенную для управления человекоподобными роботами.
Разбор новой линейки открытых моделей от Google. Почему фокус на локальную работу и мультимодальность меняет правила игры для разработчиков и исследователей.
Библиотека TRL получила стабильную версию 1.0. Разбираем, как развивались методы выравнивания искусственного интеллекта от сложного PPO до эффективного ORPO, и почему этот релиз меняет правила игры.
IBM представила новую компактную модель Granite 4.0 3B Vision, предназначенную для анализа корпоративных документов и работы на локальных серверах компаний.