Что такое LangSmith CLI?

LangSmith CLI — это агентно-ориентированный интерфейс командной строки, позволяющий AI-агентам напрямую управлять платформой LangSmith. С его помощью агенты могут выполнять действия, такие как скачивание логов или запуск экспериментов, без ручного вмешательства.

Что представляют собой «Навыки» в LangChain?

«Навыки» LangChain — это курируемые наборы инструкций и скриптов, которые AI-агенты получают по принципу прогрессивного раскрытия. Это позволяет агентам получать доступ к нужной экспертизе только при необходимости, избегая перегрузки контекста.

Как новые инструменты LangSmith повысили эффективность Claude Code?

Комбинация LangSmith CLI и «Навыков» позволила модели Claude Code значительно повысить эффективность в задачах по работе с экосистемой LangSmith. Агенты получили возможность автономно взаимодействовать с инструментами отладки и оценки, что привело к росту успешности выполнения задач с 17% до 92%.

Каково основное преимущество новых инструментов LangChain для разработки ИИ?

Основное преимущество заключается в создании замкнутого цикла самосовершенствования для AI-агентов. Они могут самостоятельно писать, тестировать, отлаживать и улучшать свой код, значительно сокращая участие человека в промежуточных этапах разработки.

Какие базовые «Навыки» доступны в LangSmith на данный момент?

В настоящее время LangSmith предлагает три базовых «навыка»: Trace для добавления логики отслеживания в код, Dataset для создания наборов данных и Evaluator для оценки работы других агентов.

Агенты обучают агентов: новый инструмент LangSmith повыша...

Суть события

Команда LangChain объявила о запуске двух важных инструментов: интерфейса командной строки (CLI) для платформы LangSmith и первой партии так называемых «навыков» (Skills). Это событие могло бы остаться незамеченным как рядовое техническое обновление, если бы не один поразительный факт. При использовании этих новых инструментов эффективность модели Claude Code в задачах по работе с экосистемой LangSmith выросла с 17% до 92%.

Фактически, разработчики создали среду, в которой AI-агенты могут самостоятельно взаимодействовать с инструментами отладки и оценки качества. Это шаг от простого написания кода к его автономному тестированию и улучшению самими нейросетями.

Контекст

Разработка приложений на основе больших языковых моделей (LLM) становится все сложнее. Если раньше разработчику достаточно было отправить запрос (prompt) и получить ответ, то теперь мы строим сложные агентные системы, которые принимают решения, используют инструменты и выполняют многошаговые задачи.

Платформа LangSmith была создана именно для того, чтобы отслеживать логику работы таких приложений (трассировка), собирать данные и оценивать качество ответов. Однако до сих пор взаимодействие с этой платформой требовало ручного вмешательства программиста или написания сложного кода интеграции.

Проблема заключалась в том, что «кодирующие агенты» (coding agents) — AI-помощники, пишущие код в терминале, — плохо понимали, как правильно использовать инструменты отладки. Им не хватало контекста и инструкций, что приводило к низкому качеству работы в специфических доменах.

Детали обновления

В центре релиза находятся два компонента:

LangSmith CLI (Command Line Interface). Это инструмент управления через терминал, созданный «агентно-ориентированным» (agent-native). Он дает AI-агентам прямые команды для выполнения любых действий внутри платформы: от скачивания логов работы до запуска экспериментов. Разработчики полагают, что в будущем циклы улучшения агентов будут управляться другими агентами, работающими исключительно в терминале.
Концепция «Навыков» (Skills). Это курируемые наборы инструкций и скриптов. Важная особенность — принцип «прогрессивного раскрытия» (progressive disclosure). Агент не загружает все знания сразу (что часто ухудшает работу модели из-за перегрузки контекста), а получает доступ к конкретному навыку только тогда, когда это необходимо для текущей задачи.

На данный момент представлено три базовых навыка:

Trace: добавление логики отслеживания в существующий код и запрос истории выполнений.
Dataset: создание наборов данных (датасетов) на основе примеров.
Evaluator: оценка работы других агентов на основе собранных данных.

Именно комбинация этих инструментов позволила модели Claude Code (Sonnet 4.6) совершить качественный скачок в бенчмарках, подняв уровень успешного выполнения задач с 17% до 92%.

Анализ

Этот релиз демонстрирует важный сдвиг в парадигме разработки AI. Мы переходим от создания инструментов для людей к созданию инструментов для агентов.

Традиционные API и документация пишутся для человека. Но AI-модели воспринимают информацию иначе. «Навыки» от LangChain — это, по сути, стандартизированный способ передачи экспертизы от разработчиков платформы непосредственно к AI-агенту. Это решает проблему «галлюцинаций» при использовании сложных библиотек: вместо того чтобы угадывать названия функций, агент получает проверенный шаблон действий.

Особенно интересен цикл самосовершенствования. Теперь агент может:

Написать код.
Добавить в него отслеживание ошибок (tracing).
Запустить код и собрать данные о его работе.
На основе данных создать тест.
Оценить себя и исправить ошибки.

Это замыкает цикл разработки (feedback loop) без участия человека на промежуточных этапах.

Перспектива

В ближайшем будущем стоит ожидать появления библиотек «навыков» для самых разных областей — от работы с базами данных до развертывания облачной инфраструктуры. Компании начнут выпускать не просто документацию для разработчиков, а готовые пакеты навыков для AI-агентов.

LangChain планирует расширять набор навыков и для своих открытых библиотек (LangGraph, DeepAgents). Если эта практика станет стандартом, порог входа в создание сложных AI-систем существенно снизится, так как большую часть рутинной работы по настройке и отладке возьмут на себя сами алгоритмы, вооруженные правильными инструкциями.

Агенты обучают агентов: новый инструмент LangSmith повышает эффективность Claude Code до 92%

Суть события

Контекст

Детали обновления

Анализ

Перспектива

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Оценка Claude Fable 5 на сложных задачах программирования: опыт команды Cursor

Как управлять рисками ИИ-агентов: подход службы безопасности Anthropic

Anthropic представила Claude Fable 5: переход к автономным агентам для сложных задач

Гайды по теме