Агенты vs Данные: почему вы используете AI неправильно
Загружать Excel-таблицы в контекстное окно — тупиковый путь. Разбираем архитектуру Remote, где нейросети пишут код вместо того, чтобы читать данные.
Загружать Excel-таблицы в контекстное окно — тупиковый путь. Разбираем архитектуру Remote, где нейросети пишут код вместо того, чтобы читать данные.
2 мин

Мы все совершаем одну и ту же ошибку. Когда нужно проанализировать огромный отчет или базу данных, мы пытаемся «скормить» файл нейросети целиком. Мы молимся на расширение контекстного окна до миллиона токенов, надеясь, что <a href="/glossary/gpt" class="text-primary hover:underline">GPT</a>-5 переварит наши гигабайты. Инженеры компании Remote доказали: это путь в никуда.
Remote — глобальная платформа для найма, которая ежемесячно обрабатывает тысячи сложнейших зарплатных ведомостей и SQL-выгрузок. Их попытки использовать стандартный подход <a href="/glossary/rag" class="text-primary hover:underline">RAG</a> или прямую загрузку файлов в <a href="/glossary/llm" class="text-primary hover:underline">LLM</a> закончились провалом. Даже топовые модели захлебывались, теряли контекст и, что хуже всего, галлюцинировали. В финансах ошибка в цифре недопустима.
Решение, к которому они пришли, меняет правила игры. Они перестали использовать AI как «процессор» информации и начали использовать его как «планировщик».
Вместо того чтобы заставлять модель читать 50-мегабайтный файл Excel, они построили Code Execution Agent на базе LangChain и LangGraph. Архитектура гениальна в своей простоте: нейросеть не видит сами данные. Она видит только схему данных. Получив задачу «конвертировать этот файл», агент пишет Python-код (используя Pandas), который выполняется в изолированной песочнице.
Это гибридный подход: «думает» нейросеть, а «делает» детерминированный код. Если код выдает ошибку, агент видит трейсбек, исправляет скрипт и запускает снова. Данные остаются в безопасности, контекстное окно свободно, а риск галлюцинаций сведен к нулю, потому что математику выполняет Python, а не вероятностная модель.
Использование LangGraph позволило превратить этот процесс в управляемый граф. Каждый шаг — загрузка, маппинг, валидация — это узел с четкими правилами перехода. Это уже не черный ящик, а надежный инженерный конвейер. Результат? Процессы, занимавшие дни ручной работы, теперь выполняются за часы, а инженеры больше не пишут одноразовые скрипты.
Главный урок кейса Remote: перестаньте ждать бесконечного контекста. Будущее не за моделями, которые помнят всё, а за агентами, которые умеют пользоваться инструментами. Если ваша задача требует точности — заставьте AI писать код, а не гадать на токенах.
Эффективная работа с большими данными требует смены парадигмы: AI должен не читать файлы, а писать код для их обработки.
Главное преимущество такого подхода — не скорость, а аудируемость: код можно проверить и воспроизвести, в отличие от скрытых «мыслей» нейросети.