Новое поколение моделей Gemini 3.5: переход к автономным ИИ-агентам и акцент на скорости
Разбор анонса Gemini 3.5 от Google. Почему индустрия смещает фокус с генерации текста на создание автономных агентов и как скорость модели влияет на решение реальных задач.

На недавней конференции Google I/O компания представила новую линейку моделей Gemini 3.5, начав с релиза версии 3.5 Flash. Главная особенность этого обновления — смещение фокуса с простой генерации текста на выполнение сложных, многоэтапных задач с помощью автономных агентов.
Суть происходящего
Индустрия искусственного интеллекта переходит на следующий этап развития. Если раньше основной метрикой успеха было качество написания текста или поддержания диалога, то теперь на первый план выходит способность модели действовать (action). Gemini 3.5 Flash позиционируется как инструмент для создания автономных рабочих процессов, где ИИ планирует шаги, пишет код, исправляет ошибки и взаимодействует с внешними инструментами без постоянного контроля со стороны человека.
Контекст и предпосылки

Performance comparison table of Gemini, Claude, and GPT models across various benchmarks, highlighting Gemini 3.5 Flash.
Долгое время разработчики сталкивались с проблемой: мощные модели (фронтирные) были слишком медленными и дорогими для того, чтобы запускать их в цикле, где ИИ должен многократно проверять и корректировать свои действия. Для агентных (agentic) систем критически важна низкая задержка. ИИ-агент, который пишет код, тестирует его и переписывает, генерирует тысячи токенов в фоновом режиме. Если модель работает медленно, процесс затягивается на часы.
Технические детали и цифры
Согласно заявлению разработчиков, Gemini 3.5 Flash генерирует токены в 4 раза быстрее других передовых моделей на рынке. При этом качество не пострадало: модель превосходит предыдущую версию Gemini 3.1 Pro в профильных тестах на программирование и агентные задачи, таких как Terminal-Bench 2.1 (76.2%) и MCP Atlas (83.6%).






