Оверклокинг интеллекта: Claude 3.5 Sonnet унижает флагманов на двойной скорости
Anthropic переворачивает игру: новая модель Sonnet 3.5 работает в два раза быстрее Opus, стоит копейки и превращает чат в полноценную рабочую среду с функцией Artifacts.
Anthropic переворачивает игру: новая модель Sonnet 3.5 работает в два раза быстрее Opus, стоит копейки и превращает чат в полноценную рабочую среду с функцией Artifacts.
3 мин

Пока рынок замер в ожидании <a href="/glossary/gpt" class="text-primary hover:underline">GPT</a>-5, лаборатории Anthropic без лишнего шума выкатили обновление, которое меняет расклад сил в кремниевой гонке. Встречайте <a href="/glossary/claude" class="text-primary hover:underline">Claude</a> 3.5 Sonnet — модель, которая должна была стать «середнячком», но вместо этого отправила в нокаут собственного старшего брата Opus и большинство конкурентов.
Главный тезис релиза звучит как вызов законам физики нейросетей: Claude 3.5 Sonnet работает в два раза быстрее, чем тяжеловесный Claude 3 Opus, но при этом превосходит его в интеллекте. Мы привыкли к классической трилемме: быстро, умно или дешево — выбери два. Anthropic, похоже, взломали эту систему.
Новинка позиционируется как модель среднего уровня (mid-tier) по цене — $3 за миллион входных токенов и $15 за выходные. Однако тесты GPQA (рассуждения уровня аспирантуры), MMLU и HumanEval (кодинг) показывают, что «бюджетный» Sonnet 3.5 обходит текущие флагманы индустрии. Он лучше понимает нюансы, юмор и сложные инструкции, выдавая контент, который всё меньше напоминает сухой машинный текст.
Но просто разогнать нейроны недостаточно. Anthropic внедряет киллер-фичу под названием Artifacts. Эпоха «просто чата» уходит в прошлое. Теперь, когда вы просите Клода написать код, сверстать документ или спроектировать веб-страницу, результат не теряется в потоке текста.
Артефакты открываются в отдельном динамическом окне рядом с диалогом. Это превращает Claude.ai из собеседника в полноценный воркспейс. Вы видите код, можете его редактировать и итерировать в реальном времени. Это первый шаг к тому, что Anthropic называет «совместной рабочей средой», где ИИ выступает не как поисковик, а как полноценный напарник-синтетик.
Для кибер-ковбоев и разработчиков новости особенно приятные. В тестах на «агентный кодинг» (исправление багов или добавление фич в опенсорсный код) Sonnet 3.5 решил 64% задач. Для сравнения: хваленый Opus справлялся только с 38%. Модель способна самостоятельно писать, отлаживать и выполнять код, обладая изощренным логическим аппаратом.
Зрение модели (Vision) также получило апгрейд. Sonnet 3.5 видит графики и диаграммы лучше всех в своем классе, что делает его идеальным инструментом для финансовой аналитики и логистики, где данные часто заперты в пикселях, а не в символах.
Несмотря на скачок интеллекта, модель остается в рамках стандарта безопасности ASL-2. Anthropic клянется, что не обучает генеративные модели на пользовательских данных без спроса — редкая добродетель в наше время тотального дата-майнинга.
Итог: Claude 3.5 Sonnet — это не просто минорный патч. Это демонстрация того, что граница между «легкими» и «тяжелыми» моделями стирается. Если «середняк» работает так, то страшно представить, что покажет Claude 3.5 Opus, релиз которого намечен на конец года.