
Claude Mythos и Проект Glasswing: Самая мощная модель Anthropic слишком опасна для публичного выпуска
8 апреля 2026 г.
TL;DR
- 7 апреля 2026 года Anthropic представил Claude Mythos Preview — неопубликованную frontier-модель, которая уже обнаружила тысячи уязвимостей нулевого дня во всех основных операционных системах и браузерах — включая баг, скрывавшийся в OpenBSD 27 лет.
- Anthropic не делает Mythos публично доступным. Вместо этого был запущен Проект Glasswing — инициатива стоимостью 100 млн долларов с участием AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Broadcom, JPMorgan Chase, Palo Alto Networks и Linux Foundation — для использования модели в защитных целях до того, как аналогичные возможности попадут в руки атакующих.
- Mythos не просто немного опережает Claude Opus 4.6. На SWE-bench Pro он набирает 77,8% против 53,4% — скачок на 24 пункта на бенчмарке, созданном для того, чтобы быть жестоко сложным.
- Стратегический посыл для каждого владельца бизнеса: «разрыв в кибербезопасности ИИ» между атакующими и защитниками вот-вот резко расширится. Большинство МСП к этому не готовы.
- В этой статье разбирается, что мы действительно знаем (с источниками), что является хайпом и три конкретных действия, которые европейские B2B-компании должны предпринять прямо сейчас.
Что такое Claude Mythos Preview?
Claude Mythos Preview — это новая frontier-модель общего назначения от Anthropic — на уровень выше нынешнего публичного Claude Opus 4.6 — которую компания описывает как демонстрацию того, что AI-системы достигли возможностей программирования, превосходящих всех людей, кроме наиболее квалифицированных специалистов по поиску и эксплуатации уязвимостей программного обеспечения.
Существование Mythos ещё не должно было стать публичным. Ошибка конфигурации в системе управления контентом Anthropic в конце марта случайно раскрыла, что компания работает над новым уровнем модели, более крупным и мощным, чем Opus. Эта утечка вынудила разговор выйти в публичное пространство раньше, чем Anthropic, вероятно, планировал.
То, что отличает Mythos от каждого другого frontier-запуска за последние два года — Anthropic сознательно выбирает не публиковать его широкой аудитории. Ньютон Ченг, руководитель Frontier Red Team Cyber в Anthropic, сказал VentureBeat, что компания не планирует делать Claude Mythos Preview общедоступным из-за его возможностей в области кибербезопасности. Это один из первых случаев, когда крупная AI-лаборатория придержала флагманскую модель, сославшись на общественный риск, а не просто на политику безопасности как театр.
Бенчмарки: Скачок Поколения, Не Инкремент
Anthropic опубликовал таблицу бенчмарков вместе с объявлением, и разрыв между Mythos Preview и нынешним публичным фронтиром (Claude Opus 4.6) неочевиден. Это тот вид скачка, который мы последний раз видели между GPT-3.5 и GPT-4.
| Бенчмарк | Claude Mythos Preview | Claude Opus 4.6 | Что измеряет |
|---|---|---|---|
| SWE-bench Verified | 93,9% | 80,8% | Реальные задачи разработки ПО |
| SWE-bench Pro | 77,8% | 53,4% | Самый сложный уровень бенчмарков программирования |
| SWE-bench Multilingual | 87,3% | 77,8% | Программирование на разных языках |
| CyberGym | 83,1% | 66,6% | Анализ уязвимостей AI-агентами |
| Humanity's Last Exam (без инструментов) | 56,8% | 40,0% | Чистое рассуждение над почти неразрешимыми задачами |
| Humanity's Last Exam (с инструментами) | 64,7% | 53,1% | Рассуждение с поддержкой инструментов |
| BrowseComp | 86,9% | 83,7% | Многоэтапное веб-исследование |
Цифры взяты из собственной публикации бенчмарков Anthropic, о которой сообщил OfficeChai: на SWE-bench Pro Mythos опережает Opus 4.6 на 24 пункта и превосходит предыдущий ведущий результат GPT-5.3-Codex более чем на 21 пункт.
Для понимания масштаба: только на SWE-bench Verified показатель Mythos 93,9% разместил бы его более чем на 13 пунктов выше любой публично доступной модели на рынке сегодня. Это не квартальное обновление. Это сброс таблицы лидеров.
Важная оговорка, которая не фигурирует в большинстве материалов: сам Anthropic отметил, что Mythos хорошо справляется с Humanity's Last Exam даже при низких вычислительных усилиях, что компания расценивает как возможный признак некоторой меморизации. Воспринимайте эти цифры HLE с долей скептицизма — но скачки на SWE-bench и CyberGym вполне реальны.
Проект Glasswing: Оборонительный Пакт на 100 Миллионов
Вместо того чтобы поставлять Mythos пользователям в стиле ChatGPT, Anthropic направляет его в коалицию. Проект Glasswing объединяет неопубликованный Mythos Preview с двенадцатью крупными технологическими и финансовыми компаниями — Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks — для поиска и устранения уязвимостей программного обеспечения в критической инфраструктуре до того, как противники смогут ими воспользоваться.
Финансовые обязательства имеют значение: Anthropic расширил доступ ещё более чем 40 организациям, разрабатывающим или обслуживающим критическое программное обеспечение, взял обязательство предоставить до 100 млн долларов в виде кредитов на использование и пожертвовал 4 млн долларов организациям по безопасности с открытым исходным кодом, включая 2,5 млн Alpha-Omega и OpenSSF и 1,5 млн Apache Software Foundation.
Почему список партнёров звучит как Who's Who? Потому что компании в области кибербезопасности, которые долго гордились своим проприетарным ИИ, публично признают, что последний релиз Anthropic обнаруживает уязвимости нулевого дня, которые не нашёл ни один другой инструмент. То, что CrowdStrike и Palo Alto Networks присоединились — это та часть, о которой никто не говорит достаточно громко: это компании, всё конкурентное преимущество которых основано на «у нас лучший AI безопасности, чем у вас».
Открытия Нулевого Дня: Баги, Скрывавшиеся Десятилетиями
Здесь история перестаёт казаться обновлением бенчмарков и начинает казаться переломным моментом.
За последние несколько недель Anthropic использовал Claude Mythos Preview для выявления тысяч уязвимостей нулевого дня — изъянов, ранее неизвестных разработчикам программного обеспечения, — многие из которых критические, во всех основных операционных системах и всех основных браузерах.
Главный пример: самый старый баг, обнаруженный Mythos, — уязвимость в OpenBSD, остававшаяся неизвестной и незакрытой 27 лет, а модель также объединила несколько уязвимостей в ядре Linux для получения доступа суперпользователя. OpenBSD — это операционная система, вся репутация которой построена на тщательном аудите. Двадцатисемилетняя дыра в ней — это тот вид находки, от которой опытные исследователи безопасности останавливаются и смотрят.
По данным 9to5Mac, некоторые из этих уязвимостей пережили десятилетия человеческих проверок и миллионы автоматизированных тестов безопасности. Эта фраза — «миллионы автоматизированных тестов безопасности» — та часть, над которой руководители бизнеса должны задуматься на минуту. Существующий арсенал статических анализаторов, фаззеров и инструментов SAST их не обнаружил. Языковая модель общего назначения — обнаружила.
Как Anthropic Реально Это Тестировал
Методология заслуживает понимания, потому что это шаблон, который каждая защитная команда безопасности будет копировать в течение следующих 18 месяцев. Anthropic запускает контейнер, изолированный от интернета, в котором работает тестируемый проект вместе с его исходным кодом, затем вызывает Claude Code с Mythos Preview и даёт ему по существу инструкцию «найди уязвимость безопасности в этой программе».
После этого модель действует агентно: читает код для формирования гипотез об уязвимостях, запускает проект для подтверждения или опровержения своих подозрений, добавляет отладочную логику или использует отладчики по мере необходимости и в итоге выдаёт либо что ошибок не существует, либо отчёт об ошибке с прототипом эксплойта и шагами воспроизведения.
Для масштабирования этого процесса Anthropic добавил два умных оптимизации. Во-первых, они просят Claude оценить каждый файл в проекте по шкале от 1 до 5 по вероятности содержания интересных ошибок, затем сначала запускают агентов на файлах с наивысшим приоритетом. Во-вторых, в конце они запускают отдельного агента-валидатора, единственная задача которого — подтвердить, является ли каждый сообщённый баг реальным и заслуживающим внимания, фильтруя технически корректные, но нерелевантные находки.
Это workflow, который любая компетентная инженерная команда может воспроизвести сегодня, используя публично доступные модели — с меньшими возможностями, но той же структурой. Это практическая идея, спрятанная в объявлении.
Почему Anthropic Придержал Mythos
Две причины — одна заявленная, одна очевидная.
Заявленная причина: риск двойного использования. Anthropic планирует сначала запустить новые защитные меры с предстоящей моделью Claude Opus, что позволит компании отточить эти меры на модели, которая не представляет такого же уровня риска, как Mythos Preview. Перевод: та же возможность, которая позволяет защитникам закрывать уязвимости нулевого дня, позволяет атакующим их находить. Пока у Anthropic нет надёжных способов обнаруживать и блокировать наступательное использование, публичный выпуск означал бы передачу мастер-ключа любому, у кого есть кредитная карта.
Очевидная причина: вычислительная мощность. В черновике записи блога, утёкшем в марте, Mythos был описан как большая, вычислительно интенсивная модель, обслуживание которой было бы дорогостоящим как для Anthropic, так и для его клиентов. На той же неделе, когда был запущен Glasswing, Broadcom подписал расширенное соглашение, дающее Anthropic доступ примерно к 3,5 гигаватт вычислительных мощностей на основе AI-процессоров Google. 3,5 гигаватт — это примерно мощность трёх ядерных реакторов. Даже при этом обслуживание Mythos для 20 миллионов пользователей в стиле ChatGPT было бы невозможным при нынешней эффективности.
Так что формулировка «мы проявляем осторожность» реальна — и это также удобный способ запустить модель, которую компания всё равно не смогла бы обслуживать.
Что Это Реально Означает для Вашего Бизнеса
Это часть, которую большинство материалов пропускает. Уберём культ бенчмарков и апокалиптические нарративы — три вещи меняются для европейских B2B-компаний прямо сейчас.
1. «Разрыв в Кибербезопасности ИИ» Вот-Вот Резко Расширится
Два года предполагалось, что ИИ помогает атакующим и защитникам примерно одинаково. Mythos — первый достоверный сигнал того, что защитники могут вырваться вперёд — но только защитники внутри коалиции Glasswing. Все остальные работают с Claude Opus 4.6, GPT-5 и Gemini 3 Pro — способными моделями, но не уровня Mythos.
Если вы управляете SaaS, интернет-магазином или любым бизнесом с базой данных клиентов, практическое следствие таково: через 12–18 месяцев публичные версии этих моделей догонят нынешний уровень Mythos. Ваши атакующие получат доступ одновременно с вами. Окно для укрепления ваших систем — сейчас, пока асимметрия ещё благоприятствует защитникам, которые действуют заблаговременно.
2. Аудиты Безопасности на Уровне Кода Стали Доступными
До этого объявления серьёзный аудит безопасности приложений стоил 15 000–80 000 € и занимал недели. Методология Mythos — контейнеризованный код, агентная охота за уязвимостями, агенты-валидаторы — сегодня может быть воспроизведена с Claude Opus 4.6 или Sonnet 4.6 за долю этой стоимости. Не на уровне качества Mythos, но на уровне «обнаруживает очевидные вещи, которые иначе превратились бы в утечку данных».
Для большинства европейских МСП, работающих с приложениями на Next.js, Laravel или Rails, это разница между тем, чтобы никогда не иметь аудита безопасности, и тем, чтобы проводить его каждый квартал. Именно здесь AI-консалтинговые компании — включая нашу в areza.digital — должны сейчас строить продуктизированные предложения.
3. Вопрос Цепочки Поставок Программного Обеспечения Становится Острее
Заявленная цель Проекта Glasswing — открытый исходный код и критическая инфраструктура. Исполнительный директор Linux Foundation Джим Землин указал, что экспертиза в области безопасности исторически была роскошью, доступной только организациям с большими командами безопасности, тогда как мейнтейнеры открытого исходного кода были предоставлены сами себе.
Если вы строите на открытом исходном коде — а каждый современный бизнес это делает — ваша цепочка поставок будет проаудирована Mythos вне зависимости от вашего участия. Уязвимости в ваших зависимостях будут найдены и закрыты быстрее, чем вы сможете их применить. Ваш ритм обновления патчей становится конкурентным фактором риска. Компании, которые автоматически обновляют зависимости еженедельно, будут в большей безопасности, чем те, кто делает это ежеквартально. Это изменение процесса, а не инструментов, и его внедрение ничего не стоит.
Что Хайп, Что Реально
Несколько утверждений, циркулирующих сегодня в LinkedIn и X, которые стоит тщательно проверить:
- «Mythos стоит в 5 раз дороже Opus 4.6» — Официально не подтверждено ни в одном опубликованном материале Anthropic. Берёт начало из вторичных комментариев. Расценивать как спекуляцию.
- «Инженер без опыта в безопасности нашёл эксплойты за ночь» — Анекдот, якобы опубликованный во внутренних материалах Anthropic, повторяемый в вирусных постах, но не в официальном объявлении. Правдоподобно, не верифицировано.
- «USAMO математическая олимпиада 97,6%» и «Cybench 100% решений» — Встречаются в некоторых постах в соцсетях, но не подтвердились в опубликованном Anthropic документе с бенчмарками. Верифицированные бенчмарки — это те, что в таблице выше.
Если вы пишете о Mythos для своей аудитории, придерживайтесь подтверждённых источниками цифр. Верифицированная история достаточно драматична — украшения не нужны.
FAQ
Что такое Claude Mythos Preview? Claude Mythos Preview — неопубликованная frontier AI-модель от Anthropic, более мощная, чем нынешний публичный Claude Opus 4.6. Она демонстрирует значительные улучшения в программировании, рассуждении и особенно в обнаружении уязвимостей кибербезопасности.
Могу ли я использовать Claude Mythos? Нет. Anthropic не делает Mythos общедоступным. Доступ ограничен партнёрами Проекта Glasswing — сейчас это 12 крупных технологических и финансовых компаний плюс около 40 дополнительных организаций, обслуживающих критическую программную инфраструктуру.
Что такое Проект Glasswing? Проект Glasswing — оборонительная инициатива в области кибербезопасности стоимостью 100 млн долларов, запущенная Anthropic 7 апреля 2026 года в партнёрстве с AWS, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, Linux Foundation и Palo Alto Networks для использования Claude Mythos Preview для поиска и устранения уязвимостей в критической инфраструктуре.
Сколько уязвимостей нашёл Mythos? Anthropic сообщает о тысячах обнаруженных уязвимостей нулевого дня во всех основных операционных системах и браузерах, включая 27-летний баг в OpenBSD и цепочку уязвимостей ядра Linux, позволявшую эскалацию привилегий до суперпользователя.
Когда Mythos будет публично выпущен? Anthropic не взял обязательств по дате публичного выпуска. Компания планирует сначала разработать новые защитные меры с использованием предстоящей модели Claude Opus до рассмотрения более широкого развёртывания класса Mythos.
Что должен делать мой бизнес? Три вещи: ужесточите ритм обновления зависимостей, запустите сканирование уязвимостей собственной кодовой базы с использованием доступных сейчас моделей (Opus 4.6 или Sonnet 4.6 по методологии, опубликованной Anthropic), и воспринимайте следующие 12–18 месяцев как окно для укрепления ваших систем до того, как аналогичные возможности достигнут атакующих.
Итог
Claude Mythos — это не просто очередной запуск модели. Это первый случай, когда frontier AI-лаборатория публично заявила, что одна из её собственных моделей слишком мощна для выпуска — и приняла это достаточно серьёзно, чтобы передать её коалиции конкурентов. Расцениваете ли вы это как ответственное управление или стратегический театр — базовые возможности реальны, а асимметрия, которую они создают между внутренними участниками коалиции и всеми остальными, будет определять безопасность европейского B2B-программного обеспечения в течение следующих 18 месяцев.
Если вы основатель, технический директор или операционный менеджер, пытающийся понять, что реально делать с этим — а не просто мудро кивать в LinkedIn — это разговор, который мы ведём в areza.digital каждую неделю. Мы помогаем европейским компаниям превращать frontier AI-возможности в системы, которые разрабатываются, защищаются и масштабируются. Забронировать 30-минутный ознакомительный звонок →
Автор: Никита Яночкин, основатель areza.digital. Источники: блог Anthropic Frontier Red Team, объявление Anthropic Glasswing, VentureBeat, TechCrunch, The New Stack, OfficeChai, IT Pro, 9to5Mac, Axios. Последнее обновление: 8 апреля 2026 г.
Перестаньте терять лидов из-за медленного сайта
Забронируйте бесплатный friction audit и увидьте, где именно ваш сайт теряет деньги.