Automatizavimas

Claude Mythos ir Projektas Glasswing: Galingiausias Anthropic modelis yra pernelyg pavojingas, kad būtų išleistas

2026 m. balandžio 8 d.

TL;DR

2026 m. balandžio 7 d. Anthropic pristatė Claude Mythos Preview — neišleistą frontier modelį, kuris jau aptiko tūkstančius nulinės dienos pažeidžiamumų visose pagrindinėse operacinėse sistemose ir naršyklėse — įskaitant klaidą, 27 metus slaptai buvusią OpenBSD.
Anthropic neišleidžia Mythos viešai. Vietoj to buvo paleistas Projektas Glasswing — 100 mln. JAV dolerių iniciatyva su AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Broadcom, JPMorgan Chase, Palo Alto Networks ir Linux Foundation — modelį naudoti gynybiškai, kol panašios galimybės nepateko į užpuolikų rankas.
Mythos ne šiek tiek lenkia Claude Opus 4.6. SWE-bench Pro jis gauna 77,8% prieš 53,4% — 24 taškų šuolis teste, sukurtame būti žiauriai sunkiu.
Strateginė žinutė kiekvienam verslo savininkui: "AI kibernetinio saugumo spraga" tarp užpuolikų ir gynėjų netrukus dramatiškai išsiplės. Dauguma MVĮ tam nėra pasiruošusios.
Šis straipsnis paaiškina, ką iš tikrųjų žinome (su šaltiniais), kas yra hype'as ir tris konkrečius veiksmus, kuriuos Europos B2B įmonės turėtų imtis dabar.

Kas yra Claude Mythos Preview?

Claude Mythos Preview yra naujas Anthropic bendrosios paskirties frontier modelis — pakopa aukščiau nei šiuo metu viešas Claude Opus 4.6 — kurį įmonė apibūdina kaip demonstraciją, kad AI sistemos pasiekė kodavimo galimybes, pranokstančias visus žmones, išskyrus pačius kvalifikuočiausius, ieškant ir išnaudojant programinės įrangos pažeidžiamumus.

Mythos egzistavimas dar neturėjo tapti viešas. Klaida Anthropic turinio valdymo sistemoje kovo pabaigoje atsitiktinai atskleidė, kad įmonė dirba su nauju modelių lygiu, didesniu ir galingesniu nei Opus. Tas nutekėjimas privertė pokalbį patekti į viešumą anksčiau, nei Anthropic tikriausiai planavo.

Tai, kas Mythos išskiria iš kiekvieno kito frontier paleidimo per pastaruosius dvejus metus — Anthropic sąmoningai pasirenka jo neišleisti viešai. Newton Cheng, Anthropic Frontier Red Team Cyber vadovas, VentureBeat pasakė, kad įmonė neplanuoja visuotinai prieinamu padaryti Claude Mythos Preview dėl jo kibernetinio saugumo galimybių. Tai vienas iš pirmų atvejų, kai didelė AI laboratorija sulaikė flagmaninį modelį, cituodama visuomeninę riziką, o ne tik saugumo politiką kaip teatrą.

Benchmark'ai: Kartų Šuolis, Ne Pokytis

Anthropic paskelbė benchmark'ų lapą kartu su pranešimu, o atotrūkis tarp Mythos Preview ir dabartinio viešo frontier (Claude Opus 4.6) nėra subtilus. Tai toks šuolis, kokį paskutinį kartą matėme tarp GPT-3.5 ir GPT-4.

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Ką matuoja
SWE-bench Verified	93,9%	80,8%	Realaus pasaulio programinės įrangos inžinerijos užduotys
SWE-bench Pro	77,8%	53,4%	Sunkiausias kodavimo benchmark'ų lygis
SWE-bench Multilingual	87,3%	77,8%	Kodavimas įvairiomis programavimo kalbomis
CyberGym	83,1%	66,6%	Pažeidžiamumų analizė AI agentų
Humanity's Last Exam (be įrankių)	56,8%	40,0%	Grynas samprotavimas beveik neišsprendžiamų problemų
Humanity's Last Exam (su įrankiais)	64,7%	53,1%	Įrankiais paremtas samprotavimas
BrowseComp	86,9%	83,7%	Kelių žingsnių žiniatinklio tyrimas

Skaičiai gauti iš paties Anthropic benchmark'ų leidinio, pranešto OfficeChai, kuris pažymėjo, kad SWE-bench Pro Mythos lenkia Opus 4.6 24 taškais ir viršija ankstesnį GPT-5.3-Codex pirmaujantį rezultatą daugiau nei 21 tašku.

Kad tai įsivaizdintume: vien SWE-bench Verified Mythos 93,9% būtų daugiau nei 13 taškų aukščiau bet kurio šiandien viešai prieinamo modelio rinkoje. Tai ne ketvirčio atnaujinimas. Tai lyderių lentelės nustatymas iš naujo.

Svarbus perspėjimas, kuris neatsiranda daugelyje apžvalgų: pats Anthropic pažymėjo, kad Mythos gerai pasirodo Humanity's Last Exam net esant mažoms skaičiavimo pastangoms, ką įmonė nurodo kaip galimą tam tikro įsiminimo požymį. Žiūrėkite į tuos HLE skaičius atsargiai — bet SWE-bench ir CyberGym šuoliai yra labai realūs.

Projektas Glasswing: 100 Milijonų Gynybinis Paktas

Vietoj to, kad pristatytų Mythos vartotojams ChatGPT stiliaus, Anthropic nukreipia jį į koaliciją. Projektas Glasswing sujungia neišleistą Mythos Preview su dvylika didelių technologijų ir finansų įmonių — Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA ir Palo Alto Networks — rasti ir pataisyti programinės įrangos pažeidžiamumus kritinėje infrastruktūroje prieš tai, kai priešininkai galės juos išnaudoti.

Finansinis įsipareigojimas svarbus: Anthropic išplėtė prieigą daugiau nei 40 papildomų organizacijų, kurios kuria ar prižiūri kritinę programinę įrangą, įsipareigojo suteikti iki 100 mln. dolerių naudojimo kreditų ir paaukojo 4 mln. dolerių atvirojo kodo saugumo organizacijoms, įskaitant 2,5 mln. Alpha-Omega ir OpenSSF bei 1,5 mln. Apache Software Foundation.

Kodėl partnerių sąrašas atrodo kaip Who's Who? Nes kibernetinio saugumo įmonės, kurios ilgai didžiavosi savo patentuotu AI, viešai pripažįsta, kad naujausias Anthropic leidimas aptinka nulinės dienos spragas, kurių jokis kitas įrankis nerado. Tai, kad CrowdStrike ir Palo Alto Networks prisijungė, yra dalis, apie kurią niekas nekalba pakankamai garsiai — tai įmonės, kurių visa konkurencinė pranašumas grindžiama "mes turime geresnį saugumo AI nei jūs".

Nulinės Dienos Atradimai: Klaidos, Slypėjusios Dešimtmečius

Čia istorija nustoja atrodyti kaip benchmark'ų atnaujinimas ir pradeda atrodyti kaip posūkio taškas.

Per pastarąsias kelias savaites Anthropic naudojo Claude Mythos Preview tūkstančiams nulinės dienos pažeidžiamumų identifikuoti — trūkumams, anksčiau nežinomiems programinės įrangos kūrėjams —, daugelis jų kritiniai, kiekvienoje pagrindinėje operacinėje sistemoje ir kiekvienoje pagrindinėje naršyklėje.

Pagrindinis pavyzdys: seniausia Mythos aptikta klaida buvo pažeidžiamumas OpenBSD, išlikęs nežinomas ir nepataisytas 27 metus, o modelis taip pat sujungė keletą Linux branduolio trūkumų supernaudotojo prieigai gauti. OpenBSD yra operacinė sistema, kurios visa reputacija sukurta ant kruopštaus audito. Dvidešimt septynerių metų skylė joje yra tokio tipo atradimas, kuris sustabdo patyrusius saugumo tyrėjus.

Pagal 9to5Mac pranešimo apžvalgą, kai kurie iš šių pažeidžiamumų išgyveno dešimtmečius žmogaus peržiūros ir milijonus automatizuotų saugumo testų. Ta frazė — "milijonai automatizuotų saugumo testų" — yra dalis, ties kuria verslo lyderiai turėtų minutę sustoti ir pagalvoti. Esamas statinių analizatorių, fuzzerių ir SAST įrankių arsenalas jų neaptiko. Bendrosios paskirties kalbos modelis aptiko.

Kaip Anthropic Iš Tikrųjų Jį Testavo

Metodika verta suprasti, nes tai šablonas, kurį kiekviena gynybinė saugumo komanda kopijuos per ateinančius 18 mėnesių. Anthropic paleidžia nuo interneto izoliuotą konteinerį, kuriame veikia testuojamas projektas su jo šaltinio kodu, tada kviečia Claude Code su Mythos Preview ir iš esmės nurodo "rask saugumo pažeidžiamumą šioje programoje".

Nuo ten modelis veikia agentiškai: skaito kodą, kad suformuluotų hipotezes apie pažeidžiamumus, paleidžia projektą, kad patvirtintų ar atmestų savo įtarimus, prideda derinimo logiką arba naudoja derintuvus pagal poreikį ir galiausiai pateikia arba kad jokia klaida neegzistuoja, arba klaidų ataskaitą su koncepcijos įrodymo exploit'u ir atkūrimo žingsniais.

Šiam procesui masteliuoti Anthropic pridėjo dvi išmintingas optimizacijas. Pirma, prašo Claude'o įvertinti kiekvieną projekto failą nuo 1 iki 5 pagal tikimybę jame rasti įdomių klaidų, tada pirmiausia paleidžia agentus ant aukščiausio prioriteto failų. Antra, pabaigoje paleido atskirą validatoriaus agentą, kurio vienintelė užduotis patvirtinti, ar kiekviena pranešta klaida yra reali ir verta dėmesio, filtruojant techniškai galiojančius, bet nereikšmingus atradimus.

Tai workflow, kurį bet kuri kompetentinga inžinerijos komanda šiandien gali atkurti naudodama viešai prieinamus modelius — mažesnėmis galimybėmis, bet ta pačia struktūra. Tai yra praktinė įžvalga, paslėpta pranešime.

Kodėl Anthropic Sulaikė Mythos

Dvi priežastys — viena paskelbta, kita akivaizdi.

Paskelbta priežastis: dvigubos paskirties rizika. Anthropic planuoja pirmiausia paleisti naujus apsaugos mechanizmus su artėjančiu Claude Opus modeliu, leisdamas įmonei tobulinti tuos mechanizmus su modeliu, kuris nekelia tokio pat rizikos lygio kaip Mythos Preview. Vertimas: ta pati galimybė, leidžianti gynėjams pataisyti nulinės dienos spragas, leidžia užpuolikams jas rasti. Kol Anthropic neturės patikimų būdų aptikti ir blokuoti įžeidžiamąjį naudojimą, viešas išleidimas reikštų pagrindinio rakto įteikimą kiekvienam su kredito kortele.

Akivaizdi priežastis: skaičiavimo galia. Kovo mėnesį nutekėjusiame tinklaraščio įrašo projekte Mythos buvo apibūdintas kaip didelis, skaičiavimo intensyvus modelis, kurio aptarnavimas būtų brangus tiek Anthropic, tiek jo klientams. Tą pačią savaitę, kai buvo paleistas Glasswing, Broadcom pasirašė išplėstą susitarimą, suteikiantį Anthropic prieigą prie maždaug 3,5 gigavato skaičiavimo pajėgumų, pagrįstų Google AI procesoriais. 3,5 gigavatai yra maždaug trijų branduolinių reaktorių produkcija. Net ir su tuo, aptarnauti Mythos 20 milijonų ChatGPT stiliaus vartotojų būtų neįmanoma esant dabartiniam efektyvumui.

Taigi "esame atsargūs" formuluotė yra reali — ir tai taip pat patogus būdas paleisti modelį, kurio įmonė vis tiek negalėtų aptarnauti.

Ką Tai Iš Tikrųjų Reiškia Jūsų Verslui

Tai yra dalis, kurią dauguma apžvalgų praleidžia. Pašalinus benchmark'ų kultą ir katastrofinius požiūrius, trys dalykai keičiasi Europos B2B įmonėms nuo šiol.

1. "AI Kibernetinio Saugumo Spraga" Netrukus Dramatiškai Išsiplės

Dvejus metus buvo daroma prielaida, kad AI padeda užpuolikams ir gynėjams maždaug vienodai. Mythos yra pirmasis patikimas signalas, kad gynėjai gali išsiveržti į priekį — bet tik gynėjai Glasswing koalicijos viduje. Visi kiti dirba su Claude Opus 4.6, GPT-5 ir Gemini 3 Pro — galingais modeliais, bet ne Mythos klasės.

Jei valdote SaaS, el. prekybos parduotuvę ar bet kurį verslą su klientų duomenų baze, praktinė implikacija yra tokia: per 12–18 mėnesių šių modelių viešos versijos pasieks dabartinį Mythos lygį. Jūsų užpuolikai turės prieigą tuo pat metu kaip ir jūs. Langą sistemų apsaugai stiprinti reikia išnaudoti dabar, kol asimetrija dar palankia gynėjams, kurie veikia anksti.

2. Saugumo Auditai Kodo Lygmeniu Tapo Prieinami

Iki šio pranešimo rimtas programų saugumo auditas kainavo 15 000–80 000 € ir užtruko savaites. Mythos metodika — konteinerizuotas kodas, agentinis pažeidžiamumų medžiojimas, validatoriaus agentai — šiandien gali būti vykdoma su Claude Opus 4.6 arba Sonnet 4.6 už nedidelę to kainos dalį. Ne Mythos kokybės lygyje, bet "pastebi akivaizdžius dalykus, kurie kitaip taptų pažeidimu" lygyje.

Daugumai Europos MVĮ, veikiančių su Next.js, Laravel ar Rails programomis, tai yra skirtumas tarp niekada neturėjimo saugumo audito ir jo turėjimo kiekvieną ketvirtį. Čia AI konsultacinės įmonės — įskaitant mūsų areza.digital — turėtų dabar kurti produktizuotus pasiūlymus.

3. Programinės Įrangos Tiekimo Grandinės Klausimas Tampa Aštresnėmis

Deklaruotas Projekto Glasswing tikslas yra atvirasis kodas ir kritinė infrastruktūra. Jim Zemlin, Linux Foundation vykdomasis direktorius, pažymėjo, kad saugumo ekspertizė istoriškai buvo prabanga, skirta organizacijoms su didelėmis saugumo komandomis, o atvirojo kodo prižiūrėtojai buvo palikti patys sau.

Jei kuriate ant atvirojo kodo — o kiekvienas modernus verslas tai daro — jūsų tiekimo grandinė bus audituota Mythos nepriklausomai nuo to, ar dalyvaujate, ar ne. Jūsų priklausomybių pažeidžiamumai bus rasti ir pataisyti greičiau, nei galite juos pritaikyti. Jūsų pataisymų dažnumas tampa konkurencinio rizikos veiksniu. Įmonės, kurios priklausomybes atnaujina automatiškai kas savaitę, bus saugesnės už tas, kurios tai daro kas ketvirtį. Tai proceso, o ne įrankių pokytis, ir jį įgyvendinti nieko nekainuoja.

Kas Yra Hype'as, Kas Realu

Keli teiginiai, šiandien sklindantys LinkedIn ir X, kuriuos verta atidžiai patikrinti:

"Mythos 5 kartus brangesnis nei Opus 4.6" — Oficialiai nepatvirtinta jokiuose Anthropic paskelbtuose materialu. Kilęs iš antrinių komentarų. Laikyti spekuliacija.
"Inžinierius be saugumo mokymo rado exploit'ų per naktį" — Anekdotas, tariamai bendrintas Anthropic vidiniuose materialu, kartojamas viraliuose įrašuose, bet ne oficaliame pranešime. Tikėtinas, nepatvirtintas.
"USAMO matematikos olimpiada 97,6%" ir "Cybench 100% sprendimo rodiklis" — Šie pasirodo kai kuriuose socialinių tinklų įrašuose, bet negalėjo būti patvirtinti Anthropic paskelbtame benchmark'ų dokumente. Patikrinti benchmark'ai yra aukščiau esančioje lentelėje.

Jei rašote apie Mythos savo auditorijai, laikykitės prie šaltiniais pagrįstų skaičių. Patikrinta istorija yra pakankamai dramatiška — jums nereikia pagražinimų.

DUK

Kas yra Claude Mythos Preview? Claude Mythos Preview yra neišleistas Anthropic frontier AI modelis, galingesnis nei dabartinis viešas Claude Opus 4.6. Jis demonstruoja reikšmingus patobulinimus kodavimo, samprotavimo ir ypač kibernetinio saugumo pažeidžiamumų aptikimo srityse.

Ar galiu naudoti Claude Mythos? Ne. Anthropic nedaro Mythos visuotinai prieinamu. Prieiga apribota Projekto Glasswing partneriais — šiuo metu 12 didelių technologijų ir finansų įmonių bei maždaug 40 papildomų organizacijų, prižiūrinčių kritinę programinės įrangos infrastruktūrą.

Kas yra Projektas Glasswing? Projektas Glasswing yra 100 mln. dolerių gynybinė kibernetinio saugumo iniciatyva, 2026 m. balandžio 7 d. paleista Anthropic, bendradarbiaujant su AWS, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, Linux Foundation ir Palo Alto Networks, siekiant naudoti Claude Mythos Preview kritinės infrastruktūros pažeidžiamumams rasti ir taisyti.

Kiek pažeidžiamumų rado Mythos? Anthropic praneša apie tūkstančius nulinės dienos pažeidžiamumų, aptiktų visose pagrindinėse operacinėse sistemose ir naršyklėse, įskaitant 27 metų klaidą OpenBSD ir Linux branduolio klaidų grandinę, leidusią supernaudotojo teisių eskalavimą.

Kada Mythos bus viešai išleistas? Anthropic neįsipareigojo dėl viešo išleidimo datos. Įmonė planuoja pirmiausia sukurti naujus apsaugos mechanizmus su artėjančiu Claude Opus modeliu prieš svarstydama platesnio Mythos klasės diegimą.

Ką mano verslas turėtų dėl to daryti? Tris dalykus: sugriežtinkite priklausomybių atnaujinimo dažnumą, vykdykite pažeidžiamumų nuskaitymus savo kodų bazėje naudodami šiuo metu prieinamus modelius (Opus 4.6 arba Sonnet 4.6 su Anthropic paskelbta metodika) ir traktuokite ateinančius 12–18 mėnesių kaip langą sistemų apsaugai stiprinti prieš tam, kad lygiavertės galimybės pasiektų užpuolikus.

Išvada

Claude Mythos nėra tik dar vienas modelio paleidimas. Tai pirmasis kartas, kai frontier AI laboratorija viešai pasakė, kad vienas iš jos modelių yra pernelyg galingas, kad būtų išleistas — ir tai priėmė pakankamai rimtai, kad perduotų jį konkurentų koalicijai. Nesvarbu, ar tai skaitote kaip atsakingą valdymą ar strateginį teatrą — pagrindinė galimybė yra reali, o asimetrija, kurią ji sukuria tarp koalicijos vidinių narių ir visų kitų, formuos Europos B2B programinės įrangos saugumą ateinančius 18 mėnesių.

Jei esate įkūrėjas, technologijų direktorius ar operatorius, bandantis suprasti, ką su tuo iš tikrųjų daryti — ne tik išmintingai linkčioti LinkedIn — tai yra pokalbis, kurį mes areza.digital vedame kiekvieną savaitę. Padedame Europos įmonėms paversti frontier AI galimybes sistemomis, kurios kuria, apsaugo ir plečiasi. Užsisakykite 30 minučių atradimo skambutį →

Parašė Nikita Janočkinas, areza.digital įkūrėjas. Šaltiniai: Anthropic Frontier Red Team tinklaraštis, Anthropic Glasswing pranešimas, VentureBeat, TechCrunch, The New Stack, OfficeChai, IT Pro, 9to5Mac, Axios. Paskutinį kartą atnaujinta 2026 m. balandžio 8 d.

Nustokite prarasti potencialius klientus dėl lėtos svetainės

Užsisakykite nemokamą trinčių auditą ir tiksliai pamatykite, kur jūsų svetainė praranda pinigus.

Užsisakyti skambutį →