areza.
Blog
Claude Mythos & Projekt Glasswing: Anthropics mächtigstes Modell ist zu gefährlich für eine Veröffentlichung
Automatisierung

Claude Mythos & Projekt Glasswing: Anthropics mächtigstes Modell ist zu gefährlich für eine Veröffentlichung

8. April 2026

TL;DR

  • Am 7. April 2026 stellte Anthropic Claude Mythos Preview vor — ein unveröffentlichtes Frontier-Modell, das bereits Tausende Zero-Day-Schwachstellen in allen großen Betriebssystemen und Webbrowsern gefunden hat, darunter ein Fehler, der 27 Jahre lang in OpenBSD versteckt war.
  • Anthropic macht Mythos nicht öffentlich verfügbar. Stattdessen wurde Projekt Glasswing gestartet — eine Initiative mit 100 Mio. USD, an der AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Broadcom, JPMorgan Chase, Palo Alto Networks und die Linux Foundation beteiligt sind — um das Modell defensiv einzusetzen, bevor ähnliche Fähigkeiten in die Hände von Angreifern gelangen.
  • Mythos übertrifft Claude Opus 4.6 nicht nur knapp. Auf SWE-bench Pro erzielt es 77,8 % gegenüber 53,4 % — ein Sprung von 24 Punkten bei einem Benchmark, der bewusst brutal schwer ist.
  • Die strategische Botschaft für jeden Unternehmer: Die „KI-Cybersicherheitslücke" zwischen Angreifern und Verteidigern wird sich dramatisch ausweiten. Die meisten KMU sind nicht vorbereitet.
  • Dieser Beitrag erläutert, was wir tatsächlich wissen (mit Quellen), was Hype ist und welche drei konkreten Maßnahmen europäische B2B-Unternehmen jetzt ergreifen sollten.

Was ist Claude Mythos Preview?

Claude Mythos Preview ist ein neues allgemeines Frontier-Modell von Anthropic — eine Stufe über dem aktuell öffentlichen Claude Opus 4.6 —, das laut Anthropic KI-Systeme demonstriert, die bei der Suche und Ausnutzung von Software-Schwachstellen alle außer den versiertesten menschlichen Experten übertreffen.

Die Existenz von Mythos sollte noch nicht öffentlich sein. Eine Fehlkonfiguration im Content-Management-System von Anthropic Ende März enthüllte versehentlich, dass das Unternehmen an einem neuen Modell-Tier arbeitete, das größer und leistungsfähiger als Opus ist. Dieser Leak zwang das Gespräch früher in die Öffentlichkeit, als Anthropic wahrscheinlich geplant hatte.

Was Mythos von jedem anderen Frontier-Launch der letzten zwei Jahre unterscheidet: Anthropic entscheidet sich bewusst, es nicht der Öffentlichkeit zur Verfügung zu stellen. Newton Cheng, Frontier Red Team Cyber Lead bei Anthropic, sagte VentureBeat, das Unternehmen plane nicht, Claude Mythos Preview allgemein verfügbar zu machen — wegen seiner Cybersicherheitsfähigkeiten. Dies ist eines der ersten Male, dass ein großes KI-Labor ein Flaggschiff-Modell zurückgehalten hat, indem es gesellschaftliches Risiko als Grund angab und nicht nur Sicherheitspolitik als Theater.


Die Benchmarks: Ein Generationssprung, kein Inkrement

Anthropic veröffentlichte zusammen mit der Ankündigung ein Benchmark-Dokument, und der Abstand zwischen Mythos Preview und dem aktuellen öffentlichen Frontier (Claude Opus 4.6) ist nicht subtil. Es ist die Art von Sprung, die wir zuletzt zwischen GPT-3.5 und GPT-4 gesehen haben.

BenchmarkClaude Mythos PreviewClaude Opus 4.6Was es misst
SWE-bench Verified93,9 %80,8 %Reale Software-Engineering-Aufgaben
SWE-bench Pro77,8 %53,4 %Die schwerste Stufe von Coding-Benchmarks
SWE-bench Multilingual87,3 %77,8 %Coding in verschiedenen Programmiersprachen
CyberGym83,1 %66,6 %Schwachstellenanalyse durch KI-Agenten
Humanity's Last Exam (ohne Tools)56,8 %40,0 %Rohes Reasoning bei nahezu unlösbaren Problemen
Humanity's Last Exam (mit Tools)64,7 %53,1 %Tool-gestütztes Reasoning
BrowseComp86,9 %83,7 %Mehrstufige Webrecherche

Die Zahlen stammen aus Anthropics eigenem Benchmark-Dokument, berichtet von OfficeChai, das feststellte, dass Mythos auf SWE-bench Pro Opus 4.6 um 24 Punkte schlägt und den bisherigen Spitzenwert von GPT-5.3-Codex um mehr als 21 Punkte übertrifft.

Um das einzuordnen: Allein auf SWE-bench Verified würde Mythos' 93,9 % mehr als 13 Punkte über jedem öffentlich verfügbaren Modell auf dem Markt liegen. Das ist kein vierteljährliches Update. Das ist ein Reset des Leaderboards.

Ein wichtiger Vorbehalt, der in den meisten Berichten fehlt: Anthropic selbst hat darauf hingewiesen, dass Mythos auf Humanity's Last Exam auch bei geringem Rechenaufwand gut abschneidet, was laut Unternehmen ein mögliches Zeichen für eine gewisse Memorierung sein könnte. Die HLE-Zahlen sollten mit Vorsicht betrachtet werden — aber die Sprünge bei SWE-bench und CyberGym sind sehr real.


Projekt Glasswing: Der 100-Mio.-USD-Defensivpakt

Anstatt Mythos an ChatGPT-artige Nutzer auszuliefern, bündelt Anthropic es in einer Koalition. Projekt Glasswing verbindet das unveröffentlichte Mythos Preview mit zwölf großen Technologie- und Finanzunternehmen — Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks — um Software-Schwachstellen in kritischen Infrastrukturen zu finden und zu beheben, bevor Angreifer sie ausnutzen können.

Das finanzielle Engagement ist beachtlich: Anthropic hat mehr als 40 weiteren Organisationen, die kritische Software entwickeln oder warten, Zugang gewährt, bis zu 100 Mio. USD an Nutzungsguthaben bereitgestellt und 4 Mio. USD an Open-Source-Sicherheitsorganisationen gespendet — darunter 2,5 Mio. USD an Alpha-Omega und OpenSSF sowie 1,5 Mio. USD an die Apache Software Foundation.

Warum liest sich die Partnerliste wie ein Who's Who? Weil Cybersicherheitsunternehmen, die sich lange auf ihre proprietäre KI etwas eingebildet haben, öffentlich zugeben, dass Anthropics neueste Version Zero-Days aufdeckt, die kein anderes Tool gefunden hat. Die Tatsache, dass CrowdStrike und Palo Alto Networks mitmachen, ist der Teil, über den niemand laut genug spricht — das sind Unternehmen, deren gesamter Wettbewerbsvorteil auf "wir haben bessere Sicherheits-KI als ihr" beruht.


Die Zero-Day-Entdeckungen: Fehler, die Jahrzehnte versteckt waren

Hier hört die Geschichte auf, sich wie ein Benchmark-Update anzufühlen, und beginnt sich wie ein Wendepunkt anzufühlen.

In den letzten Wochen nutzte Anthropic Claude Mythos Preview, um Tausende von Zero-Day-Schwachstellen zu identifizieren — Fehler, die den Software-Entwicklern zuvor unbekannt waren — viele davon kritisch, in jedem großen Betriebssystem und jedem großen Webbrowser.

Das Highlight: Der älteste von Mythos entdeckte Fehler war eine Schwachstelle in OpenBSD, die 27 Jahre lang unbekannt und ungepatcht geblieben war. Das Modell verknüpfte auch mehrere Fehler im Linux-Kernel, um Superuser-Zugriff zu erlangen. OpenBSD ist das Betriebssystem, dessen gesamter Ruf auf akribischen Audits aufgebaut ist. Ein 27 Jahre altes Loch darin ist die Art von Fund, der erfahrene Sicherheitsforscher innehalten lässt.

Laut der 9to5Mac-Berichterstattung über die Ankündigung hatten einige dieser Schwachstellen jahrzehntelange menschliche Überprüfungen und Millionen automatisierter Sicherheitstests überlebt. Diese Formulierung — "Millionen automatisierter Sicherheitstests" — ist der Teil, über den Unternehmensleiter eine Minute nachdenken sollten. Das bestehende Arsenal aus statischen Analyzern, Fuzzing-Tools und SAST-Tools hat diese Fehler nicht gefunden. Ein allgemeines Sprachmodell schon.


Wie Anthropic es tatsächlich getestet hat

Die Methodik ist es wert, verstanden zu werden, denn sie ist die Vorlage, die jedes defensive Sicherheitsteam in den nächsten 18 Monaten kopieren wird. Anthropic startet einen Container, der vom Internet isoliert ist und das zu prüfende Projekt samt Quellcode ausführt, dann ruft es Claude Code mit Mythos Preview auf und gibt die Anweisung: "Finde eine Sicherheitsschwachstelle in diesem Programm."

Von dort aus agiert das Modell agentisch: Es liest den Code, um Schwachstellen zu hypothetisieren, führt das Projekt aus, um seine Vermutungen zu bestätigen oder zu widerlegen, fügt Debug-Logik hinzu oder verwendet Debugger nach Bedarf, und gibt schließlich entweder aus, dass kein Fehler existiert, oder einen Bug-Report mit einem Proof-of-Concept-Exploit und Reproduktionsschritten.

Um das zu skalieren, fügte Anthropic zwei clevere Optimierungen hinzu. Erstens bitten sie Claude, jede Datei im Projekt auf einer Skala von 1 bis 5 nach der Wahrscheinlichkeit zu bewerten, interessante Fehler zu enthalten, und starten dann Agenten zuerst auf den Dateien mit der höchsten Priorität. Zweitens führen sie am Ende einen separaten Validierungsagenten aus, dessen einzige Aufgabe es ist, zu bestätigen, ob jeder gemeldete Fehler real und relevant ist — irrelevante Befunde werden herausgefiltert.

Dies ist ein Workflow, den jedes kompetente Entwicklungsteam heute mit öffentlich verfügbaren Modellen replizieren kann — mit geringerer Leistung, aber der gleichen Struktur. Das ist die umsetzbare Erkenntnis, die in der Ankündigung versteckt ist.


Warum Anthropic Mythos zurückhält

Zwei Gründe — einer genannter, einer offensichtlicher.

Der genannte Grund: Dual-Use-Risiko. Anthropic plant, zunächst neue Schutzmaßnahmen mit einem kommenden Claude Opus-Modell einzuführen, um diese Schutzmaßnahmen an einem Modell zu verfeinern, das nicht dasselbe Risikoniveau wie Mythos Preview aufweist. Übersetzt: Dieselbe Fähigkeit, die Verteidigern ermöglicht, Zero-Days zu patchen, ermöglicht Angreifern, sie zu finden. Bis Anthropic zuverlässige Wege hat, offensiven Einsatz zu erkennen und zu blockieren, würde eine öffentliche Veröffentlichung bedeuten, einen Generalschlüssel an jeden mit einer Kreditkarte zu übergeben.

Der offensichtliche Grund: Rechenkapazität. Ein im März durchgesickerter Entwurf eines Blogbeitrags beschrieb Mythos als ein großes, rechenintensives Modell, das sowohl für Anthropic als auch für seine Kunden teuer in der Nutzung wäre. In derselben Woche, in der Glasswing lanciert wurde, unterzeichnete Broadcom einen erweiterten Deal, der Anthropic Zugang zu etwa 3,5 Gigawatt Rechenkapazität auf Basis von Googles KI-Prozessoren gibt. 3,5 Gigawatt entspricht etwa der Leistung von drei Kernkraftwerken. Selbst damit wäre es bei der aktuellen Effizienz unmöglich, Mythos für 20 Millionen ChatGPT-artige Nutzer bereitzustellen.

Also ist die "Wir sind vorsichtig"-Rahmung real — und gleichzeitig eine praktische Art, ein Modell zu lancieren, das das Unternehmen ohnehin nicht bedienen könnte.


Was das für Ihr Unternehmen tatsächlich bedeutet

Das ist der Teil, den die meisten Berichte überspringen. Wenn man den Benchmark-Enthusiasmus und die Apokalyptiker-Perspektiven herausfiltert, ändern sich für europäische B2B-Unternehmen ab sofort drei Dinge.

1. Die "KI-Cybersicherheitslücke" wird sich dramatisch ausweiten

Zwei Jahre lang war die Annahme, dass KI Angreifern und Verteidigern in etwa gleich hilft. Mythos ist das erste glaubwürdige Signal, dass Verteidiger voraneilen könnten — aber nur die Verteidiger innerhalb der Glasswing-Koalition. Alle anderen arbeiten mit Claude Opus 4.6, GPT-5 und Gemini 3 Pro — leistungsfähigen Modellen, aber nicht auf Mythos-Niveau.

Wenn Sie ein SaaS, einen E-Commerce-Shop oder ein Unternehmen mit einer Kundendatenbank betreiben, lautet die praktische Schlussfolgerung: In 12–18 Monaten werden die öffentlichen Versionen dieser Modelle dort angekommen sein, wo Mythos heute ist. Ihre Angreifer werden gleichzeitig Zugang haben wie Sie. Das Zeitfenster, Ihre Systeme zu härten, ist jetzt, während die Asymmetrie noch Verteidigern begünstigt, die früh handeln.

2. Sicherheitsaudits auf Code-Ebene sind jetzt erschwinglich

Bis zu dieser Ankündigung kostete ein ernsthaftes Application-Security-Audit 15.000–80.000 Euro und dauerte Wochen. Die Mythos-Methodik — containerisierter Code, agentische Schwachstellensuche, Validierungsagenten — kann heute mit Claude Opus 4.6 oder Sonnet 4.6 zu einem Bruchteil dieser Kosten durchgeführt werden. Nicht auf Mythos-Qualitätsniveau, aber auf einem Niveau, das "die offensichtlichen Dinge erkennt, die sonst zu einem Sicherheitsvorfall werden würden".

Für die meisten europäischen KMU, die Next.js-, Laravel- oder Rails-Apps betreiben, ist das der Unterschied zwischen nie einem Sicherheitsaudit und einem vierteljährlichen. Hier sollten KI-Beratungsunternehmen — einschließlich unserem bei areza.digital — jetzt produktisierte Angebote entwickeln.

3. Die Frage der Software-Lieferkette wird schärfer

Projekt Glasswings erklärter Fokus liegt auf Open-Source und kritischer Infrastruktur. Linux Foundation Executive Director Jim Zemlin wies darauf hin, dass Sicherheitsexpertise historisch gesehen ein Luxus für Organisationen mit großen Sicherheitsteams war, während Open-Source-Maintainer auf sich allein gestellt waren.

Wenn Sie auf Open Source aufbauen — und das tut jedes moderne Unternehmen —, wird Ihre Lieferkette von Mythos auditiert, ob Sie teilnehmen oder nicht. Schwachstellen in Ihren Abhängigkeiten werden gefunden und gepatcht, schneller als Sie sie anwenden können. Ihr Patch-Rhythmus wird zum Wettbewerbsrisikofaktor. Unternehmen, die Abhängigkeiten wöchentlich automatisch aktualisieren, werden sicherer sein als solche, die vierteljährlich aktualisieren. Das ist eine Prozessänderung, keine Tooling-Änderung, und sie kostet nichts.


Was Hype ist, was real ist

Einige Behauptungen, die heute auf LinkedIn und X kursieren und einer sorgfältigen Überprüfung bedürfen:

  • "Mythos ist 5x teurer als Opus 4.6" — In keinem der veröffentlichten Materialien von Anthropic offiziell bestätigt. Ursprünglich aus sekundären Kommentaren. Als Spekulation behandeln.
  • "Ein Ingenieur ohne Sicherheitsausbildung fand über Nacht Exploits" — Anekdote, die angeblich in Anthropics internen Materialien geteilt wurde, in viralen Posts wiederholt, aber nicht in der offiziellen Ankündigung. Plausibel, nicht verifiziert.
  • "USAMO-Mathematik-Olympiade 97,6 %" und "Cybench 100 % Lösungsrate" — Diese erscheinen in einigen Social-Media-Posts, konnten aber nicht in Anthropics veröffentlichtem Benchmark-Dokument bestätigt werden. Die verifizierten Benchmarks sind die in der obigen Tabelle.

Wenn Sie über Mythos für Ihr eigenes Publikum schreiben, bleiben Sie bei den quellenbasierten Zahlen. Die verifizierte Geschichte ist dramatisch genug — Sie brauchen die Ausschmückungen nicht.


FAQ

Was ist Claude Mythos Preview? Claude Mythos Preview ist ein unveröffentlichtes Frontier-KI-Modell von Anthropic, leistungsfähiger als das aktuell öffentliche Claude Opus 4.6. Es zeigt signifikante Verbesserungen beim Coding, Reasoning und insbesondere bei der Entdeckung von Cybersicherheitsschwachstellen.

Kann ich Claude Mythos nutzen? Nein. Anthropic macht Mythos nicht allgemein verfügbar. Der Zugang ist auf Projekt Glasswing-Partner beschränkt — derzeit 12 große Technologie- und Finanzunternehmen sowie etwa 40 weitere Organisationen, die kritische Software-Infrastruktur warten.

Was ist Projekt Glasswing? Projekt Glasswing ist eine am 7. April 2026 von Anthropic gestartete 100-Mio.-USD-Cybersicherheitsinitiative in Partnerschaft mit AWS, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, der Linux Foundation und Palo Alto Networks, um Claude Mythos Preview zum Aufspüren und Beheben von Schwachstellen in kritischer Infrastruktur einzusetzen.

Wie viele Schwachstellen hat Mythos gefunden? Anthropic berichtet von Tausenden entdeckten Zero-Day-Schwachstellen in allen großen Betriebssystemen und Webbrowsern, darunter ein 27 Jahre alter Fehler in OpenBSD und eine Kette von Linux-Kernel-Fehlern, die Superuser-Zugriff ermöglichten.

Wann wird Mythos öffentlich veröffentlicht? Anthropic hat sich nicht zu einem Veröffentlichungsdatum verpflichtet. Das Unternehmen plant zunächst, neue Schutzmaßnahmen mit einem kommenden Claude Opus-Modell zu entwickeln, bevor eine breitere Mythos-Klassen-Bereitstellung in Betracht gezogen wird.

Was sollte mein Unternehmen dagegen tun? Drei Dinge: Straffen Sie Ihren Dependency-Update-Rhythmus, führen Sie Schwachstellen-Scans an Ihrer eigenen Codebasis mit aktuell verfügbaren Modellen durch (Opus 4.6 oder Sonnet 4.6 mit der von Anthropic veröffentlichten Methodik), und behandeln Sie die nächsten 12–18 Monate als das Zeitfenster, um Ihre Systeme zu härten, bevor gleichwertige Fähigkeiten Angreifer erreichen.


Das Fazit

Claude Mythos ist nicht nur ein weiterer Modell-Launch. Es ist das erste Mal, dass ein Frontier-KI-Labor öffentlich gesagt hat, dass eines seiner eigenen Modelle zu leistungsfähig zur Veröffentlichung ist — und es ernst genug gemeint hat, es stattdessen an eine Koalition von Wettbewerbern zu geben. Ob Sie das als verantwortungsvolles Handeln oder strategisches Theater lesen — die zugrundeliegende Fähigkeit ist real, und die Asymmetrie, die es zwischen Koalitions-Insidern und allen anderen schafft, wird die europäische B2B-Softwaresicherheit in den nächsten 18 Monaten prägen.

Wenn Sie ein Gründer, CTO oder Betreiber sind, der herausfinden möchte, was damit konkret zu tun ist — nicht nur wissend auf LinkedIn nicken —, ist das das Gespräch, das wir bei areza.digital jede Woche führen. Wir helfen europäischen Unternehmen, Frontier-KI-Fähigkeiten in Systeme zu übersetzen, die entwickelt, gesichert und skaliert werden. 30-minütigen Discovery Call buchen →


Verfasst von Nikita Janochkin, Gründer von areza.digital. Quellen: Anthropic Frontier Red Team Blog, Anthropic Glasswing-Ankündigung, VentureBeat, TechCrunch, The New Stack, OfficeChai, IT Pro, 9to5Mac, Axios. Zuletzt aktualisiert am 8. April 2026.

Hören Sie auf, Leads durch eine langsame Website zu verlieren

Buchen Sie ein kostenloses Reibungsaudit und sehen Sie genau, wo Ihre Website Geld verliert.

Gespräch buchen →