KI-Briefing KW 16/2026

Anthropic baut ein Modell — und verweigert das Release

Diese Woche hat Anthropic etwas getan, das die Branche neu sortiert: Claude Mythos wurde fertiggebaut, getestet — und dann bewusst nicht veröffentlicht. Was das bedeutet.

KW 16 · 2026 · 15. April 2026 · Stefan Braum

Das Wichtigste in 30 Sekunden

Anthropic verweigert das Release von Claude Mythos — weil das Modell Cyber-Angriffe in einem Umfang automatisiert, der für Public-Access nicht verantwortbar ist. Stattdessen: Project Glasswing mit 12 ausgewählten Partnern.
OpenAI kontert mit GPT-5.4-Cyber (eingeschränkte Gruppe) und deutet auf “Spud” — GPT-6 — bis Anfang Mai hin. Greg Brockman: “Two years of research. Not incremental.”
Meta bricht mit Open Source: Muse Spark ist das erste proprietäre Modell aus den Meta Superintelligence Labs — closed source, nur auf meta.ai.
Stanford AI Index: Der Performance-Gap zwischen US- und China-Modellen ist auf 1,7 Punkte geschrumpft. Jan 2024 waren es noch 9,3.

Claude Mythos: Das fähigste Modell, das niemand nutzen darf

Das ist der Moment, an dem die “AI Safety is theater”-Fraktion leise werden muss. Am 7. April hat Anthropic ein Modell vorgestellt, das nach allen messbaren Kriterien das fähigste je dokumentierte Frontier-Modell ist — und dann wurde das Public Release gestrichen.

Mythos Preview hat in interner Red-Team-Evaluierung tausende Zero-Day-Lücken in verbreiteten Betriebssystemen und Browsern gefunden. Ein Sandbox-Escape gelang dem Modell eigenständig. Das UK AI Security Institute bestätigte unabhängig: 73% Erfolgsrate auf Expert-CTF-Challenges, erstmals vollständige Lösung eines 32-Step Enterprise-Attack in einem Durchgang — über 1,8 Millionen dokumentierte Angriffsversuche in den Evaluierungen.

Anthropic hatte drei Optionen: (a) Weichgespülte Version veröffentlichen und Verhalten post-hoc einschränken, (b) API-Release mit aggressivem Safety-Filter, (c) kein Release. Sie wählten (c) — und ersetzten es durch Project Glasswing: zwölf strategisch ausgewählte Sicherheitspartner bekommen kontrollierten Zugang, um die Industrie auf die Praktiken vorzubereiten, die nötig werden, wenn solche Modelle unweigerlich auftauchen.

Das ist ein Präzedenzfall. Bis gestern war die Frage bei jedem Frontier-Release “wann”, nicht “ob”. Bis gestern war der wirtschaftliche Druck so groß, dass ein Lab mit “too dangerous to release” lächerlich gewirkt hätte. Jetzt nicht mehr. OpenAI reagierte binnen Tagen mit einem eigenen Cyber-Modell für eingeschränkte Nutzergruppen — das Muster wiederholt sich.

Die strategische Konsequenz: Frontier-Modelle werden in zwei Spuren zerfallen. Was die Öffentlichkeit sehen darf (mit Safety-Gates), und was nur ausgewählte Partner und Regulatoren sehen. Anthropic hat gerade den ersten offiziellen Meilenstein auf dieser Trennlinie gesetzt. Die Frage ist nicht mehr, ob andere folgen — sondern wer weniger streng ist und damit das Risiko unterschreitet.

Wer Safety als Marketing-Phrase abgeschrieben hatte, muss seine Modelle jetzt aktualisieren.

Kurz notiert

Google DeepMind: Gemini Robotics-ER 1.6. Räumliches Reasoning verbessert, plus die Fähigkeit, analoge Instrumente in Fabriken auszulesen — Druckmesser, Durchsichtfenster, Temperaturanzeigen. Erster ernsthafter Schritt, Foundation-Models mit dem Maschinenpark der realen Industrie zu verbinden. Verfügbar via Gemini API. Quelle

Meta bricht mit Open Source. Muse Spark ist das erste Closed-Source-Modell aus den Meta Superintelligence Labs, nur auf meta.ai verfügbar. Zuckerbergs Open-Science-Rhetorik der Llama-Ära wird faktisch aufgegeben. Kommentatorin: “Meta hat den Open-Weight-Punkt nicht aus Überzeugung gesetzt — sondern weil sie hinter OpenAI lagen. Jetzt, wo Muse Spark vorn ist, ist Closed Source plötzlich Strategie.” Quelle

DeepSeek V4 rollt auf Huawei-Chips. Reuters berichtet vom nahen Launch — Alibaba, ByteDance und Tencent haben bereits Großchargen Huawei-Ascend bestellt. Der US-Export-Restriction-Druck hat in China genau das bewirkt, was er verhindern sollte: einen eigenen, Nvidia-unabhängigen Frontier-Stack. Quelle

Stanford AI Index 2026 ist da. 12 Key-Takeaways, davon die unangenehmsten zwei: AI-Adoption steigt auf 88% in Organisationen (schnellere Durchdringung als PC oder Internet), und gleichzeitig sinkt der Transparency Index der führenden Labs von 58 auf 40 Punkte. Mehr Einsatz, weniger Einsicht. Zusammenfassung

OpenAI deutet auf GPT-6 im Mai. Internes Codename: “Spud”. Rollout-Fenster laut Bloomberg zwischen 14. April und 5. Mai. Brockmans Zitat “Not incremental” ist auffällig, weil die Firma bei GPT-5.x-Releases seit Monaten bewusst das Incremental-Narrativ fuhr. Quelle

Zahl der Woche

50+ Punkte — so groß ist der Performance-Gap zwischen menschlichen Experten und den besten KI-Agenten auf Humanity’s Last Exam (Nature, April 2026). 2.500 Fragen über Dutzende akademische Felder. Menschliche Experten erreichen 90% Genauigkeit, KI-Agenten 35%. Das ist der momentan ehrlichste Benchmark dafür, wo AGI wirklich steht: nicht vor der Tür, aber auch nicht am Horizont. Paper

Leseempfehlung

Stanford HAI — Inside the AI Index: 12 Takeaways from the 2026 Report. Wenn du diese Woche nur ein Stück lesen willst, dann das. Besonders die Passage zum US-Talent-Drain: H-1B-Restriktionen der Trump-Administration führen dazu, dass chinesische Top-Researcher, die US-Unis absolvieren, in steigender Zahl nach China zurückgehen. Der 7,56-Punkte-Vorsprung ist nicht nur geschrumpft, weil China aufgeholt hat — sondern auch, weil die USA sich selbst schwächen. hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report

Dieses Briefing erscheint jeden Freitag auf agi.jetzt — schau regelmäßig vorbei. Alle Daten live im Dashboard →

Themen

safety anthropic openai china benchmark

X LinkedIn