KPI Overview
Sechs Kernzahlen, quartalsweise aktualisiert
ArXiv CS-Papers / Monat
16.8k
+44% vs. Q1 2025
ArXiv Monthly Submissions (CS total, ~35% davon cs.AI/LG/CL) ↗
Das gesamte AI-Ökosystem auf einen Blick. Alle Zahlen quellenbasiert, alle Daten mit Zeitstempel.
Sechs Kernzahlen, quartalsweise aktualisiert
KW 21 · 22. Mai 2026 · Stefan Braum
Weighted Geometric Mean · 8 Benchmark-Gaps
Radar über 6 Kern-Benchmarks
Frontier-Chips, Preise und Cluster-Scale
Venture + strategische Investments · Total seit 2022: $587.4 Mrd
Top 15 AI-Unternehmen nach Valuation
| # | Firma | Val | Kategorie | Trend |
|---|---|---|---|---|
| 🥇 | Anthropic Claude Opus 4.7 | $900B | Frontier Lab | ↑ |
| 🥈 | OpenAI GPT-5.5 Pro, GPT-5.5 Instant | $852B | Frontier Lab | ↑ |
| 🥉 | xAI Grok 4.20 Heavy, Colossus 2 | $230B | Frontier Lab | ↑ |
| 04 | Databricks Mosaic, Agent Bricks | $134B | AI Platform | ↑ |
| 05 | Scale AI Donovan, SEAL Leaderboards | $29B | Data Labeling | ↓ |
| 06 | Cerebras WSE-3, CS-3 | $23B | Hardware | ↑ |
| 07 | Perplexity Comet, Deep Research | $22.6B | Application | ↑ |
| 08 | Mistral AI Medium 3.5, Large 3, Le Chat | $14B | Frontier Lab | ↑ |
| 09 | DeepSeek V3.2, V3.2-Speciale, Coder | $8B | Open Source | ↑ |
| 10 | Cohere Command R+, Embed v4 | $7B | Enterprise AI | → |
| 11 | Groq LPU v2, GroqCloud | $6.9B | Hardware | ↑ |
| 12 | Z.ai (Zhipu) GLM-5, CogVLM | $6.55B | Open Source | ↑ |
| 13 | Runway Gen-4, Act-Two | $5.3B | Application | ↑ |
| 14 | Hugging Face Hub, Transformers | $4.5B | Platform | → |
| 15 | Stability AI Stable Diffusion | $2.8B | Open Source | → |
128.400 offene AI-Stellen · +62% YoY
Globale AI-Regulierung auf einen Blick
Trump zog am 21. Mai 2026 das geplante Signing eines AI-Oversight-Dekrets (90-Tage-Vorab-Zugang für Bundesbehörden zu Frontier-Modellen) erneut zurück. Sacks/Wiles blockierten den FDA-ähnlichen Ansatz von NEC-Chef Hassett nach Direktansprache durch Zuckerberg und Musk. Drittes Vertagungs-Ereignis in Folge.
CAISI (vormals US AISI) unterzeichnete Vereinbarungen mit Google DeepMind, Microsoft und xAI über Pre-Release-Evaluationen. US-Regierung erhält frühen Modell-Zugang für Safety-Tests — der einzige bisher operative föderale Aufsichts-Mechanismus.
Transparenz- und Dokumentationspflichten für General-Purpose AI Models aktiv (AI Act Art. 111). Erweiterte Pflichten für Modelle mit Systemrisiko ab 10^25 FLOPs.
EU-Kommission veröffentlicht Leitlinien zur High-Risk-Klassifikation (Art. 6) und Template für Post-Market-Monitoring-Pläne.
Export-Controls auf Frontier-Chips & Model-Weights. Tiered country system.
Risk Management Framework für Federal-Kontraktoren. Freiwillig für Private.
Content-Filtering Requirements, Security Assessment für alle public-facing GenAI.
Pre-release Safety Testing durch UK AISI. Seit Feb 2025 zum 'AI Security Institute' umbenannt, Kooperation mit US AISI und Frontier-Labs.
Vierter globaler AI-Gipfel im Bharat Mandapam, Neu-Delhi (Co-Chairs Modi/Macron). Fortsetzung der Bletchley → Seoul → Paris → Delhi-Linie, Fokus auf Entwicklungsländer-Zugang und Energie-Footprint.
High-Risk System Compliance: Healthcare, Legal, Hiring. Audits durch Notified Bodies.
487 in 2025 · 142 in Q1 2026 (läuft)
Context, Preis und Geschwindigkeit im Vergleich
| Modell | Context | $/1M | Speed | Open |
|---|---|---|---|---|
| Gemini 3.5 Flash Google | 1M | $9.00 | 850 t/s | |
| Gemini 3.1 Pro Google | 1M | $12.00 | 220 t/s | |
| GPT-5.5 Pro OpenAI | 1M | $180.00 | 95 t/s | |
| Claude Opus 4.7 Anthropic | 1M | $25.00 | 115 t/s | |
| GPT-5.5 OpenAI | 1M | $30.00 | 170 t/s | |
| Claude Sonnet 4.6 Anthropic | 1M | $15.00 | 180 t/s | |
| Gemini 3 Flash Google | 1M | $3.50 | 350 t/s | |
| Grok 4.20 Heavy xAI | 2M | $18.00 | 88 t/s | |
| Mistral Medium 3.5 Mistral | 256k | $7.50 | 175 t/s | |
| Llama 4 Scout Meta | 10M | $0.90 | 320 t/s | |
| Llama 4 Maverick Meta | 1M | $1.40 | 280 t/s | |
| DeepSeek V3.2 DeepSeek | 164k | $0.70 | 110 t/s | |
| Qwen3.6 Plus Alibaba | 1M | $2.40 | 160 t/s | |
| GLM-5 Z.ai | 200k | $1.00 | 145 t/s |
Quartalsweise bestätigte Snapshots · WAU bzw. MAU
Datenpunkte = quartalsweise Earnings/PR-Statements. Keine geglätteten Monatsverläufe — alles dazwischen wäre erfundene Präzision. Q1 2026 noch nicht bestätigt (außer ChatGPT/Gemini per Februar-Earnings).
Drei verschiedene Metriken — bewusst getrennt: ChatGPT als WAU (so kommuniziert OpenAI), Standalone-Apps als opt-in MAU. Plus: Google AI Overviews mit 2 Mrd. monatlichen Search-Nutzern als passive Exposition (siehe Kontext-Box, eigene Größenordnung — würde im Chart alles erschlagen). Wer Google rein über AI Overviews in der normalen Suche nutzt, ist NICHT in der Gemini-App-Linie enthalten. Datenpunkte sind quartalsweise Earnings-Snapshots — keine geglätteten Monatsverläufe.
Monatliche Submissions · aktuell 16.800/Monat
Häufigste Tags in ArXiv-Abstracts und News
Q1 2026 · $239 Mrd gesamt (AI = 81 % aller VC)
39 Einträge · sortierbar, filterbar · geteilt mit Landing
Binnen 72 Stunden überholt Anthropic mit der avisierten $30-Mrd.-Runde (Bewertung $900 Mrd.) OpenAI als wertvollstes privates AI-Unternehmen, während OpenAI parallel sein S-1 für ein Q4-IPO zwischen $852 Mrd. und $1 Bio. einreicht. Dazu treten Compute-Deals in dreistelliger Milliardenhöhe (Anthropic/SpaceX-Colossus, Google-Broadcom-Chips). Capital-Race wird zum eigenständigen Standort-Risiko für europäische Labs.
Bloomberg berichtete am 22. Mai, dass Anthropic eine $30-Mrd.-Finanzierungsrunde bei einer Bewertung von $900 Mrd. (pre-money) in der kommenden Woche schließt. Co-Lead: Sequoia, Dragoneer, Altimeter, Greenoaks (je ~$2 Mrd.), plus Founders Fund und General Catalyst. Damit zieht Anthropic an OpenAIs zuletzt notierter Bewertung von $852 Mrd. (März 2026) vorbei.
OpenAI legte am 22. Mai 2026 sein S-1 vertraulich bei der SEC vor, Ziel ist ein Public Listing im Q4 2026 (potenziell September). Lead Underwriter: Goldman Sachs, Morgan Stanley. Run-Rate-Umsatz: $25 Mrd. annualisiert per März, $2 Mrd./Monat, 50 Mio. Consumer-Abos, 9 Mio. Business-User. Brennrate: $1,22 Verlust pro $1 Umsatz in Q1 2026.
Binnen vier Tagen nach Google I/O 2026 bestätigten Adobe (20.05.), Canva (19.05.) und CapCut (21.05.) native Integrationen in die Gemini-App. Canva-Connector ist bereits live (`@Canva` als Prompt-Tag), Adobe und CapCut folgen. Effekt: Gemini generiert Content und reicht ihn ohne App-Wechsel an professionelle Editing-Tools weiter. Erstes Beispiel für tiefe Workflow-Bindung zwischen Frontier-Modell und Creator-Stack.
Präsident Trump sagte am 21. Mai 2026 das angesetzte Signing eines AI-Oversight-Dekrets ab, das einen freiwilligen 90-Tage-Vorab-Zugang für Bundesbehörden zu nicht-veröffentlichten Frontier-Modellen vorgesehen hätte. Stabschefin Wiles und KI-Czar Sacks blockierten den FDA-ähnlichen Ansatz von NEC-Direktor Hassett. Drittes Mal in Folge: Vertagung in den kommenden Wochen.
CNBC berichtete am 20. Mai unter Berufung auf ein Finanzierungsdokument, dass Anthropic für Q2 2026 $10,9 Mrd. Umsatz und $559 Mio. operativen Gewinn erwartet. Das wäre der erste profitable Quartalsabschluss eines Frontier-Modell-Labors. Q1 schloss bei $4,8 Mrd. — eine Verdopplung in drei Monaten. Zahlen sind nicht-auditiert.
SpaceX legte am 20. Mai 2026 seine S-1-Anmeldung bei der SEC vor und positioniert sich offiziell als AI-Infrastruktur-Unternehmen. Rakete, Starlink, Gas-Turbinen und xAI-Compute werden als integrierter Stack beschrieben. Kennzahlen: $1,25 Mrd./Monat von Anthropic für Colossus-Compute (rund $45 Mrd. bis 2029), $12,7 Mrd. xAI-Capex letztes Jahr, Orbital-Datacenter ab 2028. Ticker: SPCX.
Nvidia meldete am 20. Mai 2026 für das Quartal bis 26. April $81,6 Mrd. Umsatz (+85 % YoY) bei $75,2 Mrd. Data-Center-Beitrag (+92 %). Q2-Guidance: $91 Mrd. ±2 %. Gleichzeitig $80 Mrd. Aktienrückkauf-Erweiterung und 25-fache Dividendenerhöhung. Quartalsweise Data-Center-Sparte überschreitet Jahresumsatz von Intel.
Am 20. Mai 2026 veröffentlichte OpenAI eine Notiz, wonach ein allgemeines Reasoning-Modell autonom die planare Unit-Distance-Vermutung von Paul Erdős (1946) widerlegt hat. Das Modell fand eine unendliche Familie von Punkt-Konstruktionen, die das bisher als optimal geltende Quadrat-Gitter polynomial schlagen. Geprüft u. a. von Noga Alon, Melanie Wood und Thomas Bloom — vollständiger Peer-Review steht aus.
Auf dem Developer-Event in Mountain View (19.–20. Mai 2026) launchte Google Gemini 3.5 Flash als Default-Modell in Gemini-App und AI-Mode-Suche — 4× höhere Output-Geschwindigkeit als Konkurrenz-Frontier-Modelle bei $1,50/$9 pro Mio. Tokens (~40 % günstiger als 3.1 Pro). Zusätzlich: Gemini Spark (persistenter Cloud-Agent für US-Ultra-Abonnenten) und Gemini Omni (multimodal, editierbares Video-Out). Google AI Ultra-Preis von $250 auf $100/Monat gesenkt.
OpenAI-Mitgründer Andrej Karpathy gab am 19. Mai 2026 auf X bekannt, dass er bei Anthropic ein neues Team unter Pre-Training-Lead Nick Joseph übernimmt. Karpathy zählt zu den einflussreichsten KI-Forschern weltweit (OpenAI-Gründungsteam 2015, Tesla-AI-Chef, zuletzt Eureka Labs). Bei Anthropic soll das neue Team Claude für interne Pre-Training-Experimente einsetzen.
Anthropic und KPMG kündigten am 19. Mai 2026 eine globale Allianz an: Claude wird in KPMGs Produkt Digital Gateway integriert, alle 276.000 KPMG-Mitarbeitenden weltweit erhalten Zugang. Anthropic wird zudem preferred partner für Private-Equity-Mandate. Innerhalb von 30 Tagen hat Anthropic damit Großkundendeals mit zwei Big-Four-Häusern (PwC, KPMG) plus Bain abgeschlossen.
Anthropic kündigte am 14. Mai 2026 eine Vier-Jahres-Partnerschaft mit der Gates Foundation über $200 Millionen in Grants, Claude-API-Credits und technischer Unterstützung an. Schwerpunkte: Impfstoff- und Therapie-Entwicklung (Polio, HPV, Präeklampsie), K-12-Tutoring in den USA, agrar-spezifische Benchmarks in afrikanischen Sprachen.
OpenAI launchte am 11. Mai 2026 mit 19 Partnern eine eigene $4-Mrd.-Tochter, die Konzerne bei der KI-Einführung begleitet. Lead: TPG. Co-Leads: Bain Capital, Brookfield, Advent. Consulting Partner: Bain, McKinsey, Capgemini. Erster Kunde und Anteilseigner: BBVA. Operativ übernimmt das Londoner Beratungshaus Tomoro mit rund 150 Forward Deployed Engineers.
Die Google Threat Intelligence Group meldete am 11. Mai 2026 erstmals mit hoher Konfidenz einen Zero-Day-Exploit, der mit einem LLM gebaut wurde — eine 2FA-Bypass-Schwachstelle in einer verbreiteten Open-Source-Administrations-Software. Die nordkoreanische Gruppe APT45 nutzt parallel KI-Tools, um in tausenden rekursiven Prompts CVE-Proof-of-Concepts automatisch zu validieren. Google verhinderte den geplanten Mass-Exploitation-Event.
OpenAI rollt GPT-5.5 Instant ab 5. Mai 2026 für alle ChatGPT-Nutzer aus. 52.5% weniger Halluzinationen in Medizin/Recht/Finanzen, Antworten 30% kürzer. GPT-5.3 Instant bleibt für Paid-User noch drei Monate über Model-Picker verfügbar.
Mistrals neues Flagship (29. April 2026) faltet Chat, Reasoning und Coding in ein 128B-Dense-Modell mit 256K Kontext. Reasoning-Budget per Request konfigurierbar. Preis $1.50/$7.50 per 1M Tokens — Modified-MIT-Lizenz erlaubt kommerzielle Nutzung unter Schwellen-Caveats.
OpenAI veröffentlicht GPT-5.5 am 23. April 2026 als „smartest and most intuitive model yet". Terminal-Bench 2.0 auf 82.7% (Opus 4.7: 69.4, Gemini 3.1 Pro: 68.5). FrontierMath Tier 4 erstmals auf 35.4%. Preis $5/$30 per 1M Tokens, 1M Kontext via API. GPT-5.5 Pro mit höherer Genauigkeit zu $30/$180 verfügbar.
Anthropic veröffentlicht Opus 4.7 am 16. April 2026. SWE-bench Verified springt um knapp 7 Punkte auf 87.6%, dreimal so viele Production-Tasks gelöst wie 4.6. Erstes Claude mit High-Resolution-Vision (3.75 MP). Preis bleibt $5/$25 per 1M Tokens, neuer Tokenizer erhöht Verbrauch je nach Content um Faktor 1.0-1.35x.
Interne Red-Team-Evaluierungen von Claude Mythos fanden tausende Zero-Day-Lücken in gängigen OS und Browsern, ein Sandbox-Escape gelang eigenständig. Anthropic verzichtet auf Public Release und startet stattdessen Project Glasswing mit 12 ausgewählten Sicherheitspartnern.
Das britische AI Security Institute evaluierte 22 Frontier-Modelle. Claude Mythos erzielte 73% Erfolgsrate auf Expert-CTF-Challenges und löste erstmals eine vollständige 32-Schritt-Enterprise-Attack autonom. 1,8M Attack-Attempts wurden dokumentiert.
Ronan Farrows Investigation (7. April 2026) zitiert 100+ Insider: OpenAI stellte dem Superalignment-Team nur 1-2% Compute statt zugesagter 20% bereit, löste das Team dreimal auf. 'Safety' wurde aus IRS-Dokumenten entfernt. Neue Governance-Krise unter Altman.
Alibabas Qwen-Team veröffentlicht Qwen3.6 Plus am 31. März 2026. 1M-Token-Kontext für Full-Codebase-Ingestion, Terminal-Bench 2.0 bei 61.6% (übertrifft Claude 4.5 Opus). OmniDocBench 91.2, MMMU 86.0. Qwen3.6-27B als dense Open-Weight übertrifft 397B-MoE-Modelle bei agentic Coding.
Die größte Private-Equity-Runde der Geschichte: SoftBank $30B, Amazon $50B, Nvidia $30B, weitere $12B. Post-Money-Bewertung $852B. OpenAI generiert laut CFO monatlich $2B Umsatz, skaliert Compute für Stargate-Projekt.
Die dritte Generation des ARC-AGI-Benchmarks testet adaptives Reasoning in neuartigen Umgebungen. Gemini 3.1 Pro führt mit 0.37%. Der Schwierigkeitssprung zeigt: AGI ist näher als gedacht — aber noch nicht da.
Trump unterzeichnete EO 14365 am 11. Dez. 2025; das daraus folgende National AI Policy Framework wurde am 20. März 2026 veröffentlicht. Es etabliert bundesweite AI-Preemption (u.a. gegen Kalifornien), gründet die AI Litigation Task Force und koppelt $42B BEAD-Funding an AI-Deregulierung.
DeepSeek R2 (März 2026): 32B-Parameter Dense-Reasoning-Modell unter MIT-Lizenz, 92.7% auf AIME 2025. Läuft auf einzelner 24GB RTX 4090 und unterbietet Frontier-API-Preise um 70%.
Ab 2. August 2026 sind die ersten Notified Bodies operativ, verpflichtende Compliance-Tests für High-Risk-Systeme beginnen. Bußgelder bis 7% des globalen Umsatzes. Erste Präzedenz-Cases werden im Laufe des Sommers erwartet.
OpenAIs GPT-5.4 (5. März 2026) mit 1M-Token-Window und Computer-Use-Verbesserung von 75%. GPT-5.4 Pro und Thinking-Varianten verfügbar. 33% weniger faktische Fehler pro Claim vs. GPT-5.2, 18% insgesamt.
Google DeepMind veröffentlicht Gemini 3.1 Pro am 19. Feb 2026. 1.048.576-Token-Kontext, verdoppelte Reasoning-Performance gegenüber Gemini 3 Pro (77,1% ARC-AGI-2). Verarbeitet 8,4h Audio, 900-Seiten-PDFs oder 1h Video in einem Prompt.
xAI launcht Grok 4.20 als public Beta (17. Feb 2026), Heavy-Variante mit 16-Agent-Architektur folgt unmittelbar. 2M-Token-Kontext, Reasoning auf AIME-perfekt, GPQA 87.5%. Grok 4.20 0309 v2 (7. April) erreicht 49 auf Artificial Analysis Intelligence Index. Grok 5 (6T MoE) auf Q2 2026 verschoben.
Dario Amodei (Anthropic-CEO) im Dwarkesh Podcast („We are near the end of the exponential"): Erwartet KI-Systeme auf Nobelpreis-Niveau für kognitive Tasks bis 2027. Caveat: Die Lücke zwischen Capability und realer Wirkung (Regulierung, physische Welt) wird bedeutend größer sein als erwartet.
Die neue Reasoning-Familie erreicht 88.9% (o3) und 92.7% (o4-mini) auf AIME 2025. Erstmals nutzen die Modelle autonom Web-Search, Python, File-Handling und Bild-Reasoning während des Thinking-Prozesses.
OpenAI, SoftBank, Oracle und MGX: $100B sofort, 7 GW Rechenzentrum-Kapazität, 5 neue Standorte in USA. Expansion nach UAE und Argentinien. Abilene-Campus (TX) seit Sept. 2025 online (Oracle, 15-Jahres-Lease), 6 weitere Gebäude dort bis Mitte 2026.
Anthropic sammelt $30B in einer Series G geführt von GIC und Coatue. Bewertung steigt auf $380B (vs. $183B nach der Series F im März 2025). ARR nach eigenen Angaben $14B, 7-facher Zuwachs bei Enterprise-Accounts >$100k/Jahr.
Z.ai (ehemals Zhipu) sammelt $558M in Hong Kong IPO am 8. Jan 2026 bei $6.55B Bewertung. GLM-5 (745B MoE, 44B aktiv) ist erstes Frontier-Modell, das vollständig auf Huawei-Ascend-Chips trainiert wurde — unabhängig von Nvidia.
Anthropic veröffentlicht Opus 4.6 (5. Feb) und Sonnet 4.6 (17. Feb 2026) mit 1M-Token-Kontext und Adaptive Thinking. Opus erreicht 80.8% auf SWE-bench Verified und 76% Long-Context-Recall (vs. 18.5% Baseline).
Mistral veröffentlicht Large 3 (Dez 2025) mit 675B Gesamt- und 41B aktiven Parametern, 256k Kontext, Apache 2.0. Jan 2026: ARR auf $400M (+1900% YoY). Mistral Small 4 im März 2026 mit konfigurierbarem Reasoning-Budget.
Llama 4 Scout ist das erste Open-Weight-Modell mit 10M-Token-Kontext. MoE-Architektur mit 17B aktiven Parametern, läuft auf einzelnem H100. Maverick (128 Experts) übertrifft GPT-4o bei Coding und Reasoning.
Mai 2025 — Mai 2026
Alle Daten in diesem Dashboard basieren auf öffentlich verifizierbaren Quellen