Berechnungsformel
// pro Pillar:
gapi = min(100, SOTAi ÷ Baselinei × 100)
// Gesamt-Score (Weighted Geometric Mean):
AGI_Proximity = exp( Σ wi × ln(gapi) ÷ Σ wi )
Warum geometrisch statt arithmetisch?
Ein arithmetisches Mittel würde Kompensation erlauben: "Multimodal 99% gleicht Self-Improvement 22% aus". Das ist für AGI irreführend.
Ein geometrisches Mittel bestraft Extreme — eine sehr niedrige Dimension drückt den Gesamtwert überproportional, weil AGI *alle* Fähigkeiten gleichzeitig braucht.
Gewichtungslogik
15%
Self-Improvement / RSI
10%
Multimodal Understanding
Long-Horizon Agency (20%) und
Self-Improvement (15%) sind die höchsten Gewichte,
weil sie die *qualitativen* Sprünge zu AGI repräsentieren.
Gesättigte Dimensionen (Knowledge, Math, Multimodal) bekommen nur 8–10%, weil sie "fast durchgelaufen" sind.
Sättigungs-Regel (automatisch)
Erreicht ein Benchmark-Gap ≥ 95% über drei Quartale in Folge,
wird automatisch auf den Successor-Benchmark umgestellt (z.B. GPQA → HLE / Humanity's Last Exam).
Damit bleibt der Index eine ehrliche Messung des Rest-Gaps — und wird nicht künstlich "fertig".
Keine Meinungen, keine Gewichte aus dem Bauch — nur öffentliche Benchmarks + veröffentlichte Human-Baselines.
Werte werden quartalsweise aktualisiert. Letztes Update: 2026-03.
Fehler? → Issue auf GitHub öffnen.