Was ist G-Computation?
G-Computation (kausale Standardisierung) schätzt, was im Durchschnitt passieren würde, wenn wir alle Personen auf einen bestimmten Expositionswert setzen — im Gegensatz zu "welche Personen hatten diesen Wert tatsächlich".
marginaleffects-Schlüsselkonzept: variables=list(X=val) setzt X für jede Beobachtung auf val und mittelt über alle Confounder-Verteilungen. Das ist echte Marginalisierung — kein "typical person".
Binäre Exposition — Estimanden
- ATE (Average Treatment Effect): E[Y(1)−Y(0)] — Effekt in der Gesamtpopulation.
- ATT (on the Treated): E[Y(1)−Y(0) | X=1] — Effekt nur bei tatsächlich Exponierten.
- ATU (on the Untreated): E[Y(1)−Y(0) | X=0] — Effekt, wenn die Nicht-Exponierten behandelt würden.
ATE ≠ ATT ≠ ATU bei Effekt-Heterogenität. Bei randomisierten Daten ohne Interaktionen sind sie gleich.
Metrische Exposition — AME & ate_k
- AME (Average Marginal Effect): Durchschnittliche partielle Ableitung dE[Y]/dX. Antwortet: "Um wie viel ändert sich Y pro einer Einheit mehr X?"
- ate_k (kausaler Kontrast): E[Y(x_hi) − Y(x_lo)] — mittelt über alle Personen die Differenz zwischen zwei spezifischen X-Werten. Antwortet: "Was wäre der Unterschied zwischen Min und Max, Q1 und Q3, etc.?"
AME und ate_k sind konzeptuell verschieden: AME ist ein Slope (pro Einheit), ate_k ist ein Gesamtkontrast (von–bis). Beide sind kausale Effekte wenn Confounding kontrolliert ist.
ate_k — Kontrast-Strings in marginaleffects
"minmax" — Min → Max der Exposition
"iqr" — Q1 → Q3 (25. → 75. Perzentil)
"sd" — Mittelwert−SD → Mittelwert+SD
c(lo, hi) — benutzerdefiniertes Interval
ATT/ATU-Analogon (metrisch)
Für metrische Expositionen gibt es kein natürliches "Behandelt/Unbehandelt". Das Analogon teilt die Population künstlich an einem Cutoff (Standard: Median):
- att_k: Kontrast — nur für Personen mit X ≥ Cutoff ("Hochbelastete")
- atu_k: Kontrast — nur für Personen mit X < Cutoff ("Niedrigbelastete")
Nützlich um zu prüfen, ob der Effekt für bereits stark Exponierte anders ist als für wenig Exponierte — Effekt-Heterogenität auf der Expositionsachse.
Dosis-Wirkungs-Kurve
Schätzt E[Y | do(X=x)] für 100 Werte von min bis max. Jeder Punkt ist ein echter G-Computation-Schätzer: die gesamte Population wird "auf X=x gesetzt" und der marginale Mittelwert berechnet.
ICE — Individuelle kausale Effekte
Individuelle Counterfactual Effects: τ̂ᵢ = Ŷᵢ(x_hi) − Ŷᵢ(x_lo). Zeigt Heterogenität im kausalen Effekt über Personen. Sortierung nach Ŷᵢ(x_lo) — gleiche Zeile = gleiche Person in beiden Plots.
Workflow
- DAG im Golem Builder → Export in G-Comp Builder
- Formel prüfen, Modell in R fitten
- Code kopieren, Estimanden berechnen
- MCMC-Draws exportieren → Decision Maker
Nur Variablen aus dem Adj.-Set sind Pflicht in der Formel. Precisions-Kovariaten (Ursache von Y, nicht von X) können sicher hinzugefügt werden — sie verringern die Varianz ohne Bias einzuführen.