(G)LMM — Mixed Models Interaktiv

Gaussian · Poisson · Gamma · Logistisch · Partial/No/Complete Pooling · Shrinkage · ICC · Simpson

© Dr. Rainer Düsing · Interactive Tools by Claude

⚠ Illustrations-Tool: Schätzungen via IRLS + Method-of-Moments — keine Laplace-Approximation (lme4/glmmTMB). Richtung und Größenordnung stimmen, exakte Werte weichen ab.

LIKELIHOOD:
POOLING:
HAUPTPLOT — DATEN & REGRESSIONSLINIEN
Partial Pooling: Gruppenlinien mit Shrinkage
Simpson-Risiko: Complete-Pooling-Linie zeigt eine andere Richtung als die gruppeninternen Effekte — Gruppenstruktur nicht ignorieren!
SHRINKAGE-DIAGRAMM
No Pooling vs. Partial Pooling Intercepts
Wie lesen? Jede Zeile = eine Gruppe, sortiert nach No-Pooling-Intercept (oben = größter). ○ = No-Pooling  ·  ● = Partial-Pooling. Pfeil zeigt Richtung und Stärke der Shrinkage zum Grand Mean (γ̂₀₀, gestrichelt).
MODELL-ERGEBNISSE
Geschätzte Parameter & Kennzahlen
Was ist ein Mixed Model?
Ein Mixed Model kombiniert Fixed Effects (γ — gleich für alle Gruppen) mit Random Effects (u₀ⱼ — gruppenspezifische Abweichungen). Das Grundmodell lautet:

y_ij = γ₀₀ + γ₁₀·x_ij + u₀ⱼ + ε_ij

Die u₀ⱼ werden nicht direkt geschätzt, sondern als Zufallsvariablen modelliert: u₀ⱼ ~ Normal(0, τ₀²). Das ermöglicht Informationsaustausch zwischen den Gruppen — jede Gruppe profitiert von den Daten der anderen.
Complete · No · Partial Pooling
Complete Pooling: Eine Gerade für alle — Gruppenstruktur wird ignoriert. Effizient, aber verzerrt wenn Gruppen wirklich unterschiedlich sind.

No Pooling: Unabhängige Geraden je Gruppe. Kein Informationsaustausch — Overfit bei kleinem n_j.

Partial Pooling (Mixed Model): Der goldene Mittelweg. Gruppenspezifische Schätzungen werden zum Grand Mean gezogen (Shrinkage). Gruppen mit wenig Daten werden stärker gezogen — das Modell „traut" ihnen weniger.
ICC — Intraklassen-Korrelation
ICC = τ₀² / (τ₀² + σ²)

Der Anteil der Gesamtvarianz, der zwischen Gruppen liegt. Faustregel: ICC > 0.05 → LMM ist notwendig, da Beobachtungen innerhalb einer Gruppe nicht unabhängig sind.

Shrinkage-Faktor λ = τ₀² / (τ₀² + σ²/n_j)

Bestimmt, wie stark die Gruppenspezifische Schätzung zum Grand Mean gezogen wird. Bei kleinem n_j oder kleinem τ₀ → starke Shrinkage. Im Shrinkage-Diagramm sichtbar als Pfeillänge.
Simpson's Paradoxon
Wenn x mit der Gruppenzugehörigkeit korreliert (x-Gruppen-Versatz > 0), kann der marginale Trend (Complete Pooling über alle Daten) dem gruppeninternen Trend entgegengesetzt sein.

Beispiel: Innerhalb jeder Gruppe steigt y mit x — aber Gruppen mit hohem x haben auch niedrigere Intercepts. Die Complete-Pooling-Linie sieht einen negativen Gesamttrend, obwohl der wahre Effekt positiv ist.

Lösung: Partial Pooling trennt den Within-Group-Effekt (γ₁₀) vom Between-Group-Effekt.
Random Intercept vs. Intercept + Slope
Random Intercept (τ₀ > 0): Gruppen unterscheiden sich in ihrem Ausgangsniveau — parallele Linien mit verschiedenen y-Achsenabschnitten. Formel: y ~ x + (1|Gruppe)

Random Intercept + Slope (τ₀, τ₁ > 0): Gruppen haben auch unterschiedliche Steigungen — kein Fan-Out oder Fan-In. Formel: y ~ x + (1+x|Gruppe)

Der Parameter ρ steuert die Korrelation: ρ > 0 → Gruppen mit hohem Intercept haben auch steilen Slope (Fan-out). ρ < 0 → Linien kreuzen sich (Fan-in).
GLMM — Wann welche Likelihood?
Das Mixed-Model-Prinzip gilt für alle Verteilungsfamilien:

Gaussian (LMM): Stetige, symmetrische AV. y ~ Normal(μ, σ)

Poisson (GLMM): Zähldaten (0, 1, 2, …). Log-Link: log(λ) = η — λ bleibt positiv.

Gamma (GLMM): Positive, rechtsschiefe Daten (Reaktionszeiten, Kosten). Log-Link.

Logistisch (GLMM): Binäre AV (0/1). Logit-Link: log(p/(1−p)) = η — p bleibt in (0,1).

In brms: family = poisson(), family = Gamma(link="log"), family = bernoulli()
ℹ (G)LMM Interaktiv — Hilfe
Was lerne ich hier?
Wenn Daten eine Gruppenstruktur haben (Personen, Schulen, Kliniken), sind einfache Regressionen problematisch — Beobachtungen innerhalb einer Gruppe sind nicht unabhängig. Mixed Models lösen das durch Random Effects: jede Gruppe bekommt einen eigenen Intercept u₀ⱼ, der aus einer gemeinsamen Verteilung N(0, τ₀) stammt.
Empfohlene Erkundung
Die wichtigsten Panels
Gruppenlinien: Fixed Effect (γ₀₀ + γ₁₀·x) + gruppenspezifische Abweichung u₀ⱼ — Partial Pooling schrupft alle Linien zum Grand Mean

Shrinkage-Diagramm: No-Pooling-Schätzung → Partial-Pooling-Schätzung; Pfeile zeigen die Zugkraft. Gruppen mit kleinem n werden stärker gezogen.

ICC-Balken: τ₀²/(τ₀²+σ²) — Anteil der Varianz zwischen Gruppen. ICC > 0.05 signalisiert, dass ein Mixed Model nötig ist.

Simpson-Warnung: erscheint, wenn Complete Pooling die Richtung des Slopes umkehrt — das klassische Simpson's Paradoxon.
GLM-Familien
Gaussian: stetige Daten — klassisches LMM
Poisson: Zähldaten (0,1,2,…) — Log-Link
Gamma: positive stetige Daten — Log-Link
Logistisch: 0/1-Daten — Logit-Link