Mixed Models – Interaktiv (LMM & GLMM)

⚠ Illustrations-Tool: Schätzungen via IRLS + Method-of-Moments — keine Laplace-Approximation (lme4/glmmTMB). Richtung und Größenordnung stimmen, exakte Werte weichen ab.

Was ist ein Mixed Model?

Ein Mixed Model kombiniert Fixed Effects (γ — gleich für alle Gruppen) mit Random Effects (u₀ⱼ — gruppenspezifische Abweichungen). Das Grundmodell lautet:

y_ij = γ₀₀ + γ₁₀·x_ij + u₀ⱼ + ε_ij

Die u₀ⱼ werden nicht direkt geschätzt, sondern als Zufallsvariablen modelliert: u₀ⱼ ~ Normal(0, τ₀²). Das ermöglicht Informationsaustausch zwischen den Gruppen — jede Gruppe profitiert von den Daten der anderen.

Complete · No · Partial Pooling

Complete Pooling: Eine Gerade für alle — Gruppenstruktur wird ignoriert. Effizient, aber verzerrt wenn Gruppen wirklich unterschiedlich sind.

No Pooling: Unabhängige Geraden je Gruppe. Kein Informationsaustausch — Overfit bei kleinem n_j.

Partial Pooling (Mixed Model): Der goldene Mittelweg. Gruppenspezifische Schätzungen werden zum Grand Mean gezogen (Shrinkage). Gruppen mit wenig Daten werden stärker gezogen — das Modell „traut" ihnen weniger.

ICC — Intraklassen-Korrelation

ICC = τ₀² / (τ₀² + σ²)

Der Anteil der Gesamtvarianz, der zwischen Gruppen liegt. Faustregel: ICC > 0.05 → LMM ist notwendig, da Beobachtungen innerhalb einer Gruppe nicht unabhängig sind.

Shrinkage-Faktor λ = τ₀² / (τ₀² + σ²/n_j)

Bestimmt, wie stark die Gruppenspezifische Schätzung zum Grand Mean gezogen wird. Bei kleinem n_j oder kleinem τ₀ → starke Shrinkage. Im Shrinkage-Diagramm sichtbar als Pfeillänge.

Simpson's Paradoxon

Wenn x mit der Gruppenzugehörigkeit korreliert (x-Gruppen-Versatz > 0), kann der marginale Trend (Complete Pooling über alle Daten) dem gruppeninternen Trend entgegengesetzt sein.

Beispiel: Innerhalb jeder Gruppe steigt y mit x — aber Gruppen mit hohem x haben auch niedrigere Intercepts. Die Complete-Pooling-Linie sieht einen negativen Gesamttrend, obwohl der wahre Effekt positiv ist.

Lösung: Partial Pooling trennt den Within-Group-Effekt (γ₁₀) vom Between-Group-Effekt.

Random Intercept vs. Intercept + Slope

Random Intercept (τ₀ > 0): Gruppen unterscheiden sich in ihrem Ausgangsniveau — parallele Linien mit verschiedenen y-Achsenabschnitten. Formel: y ~ x + (1|Gruppe)

Random Intercept + Slope (τ₀, τ₁ > 0): Gruppen haben auch unterschiedliche Steigungen — kein Fan-Out oder Fan-In. Formel: y ~ x + (1+x|Gruppe)

Der Parameter ρ steuert die Korrelation: ρ > 0 → Gruppen mit hohem Intercept haben auch steilen Slope (Fan-out). ρ < 0 → Linien kreuzen sich (Fan-in).

GLMM — Wann welche Likelihood?

Das Mixed-Model-Prinzip gilt für alle Verteilungsfamilien:

Gaussian (LMM): Stetige, symmetrische AV. y ~ Normal(μ, σ)

Poisson (GLMM): Zähldaten (0, 1, 2, …). Log-Link: log(λ) = η — λ bleibt positiv.

Gamma (GLMM): Positive, rechtsschiefe Daten (Reaktionszeiten, Kosten). Log-Link.

Logistisch (GLMM): Binäre AV (0/1). Logit-Link: log(p/(1−p)) = η — p bleibt in (0,1).

In brms: family = poisson(), family = Gamma(link="log"), family = bernoulli()

ℹ (G)LMM Interaktiv — Hilfe

Was lerne ich hier?

Wenn Daten eine Gruppenstruktur haben (Personen, Schulen, Kliniken), sind einfache Regressionen problematisch — Beobachtungen innerhalb einer Gruppe sind nicht unabhängig. Mixed Models lösen das durch Random Effects: jede Gruppe bekommt einen eigenen Intercept u₀ⱼ, der aus einer gemeinsamen Verteilung N(0, τ₀) stammt.

Empfohlene Erkundung

Mit Partial Pooling starten — das ist das LMM/GLMM
No Pooling vs. Complete Pooling vergleichen — wo divergieren die Linien?
τ₀ (Random-Effect-SD) variieren — ab wann ist Shrinkage sichtbar?
⚡ Ausreißer-Gruppe zuschalten — wie reagiert jede Pooling-Strategie?
Anzahl der Gruppen J und Gruppengrößen n_j variieren — wie verändert sich das Shrinkage?
AIC/BIC in den Modellergebnissen vergleichen — wann schneidet Partial Pooling besser ab als No/Complete Pooling?
⚠ Simpson-Preset laden und Complete Pooling beobachten — warum ist Partial Pooling hier unverzichtbar?

Die wichtigsten Panels

Gruppenlinien: Fixed Effect (γ₀₀ + γ₁₀·x) + gruppenspezifische Abweichung u₀ⱼ — Partial Pooling schrupft alle Linien zum Grand Mean

Shrinkage-Diagramm: No-Pooling-Schätzung → Partial-Pooling-Schätzung; Pfeile zeigen die Zugkraft. Gruppen mit kleinem n werden stärker gezogen.

ICC-Balken: τ₀²/(τ₀²+σ²) — Anteil der Varianz zwischen Gruppen. ICC > 0.05 signalisiert, dass ein Mixed Model nötig ist.

Simpson-Warnung: erscheint, wenn Complete Pooling die Richtung des Slopes umkehrt — das klassische Simpson's Paradoxon.

GLM-Familien

Gaussian: stetige Daten — klassisches LMM
Poisson: Zähldaten (0,1,2,…) — Log-Link
Gamma: positive stetige Daten — Log-Link
Logistisch: 0/1-Daten — Logit-Link

(G)LMM — Mixed Models Interaktiv

Fixed Effects

Random Effects

Datengenerierung

Modellformel