Zu vage (z.B. Uniform): du machst keine Annahmen, aber der Sampler muss riesige Räume erkunden → langsam, oft divergent.
Zu eng: du behinderst das Lernen aus den Daten. Der Posterior ≈ Prior, unabhängig von den Daten.
Weakly informative → der goldene Mittelweg: schließt grob unmögliche Werte aus, lässt aber viel Lernraum.
Positive Parameter (σ, τ, λ): ExponentialHalf-NormalHalf-tGammaLog-Normal
Proportionen / Wahrscheinlichkeiten: Beta
Korrelationsmatrizen: LKJ
Faustregel: Student-t(3,0,σ) als robuste Alternative zu Normal, da schwerere Ränder Ausreißer im Prior tolerieren.
· Intercept α: Normal(0, 2.5)
· Slope β: Normal(0, 1)
· Streuung σ: Exponential(1) oder Half-Normal(0,1)
Für Rohskalen muss man skalieren:
σ_prior ≈ 2–3 × SD(y) / SD(x)
Beispiel Reaktionszeiten (MW≈400ms, SD≈80ms):
α: Normal(400, 100), β pro SD(x): Normal(0, 160)
σ als Normal(0,x) in brms: Das ist korrekt — brms wendet automatisch lb=0 an (truncation). Keine Sonderbehandlung nötig, kein
half_normal().ν für Student-t zu klein: ν=1 entspricht Cauchy (kein E[x]), ν=2 hat keine endliche Varianz. Empfohlen: ν ≥ 3, typisch 3–7 für robust.
Beta-Prior für Wahrscheinlichkeiten vergessen: zi, zoi, coi-Parameter in brms sind auf [0,1] — Beta(1,1) ist Uniform, Beta(2,8) sagt: meist wenig Zero-Inflation.
| Verteilung | brms-Syntax | E[σ] | Schwere Ränder | Wann? |
|---|---|---|---|---|
| Exponential(1) | exponential(1) | 1.0 | ✗ | brms-Standard; schwach informativ |
| Half-Normal(1) | normal(0,1) | 0.80 | ✗ | Wenn σ < 2 erwartet |
| Half-Student-t(3,0,1) | student_t(3,0,1) | ~0.90 | ✓ | Kompromiss; gute Default-Wahl |
| Half-Cauchy(1) | cauchy(0,1) | — | ✓✓ | Sehr vage; hohe σ-Werte möglich |
| Gamma(2, 0.1) | gamma(2,0.1) | 20 | ✗ | brms-Standard für ν in Student-t |