Prior Lab — Bayes Thinking Lab

⟳ Credible Interval → Parameter berechnen

Untere Grenze

Obere Grenze

Masse (%)

      Das Kernproblem beim Prior-Wählen: Als Forschende hast du oft eine inhaltliche Vorstellung — z.B. „95% der plausiblen Effekte liegen zwischen −2 und +5" — weißt aber nicht, welche Parameterwerte dieser Vorstellung entsprechen. Für die Normalverteilung ist das direkt berechenbar (μ = Mittelpunkt, σ aus Quantilfunktion). Für alle anderen Verteilungen ist keine geschlossene Formel verfügbar. Der Solver oben findet die Parameter numerisch.
    

brms Prior-Syntax

Was ist ein Prior?

Ein Prior P(θ) ist eine Wahrscheinlichkeitsverteilung über mögliche Parameterwerte, bevor du die Daten siehst. Er kodiert dein Vorwissen.

Zu vage (z.B. Uniform): du machst keine Annahmen, aber der Sampler muss riesige Räume erkunden → langsam, oft divergent.

Zu eng: du behinderst das Lernen aus den Daten. Der Posterior ≈ Prior, unabhängig von den Daten.

Weakly informative → der goldene Mittelweg: schließt grob unmögliche Werte aus, lässt aber viel Lernraum.

Welche Verteilung wählen?

Parameter ohne Constraint (α, β): NormalStudent-tCauchy

Positive Parameter (σ, τ, λ): ExponentialHalf-NormalHalf-tGammaLog-Normal

Proportionen / Wahrscheinlichkeiten: Beta

Korrelationsmatrizen: LKJ

Faustregel: Student-t(3,0,σ) als robuste Alternative zu Normal, da schwerere Ränder Ausreißer im Prior tolerieren.

Gelman's Empfehlungen

Für z-standardisierte Variablen (SD=1):
· Intercept α: Normal(0, 2.5)
· Slope β: Normal(0, 1)
· Streuung σ: Exponential(1) oder Half-Normal(0,1)

Für Rohskalen muss man skalieren:
σ_prior ≈ 2–3 × SD(y) / SD(x)

Beispiel Reaktionszeiten (MW≈400ms, SD≈80ms):
α: Normal(400, 100), β pro SD(x): Normal(0, 160)

Häufige Fallstricke

Prior-Skala nicht an die AV angepasst: Normal(0,1) für einen Slope bei Rohskalen (z.B. kg, €, ms) impliziert, dass +1 Einheit x → ±1 Einheit y — je nach Skala absurd eng oder viel zu weit. Immer die Metrik der AV im Kopf behalten.

σ als Normal(0,x) in brms: Das ist korrekt — brms wendet automatisch lb=0 an (truncation). Keine Sonderbehandlung nötig, kein half_normal().

ν für Student-t zu klein: ν=1 entspricht Cauchy (kein E[x]), ν=2 hat keine endliche Varianz. Empfohlen: ν ≥ 3, typisch 3–7 für robust.

Beta-Prior für Wahrscheinlichkeiten vergessen: zi, zoi, coi-Parameter in brms sind auf [0,1] — Beta(1,1) ist Uniform, Beta(2,8) sagt: meist wenig Zero-Inflation.

Vergleichstabelle — Priors für σ und τ

Verteilung	brms-Syntax	E[σ]	Schwere Ränder	Wann?
Exponential(1)	`exponential(1)`	1.0	✗	brms-Standard; schwach informativ
Half-Normal(1)	`normal(0,1)`	0.80	✗	Wenn σ < 2 erwartet
Half-Student-t(3,0,1)	`student_t(3,0,1)`	~0.90	✓	Kompromiss; gute Default-Wahl
Half-Cauchy(1)	`cauchy(0,1)`	—	✓✓	Sehr vage; hohe σ-Werte möglich
Gamma(2, 0.1)	`gamma(2,0.1)`	20	✗	brms-Standard für ν in Student-t

GLM Prior — Hilfe

Das Grundproblem

Priors in brms müssen auf der Modellskala formuliert werden (Logit oder Log) — du denkst aber in Wahrscheinlichkeiten und Raten. Diese Skalen sind nicht linear: Normal(0, 10) auf Logit klingt vage, drückt aber fast alle Prior-Masse an die Extremwerte p≈0% und p≈100%.

Der Solver schlägt diese Brücke: Du formulierst deine inhaltlichen Grenzen auf der Ausgangsskala — der Solver liefert die passenden Prior-Parameter auf der Modellskala, die du direkt in brms verwenden kannst.

Die zwei Plots visualisieren genau diesen Zusammenhang:

Plot oben — Modellskala: Die Prior-Verteilung so, wie sie in brms eingetragen werden muss (Logit- oder Log-Skala). Nicht intuitiv lesbar, aber technisch korrekt.

Plot unten — Response-Skala: Was dieser Prior auf der Ausgangsskala impliziert (Wahrscheinlichkeit, Erwartungswert, OR/RR). Das ist, was wir eigentlich wollen — aber nicht direkt in brms formulieren können. Nur zur visuellen Orientierung.

Warum exp(β) = Multiplikator?

Log-Link (Poisson/Gamma):
log(μ) = α + β·X → μ = exp(α) · exp(β·X)

Vergleich zweier Gruppen (X: 0 → 1):

X=0: μ₀ = exp(α)
X=1: μ₁ = exp(α + β) = exp(α) · exp(β)
Rate Ratio = μ₁ / μ₀ = exp(β)

Ein β von z.B. 0.69 bedeutet: exp(0.69) ≈ 2 → Rate verdoppelt sich. β addieren auf Log-Skala = μ multiplizieren mit exp(β). Deshalb denkt man beim Prior für β in Ratios, nicht in Differenzen.

Logit-Link (Bernoulli/Binomial) — exakt dieselbe Struktur, nur mit Odds statt Raten:
logit(P) = log(P/(1−P)) = α + β·X

X=0: odds₀ = exp(α)
X=1: odds₁ = exp(α + β) = exp(α) · exp(β)
Odds Ratio = odds₁ / odds₀ = exp(β)

Intercept — Basis-Niveau

Der Intercept bestimmt das Niveau, wenn alle Prädiktoren = 0 sind.

Logit-Link: sigmoid(α) = Baseline-Wahrscheinlichkeit

„Ohne Therapie genesen 10–40% der Patienten"
→ Eingabe: 0.10 bis 0.40
→ logit(0.10) ≈ −2.20 | logit(0.40) ≈ −0.41
→ Solver: Normal(−1.30, 0.46) auf Logit-Skala
μ < 0, weil die Baseline unter 50% liegt ✓

Log-Link: exp(α) = Baseline-Erwartungswert

„Baseline: 3–15 Klinikaufenthalte pro Jahr"
→ Eingabe: 3 bis 15
→ log(3) ≈ 1.10 | log(15) ≈ 2.71
→ Solver: Normal(1.90, 0.41) auf Log-Skala
μ ≈ 1.90, weil exp(1.90) ≈ 6.7 — Mitte von 3–15 ✓

Slope / β — Effekt pro X-Einheit

Logit-Link → Odds Ratio (OR) = exp(β):

„Therapie kann Odds leicht reduzieren oder stark erhöhen
— OR zwischen 0.7 und 4.0 ist plausibel"
→ Eingabe: OR 0.70 bis 4.0
→ log(0.70) ≈ −0.36 | log(4.0) ≈ 1.39
→ Solver: Normal(0.52, 0.44) auf Logit-Skala
μ > 0, weil der Prior leicht Richtung positiver Effekt lehnt ✓

Log-Link → Rate Ratio (RR) = exp(β):

„Behandlung erhöht Ereignisrate um 50%–5-fach"
→ Eingabe: RR 1.5 bis 5.0
→ log(1.5) ≈ 0.41 | log(5.0) ≈ 1.61
→ Solver: Normal(1.01, 0.31) auf Log-Skala
μ > 0, weil Prior ausschließlich positive Effekte erwartet ✓

Faustregel für Slopes

      Normal(0, 0.5) → 95%-CrI OR/RR ≈ 0.37–2.7  (moderat)

      Normal(0, 1.0) → 95%-CrI OR/RR ≈ 0.14–7.4  (groß)

      Normal(0, 2.0) → 95%-CrI OR/RR ≈ 0.02–55   (sehr vage)

Hinweis zu μ = 0: Nur wenn die Ratio-Grenzen symmetrisch um 1 liegen (Produkt = 1, z.B. 0.5 × 2.0 = 1), ergibt der Solver zwingend μ = 0. Das ist der klassische „no-effect-prior". Asymmetrische Grenzen — wie in den Beispielen oben — ergeben μ ≠ 0 und kodieren inhaltliche Erwartungen.

ℹ Prior Lab — Hilfe

Was lerne ich hier?

Das Prior Lab zeigt alle wichtigen Prior-Verteilungen für brms — interaktiv, mit CI-Solver und direkter brms-Syntax.

Welche Verteilung passt zu welchem Parameter?
Wie setzt man inhaltliche Vorstellungen (z.B. 95%-CrI) in Parameterwerte um?
Wie lautet die brms-Syntax für den gewählten Prior?
Was sind Gelman's Empfehlungen für Standard-Situationen?

Workflow

Verteilung wählen (links): Kategorie beachten — unbegrenzt / positiv / [0,1].
CI-Solver nutzen: Inhaltliche Grenzen eingeben (z.B. „95% zwischen −2 und +5") → Parameter werden automatisch berechnet und in die Slider übernommen.
brms-Syntax kopieren: Der Code unten passt sich live an und kann direkt in R eingefügt werden.

Prior-Typen

Vage (uniform, Cauchy): kaum Vorannahmen, aber Sampler träge und oft divergent.
Weakly informative: schließt grob unmögliche Werte aus, lässt viel Lernraum — der empfohlene Weg.
Stark informativ: nur wenn echtes Vorwissen vorhanden (z.B. aus Metaanalyse).
Typische Defaults für gängige Parameter findest du in der Tabelle „Typische brms-Defaults" unten links in der Seitenleiste — klickbar zum direkten Laden der Parameter.

Häufige Entscheidungen

Intercept α: Student-t(3, 0, 2.5) — brms-Standard
Slope β (z-std.): Normal(0, 1) — Gelman
Streuung σ / τ: Exponential(1) oder Half-Normal(0,1)
Wahrsch. / Prop.: Beta(1,1) bis Beta(2,8)
Korrelation: LKJ(2) — regularisiert um 0
Reaktionszeiten: Log-Normal(μ, σ) auf log-Skala

Warum das für Bayes wichtig ist

Der Prior ist kein lästiges Beiwerk — er ist Teil des Modells. Posterior ∝ Likelihood × Prior. Ein zu enger Prior dominiert das Modell, ein zu vager verlangsamt den Sampler. Der CI-Solver hilft, Prior-Parameter inhaltlich zu begründen statt willkürlich zu wählen.

Weiter → Prior Predictive Check: überprüfe ob die gewählten Priors sinnvolle Vorhersagen implizieren — bevor du die Daten siehst