Betaverteilung

Beta_distribution_pdf.png
Betaverteilung für verschiedene Parameterwerte
Die Betaverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über dem Intervall \(\displaystyle [0,1]\).

Definition

Die Beta-Verteilung ist definiert durch die Wahrscheinlichkeitsdichte
\(\displaystyle f(x)=\over{{1}}{ {B(p,q)}}x^{p-1}(1-x)^{q-1}\, \)
Außerhalb des Intervalls \(\displaystyle [0,1]\) wird sie durch \(\displaystyle f(x)=0\) fortgesetzt. Sie besitzt die Parameter \(\displaystyle p\) und \(\displaystyle q\). Um ihre Normierbarkeit zu garantieren, wird \(\displaystyle p,q > 0\) gefordert.
340_Beta-distribution.png
Dichten verschiedener beta-verteilter Zufallsgrößen
Der Vorfaktor \(\displaystyle 1/B(p,q)\) dient der korrekten Normierung. Der Ausdruck
\(\displaystyle B(p,q)=\over{\Gamma(p) \Gamma(q)}{\Gamma(p+q)}\)\(\displaystyle =\int\limits_0^1 u^{p-1} (1-u)^{q-1} \, du\)
steht für Betafunktion, nach der die Verteilung benannt ist. Dabei ist \(\displaystyle \Gamma(x)\) die Gammafunktion.
 
 

Eigenschaften

Maximum

Die Dichtefunktion \(\displaystyle f\) besitzt ihr Maximum an der Stelle \(\displaystyle x_{max}=\braceNT{1+\dfrac{q-1}{p-1}}^{-1}\).

Erwartungswert

Der Erwartungswert berechnet sich zu
\(\displaystyle \operatorname{E}(X)=\over{p }{ p+q}\).

Varianz

Die Varianz ergibt sich zu
\(\displaystyle \operatorname{Var}(X)=\over{pq }{ (p+q+1)(p+q)^{2}}\).

Standardabweichung

Für die Standardabweichung ergibt sich
\(\displaystyle \sigma = \sqrt{\dfrac{pq}{(p+q+1)(p+q)^2}}\).

Variationskoeffizient

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten
\(\displaystyle \operatorname{VarK}(X) = \sqrt{\dfrac{q}{p(p+q+1)}}\).

Schiefe

Die Schiefe ergibt sich zu
\(\displaystyle \operatorname{v}(X) = \dfrac{2(q-p)\sqrt{p+q+1}}{(p+q+2)\sqrt{pq}}\).

Symmetrie

Die Beta-Verteilung ist für \(\displaystyle p=q\) symmetrisch um \(\displaystyle x=\dfrac{1}{2}\) mit der Schiefe \(\displaystyle \operatorname{v}(X)=0\).

Beziehungen zu anderen Verteilungen

Beziehung zur Gammaverteilung

Wenn die Zufallsvariablen \(\displaystyle X\) mit \(\displaystyle \gamma(a,b)\)und \(\displaystyle Y\) mit \(\displaystyle \gamma(a,c)\) Gamma-verteilt sind mit den Parametern \(\displaystyle a, b\) und \(\displaystyle c\), dann ist die Größe \(\displaystyle \dfrac{X}{X+Y}\) Beta-verteilt mit
\(\displaystyle B(b,c) = \dfrac{\gamma(a,b)}{\gamma(a,b)+\gamma(a,c)}\).

Beziehung zur F-Verteilung

Die Beta-Verteilung geht mit \(\displaystyle p=n/2,\, q=m/2\) und ganzzahligen \(\displaystyle n\) und \(\displaystyle m\) in die F-Verteilung über.

Beispiel

Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der Quotient \(\displaystyle X = U/(U+V)\) aus den stochastisch unabhängigen Zufallsvariablen \(\displaystyle U\) und \(\displaystyle V\), die beide gammaverteilt sind mit den Parametern \(\displaystyle b\) und \(\displaystyle p_u\) bzw. \(\displaystyle p_v\), ist betaverteilt mit den Parametern \(\displaystyle p_u\) und \(\displaystyle p_v\). \(\displaystyle U\) und \(\displaystyle V\) lassen sich als Chi-Quadrat-Verteilungen mit \(\displaystyle 2p_u\) bzw. \(\displaystyle 2p_v\) Freiheitsgraden interpretieren.
Mit Hilfe der Linearen Regression wird eine Regressionsgerade \(\displaystyle y = a + bx\) durch eine Punktwolke mit \(\displaystyle n\) Wertepaaren \(\displaystyle (x_i;y_i) (i=1,\dots ,n)\) zweier statistischer Merkmale \(\displaystyle x\) und \(\displaystyle y\) gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der \(\displaystyle y_i\)-Werte von der Geraden minimiert wird.
Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung zerlegen in die so genannte erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS):
\(\displaystyle TSS= ESS+RSS\).
Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung
\(\displaystyle r^{2}=\over{{ESS}}{{TSS}}\)
beziehungsweise
\(\displaystyle r^{2}=\over{ {ESS} }{ { {ESS}+{RSS}}}\)
ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von \(\displaystyle x\) und \(\displaystyle y\) darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.
Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.

Man darf nicht das, was uns unwahrscheinlich und unnatürlich erscheint, mit dem verwechseln, was absolut unmöglich ist.

Carl Friedrich Gauß

Copyright- und Lizenzinformationen: Diese Seite basiert dem Artikel Betaverteilung aus der frеiеn Enzyklοpädιe Wιkιpеdιa und stеht unter der Dοppellizеnz GNU-Lιzenz für freie Dokumentation und Crеative Commons CC-BY-SA 3.0 Unportеd (Kurzfassung). In der Wιkιpеdιa ist eine Listе dеr Autorеn des Originalartikels verfügbar. Da der Artikel geändert wurde, reicht die Angabe dieser Liste für eine lizenzkonforme Weiternutzung nicht aus!
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld  • Dοrfplatz 25  •  17237 Blankеnsее  • Tel.: 01734332309 (Vodafone/D2)  •  Email: cο@maτhepedιa.dе