Die Beta-Verteilung ist definiert durch die Wahrscheinlichkeitsdichte
f(x)=B(p,q)1xp−1(1−x)q−1
Außerhalb des Intervalls[0,1] wird sie durch f(x)=0 fortgesetzt. Sie besitzt die Parameter p und q. Um ihre Normierbarkeit zu garantieren, wird p,q>0 gefordert.
Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der QuotientX=U/(U+V) aus den stochastisch unabhängigen ZufallsvariablenU und V, die beide gammaverteilt sind mit den Parametern b und pu bzw. pv, ist betaverteilt mit den Parametern pu und pv. U und V lassen sich als Chi-Quadrat-Verteilungen mit 2pu bzw. 2pv Freiheitsgraden interpretieren.
Mit Hilfe der Linearen Regression wird eine Regressionsgerade y=a+bx durch eine Punktwolke mit n Wertepaaren (xi;yi)(i=1,…,n) zweier statistischer Merkmale x und y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der yi-Werte von der Geraden minimiert wird.
Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung zerlegen in die so genannte erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS):
TSS=ESS+RSS.
Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung
r2=TSSESS
beziehungsweise
r2=ESS+RSSESS
ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.
Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.
Wie ist es möglich, daß die Mathematik, letztlich doch ein Produkt menschlichen Denkens unabhängig von der Erfahrung, den wirklichen Gegebenheiten so wunderbar entspricht?