Mathematische Statistik
Als
mathematische Statistik bezeichnet man das Teilgebiet der
Statistik, das die Methoden und Verfahren der
Statistik mit mathematischen Mitteln analysiert beziehungsweise mit ihrer Hilfe erst begründet. Gemeinsam mit der
Wahrscheinlichkeitstheorie bildet die
mathematische Statistik das als
Stochastik. Meist weitgehend synonym werden die Begriffe
induktive Statistik und
Inferenzstatistik (
schließende Statistik) gebraucht, die den zur beschreibenden
Statistik komplementären Teil der
Statistik charakterisieren.
Womit beschäftigt sich Statistik?
Gegenstand der
Statistik sind Grundgesamtheiten, deren Mitglieder allesamt ein bestimmtes Merkmal aufweisen. Gesucht sind Aussagen darüber, wie häufig dieses Merkmal innerhalb der
Grundgesamtheit seine möglichen Werte annimmt. Oft beschränken sich die Aussagen auf abgeleitete Größen wie zum Beispiel den
Durchschnitt der Merkmalswerte, die die Mitglieder der
Grundgesamtheit besitzen.
Ein Beispiel ist die häufig als Alterspyramide grafisch dargestellte Altersverteilung, wobei es sich bei der
Grundgesamtheit beispielsweise um die deutsche Bevölkerung handeln kann. Da eine präzise Bestimmung der Altersverteilung der Deutschen eine aufwändige Vollerhebung wie eine Volkszählung voraussetzt, sucht man nach Methoden, mit denen weitgehend zuverlässige Aussagen bereits auf
Basis von Teilerhebungen möglich sind. Wie im Beispiel des Politbarometers werden dazu nur die Mitglieder zufällig ausgewählter
Teilmengen der
Grundgesamtheit, sogenannte
Stichproben, auf das interessierende Merkmal untersucht.
Statistische Modelle
Eine gänzliche Formalisierung auf
Basis mathematischer Objekte wird mit dem Begriff des
statistischen Modells erzielt, oft auch als
statistischer Raum bezeichnet. Abweichend vom bisher beschriebenen, eher anwendungsorientierten Szenario kann dabei auf die Festlegung einer
Grundgesamtheit verzichtet werden:
Die möglichen Stichprobenergebnisse
x werden zu einer
Menge X, dem
Stichprobenraum, zusammengefasst. Die darin beobachtbaren Ereignisse werden formal durch eine zum Stichprobenraum
X definierte
σ-Algebra
F charakterisiert. Die Verteilungsannahme, das heißt die in Frage kommenden
Wahrscheinlichkeitsverteilungen, entsprechen einer Familie
(Pϑ)ϑ∈Θ von Wahrscheinlichkeitsmaßen auf
(X,F). Ein statistisches Modell ist damit formal ein
Tripel (X,F,Pϑ:ϑ∈Θ). Ist
ϑ ein reeller Parametervektor, also
Θ⊆Rd, so spricht man von einem
parametrischen Modell mit
Parameterraum Θ. Den Fall
d=1 eines reellen Parameters nennt man
einparametriges Modell.
Eine
messbare Funktion S von
(X,F) in einen weiteren
Messraum (S,Σ) heißt
Stichprobenfunktion oder
Statistik. Eine
Schätzfunktion oder kurz ein
Schätzer für eine Kenngröße
τ(ϑ)∈S des Parameters ist eine Stichprobenfunktion
T:X→S.
Beispiel
Eine (möglicherweise gezinkte) Münze wird
n=100 Mal geworfen. Die
Wahrscheinlichkeit p, dass bei einem Wurf Kopf fällt, sei unbekannt. Es wird beobachtet, wie oft die Münze Kopf zeigt. Das zugehörige statistische Modell
(X,F,Pϑ:ϑ∈Θ) dafür ist gegeben durch
- X={0,1,…,n} als Stichprobenraum,
- F die Potenzmenge von X,
- Θ=[0,1] als Menge der möglichen Werte des unbekannten Parameters ϑ=p,
- Pϑ ist die Binomialverteilung mit den Parametern n=100 und ϑ.
Ein naheliegender Schätzer für den Parameter
τ(ϑ)=ϑ ist in diesem Fall gegeben durch die relative Häufigkeit
T(x)=nx=100x für
x∈X.
Scherzhafte Beispiele haben manchmal größere Bedeutung als ernste.
Michael Stifel
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld
• Dοrfplatz 25 • 17237 Blankеnsее
• Tel.: 01734332309 (Vodafone/D2) •
Email: cο@maτhepedιa.dе