Mathematische Statistik

Als mathematische Statistik bezeichnet man das Teilgebiet der Statistik, das die Methoden und Verfahren der Statistik mit mathematischen Mitteln analysiert beziehungsweise mit ihrer Hilfe erst begründet. Gemeinsam mit der Wahrscheinlichkeitstheorie bildet die mathematische Statistik das als Stochastik. Meist weitgehend synonym werden die Begriffe induktive Statistik und Inferenzstatistik (schließende Statistik) gebraucht, die den zur beschreibenden Statistik komplementären Teil der Statistik charakterisieren.
Die mathematische Grundlage der mathematischen Statistik ist die Wahrscheinlichkeitstheorie.
 
 

Womit beschäftigt sich Statistik?

Gegenstand der Statistik sind Grundgesamtheiten, deren Mitglieder allesamt ein bestimmtes Merkmal aufweisen. Gesucht sind Aussagen darüber, wie häufig dieses Merkmal innerhalb der Grundgesamtheit seine möglichen Werte annimmt. Oft beschränken sich die Aussagen auf abgeleitete Größen wie zum Beispiel den Durchschnitt der Merkmalswerte, die die Mitglieder der Grundgesamtheit besitzen.
Ein Beispiel ist die häufig als Alterspyramide grafisch dargestellte Altersverteilung, wobei es sich bei der Grundgesamtheit beispielsweise um die deutsche Bevölkerung handeln kann. Da eine präzise Bestimmung der Altersverteilung der Deutschen eine aufwändige Vollerhebung wie eine Volkszählung voraussetzt, sucht man nach Methoden, mit denen weitgehend zuverlässige Aussagen bereits auf Basis von Teilerhebungen möglich sind. Wie im Beispiel des Politbarometers werden dazu nur die Mitglieder zufällig ausgewählter Teilmengen der Grundgesamtheit, sogenannte Stichproben, auf das interessierende Merkmal untersucht.

Statistische Modelle

Eine gänzliche Formalisierung auf Basis mathematischer Objekte wird mit dem Begriff des statistischen Modells erzielt, oft auch als statistischer Raum bezeichnet. Abweichend vom bisher beschriebenen, eher anwendungsorientierten Szenario kann dabei auf die Festlegung einer Grundgesamtheit verzichtet werden:
Die möglichen Stichprobenergebnisse \(\displaystyle x\) werden zu einer Menge \(\displaystyle \mathcal{X}\), dem Stichprobenraum, zusammengefasst. Die darin beobachtbaren Ereignisse werden formal durch eine zum Stichprobenraum \(\displaystyle \mathcal{X}\) definierte \(\displaystyle \sigma\)-Algebra \(\displaystyle \mathcal{F}\) charakterisiert. Die Verteilungsannahme, das heißt die in Frage kommenden Wahrscheinlichkeitsverteilungen, entsprechen einer Familie \(\displaystyle (P_\vartheta)_{\vartheta \in \Theta}\) von Wahrscheinlichkeitsmaßen auf \(\displaystyle (\mathcal{X}, \mathcal{F})\). Ein statistisches Modell ist damit formal ein Tripel \(\displaystyle (\mathcal{X}, \mathcal{F}, P_\vartheta : \vartheta \in \Theta)\). Ist \(\displaystyle \vartheta\) ein reeller Parametervektor, also \(\displaystyle \Theta \subseteq \R^d\), so spricht man von einem parametrischen Modell mit Parameterraum \(\displaystyle \Theta\). Den Fall \(\displaystyle d=1\) eines reellen Parameters nennt man einparametriges Modell.
Eine messbare Funktion \(\displaystyle S\) von \(\displaystyle (\mathcal{X},\mathcal{F})\) in einen weiteren Messraum \(\displaystyle (\mathcal{S}, \Sigma)\) heißt Stichprobenfunktion oder Statistik. Eine Schätzfunktion oder kurz ein Schätzer für eine Kenngröße \(\displaystyle \tau(\vartheta) \in \mathcal S\) des Parameters ist eine Stichprobenfunktion \(\displaystyle T : \mathcal{X} \to \mathcal{S}\).

Beispiel

Eine (möglicherweise gezinkte) Münze wird \(\displaystyle n=100\) Mal geworfen. Die Wahrscheinlichkeit \(\displaystyle p\), dass bei einem Wurf Kopf fällt, sei unbekannt. Es wird beobachtet, wie oft die Münze Kopf zeigt. Das zugehörige statistische Modell \(\displaystyle (\mathcal{X}, \mathcal{F}, P_\vartheta : \vartheta \in \Theta)\) dafür ist gegeben durch
  • \(\displaystyle \mathcal{X} = \{0,1,\ldots,n\}\) als Stichprobenraum,
  • \(\displaystyle \mathcal{F}\) die Potenzmenge von \(\displaystyle \mathcal{X}\),
  • \(\displaystyle \Theta = [0,1]\) als Menge der möglichen Werte des unbekannten Parameters \(\displaystyle \vartheta = p\),
  • \(\displaystyle P_\vartheta\) ist die Binomialverteilung mit den Parametern \(\displaystyle n=100\) und \(\displaystyle \vartheta\).
Ein naheliegender Schätzer für den Parameter \(\displaystyle \tau(\vartheta)=\vartheta\) ist in diesem Fall gegeben durch die relative Häufigkeit \(\displaystyle T(x) = \dfrac{x}{n} = \dfrac{x}{100}\) für \(\displaystyle x \in \mathcal{X}\).

Scherzhafte Beispiele haben manchmal größere Bedeutung als ernste.

Michael Stifel

Copyright- und Lizenzinformationen: Diese Seite basiert dem Artikel Mathematische Statistik aus der frеiеn Enzyklοpädιe Wιkιpеdιa und stеht unter der Dοppellizеnz GNU-Lιzenz für freie Dokumentation und Crеative Commons CC-BY-SA 3.0 Unportеd (Kurzfassung). In der Wιkιpеdιa ist eine Listе dеr Autorеn des Originalartikels verfügbar. Da der Artikel geändert wurde, reicht die Angabe dieser Liste für eine lizenzkonforme Weiternutzung nicht aus!
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld  • Dοrfplatz 25  •  17237 Blankеnsее  • Tel.: 01734332309 (Vodafone/D2)  •  Email: cο@maτhepedιa.dе