· 

Grundbegriffe der deskriptiven Statistik

1. Einführung

Statistische Methoden sind aus vielen Bereichen der Informatik, wie etwa Big-Data-Analysen oder neuronalen Netzen nicht mehr wegzudenken. Deshalb ist Statistik ein wichtiger Bestandteil des Informatikstudiums. Der Aufgabenkern der deskriptiven Statistik liegt in der Beschreibung bzw. Darstellung von Häufigkeiten von Merkmalsausprägungen. Da sind jetzt ziemlich viele Begriffe gefallen, die unbedingt einer Erklärung bedürfen. Deshalb sollst du erfahren , was man unter

  • einem Merkmal, 
  • einer Merkmalsausprägung, 
  • einer statistischen Einheit bzw. einem Merkmalsträger und
  • der Grundgesamtheit

versteht. Zudem sollen die Eigenschaften

  • häufbar und nicht häufbar,
  • quantitativ und qualitativ, sowie
  • diskret und stetig

näher beleuchtet werden.


2. Merkmal, Merkmalsausprägung, Merkmalsträger und Grundgesamtheit

Für die Begriffe Merkmal, Merkmalsausprägung, Merkmalsträger bzw. statistische Einheit und Grundgesamtheit betrachten wir ein Beispiel, das uns näher nicht sein könnte, nämlich den Menschen. Ein Mensch weist verschiedene Merkmale auf, wie etwa das Geschlecht, das Gewicht, die Körpergröße, das Alter oder die Haarfarbe. Der Mensch besitzt bzw. trägt also verschiedene Merkmale, was ihn zum Merkmalsträger bzw. zur statistischen Einheit macht. Die einzelnen Merkmale können verschiedene Ausprägungen haben. Beim Geschlecht gibt es z. B. die Merkmalsausprägungen "männlich" und "weiblich". Das Gewicht kann in kg als numerischer Wert angegeben werden. Die Körpergröße ist ebenfalls ein numerischer Wert in z. B. Metern. Das Alter kann man bspw. als Ganzzahl angeben. Als Haarfarben sind u. a. "schwarz", "braun", "blond" oder "rot" denkbar. Betrachtet man alle Menschen auf diesem Planeten, so ergibt sich die Grundgesamtheit der statistischen Einheit "Mensch".

3. (Nicht) häufbar, qualitativ, quantitativ, diskret und stetig

Wie du vielleicht gemerkt hast, können die Merkmalsausprägungen in unterschiedlichen Einheiten angegeben werden. Manche von ihnen sind quantitativ, d. h. sie können durch eine Zahl gemessen werden, wie bspw. das Gewicht oder die Körpergröße. Andere wiederum (wie etwa das Geschlecht oder die Haarfarbe) können nur qualitativ unterschieden werden, d. h. man kann  nur zwischen verschiedenen Eigenschaften unterscheiden. Natürlich könnte man auf die physikalische Ebene wechseln und Farben anhand ihrer Wellenlängen charakterisieren und versuchen sie auf diesem Wege zu quantifizieren, doch es bleibt die Frage, inwieweit diese Vorgehensweise für die Konstruktion einer statistischer Untersuchung sinnvoll ist.

Im Zusammenhang mit den Merkmalen wird häufig der Begriff "häufbar" bzw. "nicht häufbar" verwendet. "Häufbar" ist ein Merkmal, wenn die statistische Einheit mehrere Ausprägungen dieses Merkmals gleichzeitig haben kann. Das Merkmal "Beruf" ist z. B. häufbar, da man neben einer Tätigkeit als Informatiker nebenberuflich gleichzeitig noch als Portier in einem Hotel arbeiten könnte. Ein nicht häufbares Merkmal des Menschen ist z. B. sein Alter. Niemand wird von sich behaupten können, 18 und 42 Jahre alt zu sein.

Mit dem Begriff Stetigkeit ist in der deskriptiven Statistik gemeint, dass etwas überabzählbar ist, d. h. du kannst es nicht abzählen, da es immer noch weitere Werte "dazwischen" geben kann. Die Körpergröße eines Menschen ist z. B. eine stetige Größe, da man 1.85m, 1.8523m, 1.85232842m oder beliebig genau dazwischen groß sein kann. Die Genauigkeit wird nur durch unsere technischen Messmöglichkeiten beschränkt. Es liegt quasi ein Kontinuum vor und immer dann, wenn man keine lückenhaften Sprünge, sondern einen fließenden Übergang  zwischen den einzelnen Werten hat, spricht man von einer stetigen Größe. Diskret heißt ganz vereinfacht "mit Lücken". Mathematisch korrekt wäre an dieser Stelle der Begriff "abzählbar". In der Schule hast du vielleicht gelernt, dass eine Funktion stetig ist, wenn man sie ohne den Stift abzusetzen zeichnen kann. Eine diskrete Größe ist z. B. die Anzahl der Menschen auf diesem Planeten. Es kann 7 297 713 110 Menschen auf diesem Planeten geben, doch niemals z. B. 7 297 713 110.314 Menschen.

Kommentar schreiben

Kommentare: 0