Statistik - die wichtigsten Rechnungen & Begriffe


notes Inhalte

In jedem Bereich der Mathematik wird gerechnet – so auch in der Statistik. Zunächst scheint das Rechnen hier nicht erforderlich zu sein. Schließlich dienen Schaubilder und Tabellen bereits zur Übersicht. Allerdings sind Statistiken häufig sehr umfangreich, lassen mehrere Faktoren mit einfließen, enthalten zahlreiche Merkmalsausprägungen und beispielsweise befragte Personen sind in großer Anzahl vertreten. Ein Blick auf ein Diagramm ist dann zwar sinnvoll und macht die Aufgabe greifbar. Allerdings kann der Betrachter aufgrund der Datenmenge zu Fehlinterpretationen kommen. Das Ergebnis ist eine falsche Auswertung. Daher ist es wichtig, dass du deine Tabelle mit Rechnungen untermauerst.

 

Natürlich ist die Tabelle selbst erst nach diversen Berechnungen zu erstellen. Blindlings Daten nach Einschätzung ein zu tragen, gehört nicht zur Statistik. Beschäftige dich daher mit den Berechnungen einzelner Werte. In der herkömmlichen Statistik für Schule und Ausbildung musst du nicht besonders viel rechnen. Anders sieht es im Studium aus. Hier geht es darüber hinaus auch um das Ergründen und Begründen statistischer Methoden und Erhebungen.

1. Das arithmetische Mittel

Wenn du in der Schule in einem Fach zwischen zwei Noten standest oder sehr viele Noten erhalten und dadurch den Überblick verloren hast, warst du gezwungen den Durchschnitt deiner Leistungen zu berechnen. Dazu hast du deine Noten miteinander addiert und die Summe durch die Anzahl der Noten geteilt. Ebenso verfährst du beim arithmetischen Mittel. Kurze Erklärung: Das arithmetische Mittel ist die Mitte deiner Merkmalsausprägungen. Es errechnet sich aus den gesamten Merkmalsausprägungen x (wie beispielsweise Noten) und ihrer Anzahl n.

 

X =

 

Wollen wir uns den Sachverhalt an einem Beispiel vergegenwärtigen. Es kam ein neues Spiel auf den Markt und du möchtest in der Highscore-Liste ganz oben stehen. Pro Spiel bekommst du Punkte. Dein Freund, der das Spiel ebenso mit Begeisterung spielt, hat im Durchschnitt 310 Punkte. Kannst du seinen Durchschnitt übertreffen? Um das herausfinden zu können, notierst du alle deine Punkte der letzten 10 Spiele:

 

Spiel

Punkte

1

450

2

98

3

260

4

625

5

74

6

305

7

120

8

610

9

555

10

310

 

Addiere nun alle Häufigkeiten und dividiere die entstandene Summe durch die Anzahl der Spiele (10).

 

x =

 

x = 340,7

 

Im Durchschnitt hattest du innerhalb der letzten 10 Spiele 340,7 Punkte erreicht. Damit liegt dein Freund einige Punkte unter dir.

 

Was wäre geschehen, wenn manche Punktzahlen mehrfach vorgekommen wären? In diesem Fall gehst du prinzipiell genauso vor wie bei verschiedenen Merkmalsausprägungen. Um dir die Rechnung zu vereinfachen und Additionen zu verkürzen, kannst du dann auch mit einer Multiplikation arbeiten.

 

Beispiel: Du hast mehrfach gespielt und im siebten und neunten Spiel jeweils 360 Punkte erzielt. Dann verkürzt du dir das Rechnen, indem du nicht 360 + 360 berechnest, sondern die Addition in ein Produkt verwandelst: 2 * 360.

2. Spannweite

Vögel haben unterschiedliche Spannweiten. Auch auf einen Drachen und auf Flugzeuge trifft das zu. In jedem Fall ist mit der Spannweite die Entfernung der linken von der rechten Flügelspitze gemeint. Umgewandelt auf die Statistik erhalten wir eine ähnliche Erklärung. Die Spannweite meint den Unterschied zwischen der höchsten und der niedrigsten Merkmalsausbildung. Sie wird mit dem Kleinbuchstaben w gekennzeichnet.

 

Ein Beispiel:

 

In einem Supermarkt wird gemessen wie viele Artikel die unterschiedlichen Personen kaufen. Daraus ergibt sich eine Liste (häufig auch als Urliste bezeichnet). Bei diesem Beispiel spielt es zum Erkennen der Spannweite eine tragende Rolle, um wie viele Personen es sich tatsächlich handelte. Wer was mitgenommen hat, das kannst du vernachlässigen. Wichtig ist wie viele Artikel in einem Einkaufswagen landeten.

 

Person

Anzahl der Artikel

1

3

2

7

3

4

4

8

5

19

6

18

7

1

8

26

9

34

10

5

 

Sie dir nun die Merkmalsausprägungen (Anzahl der Artikel) an. Such den kleinsten und den größten Wert heraus. In diesem Beispiel ist der höchste Wert 34 und der kleinste liegt bei 1. Du subtrahierst diese beiden Werte und erhältst die Spannweite:

 

w = 34 – 1 = 33

 

Mit der Spannweite kannst du recht wenig anfangen. Sie ist nur dann sinnvoll, wenn du eine Statistik schnell erkennen willst. Für das grobe Analysieren reicht sie aus. Meistens ist jedoch mehr gefragt. Es muss mittels verschiedener Rechnungen aufgezeigt werden wie sich die einzelnen Werte im Detail verhalten. In dem Fall sind die durchschnittliche Abweichung und die Standardabweichung wichtig. Übrigens: Maximal- und Minimalwert werden im Zusammenhang mit der Statistik auch als Extremwerte bezeichnet. Die Spannweite ist von ihnen – und nur von ihnen – abhängig. Sie verschluckt keine Daten und ist somit für genaue Berechnungen geeignet, sofern es um oberflächliche Angaben und nicht um eine ausgiebige Berechnung geht.

3. Durchschnittliche absolute Abweichung und Standardabweichung

In einem vorherigen Teil behandelten wir das arithmetische Mittel. Erinnere dich zurück: Das arithmetische Mittel berechnest du durch Addition der Merkmalsausprägungen und anschließender Division der Summe durch die Gesamtanzahl. Diese Kenntnisse benötigen wir, um die durchschnittliche absolute Abweichung berechnen zu können. Was ist die durchschnittliche absolute Abweichung? Das arithmetische Mittel steht für die Mitte der Merkmalsauspägungen. Von der durchschnittlichen absoluten Abweichung sprechen wir, wenn wir die Abweichung vom arithmetischen Mittel ausdrücken wollen. Sie stellt demnach ein Steuungsmaß dar, gibt an, wie weit die Werte im Bereich der Wertemenge gestreut vorliegen.

 

Die Formel für die durchschnittliche absolute Abweichung lautet:

 


Die Formel wirkt auf den ersten Blick kompliziert. Hier bedarf es einer Erklärung:

 

D = durchschnittliche absolute Abweichung.

In Mathematikbüchern gibt es dafür noch andere Begriffe, wie etwa die mittlere absolute Abweichung. Sie wird mit der Formel errechnet.

 

n = Gesamtanzahl (wie auch in den Beispielen zuvor.

 

Mit xi meint man eine der Merkmalsausprägungen und x steht für den Mittelwert innerhalb der Streuung.

 

Um D berechnen zu können, müssen wir zunächst das arithmetische Mittel ermitteln. Zur Verdeutlichung erneut das Beispiel zum Supermarkt und der Frage wie viele Artikel einzelne Personen kauften:

 

Person

Anzahl der Artikel

1

3

2

7

3

4

4

8

5

19

6

18

7

1

8

26

9

34

10

5

 

Das arithmetische Mittel berechnest du, indem du die gekauften Gegenstände der Personen addierst und die Summe durch die Anzahl der Einkäufer dividierst:

 

= (3 + 7 + 4 + 8 + 19 + 18 + 1 + 26 + 34 + 5) : 10 = 115 : 10 = 11,5

 

Im Mittel kaufte jeder 11,5 Artikel. Mit dem Erhalt des Durchschnitts gehen wir einen Schritt weiter und ermitteln nun die Entfernungen der einzelnen Werte vom Durchschnittswert 11,5:

 

x1 = 3

| x1 - | = | 3 – 11,5 | = 8,5

 

x2 = 7

| x 2 - | = | 7 – 11,5| = 4,5

 

x3 = 4

| x3 - | = | 4 – 11,5| = 7,5

 

x4 = 8

| x 4 - | = | 8 – 11,5| = 3,5

 

x5 = 19

| x5 - | = | 19 – 11,5| = 7,5

 

x6 = 18

| x 6 - | = | 18 – 11,5| = 6,5

 

x7 = 1

| x7 - | = | 1 – 11,5| = 10,5

 

x8 = 26

 

| x8 - | = | 26 – 11,5| = 14,5

 

x9 = 34

 

| x 9 - | = | 34 – 11,5| = 22,5

 

x10 = 5

 

| x10 - | = | 5 – 11,5| = 6,5

 

Die erhaltenen Ergebnisse sind sehr wichtig für die Berechnung der mittleren absoluten Abweichung. Erinnern wir uns dazu, dass n = 10 ist. Achtung: Du rechnest mit Beträgen. Negative Zahlen kommen in deinen Ergebnissen daher nicht vor.

 

Wir berechnen nach der Formel:

 

D (1) = * (8,5 + 4,5 + 7,5 + 3,5 + 7,5 + 6,5 + 10,5 + 14,5 + 22,5 + 6,5)

 

D(1) = * 92

 

D(1) = 18,4

 

Bei dieser Aufgabe ist 18,4 die mittlere/durchschnittliche absolute Abweichung. Interessant ist es in diesem Zusammenhang den Modus und den sogenannten Median zu ergründen.

4. Modus

Der Modus ist ein Wert innerhalb der Merkmalsausprägungen. Er entspricht er den quantitativen Werten. In vielen Büchern und im virtuellen Bereich findest du den Modus auch unter dem Begriff Modalwert. Er gibt an welches Merkmal besonders häufig vorkam. Da es hier um qualitative Merkmale geht, soll folgendes Beispiel dienen.

 

Gemessen an der Fernsehsendung haben wir 100 Leute gefragt. Sie sollten uns ihre Lieblingsschulfächer nennen. Die Passanten wählten zu 20 Prozent das Fach Mathematik, 50 Prozent liebten Sprachen, 15 Prozent nannten Sport als Schulfach, 10 Prozent entschieden sich für die Naturwissenschaften und 5 Prozent gaben Geisteswissenschaften an.

 

Die Umrechnung zeigt, dass 20 Menschen Mathe aussuchten, 50 Menschen Sprachen, 15 lieben Sport, 10 Personen favorisierten die Naturwissenschaften und 5 Leute bevorzugten die Geisteswissenschaften. Damit liegen die Sprachen innerhalb der Beliebtheitsskala ganz vorne. Dieser Wert ist im Rahmen des Vergleichs mit den anderen Fach-Möglichkeiten besonders groß. Doch egal welche Größe er hat, er schneidet besser ab als die anderen und ist an der Spitze. Ein solcher Wert wird als Modalwert bezeichnet. Die Berechnung der mittleren absoluten Abweichung erfolgt anders, wenn der Modalwert der Ausgangspunkt ist. Achtung: Manchmal begegnen dir Aufgaben mit mehreren gleichen Werten im Bereich der Merkmalsausprägung. Ein Beispiel wäre, dass bei der Fachwahl 30 Menschen Deutsch, 30 Menschen Englisch, 20 Russisch und 20 Menschen Französisch gewählt hätten. Da hier zweimal 30 vorkommt, gibt es keinen Modalwert.

5. Median

Was der Median oder auch Zentralwert ist, können wir leicht ermitteln. „Zentral“ ist mit „Zentrum“ begriffsverwandt und bedeutet damit „Mitte“. Du hast beispielsweise eine Zahlrenreihe, die aus sich folgenden natürlichen Zahlen besteht:

 

1 – 2 – 3 – 4 – 5 – 6 – 7 – 8

 

Der Zentralwert stellt die Mitte dieser Zahlenreihe dar. Dabei kommt sogleich eine Frage auf. Wo befindet sich die Mitte in einer Reihe mit gerader Anzahl von Gliedern? Ist sie hier bei 4 oder bei 5? Ganz einfach! Der Zentralwert besteht bei einer geraden Anzahl verschiedener Glieder immer aus den beiden mittleren Elementen: hier 4 und 5. Diese beiden Werte addierst du und dividierst sie durch ihre Anzahl: (4 + 5) : 2 = 4,5

 

Z = 4,5

 

Bei einer Reihe mit ungerader Anzahl ist es leichter. Hier schaust du tatsächlich wo die Mitte ist und musst nichts weiter berechnen. Schau dir dazu die folgende Reihe an:

 

2 – 3 – 4 – 5 – 6

 

Das Zentrum der Reihe ist die Zahl 4, denn links und rechts neben ihr stehen gleich viele Glieder.

 

Z = 4

6. Die Standardabweichung und Varianz

Du möchtest wissen wie weit die einzelnen Werte der Merkmalsausprägungen im Gesamtbild verteilt sind. Dann benutzt du die Standardabweichung. Auch sie lässt sich einfach berechnen. Zunächst solltest du aus einer Urliste eine Tabelle anfertigen.

 

Beispiel: 10 Personen in einer Bäckerei wurden nach ihrer Leistung beurteilt. Dabei ging es um die Anzahl an Broten, die sie binnen einer Stunde im Ofen backen konnten. In der nachstehenden Tabelle siehst du die Anzahl an gebackenen Broten pro Person.

 

25

28

25

25

28

12

39

12

28

10

 

Daraus entwickeln wir eine Häufigkeitstabelle. Auf der linken Seite stehen die Merkmalsausprägungen selbst. Auf der rechten Seite befindet sich die Anzahl zu jedem Merkmal (wie oft kam es vor):

 

 

xi

fi

10

1

12

2

25

3

28

3

39

1

 

n=10

 

Wir berechnen aschließend das arithmetische Mittel und erhalten:

 

= (10 + (2 * 12) + (3 * 25) + (3 * 28) + (1 * 39)) : 10 = 232 : 10 = 23,2 Brote

 

Wir gehen nun zwei Schritte weiter und komplettieren die Rechnung:

 

xi

fi

(Xi -

(Xi -)² *fi

10

1

23,2

174,24

174,24

12

2

23,2

125,44

250,88

25

3

23,2

3,24

9,72

28

3

23,2

23,04

69,12

39

1

23,2

249,64

249,64

 

n = 10

 

 

Σ = 753,6

 

 

Die Standardabweichung (s) berechnen wir mit nachstehender Formel:

 

 

Was bedeutet dieses Ergebnis? Die Bäcker backen im Durchschnitt 23,2 +/- 8,68 Brote in einer Stunde.

 

Neben diesen Berechnungen gibt es Klasseneinteilungen. Sie sind immer dann wichtig, wenn es um bestimmte Differenzen geht, die zu einer Merkmalsausprägung gehören. Bspw.: Auf einem Marktplatz befinden sich 50 Menschen, die zwischen 5 und 15 Jahre alt sind. Die Berechnung ähnelt sehr der Berechnung mit einfachen Tabellen. Wichtig ist nur, dass der Mittelpunkt der Klassen gefunden wird, denn damit ist zu rechnen und nicht mit den Klassen selbst.

 

Die Varianz ist ebenfalls ein Streuungsparameter. Sie steht mit der Standardabweichung in Verbindung, ist jedoch von geringerer Bedeutung als diese. Sie orientiert sich am Mittelwert, den wir zu Anfang als das arithmetische Mittel bezeichnet haben. Ihre Berechnung gibt am Ende die mittlere quadratische Abweichung vom arithmetischen Mittel an. Die Quadrierung der Abstände wirkt sich ungünstig auf die Aussagekraft der ermittelten Streungsmaße aus. Außerdem werden manche Ergebnisse scheinbar völlig vernachlässigt, weswegen die Varianz eher selten gebraucht wird und nur in bestimmten Bereichen bedeutsam ist.

7. Mengen

Mengen begegnen uns bereits im Alltag, wenn wir eine Gruppe von Menschen sehen. Eine Menge Bäume finden wir in der Natur. Die Mengen lassen sich unterschiedlich darstellen und können einen Bezug zueinander haben. Innerhalb von Statistik und Wahrscheinlichkeiten kommen sie daher ebenfalls vor:

 

Die Teilmenge steht an erster Stelle. Wenn wir zwei Mengen vor uns haben, deren Glieder zum Teil gleich sind, so ist die eine Menge Teilmenge der anderen. Bezüglich der Statistik sprechen wir nicht von Mengen. Hier geht es um Ereignisse.

 

Das Gegenereignis: Bislang haben wir uns vorwiegend mit den günstigen Ausgängen beschäftigt. Trotzdem gibt es auch eine andere Seite, die Gegenereignisse. Wenn beim Münzwurf Zahl das Ereignis darstellt, so ist nicht Zahl (in dem Fall Kopf) das Gegenereignis. Bei umfangreicheren Aufgaben wirst du häufiger vom Gegenereignis lesen und es in Formeln finden (bspw. In der Bernoulli-Kette).

 

Findet sich in zwei Ereignissen ein gemeinsames Elementarereignis oder mehr, so sind sie vereinbar. Im Umkehrschluss bedeutet das, dass unvereinbare Ereignisse kein gemeinsames Elementarereignis besitzen.

 

Die dargestellten Sachverhalte kennst du sicher noch aus der Schulzeit. Zur Wiederholung der Mengenschreibweise:

 

 

Das einem U ähnelnde Zeichen steht in der Mathematik für oder. Mit oder ist gemeint: Entweder Ereignis A oder Ereignis B tritt ein. Viele kommen an dieser Stelle durcheinander. Oder meint nämlich nicht, dass auch beide Ereignisse eintreffen können. Es handelt sich hier explizit um ein Oder: Bspw: Du nimmst entweder den Bus oder das Auto. Beides nimmst du nicht. Auch: Du kaufst dir einen Fernseher oder ein Mountainbike – nicht beides.

 

Anders sieht es bei der Und-Verknüpfung aus:

 

 

Hier ist gemeint, dass Ereignis A und B eintreten. Sie müssen zwingend gleichzeitig eintreten, sonst gilt die Mengenschreibweise nicht.

 

Was ist, wenn Ereignisse verneint werden sollen? In dem Fall sind die Zeichen zu ergänzen:

 

 

„A und nicht B“ ODER „B und nicht A“.

 

Wenn du diese Schreibweise vor dir hast, weißt du, dass genau eines der beiden Ereignisse A oder B eintritt.

 

Anders sieht es hier aus:

 

 

Weder A noch B treffen ein.

 

Manchmal fällt das Visualisieren jener Sachverhalte schwer. Daher ist es wichtig, dass du grafische Beispiele zu diesem Thema anschaust. Die Mengenschreibweise ist nämlich nicht nur im Bereich Statistik/Wahrscheinlichkeitsberechnung notwendig. Wenn du über das Wissen zu diesem Thema verfügst, fällt dir auch das Verstehen von Algorithmen in der Informatik leichter.

 

 

Das ist das Ereignis A. Nun wollen wir uns ansehen, wie das Gegenereignis (nicht A) aussieht:

 

 

Das Gegenereignis von A ist nicht A. In unserem Venn-Diagramm stellt es den schwarzen Bereich um A dar.

 

 

Treten die Ereignisse A und B ein, erhalten wir folgendes Schaubild – bestehend aus den beiden Ereignissen und ihrer Vereinigung.

 

 

„A und B“ umfasst den kompletten Bereich – so auch die Schnittmenge der Ereignisse,

 

Bei „A oder B“ geht es lediglich um die Schnittmenge. Die restlichen Teile des Schaubilds bleiben unberücksichtigt.

 

 

„Nicht A und nicht B“ meint hier die Ereignisse, welche sich in der schwarzen Fläche befinden.

 

 

„A und nicht B“ oder „B und nicht A“. Die Grafik steht für den Teil, der nicht die Schnittmenge der Ereignisse von A und B darstellt.

 

Ein Beispiel verdeutlicht die Mengen: Sie würfeln und erhalten die Ereignisse A und B. A und B stehen für:

A =

 

B =

 

=

 

Wie sieht es bei den Negationen aus?

 

 

Die Menge zu nicht A und nicht B macht hier keinen Sinn. Folgendes Beispiel mit anderen Ereignissen A und B. A = , B =

= 3
 
= 5,7 und 1,2
 




Kombination:

Tipp: Du willst die Buchhaltung schneller lernen? Jetzt hier klicken!
whatshot Beliebteste Artikel