Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Kapitel 2
In diesem Kapitel
Kein Mensch will sich ewig lange Zahlenkolonnen durchlesen, die womöglich noch ungeordnet angeboten werden. In diesem Kapitel geht es darum, in welchem Fall welches Diagramm geeignet ist, einen Sachverhalt übersichtlich und unverfälscht darzustellen.
Am Anfang der Datenbearbeitung steht immer die Tabelle. Nach der Erfassung der Daten werden sie typischerweise in Tabellen aufgelistet und stehen zur Weiterverwertung bereit. Und natürlich können Sie Tabellen auch dazu verwenden, Messreihen darzustellen, unabhängig davon, ob sie qualitative oder quantitative Merkmale enthalten. Dies geschieht in sogenannten Häufigkeitstabellen, mehr über Häufigkeitstabellen finden Sie in Kapitel 3.
Dazu ein Beispiel mit einem qualitativen Merkmal: Ich habe 50 Studenten befragt, wie groß ihr Interesse an Statistik ist, und ihnen 5 Antwortmöglichkeiten gegeben: »sehr groß«, »groß«, »mittel«, »gering« und »sehr gering«. Das Ergebnis können Sie in Tabelle 2.1 bestaunen.
Die Zahlen in der rechten Spalte der Tabelle geben die Anzahl der Studenten wieder, die für diese Kategorie gestimmt haben. Man nennt sie die absoluten Häufigkeiten nt. Die Summe der absoluten Häufigkeiten entspricht der Größe der Grundmenge N, also hier der Zahl 50. Es gilt also:
Interesse
Anzahl der Studenten
sehr groß
4
groß
14
mittel
21
gering
8
sehr gering
3
Tabelle 2.1: Beispiel einer Häufigkeitstabelle eines qualitativen Merkmals (Interesse)
Die verschiedenen Arten von Häufigkeiten werden noch in Kapitel 5 eine Rolle spielen. Zugegeben, ich habe diese Umfrage nicht wirklich durchgeführt. Vermutlich würde die Tabelle sonst etwas anders aussehen.
Wer kennt sie nicht? Die Torten-, Kuchen- oder Kreisdiagramme? Sie haben mehrere Bezeichnungen und ich werde mich bewusst auf keine festlegen. Mit ihnen werden meistens prozentuale Verhältnisse dargestellt. Beispiele dafür können sein:
Es ist Ihnen sicher klar, dass man diese Aufzählung beliebig fortführen könnte.
Wenn Sie damit das fiktive Umfrageergebnis (siehe Tabelle 2.1) darstellen wollen, müssen Sie die vorhandenen Zahlen, also die absoluten Häufigkeiten, erst in dazu passende Winkel umrechnen. Dies führt auf die erste, wenn auch harmlose, Formel des Buches.
Diese Formel brauchen Sie, um die Größe des Tortenstücks zu bestimmen:
ni . absolute Häufigkeiten
N . Summe der absoluten Häufigkeiten, also
ai . Winkel der i-ten absoluten Häufigkeit in Grad
Dann gilt
beziehungsweise nach ai aufgelöst:
Die Formel besagt, dass das Verhältnis zwischen einer absoluten Häufigkeit ni und der Summe der Häufigkeiten N genau dem Verhältnis zwischen dem Winkel ai und dem Vollwinkel 360° entspricht.
Mit dieser Formel ergeben sich zu den schon bekannten Häufigkeiten ni und zur Summe N = 50 die entsprechenden Winkel ai in Tabelle 2.2.
Anzahl der Studenten ni
Winkel ai
Tabelle 2.2: Häufigkeitstabelle mit zugehörigen Winkeln für ein Tortendiagramm
Jetzt, wo die Winkel bekannt sind, können Sie ohne Weiteres das Kreisdiagramm zeichnen. Sie sehen es in Abbildung 2.1.
Abbildung 2.1: Kreisdiagramm zur Umfrage aus Tabelle 2.1
Stellen Sie sich vor, ich würde mit einer zweiten Studentengruppe die gleiche Umfrage zur Beliebtheit von Statistik durchführen; diese zweite Gruppe umfasse aber N = 500 Studenten, also 10-mal so viele. Nun möchte ich diese beiden Umfragen in zwei Kreisdiagrammen darstellen. Sollte ich nun die beiden Kreise gleich groß wählen oder sollte der zweite Kreis größer sein? Und wenn größer, um wie viel größer sollte er sein?
Hier die Antwort: Ist N größer, so sollte der Kreis im zugehörigen Kreisdiagramm auch größer sein, um der größeren Grundmenge auch gerecht zu werden. Die Größe wählen Sie dabei üblicherweise so, dass die Kreisflächen zur Grundmenge proportional sind und nicht die Kreisradien.
Ist also bei der zweiten Umfrage die Grundmenge N 10-mal so groß wie bei der zweiten, so wählen Sie den Radius des ersten Kreises nicht 10-mal so groß, denn dies würde eine 100-fache Fläche erzeugen. Die Fläche eines Kreises wächst nämlich mit dem Quadrat des Radius. Darum wählen Sie den Radius -mal so groß. Hier die zugehörige Formel für die Berechnung des Verhältnisses der Radien r1 und r2 zweier Kreisdiagramme in Abhängigkeit von den Grundmengen (N1 und N2) der beiden Umfragen, Messungen oder Zählungen:
N1, N2 . Grundmengen der beiden Umfragen, Messungen oder Zählungen
r1, r2 . Radien der zugehörigen Kreisdiagramme
beziehungsweise nach r1 oder r2 aufgelöst:
Säulendiagramme (auch Balkendiagramme genannt) sind mindestens genauso verbreitet wie Kreisdiagramme. In ihnen werden die Häufigkeiten durch die entsprechenden Säulenhöhen dargestellt. Handelt es sich statt Säulen (oder Balken) um dünne Stäbe, manchmal mit einer Verdickung am oberen Ende, so spricht man auch von Stabdiagrammen.
In einem Säulen- oder Stabdiagramm sehen Sie leichter als in einem Kreisdiagramm, welche Kategorie der Spitzenreiter ist, da sich Ihr Auge leichter tut, nebeneinander stehende Höhen miteinander zu vergleichen als nebeneinander liegende Winkel in einem Kreis. Abbildung 2.2 zeigt das Äquivalent zu Abbildung 2.1. Das Kreisdiagramm in Abbildung 2.1 und das Säulendiagramm in Abbildung 2.2 beziehen sich jeweils auf das Datenmaterial der Häufigkeitstabelle 2.1. Urteilen Sie selbst, welches der Diagramme Sie für das aussagekräftigste halten!
Abbildung 2.2: Säulendiagramm zur Umfrage aus Tabelle 2.1
Bei einem stetigen Merkmal oder einem diskreten mit sehr vielen Ausprägungen ist es sinnvoll, die Merkmale in Klassen zusammenzufassen, um sie in einem Säulendiagramm darzustellen. In diesem Zusammenhang möchte ich besonders den Begriff Histogramm hervorheben, da er in vielen Darstellungen eine große Rolle spielt. Ein Histogramm ist ein besonderes Säulendiagramm, das nur bei quantitativen Merkmalen Anwendung findet und dort auch gewissen Regeln unterworfen ist, die leider immer wieder gebrochen werden, sei es aus Unkenntnis oder sei es, um eine bestimmte Aussage zu untermauern.
Hier ein Beispiel zu einem Histogramm.
Stellen Sie sich vor, Sie wollten die Körpergrößen einer Schulklasse aus 20 Schülern in einem Säulendiagramm darstellen. Die bereits sortierten Messdaten lauten in cm:
Dateiformat: ePUBKopierschutz: Adobe-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet – also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein „harter” Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.Bitte beachten Sie: Wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!
Weitere Informationen finden Sie in unserer E-Book Hilfe.