grafischen Darstellungen

Download Report

Transcript grafischen Darstellungen

Die Darstellung der Daten
DIE GRAFISCHE DARSTELLUNG DER DATEN
Übersetzung: / Tradotto da:
Oberschule; Thema: Daten - Grafiken (30.09.13); Paket: S2.C.2
INHALT
1. Einleitung
2. Grafische Darstellung von qualitativen
Merkmalen
3. Grafische Darstellung von quantitativen
Merkmalen
4. Grafische Darstellung von doppelten
statistischen Verteilungen
5. Die Auswahl der grafischen Darstellung
1. Einleitung
a) Ziel
b) Möglichkeiten der grafischen Darstellung
c) Verschiedene Darstellungsmöglichkeiten
aufgrund des Erfassungsniveaus der
Merkmale
d) Die Komponenten einer Grafik
e) Die Relevanz der Daten
a) Ziel
Die grafischen Darstellungen zielen darauf ab, anhand von:
- Bildern,
- Linien oder Segmenten,
- Flächen oder Bereichen,
- Körpern,
- konventionellen Symbolen
- usw.
eine Häufigkeits- oder Intensitätsverteilung der Ausprägungen
eines oder mehrerer Merkmale abzubilden.
b) Möglichkeiten der grafischen Darstellung
Unmittelbare Darstellung der Entwicklung des Phänomens
und der Struktur der Verteilung, die eine aussagekräftige und
umfassende Beschreibung der Daten ermöglicht;
- Zusammenfassung und folglich die Möglichkeit, auf kleinem
Raum mehrere Verteilungen zu vergleichen (Kurven, mit
Datenpunkten usw.);
- investigative Möglichkeiten:
• „anormale“ Fälle werden hervorgehoben (besondere
Spitzen in der Grafik), die auf Datenfehler oder tatsächlich
unnormale Fälle zurückgehen und weiter vertieft werden
müssen,
• heben die Wechselbeziehungen zwischen Merkmalen
hervor, zwischen denen eine logische Verbindung besteht,
• erlauben es, Grundentwicklungen (Trends) zu ermitteln, die
mit mathematischen Funktionen interpolierbar sind (z.B.
Normalkurve, Gerade usw.).
c) Verschiedene Darstellungsmöglichkeiten aufgrund
des Erfassungsniveaus der Merkmale
Für jede einfache, doppelte oder mehrfache Verteilung gibt es
eine passende grafische Darstellungsmöglichkeit und ein und
dieselbe Verteilung kann mit mehreren Arten von Grafiken
dargestellt werden.
Im Allgemeinen bestehen Einschränkungen zwischen der Art der
grafischen Darstellung und dem Erfassungsniveau der
darzustellenden Merkmale, die zu beachten sind, damit die
Abbildung korrekt ist bzw. eine Darstellung bietet, die möglichst
wahrheitsgetreu das Phänomen und seine statistische Verteilung
wiedergibt.
Damit eine grafische Darstellung nützlich und aussagekräftig ist,
muss sie alle Informationen, die zum Verständnis der
abgebildeten Daten nötig sind, unmittelbar und klar enthalten.
d) Die Komponenten einer Grafik
•
Die Daten: werden als Säulen, Linien, Flächen oder Punkte
dargestellt.
•
Unterstützende
Komponenten:
Verständnis der Daten:
ermöglichen
das
− Grafiktitel
− Achsentitel
− Achsenbeschriftungen
− Maßeinheit der Daten
− Raster
− Legende
− Datenbeschriftungen
− Anmerkungen
− Datenquelle.
•
Dekorative
zusammen.
Elemente:
hängen
nicht
mit
den
Daten
Unterstützende Komponenten 1/2
•
Der Titel der Grafik muss kurz und bündig sein.
Es gibt zwei Arten:
• Der
informative
Titel
enthält
die
nötigen
Informationen zum Verständnis der Daten. Er
beantwortet die drei Fragen:
„Was?“, „Wo?“ und
„Wann?“.
z.B. Arbeitslosenquote in Italien, Jahre 2009-2012
• Der beschreibende Titel fasst den in der Grafik
dargestellten Trend oder das Muster in wenigen Worten
zusammen.
z.B. Zunahme der Arbeitslosigkeit in Italien von 2009
bis 2012.
•
Die
Achsentitel
benennen
die
qualitativen
oder
quantitativen Variablen, die von den Achsen dargestellt
werden. Wenn sie aus dem Grafiktitel ersichtlich sind, müssen
sie nicht wiederholt werden.
•
Die Achsenbeschriftungen beschreiben die von der Grafik
dargestellten Ausprägungen oder Werte.
Unterstütztende Komponenten 2/2
•
Maßeinheit der Daten (z.B. „in Tausend“ , „%“ etc.).
Wenn die Maßeinheit offensichtlich ist, muss
angegeben werden (z.B. „Jahre“ bei Zeitreihen).
sie
nicht
•
Das Gitter kann hinzugefügt werden, um die Lektüre und
den Vergleich der Daten zu erleichtern.
•
Die Legende identifiziert Symbole, Schraffierungen oder
Farben, die für die Darstellung der Daten verwendet wurden.
•
Die Datenbeschriftungen, die oberhalb oder neben den
Säulen, Flächen oder Linien angezeigt werden, erleichtern die
Lektüre der Grafik.
•
Die Anmerkungen können hinzugefügt werden, um
Definitionen oder Informationen zur Methodologie zu liefern.
•
Die Quelle, aus welcher die Daten stammen.
e) Die Relevanz der Daten 1/2
Um die Aussagekraft einer Grafik zu maximieren, muss sich
die Aufmerksamkeit auf die Daten konzentrieren.
Die unterstütztenden Komponenten:
•
sind deshalb nur wenn nötig anzuzeigen: Achsentitel,
Legende und Beschriftungen dienen in einigen Fällen zum
Verständnis der Grafik, können aber in anderen Fällen absolut
unnötig sein.
•
müssen unauffälliger sein: für die Achsen und das Gitter
sind vorzugsweise dünnere Linien zu verwenden und für die
Daten hingegen dickere.
Die dekorativen Effekte dürfen nicht die Aufmerksamkeit
des Lesers von den Daten ablenken.
e) Die Relevanz der Daten 2/2
Eine klare Grafik
Eine unübersichtliche Grafik
30
30
25
25
20
20
15
Reihe1
10
15
10
10
10
0
A
B
C
In der linken Grafik werden alle
Komponenten
sehr
hervorgehoben.
Das ergibt ein unübersichtliches
Bild, das schwer lesbar ist,
obwohl nur 3 Werte vorhanden
sind.
0
A
B
C
Die
rechte
Grafik
ist
einfacher zu lesen.
Da nur wenige unterstützende Komponenten verwendet
werden, kann sich die Aufmerksamkeit auf die Daten
konzentrieren.
2. Grafische Darstellung von qualitativen
Merkmalen
a) Balkendiagramme
b) Kreis-/Tortendiagramme
c) Diagramme in Polarkoordinatensystemen
d) Kartogramme, thematische Karten
a) Balkendiagramme
(1/2)
Die Balkendiagramme (oder Orthogramme) werden verwendet, um
nominale oder ordinale Reihen grafisch darzustellen. Es gibt zwei
verschiedene Arten:
- Säulendiagramme, wenn es sich um eine Reihe von Säulen, vertikalen
oder rechteckigen Elementen (auf gleicher oder willkürlicher Basis)
handelt, die gleich weit voneinander entfernt sind und von denen es so
viele wie Merkmale gibt. Die Höhe entspricht der (absoluten oder
relativen) Häufigkeit oder Intensität der darzustellenden Ausprägung oder
ist proportional zu dieser;
- Balkendiagramme, wenn es sich um so viele Balken (horizontale,
rechteckige Elemente) handelt, wie Merkmalsausprägungen vorhanden
sind, die übereinander dargestellt werden und gleich weit voneinander
entfernt sind. Die Länge entspricht der (absoluten oder relativen)
Häufigkeit oder Intensität der darzustellenden Ausprägung oder ist
proportional zu dieser.
Die Balkendiagramme zeichnen sich dadurch aus, dass sie nur eine Achse
haben (vertikal bei Säulen, horizontal bei Balken) mit Stricheinteilung der
Maßeinheit, die für die Darstellung der Häufigkeiten oder Intensitäten
gewählt wurde. Auf der anderen Achse sind hingegen die (qualitativen)
Ausprägungen abgetragen, die standardgemäß gleich weit voneinander
entfernt sind.
a) Balkendiagramme
Säulendiagramm
(2/2)
Balkendiagramm
Wenn die grafische Darstellung eine nominale Reihe abbildet, ist die
Reihenfolge der Ausprägungen willkürlich. Wenn es sich hingegen
um eine ordinale Reihe handelt (z.B. Studientitel), werden die
Ausprägungen gemäß ihrer natürlichen Reihenfolge angeordnet.
b) Kreis-/Tortendiagramme
(1/2)
Die Kreisdiagramme werden wegen ihrer Form so genannt und
sind allgemein als „Tortendiagramme“ bekannt.
Sie eignen sich besonders gut für nominale oder ordinale
Reihen.
Sie heben die relative Bedeutung der einzelnen Ausprägungen am
Gesamten hervor.
Es gibt verschiedene Arten, vor allem:
- mit variablen Stücken oder Sektoren, mit Winkeln im
Zentrum, die der absoluten (oder relativen) Häufigkeit der
einzelnen Ausprägung entsprechen, und fixem Radius;
- mit festen Stücken oder Sektoren, mit gleichen Winkeln im
Zentrum und variablem Radius, der den absoluten (oder relativen)
Häufigkeiten der einzelnen Ausprägungen entspricht.
b) Kreis-/Tortendiagramme
In dieser Abbildung ist sowohl
der Ausgangspunkt auf der
Kreisfläche als auch die
Reihenfolge der Modalitäten
(Stücke) willkürlich.
(2/2)
Grafische Darstellung, die besonders für geordnete qualitative Merkmale geeignet ist (z.B. Rangordnungen), bei denen die Reihenfolge
von vornherein von den absoluten
Häufigkeiten vorgegeben ist.
c) Diagramme in Polarkoordinatensystemen
Damit werden zyklische Reihen dargestellt.
Zyklische Reihen sind Verteilungen von qualitativen Variablen, die
eine natürliche Reihenfolge haben, aber keine erste und letzte
Ausprägung.
Beispiel.
Die
Geburten,
Eheschließungen,
Verkäufe
von
bestimmten Produkten, astronomische oder Wetterphänomene
usw. nach Monaten des Jahres, Tagen der Woche usw.
Wenn das zyklische Merkmal
als stetig angesehen werden
kann (bzw. wenn es im Laufe
der Zeit kontinuierliche Veränderungen erfährt), können die
Extremwerte
der
Vektoren
verbunden werden, um die
Entwicklung des Phänomens
zu unterstreichen.
d) Kartogramme, thematische Karten
Die Kartogramme sind nützliche
Grafiken bei der Darstellung von
räumlichen Reihen.
Zur Erstellung eines Kartogramms
benötigt man eine geografische
oder topografische Landkarte, auf
welcher die verschiedenen Zonen,
Regionen, (geografischen,
politischen, administrativen)
Gebiete eingezeichnet sind, für
welche die Intensität oder
Häufigkeit eines oder mehrerer
Merkmale untersucht wird (z.B.
Geburten, Gestorbene, Pro-KopfEinkommen nach Region, Provinz,
Gemeinde).
(1/2)
d) Kartogramme, thematische Karten
Die thematischen Karten erlauben es,
wenn auch nur sehr empirisch und annähernd, die räumliche Autokorrelation zu
berücksichtigen. Darunter versteht man die
Möglichkeit, dass die Ausprägungen eines
Phänomens, das ein bestimmtes Gebiet
betrifft, von der räumlichen Nähe zwischen
den Orten, in denen das Phänomen
beobachtet wurde, beeinflusst wird.
(2/2)
3. Grafische Darstellung von
quantitativen Merkmalen
a) Histogramme
b) Kartesische Diagramme mit Segmenten
c) Häufigkeitspolygon und –kurven für stetige Variablen
d) Informationstechnische Darstellungen:
- Stamm-Blatt-Diagramm (stem-and-leaf-plot)
- Kastengrafik (boxplot)
- Chernoff-Gesichter
- Ideogramme oder Piktogramme
a) Histogramme
(1/2)
Die
Histogramme
werden
dazu
verwendet,
um
Häufigkeitsverteilungen von quantitativen Merkmalen grafisch
darzustellen, deren Ausprägungen aus Wertklassen bestehen.
Zu diesem Zweck werden zwei Fälle unterschieden:
- Die Wertgrößenklassen sind gleich breit. In diesem Fall
haben wir viele angrenzende Rechtecke. Jedes davon hat eine
Basis, die der Breite der Klasse entspricht, und eine Höhe, die der
(absoluten oder relativen) Häufigkeit entspricht bzw. proportional
ist zum Gesamten der Einheiten der Klasse;
Die Grundannahme, auf die
sich die Darstellung in Histogrammen stützt, ist, dass
die in jeder Wertgrößenklasse klassifizierten Einheiten innerhalb der Klasse
gleichverteilt sind.
a) Histogramme
(2/2)
Um die Entwicklung und die Form der Verteilung klarer
aufzuzeigen, können die zentralen Punkte der oberen Seite der
Rechtecke mit Linien verbunden werden. So erhält man eine
unterbrochene Linie, die Häufigkeitspolygon genannt wird. Sie
muss geschlossen werden, indem sie zur Abszisse außerhalb der
beiden äußersten Klassen verlängert wird, sodass die Fläche
innerhalb des Häufigkeitspolygons jener des Histogramms
entspricht.
- Die Wertgrößenklassen sind unterschiedlich breit. In
diesem Fall erhalten wir eine Reihe von Rechtecken mit
unterschiedlich breiter Basis, die der Breite der Klassen und der zu
berechnenden Höhe entsprechen, sodass die Häufigkeiten
proportional zu den Flächen der jeweiligen Rechtecke sind.
Auf der Ordinate werden die
so genannten Häufigkeitsdichten abgetragen, die sich
aus dem Verhältnis zwischen
(absoluter
oder
relativer)
Häufigkeit jeder Klasse und
der jeweiligen Breite ergeben.
b) Kartesische Segmentdiagramme
(1/2)
Sie werden verwendet, um quantitative diskrete Merkmale
darzustellen, die nicht in Klassen eingeteilt sind. Sie können als
vertikale Segmente abgebildet werden.
Beispiel. Anzahl der Haushaltsmitglieder, Anzahl der Zimmer
einer Wohnung, Anzahl der Arbeitsstätten der Unternehmen usw.
Sie werden wie die normalen kartesischen Diagramme mit zwei
vertikalen Achsen erstellt: mit der Abszisse (x) und der Ordinate
(y), die ihren gemeinsamen Ursprung bei Null haben. Jedes
geordnete Wertepaar (xi,yi) definiert einen Punkt im Plan und die
Gesamtheit aller Paare (xi = i-te quantitative Ausprägung, yi = ite Häufigkeit der Ausprägung) definiert die Summe der Punkte im
Plan, welche die grafische Darstellung der berücksichtigten
Verteilung bilden.
Um diese Punkte sichtbarer zu machen, werden vertikale
Segmente gezogen, welche die Abszisse (xi) mit dem
entsprechenden Punkt des Plans auf der Ordinate (yi) verbinden.
b) Kartesische Segmentdiagramme
(2/2)
Es ist darauf zu achten, dass es in diesem Fall falsch ist, ein
Häufigkeitspolygon durch Verbinden der Punkte zu erstellen, da
es sich um ein diskretes Merkmal handelt und es deshalb,
aufgrund seiner Natur, nicht die Werte annimmt, die zwischen
den quantitativen Ausprägungen angegeben sind. Eine
Häufigkeitslinie, welche die Ausprägungen untereinander
verbindet, würde den Ausprägungen selbst auch Zwischenwerte
zuweisen.
c) Häufigkeitspolygon und –kurven für stetige
Variablen
(1/4)
Die orthogonalen kartesischen Diagramme werden auch
verwendet, um stetige quantitative Merkmale grafisch darzustellen
(wie z.B. Alter, Preise) oder, im Falle von Zeitreihen, jene
Merkmale, von denen man annimmt, dass sie sich im Zeitverlauf
stetig verändern.
Die Erstellung dieser Diagramme entspricht vollkommen jener zur
Erstellung von Diagrammen mit Stäben oder Segmenten, außer
dass in diesem Fall die Punkte (xi,yi) im kartesischen
Koordinatensystem, welche die Verteilung darstellen, mit einer
Linie verbunden werden, die Häufigkeitspolygon genannt wird.
c) Häufigkeitspolygon und –kurven für stetige
Variablen
(2/4)
Bei zunehmender Zahl der erhobenen Einheiten nähert sich das
Häufigkeitspolygon immer mehr an eine stetige Linie an, die
Häufigkeitskurve genannt wird. Diese kann manchmal auch
durch mathematische Funktionen ausgedrückt werden.
c) Häufigkeitspolygon und –kurven für stetige
Variablen
(3/4)
Probleme mit dem Maßstab: Diese Grafiken zeigen dieselbe
Verteilung, aber die Entwicklung der Zeitreihe wird unterschiedlich
wahrgenommen.
Quelle: UNECE, Making Data Meaningful Part 2: A guide to presenting statistics,United nations, Geneva 2009.
Die linke Grafik zeigt
einen stabilen Trend für
etwa 10 Jahre, gefolgt
von einem mäßigen
Wachstum.
Reduziert man den Maßstab der
Ordinatenachse (rechte Grafik),
zeigen sich die Schwankungen
in den ersten 10 Jahren deutlicher und der Anstieg der letzten
Jahre scheint größer zu sein.
c) Häufigkeitspolygon und –kurven für stetige
Variablen
(4/4)
Probleme mit dem Maßstab: Wenn die Ordinatenachse nicht
bei Null beginnt, sollte dies hervorgehoben werden, um die
Aufmerksamkeit des Lesers darauf zu lenken.
d) Informationstechnische Darstellungen
(1/5)
Es gibt vier Haupttypologien:
- Stamm-Blatt-Diagramm (stem-and-leaf-plot).
Es werden die Maturanoten von 10 Schülern berücksichtigt:
65 74 79 83 83 86 88 92 97 99
Im ersten Schritt werden die Zehnerstellen von den Einerstellen
wie folgt getrennt:
6|5
Im zweiten Schritt werden die Stämme
7|4
zusammengefasst,
indem
die
Blätter
7|9
nebeneinander hingeschrieben werden:
8|3
8|3
8|6
8|8
9|2
9|7
9|9
6|5
7|49
8|3368
9|279
Bei der Stamm-Blatt-Darstellung werden die ersten zwei
Ziffern des Intelligenzquotienten
als „Stämme“ und die dritte
Stelle als „Blatt“ betrachtet:
d) Informationstechnische Darstellungen
(2/5)
Diese Art der grafischen Darstellung hebt sowohl sofort hervor, bei
welchen Daten die Zahlen 6, 7, 8, 9 an erster Stelle stehen, als
auch ihre Anzahl.
Auf diese Weise können mehrere quantitative Ausprägungen
angezeigt werden, die sich untereinander z.B. in der Einerstelle
unterscheiden.
Die Blätter können auch ansteigend angeordnet werden, womit
man Folgendes erhält:
Aus dieser Tabelle ist ersichtlich, dass nur ein Schüler eine
Maturanote von 65 Punken hat, drei eine über 90.
d) Informationstechnische Darstellungen
(3/5)
- Kastengrafik (boxplot), die es ermöglicht, die Hauptmerkmale
einer einfachen statistischen Verteilung anzuordnen.
Im Beispiel der folgenden Kastengrafik:
sieht man ein Rechteck, bei dem:
a) der untere und der obere Rand das 1. Quartil (Q1) bzw. das 3.
Quartil (Q3) der berücksichtigten Verteilung angeben
b) die unterbrochene Linie innerhalb des Rechtecks den Median
(Q2=2. Quartil) angibt
c) das Symbol „+“ den arithmetischen Durchschnitt darstellt
d) die unterbrochene vertikale Linie (whiskers) die Ausdehnung der
Verteilung von Q1 und nach Q3 anzeigt.
d) Informationstechnische Darstellungen
(4/5)
- Chernoff-Gesichter, eine besondere grafische Darstellung, die
1973 eingeführt wurde und nur über entsprechende Computer
und Software ausführbar ist, bei denen die Züge eines Gesichts
(Augen, Nase, Mund) verwendet werden, um die verschiedenen
Komponenten einer Information darzustellen;
Diese Darstellungen eignen sich sowohl für einfache als auch für
multiple statistische Verteilungen.
Eine Einschränkung dieser originellen und aussagekräftigen
Darstellungen ist, dass es nicht immer sofort klar ist, welche
Grafikelemente die Daten darstellen. Die Gesichtsform und der
Gesichtsausdruck können sich aus der Kombination der Werte
von mehreren Variablen ergeben und die Information, die sich
daraus schließen lässt, ist eher qualitativ (Ähnlichkeiten,
Unterschiede) als quantitativ.
d) Informationstechnische Darstellungen
(5/5)
- Ideogramme oder Piktogramme, grafische Darstellungen,
die sehr populärwissenschaftlich sind, da sie Figuren, Symbole
verwenden, die normalerweise alle untereinander sehr ähnlich
sind und die unmittelbar dem dargestellten Merkmal ähneln
(Menschen, Gegenstände usw.). Sie haben eine unterschiedliche Größe oder Anzahl, um die Häufigkeit oder Intensität des dargestellten Merkmals anzugeben.
Jedes (qualitative oder quantitative) statistische Merkmal kann
mit dieser Grafikart dargestellt werden.
Es ist anzumerken, dass diese Darstellungen missverständlich
sein können, da es nicht immer einfach ist, sie zu lesen. Sie
haben einen geringen wissenschaftlichen Nutzen.
4. Grafische Darstellungen von doppelten
statistischen Verteilungen
a) Punktwolke
b) Raumbild
c) Balkendiagramme und Kartodiagramme
d) Alterspyramide
a) Punktwolke oder Streudiagramm
(1/2)
Diese grafische Darstellung wird sehr häufig für doppelte
statistische Verteilungen mit zwei quantitativen Merkmalen
genutzt, da damit die bestehende Korrelation zwischen den
Variablen angezeigt werden kann.
Das Streudiagramm ist ein kartesisches Diagramm, bei dem auf
der Abszisse (x) und auf der Ordinate (y) die Werte der beiden
Variablen (X,Y) angegeben sind und bei dem jeder Punkt P des
Systems eine Erhebungseinheit darstellt, welche als Wert der zwei
Variablen die Koordinaten (xi,yi) hat.
Die
Punktwolke
zeigt
die
Streuung
zwischen
den
Erhebungseinheiten bzw. deren Nähe oder Entfernung, wobei sie
jeweils ihre Ähnlichkeit/ihren Unterschied im Vergleich zu zwei
gleichzeitig betrachteten Merkmalen angeben.
Wichtig ist dabei die Form, die von der Punktwolke angenommen
wird. Sie kann Hinweise über die Art der bestehenden Beziehung
zwischen zwei Variablen geben.
a) Punktwolke oder Streudiagramm
(2/2)
Beispiel:
- wenn die Punktwolke eine Kugelform annimmt, besteht zwischen
den zwei Variablen keine lineare Beziehung
- wenn sich die Punkt jedoch tendenziell entlang einer Geraden
verteilen, besteht zwischen den zwei Variablen eine lineare
Beziehung (Y = B0+B1X)
b) Raumbild
Auch
Raumbilder
sind
besonders
gut
Kontingenztabellen grafisch darzustellen.
(1/2)
geeignet,
um
Ein Raumbild besteht aus einem orthogonalen kartesischen
Diagramm in einem dreidimensionalen Raum, R³, in dem auf den
drei Achsen (x, y und z) Folgendes abgetragen ist: die Werte der
Variablen X, die Werte der Variablen Y und die kombinierte
Häufigkeit Z = f(x,y) der beiden Variablen.
b) Raumbild
(2/2)
Bei der Erstellung des Raumbilds muss, je nachdem, ob beide
Variablen diskret oder eine diskret und eine stetig oder beide stetig
sind, Folgendes unterschieden werden:
- Raumbild mit Säulen: wird bei zwei diskreten Variablen oder
bei Variablen in Wertklassen verwendet, wobei der zentrale Wert
jeder Klasse herangezogen wird;
- Raumbild mit Kurven: wird verwendet, wenn beide Variablen
stetig sind oder eine diskret und die andere stetig ist.
c) Balkendiagramme und Kartogramme
(1/2)
Im Fall von doppelten statistischen Verteilungen mit zwei
qualitativen Variablen oder einer quantitativen und einer
qualitativen Variablen (Kontingenztabellen) gibt es verschiedene
Darstellungsmöglichkeiten, je nach Art der beiden berücksichtigten
Merkmale und der Zwecke der grafischen Darstellung.
Zu den häufigsten Darstellungen gehört jene, die bereits bei den
einfachen statistischen qualitativen Variablen gezeigt wurde, das
Balkendiagramm, auch wenn es in diesem Fall dreidimensional ist
und zwei Merkmale und die kombinierte Häufigkeit deren
Ausprägungen abbildet: Diagramm mit vertikalen Säulen mit
Spaltensummen und Diagramm mit Stapelsäulen mit
Zeilensummen.
c) Balkendiagramme und Kartogramme
(2/2)
Die Kartogramme sind nichts anderes als Kartogramme, auf
denen anstelle der einfachen territorialen Reihen territoriale
Reihen mit zwei oder mehr Merkmalen dargestellt werden.
Beispiel: Die Lebendgeborenen und die Gestorbenen je 1.000
Einwohner in den 20 Regionen Italiens im Jahr 1986.
d) Alterspyramide
(1/2)
Das ist eine besondere und aussagekräftige grafische Darstellung
der Struktur eines Kollektivs oder einer Bevölkerung nach Alter und
Geschlecht.
Es besteht aus zwei gedrehten Histogrammen, die den beiden
Geschlechtern entsprechen, auf deren gemeinsamer vertikaler Achse
die Ausprägungen des Merkmals Alter (in Klassen) angegeben sind
und auf deren horizontalen Achsen die (absoluten oder relativen)
Häufigkeiten der Männer und Frauen entsprechend den einzelnen
Altersklassen abgetragen sind.
d) Alterspyramide
(2/2)
Aus der Form der Pyramide lassen sich Hinweise sowohl zu
Faktoren, welche die aktuelle Struktur nach Alter und Geschlecht
beeinflussen, als auch zur vergangenen Entwicklung als auch
Voraussagen für einen Zeitraum bis zu einem Jahrhundert machen.
Diese Hinweise können durch Analysen der folgenden Elemente
gemacht werden:
- Die Basis, die Angaben zur Geburtenentwicklung liefert. Wenn
sie sehr breit ist, ist die Geburtenzahl stark ansteigen; wenn sie
ausreichend breit ist, ist die Geburtenzahl konstant oder leicht
rückläufig; wenn sie schmal ist, sinkt die Geburtenzahl.
- Die Neigung der Seiten, die Hinweise über das allgemeine
Niveau des Ausscheidens durch Tod gibt. Wenn die Seiten sehr
schräg sind, ist die Sterblichkeit hoch; wenn die Seiten nur wenig
schräg sind, ist die Sterblichkeit gering.
- Das Vorhandensein von Schwellungen oder Verengungen in
bestimmten Altersklassen, das Hinweise auf den Einfluss
besonderer Störfaktoren gibt (z.B. erster Weltkrieg).
Die Auswahl der grafischen Darstellung 1/2
Diese 2 Grafiken zeigen dieselbe Verteilung.
Welche ist klarer?
Quelle: UNECE, Making Data Meaningful Part 2: A guide to presenting statistics,United nations, Geneva 2009.
Welcher Bereich des Kreisdiagramms ist am größten?
Die Auswahl der grafischen Darstellung 1/2
Den meisten Menschen fällt es leichter, Teile statt Winkeln zu
vergleichen.
Im Kreisdiagramm scheinen die Bereiche 1 und 4 identisch, während
man im Säulendiagramm den Unterschied deutlich sieht.
Quelle: UNECE, Making Data Meaningful Part 2: A guide to presenting statistics,United nations, Geneva 2009.
Es ist empfehlenswert, dieselbe Verteilung in mehreren Grafiken
darzustellen umd jene zu ermitteln, welche die Aussage, die man
kommunzieren möchte, am besten abbildet.
Bibliografie
• Leti G., Statistica Descrittiva, Il Mulino, Bologna, 1983
• UNECE, Making Data Meaningful Part 2: A guide to
presenting statistics,United nations, Geneva 2009.
• http://www3.istat.it/servizi/studenti/valoredati
…und jetzt…
Gute Arbeit!
Rete per la promozione della
cultura statistica
Per ulteriori moduli didattici relativi alle scuole secondarie di secondo grado si prega di consultare anche la piattaforma Scuola di
statistica – Lab (accessibile dal link http://scuoladistatistica-lab.istat.it/)