Welche Erklärungen passen zu den jeweiligen Grundbegriffen?
Verteilung = Verteilung der Daten mit Blick auf verschiedene Ausprägungen eines Merkmals, durch versch. Kennwerte
Lagemaß = zentrale Tendenz, Wie ist die Lage
Streuungsmaß = Abweichung von der Tendenz
Streuungsmaß = zentrale Tendenz, Wie ist die Lage
Lagemaß = Abweichung von der Tendenz
Urliste = grundlegende Daten (Gesamtheit aller Daten)
Urliste = sortierte Daten, die für die Forschung gebraucht werden
Rangwertreihe = sortierte Urliste, der Größe nach sortiert
Rangwertreihe = grundlegende Daten (Gesamtheit aller Daten)
Häufigkeitsverteilung = Häufigkeit wie oft ein Merkmal in Stichprobe auftritt
Was ist die absolute Häufigkeit?
Anzahl (fi): Wie oft tritt eine Ausprägung i des Merkmals X in einer Stichprobe mit dem Umfang N auf?
(pi): Wie oft tritt eine Ausprägung i des Merkmals X im Verhältnis zur Gesamtstichprobe mit dem Umfang N auf?
Was ist die relative Häufigkeit?
(fi): Wie oft tritt eine Ausprägung i des Merkmals X in einer Stichprobe mit dem Umfang N auf?
Welcher der folgenden Begriffe haben die richtige Abkürzung?
Merkmalsausprägungen xi
Merkmalsausprägung mi
absolute Häufigkeit fi (ni)
absolute Häufigkeit pi (ni)
relative Häufigkeit pi
relative Häufigkeit fi
gültige Prozente: relative Häufigkeiten exklusive fehlenden Fälle valid pi
gültige Prozente: relative Häufigkeiten inklusive fehlenden Fälle invalid pi
kumulierte relative Häufigkeiten Σpi
kumulierte absolute Häufigkeiten Σpi
Was sind die richtigen Aussagen bezüglich des Säulendiagramms?
kann für relative und für absolute Häufigkeiten verwendet werden
kann nur für relative Häufigkeit verwendet werden
kann nur für die absolute Häufigkeit verwendet werden
7 Kategorien sind eine gute Darstellungsgröße
10 Kategorien sind eine gute Darstellungsgröße
nach Größe sortieren, um einen besseren Überblick zu schaffen
Was sind die richtigen Aussagen bezüglich des Balkendiagramms?
gebräuchlichere Darstellung, da es schon bereits in Prozent (relative Häufigkeit) ist
nicht so eine gebräuchliche Anwendung, da man noch die relative Häufigkeit ausrechnen muss, um die Prozente zu haben
es sollten nicht zu viele Ausprägungen geben
bei den Balkendiagramme können auch mehrere Ausprägungen verwendet werden, ohne das man den Überblick verliert
7 Kategorien ist eine gute Darstellungsgröße
Druch Rundungsfehler, kann es manchmal zu einen insgesamten Prozentnteil von 101% kommen - diese Aussage gehört zu welcher Darstellungsform?
Kreisdiagramm
Balkendiagramm
Säulendiagramm
Welche Grundregeln gibt es bei der Verwendung von Darstellungsformen?
Abbildungen müssen selbsterklärend sein
einheitliches Layout
nicht zu viele Kategorien innerhalb eines Diagramms
Abbildungen sollten durch ihren kurzen Beitext verständlich sein
man sollte immer das Layout wählen, was zum Thema der Arbeit/Forschung am besten passt, somit können die Diagramme innherhalb einer Arbeit unterschiedlich aussehen
es sollte so viele Diagramme wie möglich erstellt werden
welche Aussagen stimmen bezüglich der metrische Daten?
können jeden Wert annehmen
da sie jeden Wert annehmen können, sind diese schwieriger zu erfassen
für eine Übersicht ist eine Gruppierung/vielfach eine Kategorisierung notwendig
zb: Einkommen, Nutzungsdauer
zb: Geburtstag, Geschlecht
metrische Daten können genau einen bestimmten Wert annehmen
da metrische Daten nur einen bestimmten Wert annehmen kann, sind diese leichter zu erfassen
Gruppierung und Kategorisierung sind bei metrischen Daten nicht notwendig
Welche Schritte gibt es bei den metrischen Daten zu beachten?
Anzahl Gruppen und Gruppenbreite festlegen
Jede Beobachtung einer Gruppe zuordnen
Gruppenmitte berechnen
Tabelle mit absoluten und relativen Werten erstellen
Größe der Gruppemitte festlegen
Jede Kategorie einer Gruppe zuordnen
Gruppenbreite berechnen
Was sind die Regeln der Häufigkeitsverteilungen?
Jede Ausprägung muss genau einer Klasse zugeordnet werden können
jede Ausprägung muss auf eine oder mehrere Klassen zugeordnet werden können
5-10 Gruppen optimal
5-12 Gruppen optimal
Randklassen sollten gering besetzt sein
Randklassen sollten hoch besetzt werden
Möglichst Gruppenbreite konstant halten
Offene Klassen möglichst vermeiden
Offene Klassen sollte vorhanden sein
Gruppenbreite muss nicht unbedingt gleich bleiben, sollte jedoch überschaubar sein
Für metrische Merkmale beim Histogramm, welche folgenden Aussagen stimmen?
stellt die Häufigkeiten in einzelnen Klassen flächengetreu dar
stellt die Daten der einzelnen Klassen flächengetreu dar
Fläche = Höhe x Breite
Fläche = Höhe x Breite : 1/2
die Klassenbreite ergibt sich aus der Breite des Intervalls
die Klassenbreite ergibt sich aus der Breite des Balkens
Welche Beschreibungen zur Dichte stimmen hier?
hi = Höhe des i-ten Histogrammbalkens
ni = Anzahl der Personen in dieser Gruppe
N = Gesamtzahl an Personen
bi = Breite der i-ten Klasse
hi = Breite der i-ten Klasse
bi = Anzahl der Personen in dieser Gruppe
N = Anzahl der Personen in dieser Gruppe
ni = Gesamtzahl an Personen
Massenzahlen für bereits erhobene Daten (Stichprobe) nennen wir...
Verteilungskennwerte (deskriptive Statistik)
Verteilungskennwerte (induktive Statistik)
Verteilungsparameter (induktive Statistik)
Verteilungsparameter (deskriptive Statistik)
Maßzahlen für die Grundgesamtheit nennen wir...
Was ist der Modus?
Der Modus ist der Wert einer Verteilung der am häufigsten auftritt
Der Modus ist der Wert einer Verteilung der am wenigsten auftritt
Was sind die Vor- und Nachteile des Modus?
+ Informiert über das Typische
- Gibt es mehrere Werte die häufig auftreten, dann mach der typischste Wert keinen Sinn mehr
- wenn 2 Kategorien gleichstark auftreten -> nicht mehr ganz so aussagekräftig,, somit Informationsarm, da es mehrere Werte annehmen kann
- Instabil = weil es kann keinen Modus oder mehrere Modi geben
+ kann nur einen Wert annehmen
+ Informationsreich
+ ist sehr stabil
Was ist der Median?
Der Median (Md) ist der Wert, der die Verteilung in zwei gleich große Hälften zerlegt: 50% der Werte sind kleiner und 50% der Werte sind größer als der Median
Der Median (Md) ist der Wert, der die Verteilung in zwei ungleich große Hälften zerlegt: 30% der Werte sind kleiner und 70% der Werte sind größer als der Median
Welche Aussagen über umgruppiert Daten und gruppierte Daten stimmen bei dem Median?
Ungruppierte Daten: Daten müssen zunächst der Größe nach geordnet werden. Dann ist der Median bei ungeraden Zahlen die Ausprägung des „mittleren“ Wertes.
gruppierte Daten: Daten müssen zunächst der Größe nach geordnet werden. Dann ist der Median bei geraden Zahlen die Ausprägung des „mittleren“ Wertes.
Bei geradem n gibt es keine echte Mitte. In diesem Fall liegt der Median genau in der rechnerischen Mitte zwischen den beiden Werten, die der Mitte der Verteilung am nächsten kommen.
Bei umgruppierten Daten gibt es keine echte Mitte. In diesem Fall liegt der Median genau in der rechnerischen Mitte zwischen den beiden Werten, die der Mitte der Verteilung am nächsten kommen.
Was ist der Mittelwert?
Der (arithmetische) Mittelwert, Durchschnittswert oder Schwerpunkt einer Verteilung ist die durchschnittliche Ausprägung aller Werte
Der (arithmetische) Mittelwert, Durchschnittswert oder Schwerpunkt einer Verteilung ist die durchschnittliche Ausprägung aller Werte dividiert durch die Summe aller Werte
Was sind die Vor- und Nachteile des Mittelwertes?
+ extrem informativ und sehr gebräuchlich
+ sehr leicht herauszufinden
+ sehr stabil
- nicht sehr stabil