| Question | Answer |
| Grundgesamtheit | Menge gleichartiger Objekte, an denen (mindestens) eine Eigenschaft untersucht werden soll GG genau definieren, d.h. räumlich und zeitlich abgrenzen |
| Merkmal (Variable) | die zu untersuchende Eigenschaft |
| (Merkmals-)Ausprägung | Werte, die das Merkmal annehmen kann |
| Untersuchungseinheit | ein Objekt aus der Grundgesamtheit |
| Stichprobe | Teilmenge der Grundgesamtheit, an denen das/die Merkmal(e) gemessen werden |
| nominal | mögliche Mermalsausprägung; Skalenmaß; keine natürliche Reihenfolge der Skalenwerte, z.B. Parteien, Berufe, Familienstand, Farben |
| ordinal | mögliche Merkmalsausprägung; Skalenmaß; Rangfolge vorhanden, aber keine Zahlenverhältnisse oder Abstände interpretierbar, z.B. Platzierungen, Schulnoten, Rankings |
| kardinal (metrisch) | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen --> diskret/stetig |
| diskret | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen; nur endlich viele verschiedene Ausprägungen möglich, z.B. Anzahl, Alter |
| stetig | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen; beliebige Ausprägungen in einem bestimmten Bereich möglich, z.B. Länge, Gewicht, Zeit, Kapital Bemerkung: Alle gemessenen Daten sind streng genommen diskret (endliche Messgenauigkeit), werden aber streng mmodelliert |
| Mittelwert (arithmetisches Mittel) | |
| order statistics | x von (k)=k-te Ordnungsstatisik |
| Median |
Image:
Formel_Median (image/png)
|
| Median | tatsächlicher mittlerer Wert der Stichprobe; Eindimensionales Maß; Median ist wesentlich weniger anfällig für Fehler in den Daten (Robustheit) Schreibweisen: "Der Median beträgt..." "Die durchschnittliche Körpergröße beträgt..." "Die mediane körpergröße beträgt..." !!! nicht: "Die mittlere Körpergröße beträgt..:" !!! |
| Hodges-Lehmann-Mittelwert | Eindimensionales Maß; der Median der Mittelwerte aller Paare von Beobachtungen |
| gewichtetes arithmetisches Mittel |
Image:
gew_arit_mittel (image/png)
|
| gewichtetes arithmetisches Mittel | Eindimensionales Maß ...ist sinnvoll, wenn die Daten selbst Mittelwerte von unterschiedlich großen Gruppen sind |
| Geometrisches Mittel |
Image:
geom_mittel (image/png)
|
| geometrisches Mittel | Eindimensionales Maß ...ist sinnvoll für positive Werte, z.B. Wachstumsraten |
| harmonisches Mittel | Eindimensionales Maß ...ist sinnvoll, z.B. für Geschwindigkeiten |
| harmonisches Mittel |
Image:
harm_mittel (image/png)
|
| Modalwert | Eindimensionales Maß (der am häufigsten auftretende Wert) ...ist sinnvoll bei nominalen, ordinalen Skalen, oder diskret verteilten Merkmalen mit wenig verschiedenen möglichen Ausprägungen, z.B. Schulnoten |
| Mittelwert (arithmetisches Mittel) | Eindimensionales Maß |
| Standardabweichung | Streuungsmaß; (am häufigsten verwendet) |
| Standardabweichung |
Image:
standardabwe (image/png)
|
| Varianz | Streuungsmaß; Maß für die mittlere quadratische Abweichung vom Mittelwert |
| Varianz |
Image:
varianz (image/png)
|
| Ginis mittlere Differenz | Streuungsmaß; Mittelwert aller paarweisen Abstände der Daten |
| Median der absoluten Abstände (vom Median) | Streuungsmaß; (ähnlich wie Median sehr gute Robustheitseigenschaften) |
| Interquartilsabstand | Streuungsmaß; |
| Histogramm | graphische Zusammenfassung eindimensionaler Daten; Klassen werden entlang der x-Achse aufgetragen; über jeder Klasse wird eine Säule gezeichnet (keine Lücke zwischen den Säulen); die Höhe der Säule gibt Anzahl der Beobachtungen in der Klasse an für stetige Merkmale (oder diskreten mit vielen Ausprägungen) |
| Klassenbreite | graphische Zusammenfassung eindimensionaler Daten; ...nach Sturges ...nach Scott ...nach Freedman & Diaconis |
| Balkendiagramm | graphische Zusammenfassung eindimensionaler Daten; für Merkmale mit wenigen Ausprägungen (nominal, ordinal, diskret) |
| Boxplot | graphische Zusammenfassung eindimensionaler Daten; ...fasst viele Kenngrößen und Charakteristiken eines Datensatzes zusammen (Median, oberes u. unteres Quartil, IDA) ...macht Ausreißer, Symmetrie/Schiefe, Wölbung deutlich wird häufig verwendet, um Datensätze miteinander zu vergleichen |
| Lineare Regression | zweidimensionaler Datensatz; ein Merkmal hängt ungefähr (im Mittel) linear von einem anderen ab |
| Korrelationskoeffizient | zweidimensionaler Datensatz; |
| Kovarianz | Maß für die Abhängigkeit zweier Merkmale, ist aber alleine wenig aussagekräftig, denn sie hängt von der Streuung ab |
Want to create your own Flashcards for free with GoConqr? Learn more.