Statistika

Description

1 Statistika Quiz on Statistika, created by Unstoppable Troll on 16/01/2025.
Unstoppable Troll
Quiz by Unstoppable Troll, updated 9 months ago
Unstoppable Troll
Created by Unstoppable Troll 9 months ago
320
0

Resource summary

Question 1

Question
Co znamená pojem "pravděpodobná délka života" ve statistické demografii?
Answer
  • Je to nejvyšší věk, kterého lze teoreticky dosáhnout v dané populaci.
  • Je to věk, kterého by se při dané úmrtnosti dožila polovina obyvatel (medián).
  • Je to statistický odhad doby, po kterou je očekáváno, že jedinci zůstanou v produktivním věku.
  • Je to průměrný počet let, který se očekává, že jedinec stráví živý, vzhledem k úmrtnostním sazbám jeho věkové skupiny.
  • Je to odhadovaný počet let, které by jedinec mohl žít, pokud by se všechny současné zdravotní podmínky a úmrtnostní trendy náhle zlepšily.

Question 2

Question
Jak se při faktorové analýze počítá faktorové skóre?
Answer
  • Součtem standardizovaných hodnot proměnných.
  • Zprůměrováním hodnot pozorovaných proměnných.
  • Vynásobením standardizovaných hodnot pozorovaných proměnných faktorovými zátěžemi.
  • Vydělením hodnot pozorovaných proměnných faktorovými zátěžemi.

Question 3

Question
Jaká charakteristika nejlépe popisuje progresivní věkovou pyramidu?
Answer
  • Široká základna a úzký vrchol.
  • Téměř rovnoměrná šířka napříč věkovými skupinami, což ukazuje na stabilní počet narození a úmrtí.
  • Výrazně širší vrchol než základna, což ukazuje na převahu starších generací nad mladšími.
  • Úzký střed a široká základna i vrchol, což naznačuje velké počty mladých i starších lidí.
  • Úzká základna a široký vrchol.

Question 4

Question
Co jsou marginální četnosti v kontingenční tabulce?
Answer
  • Specifické hodnoty v tabulce, které jsou výrazně vyšší nebo nižší než ostatní a mohou indikovat zajímavý vzorek.
  • Hodnoty, které označují nejčastější kombinaci kategorií ve dvou proměnných.
  • Hodnoty, které reprezentují průměr každého řádku nebo sloupce v tabulce.
  • Četnosti v nejnižším řádku a pravém sloupci tabulky, které sumarizují celkový počet případů pro každou proměnnou.

Question 5

Question
Právě jste použili PROC REG k regresi y na X1 a zjistili níže uvedenou tabulku odhadů parametrů. Jaký je vzhledem k těmto informacím nejlepší odhad (předpovězená hodnota) y, když X1 = 13?
Answer
  • 115
  • 0
  • 135
  • Není dostatek informací.
  • 5

Question 6

Question
Jednou z metod určení minimální velikosti vzorku je pomocí maximální šíře intervalu spolehlivosti. Představte si, že jste provedli průzkum spokojenosti zákazníků ve vaší restauraci a vypočítali průměrné hodnocení spokojenosti 8,2 z 10 na základě vzorku 100 náhodně vybraných zákazníků. Dále jste vypočítali 95% interval spolehlivosti pro tento průměr, který je (7,9; 8,5). Co tento interval spolehlivosti znamená?
Answer
  • Pokud bychom tento průzkum opakovali mnohokrát, očekáváme, že průměrné hodnocení spokojenosti 95% těchto vzorků bude mezi 7,9 a 8,5.
  • Průměrné hodnocení všech zákazníků v populaci je s 95% pravděpodobností přesně 8,2.
  • S 95% pravděpodobností má každý zákazník v populaci hodnocení spokojenosti mezi 7,9 a 8,5.
  • 95% všech zákazníků v průzkumu ohodnotilo restauraci skórem mezi 7,9 a 8,5.

Question 7

Question
Při provádění faktorové analýzy jste se rozhodli použít rotaci faktorů. Jaký je hlavní rozdíl mezi použitím ortogonální rotace, jako je například Varimax, a neortogonální rotace, jako je například Oblimin?
Answer
  • Ortogonální a neortogonální rotace jsou v podstatě totožné ve svých výsledcích; rozdíl je pouze v názvosloví.
  • Neortogonální rotace vytváří faktory, které jsou vždy lepší pro interpretaci, zatímco ortogonální rotace může vést k faktorům, které jsou těžko interpretovatelné.
  • Ortogonální rotace je vhodná pouze pro binární data, zatímco neortogonální rotace je vhodná pro spojitá data.
  • Ortogonální rotace udržuje faktory nekorelované, zatímco neortogonální rotace umožňuje faktorům, aby byly korelované.
  • Ortogonální rotace udržuje faktory korelované, zatímco neortogonální rotace umožňuje faktorům, aby byly nekorelované.

Question 8

Question
Analyzujete vztah mezi generací (úrovně od nejstarší po nejmladší: baby boomers, gen X, gen Y, gen Z) a četností online komunikace s přáteli (úrovně od „Vůbec ne“ po „Několikrát denně“). Který vhodný test míry asociace byste zvolili vzhledem k charakteru obou proměnných?
Answer
  • Pearsonův chí-kvadrát test
  • Anderson-Darlingův test
  • Kaiser-Meier-Olkinův test (MSA)
  • Goodman-Kruskalovo gamma

Question 9

Question
Jaká je jedna z hlavních výhod metody shlukování k-means oproti metodě hierarchického shlukování?
Answer
  • K-means je typicky rychlejší a efektivnější z hlediska výpočetní náročnosti pro velké datové sady, zatímco hierarchické shlukování může být pro velké sady pomalé a náročné na paměť.
  • Na rozdíl od k-means, hierarchické shlukování nemůže určit počet shluků automaticky, což je klíčovou výhodou k-means.
  • Metoda k-means je vždy přesnější, protože používá techniku iterativní optimalizace, na rozdíl od hierarchického shlukování, které závisí na pevně daném pořadí rozhodnutí.
  • Metoda k-means poskytuje přesnější výsledky, protože vždy dosahuje globálního optima rozdělení shluků.

Question 10

Question
Co představuje β₁ v jednoduchém lineárním regresním modelu?
Answer
  • parametr konstanty
  • parametr sklonu regresní přímky
  • variaci X kolem regresní přímky
  • prediktivní (vysvětlující) proměnnou
  • variaci závislé proměnné kolem regresní přímky

Question 11

Question
Jaký význam má ANOVA (omnibusový test) v kontextu lineární regresní analýzy?
Answer
  • Určuje, zda je variabilita reziduí ve všech skupinách nezávislé proměnné stejná.
  • Porovnává průměry dvou nebo více skupin nezávislé proměnné a určuje, zda jsou všechny stejné.
  • Testuje, zda je každý jednotlivý regresní koeficient v modelu statisticky významně odlišný od nuly.
  • Testuje, zda jsou všechny koeficienty regresního modelu současně rovny nule, tedy zda model jako celek významně předpovídá závislou proměnnou.

Question 12

Question
Máte shluk čtyř bodů v dvourozměrném prostoru: A(2, 4), B(4, 2), C(4, 4) a D(6, 6). Jaký je souřadnicový bod centroidu tohoto shluku?
Answer
  • (4, 5)
  • (4, 4)
  • (3, 3)
  • (5, 5)
  • (5, 4)

Question 13

Question
Ve městě A bylo v loňském roce zaznamenáno 20,000 narození a 15,000 úmrtí, zatímco v městě B bylo 25,000 narození a 20,000 úmrtí. Do každého z obou měst se přistěhovalo 1,000 obyvatel, neodstěhoval se nikdo. Pokud obě města začínala rok s počtem obyvatel 500,000, jaký byl procentuální přirozený přírůstek v každém městě za minulý rok?
Answer
  • Město A: 0.5%, Město B: 1%
  • Město A: 1%, Město B: 0.5%
  • Město A: 2%, Město B: 1%
  • Město A: 1%, Město B: 1%
  • Město A: 1%, Město B: 2%

Question 14

Question
Mějme náhodnou veličinu X s průměrem μ = 5 a standardní odchylkou σ = 2, a náhodnou veličinu Y s průměrem μ = 10 a standardní odchylkou σ = 4. Který z následujících výroků nejlépe charakterizuje vztah mezi jejich korelační a kovarianční maticí?
Answer
  • Korelační a kovarianční matice budou identické, protože obě měří lineární závislost mezi proměnnými.
  • Korelační matice poskytuje méně informací o variabilitě dat než kovarianční matice, protože normalizuje rozptyl na jednotkový interval.
  • Korelační matice transformuje původní data tak, že eliminuje vliv rozdílných jednotek a měřítek, zatímco kovarianční matice zachovává původní rozměry proměnných.
  • Kovarianční matice bude mít vyšší hodnoty než korelační matice, protože nezohledňuje standardizaci proměnných.

Question 15

Question
Co reprezentuje dendrogram v kontextu hierarchického shlukování?
Answer
  • Dendrogram zobrazuje počet iterací potřebných k dosažení finálního rozdělení shluků v metodě k-means.
  • Dendrogram představuje průměrnou hodnotu všech bodů ve shluku a je používán k určení optimálního počtu shluků v datech.
  • Dendrogram je grafické znázornění postupného sloučení nebo rozdělování shluků, které ukazuje, jak jsou jednotlivé body nebo skupiny bodů vzájemně propojeny na různých úrovních podobnosti.
  • Dendrogram ukazuje rozložení vzdáleností mezi jednotlivými body dat, přičemž každá větev dendrogramu odpovídá jednomu bodu.

Question 16

Question
Analytik zkoumá faktory ovlivňující cenu bytů a má k dispozici následující prediktory: velikost bytu v m², počet pokojů, velikost obývacího pokoje v m², vzdálenost od centra města a stáří budovy. Po provedení diagnostiky modelu zjistil VIF (Variance Inflation Factor) > 8 u proměnných „velikost bytu“ a „počet pokojů“. Jaký je nejvhodnější postup?
Answer
  • Standardizovat obě proměnné a ponechat je v modelu.
  • Ponechat všechny prediktory v modelu, protože VIF < 10.
  • Vytvořit novou proměnnou jako průměr z obou korelovaných proměnných.
  • Odstranit jednu z korelovaných proměnných na základě jejich teoretického významu pro model a síly vztahu k vysvětlované proměnné.

Question 17

Question
Pro kontingenční tabulku s 𝑅 řádky a 𝑆 sloupci má chí-kvadrát rozdělení počet stupňů volnosti:
Answer
  • (R−1)(S−1)
  • (R+S−1)
  • R+S
  • R×S

Question 18

Question
Předpokládejte normální rozdělení hodnot. Jakou plochu pod křivkou normálního rozdělení bychom přibližně pokryli, pokud bychom se od průměru odchýlili od plus mínus jednu směrodatnou odchylku?
Answer
  • 90 %
  • 68 %
  • 95 %
  • 100 %

Question 19

Question
Následující tabulka ukazuje přeživší z Titaniku podle pohlaví. Jaký je poměr šancí (odds ratio) na přežití žen (female) vůči přežití mužů (male)?
Answer
  • 1,07
  • 2,73
  • 10,1
  • 0,27

Question 20

Question
Která z následujících hodnot MSA (Measure of Sampling Adequacy) indikuje velmi dobrou vhodnost dat pro faktorovou analýzu?
Answer
  • 0,45
  • 0,55
  • 0,65
  • 0,85

Question 21

Question
Máme populaci vysokoškolských studentů v ČR rozdělenou do čtyř oborů: humanitní, přírodovědecké, technické a lékařské. Z této populace chceme provést průzkum o studijních návycích. Abychom zajistili, že naše výsledky budou reprezentativní pro celou univerzitu, chceme, aby náš vzorek správně odrážel zastoupení studentů z každé fakulty v celkové populaci. Shromáždění dat o populaci: Ze statistického úřadu zjistíme, že v celkové populaci je 30 % studentů z humanitní fakulty, 25 % z přírodovědecké, 25 % z technické a 20 % z lékařské. Výběr vzorku: Náhodně vybereme 200 studentů a uspořádáme průzkum. Po sběru dat zjistíme, že náš vzorek má 40 % studentů z humanitní fakulty, 20 % z přírodovědecké, 20 % z technické a 20 % z lékařské. Jaký test použijete pro ověření shody očekávaných a získaných četností, tj. pro ověření reprezentativnosti struktury vzorku?
Answer
  • Kendallovo tau.
  • Chí-kvadrát test.
  • Kolmogorov-Smirnovův test.
  • Pearsonův korelační koeficient.

Question 22

Question
Několik druhů ovoce a zeleniny bylo podrobeno shlukové analýze podle obsahu energie, bílkovin, sacharidů a vlákniny. Původní proměnné byly standardizovány pomocí z-skóre. Byly identifikovány 4 shluky. Jedna z výstupních tabulek je uvedena níže. Který klastr je charakteristický nadprůměrnou energetickou hodnotou a obsahem vlákniny?
Answer
  • Klastr 2
  • Z uvedených dat to nelze poznat.
  • Klastr 1
  • Klastr 3
  • Klastr 4

Question 23

Question
Marketingová agentura analyzuje data o online nákupním chování zákazníků. Při určování počtu shluků sledují více kritérií a pozorují: - Pseudo F statistika má maximum při 3 shlucích. - Cubic Clustering Criterion (CCC) má maximum při 4 shlucích. - Silueta má nejvyšší průměrnou hodnotu při 3 shlucích. - Z business perspektivy dává smysl rozdělení do 3-4 segmentů.
Answer
  • Detailně prozkoumat řešení pro 3 i 4 shluky a vybrat to, které lépe odpovídá business potřebám a je lépe interpretovatelné.
  • Automaticky zvolit 3 shluky, protože to podporuje většina kritérií.
  • Automaticky zvolit 4 shluky podle CCC.
  • Hledat další řešení s více shluky, protože kritéria nejsou jednotná.

Question 24

Question
Co ukazuje scree plot při faktorové analýze?
Answer
  • Rotované faktorové zátěže.
  • Korelační matici pozorovaných proměnných.
  • Vlastní čísla faktorů v sestupném pořadí.
  • Rozložení faktorových skóre.

Question 25

Question
Výzkumník analyzuje data z dotazníkového šetření spokojenosti zaměstnanců. Po provedení faktorové analýzy zjistil následující hodnoty komunality: - Spokojenost s platem: 0,82 - Spokojenost s kolektivem: 0,78 - Spokojenost s pracovní dobou: 0,25 - Dojezdová vzdálenost do práce: 0,15 Jaký by měl být další postup?
Answer
  • Zvážit vyřazení posledních dvou proměnných z analýzy kvůli nízké komunalitě, protože pravděpodobně měří jiný konstrukt než ostatní proměnné.
  • Přidat více proměnných do analýzy, aby se zvýšily hodnoty komunality u všech položek.
  • Vyřadit první dvě proměnné, protože jejich komunality jsou příliš vysoké a zkreslují výsledky.
  • Ponechat všechny proměnné v analýze, protože reprezentují různé aspekty spokojenosti.

Question 26

Question
Byla provedena analýza závislosti mezi počtem hodin, které respondent tráví denně sledováním televize (tv1_tvhours) a potenciálními prediktory: věk respondenta (d1_age), vzděláním otce respondenta vyjádřeném počtem ukončených let vzdělání (d24_paeduc) a pohlavím (d5_gender, referenční úroveň „Male“). Výsledky analýzy jsou uvedeny v tabulce. Jakým způsobem byla vypočítána t-statistika pro každý regresní koeficient?
Answer
  • Vynásobíte odhad koeficientu (estimate) jeho standardní chybou (SE).
  • Vydělíte odhad koeficientu (estimate) jeho standardní chybou (SE).
  • Žádná možnost není správná.
  • Vydělíte standardní chybu (SE) odhadem koeficientu (estimate).
  • Vydělíte standardizovaný odhad koeficientu (Stand. Estimate) jeho chybu.

Question 27

Question
Máte data o populaci, ve které je 25,000 osob ve věku 0–14 let a 50,000 osob v produktivním věku (15–64 let). Jaký je index závislosti mladých pro tuto populaci?
Answer
  • 0,2
  • 0,5
  • 50
  • 2,0
  • 1,0

Question 28

Question
Vyberte pravdivé tvrzení týkající se testování statistických hypotéz.
Answer
  • Nulovou statistickou hypotézu zamítáme, pokud je p-hodnota vyšší než stanovená hladina významnosti.
  • Při větší velikosti vzorku je dosažení statistické významnosti méně pravděpodobné. S rostoucí velikostí vzorku se snižuje schopnost detekovat i menší efekty jako statisticky významné.
  • Pro pravděpodobnostní výběry obecně platí, že čím menší je náhodný výběr, tím nižší je pravděpodobnost statistické chyby II. druhu.
  • Při větší velikosti vzorku je dosažení statistické významnosti pravděpodobnější. S rostoucí velikostí vzorku se zvyšuje schopnost detekovat i menší efekty jako statisticky významné.

Question 29

Question
Několik druhů ovoce a zeleniny bylo podrobeno shlukové analýze podle obsahu energie, bílkovin, sacharidů a vlákniny. Byly identifikovány 4 shluky. Jedna z výstupních tabulek je uvedena níže. Který shluk je nejvíce homogenní a proč?
Answer
  • Shluk 3, protože má nejnižší ukazatel RMS Std Deviation.
  • Shluk 1, protože má nejvyšší ukazatel RMS Std Deviation.
  • Shluk 2, protože má největší ukazatel „Maximum Distance From Seed to Observation“.
  • Z uvedených ukazatelů nelze poznat, který shluk je nejvíce homogenní.
  • Shluk 4, protože má nejnižší ukazatel „Maximum Distance From Seed to Observation“.

Question 30

Question
Jaký je vztah mezi odhadem sklonu regresní přímky (β1) metodou nejmenších čtverců ve jednoduché lineární regresi a Pearsonovým korelačním koeficientem?
Answer
  • Sklon regresní přímky (β1) je roven Pearsonovu korelačnímu koeficientu vydělenému poměrem směrodatné odchylky závislé proměnné k směrodatné odchylce nezávislé proměnné.
  • Sklon regresní přímky (β1) je roven Pearsonovu korelačnímu koeficientu vydělenému poměrem směrodatné odchylky nezávislé proměnné k směrodatné odchylce závislé proměnné.
  • Sklon regresní přímky (β1) je roven Pearsonovu korelačnímu koeficientu násobenému poměrem směrodatné odchylky závislé proměnné k směrodatné odchylce nezávislé proměnné.
  • Sklon regresní přímky (β1) je roven Pearsonovu korelačnímu koeficientu násobenému poměrem směrodatné odchylky nezávislé proměnné k směrodatné odchylce závislé proměnné.
  • Sklon regresní přímky (β1) je roven Pearsonovu korelačnímu koeficientu vynásobenému směrodatnou odchylkou závislé proměnné.

Question 31

Question
Co je charakteristické pro prostý náhodný výběr (simple random sampling) v kontextu sběru dat?
Answer
  • Výběr vzorku z populace na základě jeho dostupnosti nebo pohodlí pro výzkumníka.
  • Vybrání vzorku tak, aby odrážel určité charakteristiky populace prostřednictvím kvót.
  • Každý člen populace má známou a stejnou šanci být vybrán do vzorku.
  • Výběr vzorku z populace tak, aby každá skupina byla zastoupena proporcionálně k její velikosti.

Question 32

Question
Ukazatel počet zemřelých mužů na 1000 mužů se nazývá:
Answer
  • Specifická míra smrtnosti
  • Specifická míra úmrtnosti
  • Obecná míra úmrtnosti
  • Obecná míra smrtnosti

Question 33

Question
Manažer banky je znepokojen tím, že procento zpracovaných úvěrů, které obsahují chyby, se zvýšilo nad přijatelných 1 %. K ověření jeho obavy se provede test významnosti (H₀: míra chybovosti úvěrů = 0,01, Hₐ: míra chybovosti úvěrů > 0,01). Manažer dojde k závěru, že míra chybovosti je vyšší než 1 %, i když ve skutečnosti tomu tak není. Jakého typu chyby se manažer dopustil?
Answer
  • Chyba IV. druhu
  • Chyba I. druhu
  • Chyba II. druhu
  • Chyba III. druhu

Question 34

Question
Několik druhů ovoce a zeleniny bylo podrobeno shlukové analýze podle obsahu energie, bílkovin, sacharidů a vlákniny. Byly identifikovány 4 shluky. Jedna z výstupních tabulek je uvedena níže. Která proměnná nejvýrazněji odlišuje shluky?
Answer
  • Bílkoviny
  • Všechny proměnné mají stejnou diskriminační schopnost (OVER-ALL)
  • Energie_KJ
  • Vláknina
  • Sacharidy

Question 35

Question
Jak souvisí Euklidovská vzdálenost s Pythagorovou větou?
Answer
  • Euklidovská vzdálenost se vztahuje pouze k vzdálenostem v trojrozměrném prostoru, zatímco Pythagorova věta se aplikuje pouze v rovině.
  • Euklidovská vzdálenost je odvozena z Pythagorovy věty a slouží k výpočtu přímé vzdálenosti mezi dvěma body v rovině nebo v prostoru.
  • Pythagorova věta a Euklidovská vzdálenost jsou synonyma a označují stejný matematický koncept.
  • Pythagorova věta a Euklidovská vzdálenost spolu vůbec nesouvisejí.

Question 36

Question
Jak se vypočítá koeficien determinace (R2) ve vztahu k jednoduché lineární regresi?
Answer
  • Jako součet čtverců rozdílů mezi predikovanými a pozorovanými hodnotami závislé proměnné, vydělený celkovým počtem pozorování.
  • Jako podíl součtu čtverců reziduí a celkového součtu čtverců.
  • Jako kvadrát Pearsonova korelačního koeficientu mezi nezávisle a závisle proměnnou.
  • Jako součet konstanty 1 a podílu součtu čtverců reziduí k celkovému součtu čtverců.

Question 37

Question
Představte si, že analytický tým chce použít chí-kvadrát test pro ověření, zda je vzorek studentů reprezentativní z hlediska struktury podle věkových skupin. Tým shromáždil data o věkové struktuře z celkové populace a porovnává je s věkovou strukturou ve svém vzorku. Jaké tvrzení nejlépe popisuje, jak by měl být chí-kvadrát test použit v tomto scénáři?
Answer
  • Chí-kvadrát test by měl být použit k určení rozdílů ve věkové struktuře mezi vzorkem a populací jako přímý důsledek použití stratifikovaného náhodného výběru proti jiné metodě náhodného výběru vzorku.
  • Chí-kvadrát test by měl být použit k určení pravděpodobnosti, že vzorek pochází z jiné populace s odlišnou věkovou strukturou, bez ohledu na data z celkové populace.
  • Chí-kvadrát test by měl být použit k přímému porovnání počtu studentů v každé věkové skupině ve vzorku s očekávanými počty na základě věkové struktury celkové populace.
  • Chí-kvadrát test by měl být použit k výpočtu průměrného věku ve vzorku a porovnání tohoto průměru s průměrným věkem v celkové populaci.

Question 38

Question
Chcete analyzovat souvislost mezi mírou plýtváním potravinami (Waste) a generací (Gen) z dočasného datového souboru s názvem „Consumers“. Který z následujících kódů SAS generuje kontingenční tabulku s pozorovanými a očekávanými četnostmi?
Answer
  • proc freq data=work.Consumers; var Waste Gen / expected; run;
  • proc freq data=work.Consumers; var Waste*Gen / expected; run;
  • proc freq data=work.Consumers; tables Waste*Gen / expected; run;
  • proc freq data=work.Consumers; tables Waste Gen / expected; run;

Question 39

Question
Která podmínka NEpatří mezi kritéria definice nezaměstnaných osob podle mezinárodního standardu?
Answer
  • Osoby byly bez práce, tzn. nebyly v pracovním poměru ani samozaměstnané.
  • Osoby nebyly v pracovním poměru ale byly samozaměstnané.
  • Osoby jsou ve věku od 15 let.
  • Osoby byly připraveny k nástupu do práce (nejpozději do 14 dnů).
  • Osoby hledaly aktivně práci.

Question 40

Question
Představte si, že výzkumný tým provádí průzkum spokojenosti zaměstnanců ve velké mezinárodní společnosti. Aby získali reprezentativní vzorek, rozhodnou se použít stratifikovaný náhodný výběr, rozdělující zaměstnance do skupin podle oddělení a zeměpisné polohy. Jaký je hlavní cíl použití stratifikovaného náhodného výběru v tomto případě?
Answer
  • Zajistit, že každý zaměstnanec má stejnou šanci být vybrán do vzorku.
  • Umožnit týmu sbírat data rychleji tím, že se zaměří pouze na specifické skupiny zaměstnanců.
  • Zajistit, že vzorek bude obsahovat proporcionální zastoupení zaměstnanců z různých oddělení a lokací.
  • Snížit variabilitu vzorku tím, že se vybere stejný počet respondentů z každé skupiny.

Question 41

Question
Obdrželi jste výsledek Kaiser-Meier-Olkinovy metriky (KMO) ve výši 0.65 pro váš datový soubor, který plánujete analyzovat pomocí faktorové analýzy. Jak byste interpretovali tuto hodnotu v kontextu vhodnosti vašich dat pro faktorovou analýzu?
Answer
  • KMO hodnota 0.65 je nedostatečná pro jakýkoliv závěr, protože je potřeba dalších testů k určení vhodnosti dat pro faktorovou analýzu.
  • Data jsou nevhodná pro faktorovou analýzu, protože KMO hodnota 0.65 ukazuje, že většina položek nevykazuje dostatečnou společnou varianci.
  • Data jsou naprosto nevhodná pro faktorovou analýzu, protože KMO hodnota 0.65 značí velmi nízkou společnou varianci mezi položkami.
  • Data jsou poměrně vhodná pro faktorovou analýzu, ale s mírnou opatrností, protože KMO hodnota 0.65 naznačuje střední míru společné variance.
  • Data jsou velmi vhodná pro faktorovou analýzu, protože KMO hodnota 0.65 představuje vysokou míru společné variance mezi položkami.

Question 42

Question
Jaká je maximální možná hodnota faktorové zátěže ve faktorové analýze?
Answer
  • 0
  • 0,5
  • 0,8
  • 1
  • -1

Question 43

Question
Co označuje statistická chyba II. druhu?
Answer
  • Odhalení falešného pozitivního výsledku, když ve skutečnosti neexistuje žádný skutečný efekt.
  • Nezamítnutí nulové hypotézy, která ve skutečnosti neplatí, tedy přehlédnutí skutečného efektu.
  • Chyba způsobená nepřesnými nebo zkreslenými daty v analýze.
  • Nesprávné zamítnutí nulové hypotézy, když ve skutečnosti platí.

Question 44

Question
Předpokládejme, že testujete ordinální souvislost mezi příjmem lidí (Income) a jejich indexem tělesné hmotnosti (BMI). Úrovně proměnných jsou uvedeny v tabulce. Mantelova-Haenszelova p-hodnota chí-kvadrátu je 0,01 a Spearmanova korelační statistika je 0,253. Jaký můžete vyvodit závěr o souvislosti mezi příjmem a BMI?
Answer
  • Existuje přímo úměrná ordinální asociace.
  • Existuje inverzní ordinální asociace.
  • Nelze vyvodit žádný závěr. Výsledky jsou neplatné, protože hodnoty proměnných nejsou správně uspořádány.
  • Neexistuje žádná statisticky významná ordinální asociace.

Question 45

Question
Jak se vypočítá hodnota chí-kvadrát statistiky v kontextu testu dobré shody (goodness-of-fit test)?
Answer
  • Rozdíl mezi nejvyšší pozorovanou četností a nejvyšší očekávanou četností.
  • Součet čtverců rozdílů mezi pozorovanými a očekávanými četnostmi, vydělených očekávanými četnostmi.
  • Součet čtverců rozdílů mezi pozorovanými a průměrnými hodnotami, vydělených standardní odchylkou.
  • Součet čtverců rozdílů mezi pozorovanými a očekávanými četnostmi, vydělených pozorovanými četnostmi.
  • Průměr čtverců rozdílů mezi pozorovanými a očekávanými četnostmi pro každou kategorii.

Question 46

Question
Co označuje termín HETEROSKEDASTICITA ve vztahu k vícenásobné lineární regresi?
Answer
  • Přítomnost vysoké korelace mezi nezávisle proměnnými v regresním modelu, což vede k problémům s multikolinearitou.
  • Přítomnost konstantní variance reziduí napříč všemi hodnotami prediktorů, což je předpoklad pro validní regresní analýzu.
  • Přítomnost proměnlivé variance reziduí napříč různými hodnotami nezávislé proměnné, což může vést k neefektivním a zkresleným odhadům.
  • Přítomnost lineárního vztahu mezi všemi nezávisle proměnnými a závislou proměnnou v regresním modelu.

Question 47

Question
Máte data o populaci, kde je 20,000 osob ve věku 0–14 let a 5,000 osob ve věku 65 a více let. Jaký je index stáří pro tuto populaci?
Answer
  • 50
  • 400
  • 250
  • 25
  • 75
  • 100

Question 48

Question
Několik druhů ovoce a zeleniny bylo podrobeno shlukové analýze podle obsahu energie, bílkovin, sacharidů a vlákniny. Byly identifikovány 4 shluky. Jedna z výstupních tabulek je uvedena níže. Které klastry jsou si nejblíže?
Answer
  • Klastry 2 a 4
  • Klastry 3 a 4
  • Klastry 2 a 3
  • Klastry 1 a 3
  • Klastry 1 a 2

Question 49

Question
Analytický tým plánuje průzkum veřejného mínění v rámci různorodého městského obyvatelstva. Rozhodli se použít kvótní výběr respondentů, stanovili kvóty na základě pohlaví, věku a vzdělání. Jaký je hlavní cíl použití kvótního výběru v tomto případě?
Answer
  • Snížit celkové náklady a čas potřebný pro sběr dat tím, že se výzkumníci zaměří na snadno dostupné respondenty.
  • Umožnit přesné a reprezentativní odhady pro celou populaci tím, že velikost vzorku každé skupiny bude shodná s velikostí skupiny v populaci.
  • Zajistit, že každá skupina obyvatelstva bude mít přesně stanovený počet respondentů, odpovídající jejich podílu ve společnosti.
  • Zvýšit náhodnost a objektivitu výběru tím, že výzkumníci budou náhodně oslovovat lidi, dokud nenaplní stanovené kvóty.

Question 50

Question
Máte data rozdělená do tří shluků a následující průměrné hodnoty koeficientu siluety pro každý shluk: Shluk 1 = 0.75, Shluk 2 = 0.55, Shluk 3 = 0.20. Na základě těchto informací, který shluk byste identifikovali jako nejhomogennější?
Answer
  • Shluk 1, protože má nejvyšší průměrnou hodnotu koeficientu siluety, což ukazuje na dobře oddělený a soudržný shluk.
  • Žádný shluk, protože hodnoty siluety jsou příliš vysoké pro identifikaci homogenity.
  • Všechny shluky jsou stejně homogenní, protože koeficient siluety se používá k měření odlišnosti, nikoli homogenity.
  • Shluk 2, protože střední hodnota siluety naznačuje, že má rozumnou soudržnost a oddělení od ostatních shluků.
  • Shluk 3, protože nízká hodnota siluety naznačuje výraznou homogenitu v rámci shluku.

Question 51

Question
Korelace mezi výší školného a počtem absolventů na amerických vysokých školách je 0,55. Co to znamená?
Answer
  • Zvýšení míry graduace je nákladné, což vede ke zvýšení školného.
  • Bohatší studenti mají tendenci absolvovat častěji než chudší studenti.
  • Způsob, jak zvýšit počet absolventů na vaší vysoké škole, je zvýšit školné.
  • Nic z uvedeného, korelace nevypovídá nic o kauzalitě vztahu.

Question 52

Question
Tato tabulka ukazuje statistiky četností pro proměnné Region (Country) a Velikost (Size) ze souboru dat, který obsahuje údaje o lidech a automobilech, které řídí. Jsou sledovány tři regiony (Amerika, Evropa, Japonsko) a tři velikostní kategorie automobilů (Large = velké; Medium = středně velké; Small = malé). Jaké důkazy v tabulce naznačují možnou významnou asociaci mezi regionem a velikostí automobilů?
Answer
  • Sloupcová procenta (Col Pct) ukazují, že většina automobilů každé velikosti se vyrábí v Japonsku.
  • Celková četnost (Total) se liší mezi velikostními kategoriemi automobilů.
  • Řádková procenta (Row Pct) naznačují, že rozdělení velikostí se mění se změnou regionu.
  • Statistiky četností naznačují, že hodnoty každé proměnné jsou rovnoměrně rozloženy v jednotlivých úrovních.

Question 53

Question
Označte pravdivé tvrzení týkající se shlukové analýzy.
Answer
  • U shlukové analýzy známe předem příslušnost případů do skupin.
  • Žádné z uvedených tvrzení není pravdivé.
  • Shluková analýza nerozlišuje závisle a nezávisle proměnné.
  • Shluková analýza je synonymum slova segmentace.
  • Shluková analýza vždy využívá jako datový vstup korelační matici.

Question 54

Question
Ve které situaci je vhodné použít Fisherův přesný test?
Answer
  • Když se analyzují kontingenční tabulky s větším počtem než 2 řádky a 2 sloupce.
  • Když analyzujeme 2x2 kontingenční tabulku a některé očekávané četnosti jsou velmi malé (např. menší než 5).
  • Když jsou očekávané četnosti ve všech buňkách kontingenční tabulky větší než 10.
  • Když jsou data měřena na intervalové nebo poměrové škále a jsou normálně rozdělena.

Question 55

Question
Co znamená pojem "střední délka života" ve statistické demografii?
Answer
  • Je to věk, ve kterém polovina populace zemřela a polovina ještě žije.
  • Je to nejvyšší věk, kterého lze dosáhnout v dané populaci.
  • Je to věk, ve kterém většina populace dosahuje svého maximálního zdraví a vitality.
  • Je to odhadovaný počet let, které by jedinec mohl žít, pokud by se všechny nemoci a zdravotní rizika okamžitě eliminovaly.
  • Je to průměrný počet let, kterého by dožil novorozenec při zachování současné úmrtnosti.

Question 56

Question
V rámci výzkumu chcete zjistit, zda nově zavedený vzdělávací program má vliv na zlepšení výsledků studentů na standardizovaných testech. Jak správně formulujete oboustrannou nulovou a alternativní hypotézu pro tento scénář?
Answer
  • Nulová hypotéza (H0): Nový vzdělávací program má vliv na výsledky studentů. Alternativní hypotéza (H1): Nový vzdělávací program nemá vliv na výsledky studentů.
  • Nulová hypotéza (H0): Neexistuje žádný rozdíl ve výsledcích studentů před a po zavedení nového vzdělávacího programu. Alternativní hypotéza (H1): Existuje rozdíl ve výsledcích studentů před a po zavedení nového vzdělávacího programu.
  • Nulová hypotéza (H0): Výsledky studentů se po zavedení nového vzdělávacího programu nezměnily. Alternativní hypotéza (H1): Výsledky studentů se po zavedení nového vzdělávacího programu zlepšily.
  • Nulová hypotéza (H0): Výsledky studentů se po zavedení nového vzdělávacího programu zhoršily. Alternativní hypotéza (H1): Výsledky studentů se po zavedení nového vzdělávacího programu zlepšily.

Question 57

Question
Při provádění analýzy hlavních komponent z multidimenzionálních dat obsahujících pět manifestačních spojených proměnných jste zjistili, že první tři hlavní komponenty vysvětlují 60 %, 15 % a 10 % celkové variance dat. Chcete-li snížit dimenzionalitu dat, zatímco zachováte co nejvíce informací, kolik hlavních komponent byste si vybrali a proč?
Answer
  • Dvě hlavní komponenty, protože dohromady vysvětlují 75 % variance dat, což je většina informace.
  • Pouze jednu hlavní komponentu, protože sama vysvětluje většinu variance dat.
  • Tři hlavní komponenty, protože společně vysvětlují 85 % celkové variance dat a poskytují nejkomplexnější pohled.
  • Čtyři hlavní komponenty, protože čtvrtá komponenta může nabídnout důležité informace, které nejsou obsaženy v prvních třech.
  • Všech pět hlavních komponent, protože každá další komponenta dodává další informace a přesnost.

Question 58

Question
Jak se vypočítá koeficient phi (φ) pro měření síly vztahu mezi dvěma binárními (dichotomickými) proměnnými v 2x2 kontingenční tabulce?
Answer
  • Vypočítá se jako koeficient korelace mezi hodnotami dvou proměnných, kde každá hodnota je nahrazena její průměrnou hodnotou ve sloupci nebo řádku.
  • Vypočítá se jako odmocnina z poměru chí-kvadrát statistiky a celkového počtu pozorování.
  • Vypočítá se jako podíl rozdílu mezi pozorovanými a očekávanými četnostmi a celkového počtu pozorování.
  • Vypočítá se jako součet čtverců rozdílů mezi pozorovanými a očekávanými četnostmi, vydělený celkovým počtem pozorování.

Question 59

Question
Představte si, máte za úkol analyzovat krabicový graf (box plot), který zobrazuje rozdělení finálních známek z matematiky ve dvou různých třídách. Který z následujících závěrů lze správně vyvodit z krabicového grafu?
Answer
  • Medián, rozpětí mezi čtvrtým a prvním kvartilem a identifikaci odlehlých hodnot pro každou třídu.
  • Průměrné skóre, modus a rozdíl mezi třídami ve výskytu určitých známek.
  • Absolutně nejvyšší a nejnižší známka v každé třídě a průměrný počet studentů, kteří dosáhli těchto známek.
  • Procento studentů, kteří dosáhli nadprůměrné známky v každé třídě a rozdíl mezi nejlepšími a nejhoršími studenty.

Question 60

Question
Která metoda se ve společenských vědách nejčastěji používá k určení výchozího souboru faktorů při explorační faktorové analýze?
Answer
  • Shluková analýza
  • Wardova metoda
  • Diskriminační analýza
  • Odhad metodou maximální věrohodnosti
  • Analýza hlavních komponent

Question 61

Question
Máte data rozdělená do různého počtu shluků a k dispozici následující hodnoty Pseudo F kritéria pro každé rozdělení: 1 shluk = 10.5, 2 shluky = 15.3, 3 shluky = 25.8, 4 shluky = 22.5, 5 shluků = 20.1. Jaký počet shluků byste zvolili jako optimální na základě Pseudo F kritéria?
Answer
  • 4 shluky, protože po této hodnotě Pseudo F kritéria začíná klesat.
  • 2 shluky, protože je to první zvýšení hodnoty Pseudo F kritéria.
  • 1 shluk, protože nižší hodnota Pseudo F kritéria znamená lepší model.
  • 5 shluků, protože s vyšším počtem shluků obecně získáváme přesnější model.
  • 3 shluky, protože tato hodnota Pseudo F kritéria je nejvyšší a ukazuje na nejlepší rozdělení.

Question 62

Question
Představte si, že provádíte chí-kvadrát test nezávislosti, abyste zjistili, zda existuje vztah mezi pohlavím (muži vs. ženy) a preferencí určitého typu diety (nízkotučná vs. nízkosacharidová). Po provedení testu obdržíte p-hodnotu 0.045. Jak byste interpretovali tento výsledek?
Answer
  • Nemůžeme určit žádný vztah mezi pohlavím a preferovaným typem diety, protože p-hodnota je vyšší než 0.01.
  • Existuje vztah mezi pohlavím a preferovaným typem diety, protože p-hodnota je nižší než 0.05.
  • Existuje silný vztah mezi pohlavím a preferovaným typem diety, protože p-hodnota je přesně 0.045.
  • Neexistuje žádný vztah mezi pohlavím a preferovaným typem diety, protože p-hodnota je nižší než 0.05.

Question 63

Question
Co při faktorové analýze znamená faktorová zátěž blízká 0?
Answer
  • Žádný vztah mezi proměnnou a faktorem.
  • Proměnná má nízkou variabilitu.
  • Silný vztah mezi proměnnou a faktorem.
  • Záporný vztah mezi proměnnou a faktorem.

Question 64

Question
Asociace mezi ordinálními znaky v kontingenční tabulce může být měřena několika ukazateli, které jsou založeny na počtu konkordantních a diskordantních párů. Jak se určují konkordantní páry při hodnocení shody odpovědí dvou respondentů na sérii otázek s možnými odpověďmi „ano“ nebo „ne“?
Answer
  • Konkordantní páry jsou ty, kde oba respondenti poskytli odpovědi, které se liší o stanovený počet bodů na škále.
  • Konkordantní páry jsou ty, kde jeden respondent odpověděl „ano“ a druhý „ne“ na stejnou otázku.
  • Konkordantní páry jsou ty, ve kterých oba respondenti odpověděli „ano“ nebo oba odpověděli „ne“ na stejnou otázku.
  • Konkordantní páry jsou ty, kde oba respondenti odpověděli s odlišnými odpověďmi na každou otázku.

Question 65

Question
Po dokončení faktorové analýzy na sadě psychologických testů jste extrahovali několik faktorů a vypočítali faktorová skóre pro každého respondenta. Byla použita rotace Varimax. Která z následujících tvrzení nejlépe popisuje očekávanou vlastnost těchto extrahovaných faktorových skóre?
Answer
  • Faktorová skóre jsou korelována mezi sebou, což ukazuje na společnou varianci mezi faktory.
  • Každé faktorové skóre přesně odpovídá pouze jedné původní proměnné z datové sady.
  • Faktorová skóre jsou vždy kladná, protože reprezentují míru, jakým jednotlivci skórují na každém faktoru.
  • Každé faktorové skóre má průměr 0 a směrodatnou odchylku 1, což značí standardizaci v rámci vzorku.
  • Faktorová skóre jsou nezávislá na počtu faktorů extrahovaných během analýzy.

Question 66

Question
Předpokládejme, že analyzujete vztah mezi přísadami hot dogů a jejich chutí. Která z následujících statistik dokládá poměrně silnou souvislost mezi proměnnými Druh masa (která má hodnoty Hovězí, Vepřové a Drůbež) a Chuť (která má hodnoty Špatná a Dobrá)?
Answer
  • Cramerova statistika V, která je blízká 1.
  • Poměr šancí (odds ratio), který je větší než 1.
  • Spearmanova pořadová korelace, která je blízká 1.
  • Goodman-Kruskalovo gamma, které je blízké 1.

Question 67

Question
Vzhledem k informacím v tomto shrnutí výběru proměnných, která metoda postupného výběru byla zvolena?
Answer
  • BACKWARD
  • STEPWISE
  • Není dostatek informací.
  • FORWARD

Question 68

Question
Při provádění faktorové analýzy na sadě proměnných jste vypočítali komunialitu pro jednu specifickou proměnnou a získali hodnotu 0,85. Co tato hodnota indikuje o proměnné ve vztahu k extrahovaným faktorům?
Answer
  • 15 % variability proměnné je vysvětleno extrahovanými faktory, zatímco 85 % je jedinečné pro proměnnou.
  • Komunalita 0,85 znamená, že proměnná je téměř zcela nezávislá na extrahovaných faktorech a měla by být vyřazena z analýzy.
  • Žádná z uvedených možností není správně.
  • 85 % variability proměnné nelze vysvětlit žádným z extrahovaných faktorů.
  • 85 % variability proměnné je vysvětleno všemi extrahovanými faktory dohromady.

Question 69

Question
Čeho se při faktorové analýze dosáhne rotací faktorů?
Answer
  • Zjednodušuje faktorovou strukturu pro lepší interpretaci.
  • Zvětšuje velikost vzorku pro faktorovou analýzu.
  • Snižuje počet pozorovaných proměnných.
  • Transformuje pozorované proměnné na latentní faktory.

Question 70

Question
Jak definujete pojem statistická síla testu?
Answer
  • Pravděpodobnost nezamítnutí nulové hypotézy, pokud je ve skutečnosti nepravdivá.
  • Míra schopnosti testu statistické hypotézy správně zamítnout nulovou hypotézu.
  • Pravděpodobnost, že se dopustíte chyby I. druhu.
  • Pravděpodobnost, že se dopustíte chyby II. druhu.

Question 71

Question
V rámci statistického projektu by Andrea ráda shromáždila údaje o velikosti domácností ve svém městě. Za tímto účelem se zeptá každé osoby ve své třídě na velikost její domácnosti a oznámí, že její vzorek je prostým náhodným výběrem. Nejedná se však o prostý náhodný výběr. Která z následujících možností nejlépe zdůvodňuje tuto otázku?
Answer
  • Andrea nepoužila žádnou randomizaci; provedla účelový výběr.
  • Andrea nezvažovala žádné kontrolní proměnné, které by mohly ovlivnit odpověď.
  • Andrea nepoužila stratifikovaný vzorek.
  • Andrea oslovila spolužáky osobně místo toho, aby je oslovila prostřednictvím sociální sítě.

Question 72

Question
V supermarketech a dokonce i v restauracích je poměrně běžné, že jsou ryby špatně označeny. V následující tabulce jsou uvedeny výsledky studie, při níž byl odebírán náhodný vzorek 156 ryb určených k prodeji a testován. Výzkumníci klasifikovali každý vzorek jako správně označený (properly labeled) nebo nesprávně označený (mislabeled). Jaká část uzených ryb (smoked) ve vzorku byla nesprávně označená? Vyberte nejbližší odpověď.
Answer
  • 18 %
  • 72 %
  • 28 %
  • 78 %
  • 9 %

Question 73

Question
Byla provedena analýza závislosti mezi počtem hodin, které respondent tráví denně sledováním televize (tv1.tvhours), a potenciálními prediktory: věk respondenta (d1_age), vzděláním respondenta vyjádřeném počtem ukončených let vzdělání (d4_educ) a vzděláním otce respondenta vyjádřeném počtem ukončených let vzdělání (d24_paeduc). Jedním z výstupů analýzy je takzvaný Q-Q graf. K čemu slouží?
Answer
  • Rozdělení reziduí modelu srovnávající jejich skutečné rozdělení s teoreticky očekávaným rozdělením, obvykle normálním.
  • Schopnost modelu předpovídat závisle proměnnou na základě nezávisle proměnných.
  • Sílu a směr vztahu mezi nezávislými a závisle proměnnou.
  • Přítomnost nebo absenci heteroskedasticity v reziduích modelu.
  • Variabilitu reziduí modelu a jejich tendenci se zvyšovat nebo snižovat s predikovanými hodnotami.

Question 74

Question
Co o regresním modelu vypovídá histogram v diagnostických grafech níže?
Answer
  • Že odhady modelu jsou zkreslené, konce sloupců histogramu zřetelně převyšují proloženou křivku.
  • Že soubor dat obsahuje vlivná pozorování.
  • Že odhady modelu jsou zkreslené, protože histogram identifikuje problém s kolinearitou.
  • Že chyby odhadu jsou normálně rozděleny.

Question 75

Question
Velká otázka na výběr správného grafu k popisu, tohle je jeden z popisů tak vyber správný graf. Manažer lidských zdrojů použije psychologický průzkum, aby vyhodnotil současnou spokojenost zaměstnanců pomocí skóre spokojenosti.
Answer
  • Histogram.
  • Sloupcový graf a tabulka četností
  • Koláčový graf.
  • Bodový graf.

Question 76

Question
Velká otázka na výběr správného grafu k popisu, tohle je jeden z popisů tak vyber správný graf. Účetní společnost se obává, že zaměstnanci s nízkými platy častěji využívají možnost hrazení drobných výdajů, aby si vynahradili své nízké platy, a chce porovnat mzdy a náhrady drobných výdajů.
Answer
  • Sloupcový graf a tabulka četností.
  • Histogram.
  • Koláčový graf.
  • Bodový graf.

Question 77

Question
Velká otázka na výběr správného grafu k popisu, tohle je jeden z popisů tak vyber správný graf. Marketingový manažer chce pro ředitele připravit zprávu ilustrující počet reklam umístěných na různých televizních kanálech, v novinách a na internetových stránkách. Má k dispozici počty pro jednotlivá místa.
Answer
  • Histogram.
  • Sloupcový graf a tabulka četností.
  • Koláčový graf.
  • Bodový graf.

Question 78

Question
Velká otázka na výběr správného grafu k popisu, tohle je jeden z popisů tak vyber správný graf. Manažer prodeje chce porovnat měsíční úroveň prodeje všech svých prodejců jako podíl na celkovém prodeji celé společnosti.
Answer
  • Histogram.
  • Sloupcový graf a tabulka četností.
  • Koláčový graf.
  • Bodový graf.

Question 79

Question
Představte si, že máte dendrogram zobrazující výsledky hierarchického shlukování deseti různých bodů. Na horizontální ose jsou označeny body od 1 do 10, a vertikální osa měří vzdálenost nebo podobnost. Ve vzdálenosti 5 na vertikální ose lze vidět, že celý dendrogram se dělí na dvě hlavní větve. Jak byste interpretovali tuto informaci?
Answer
  • Vzdálenost 5 na dendrogramu neindikuje nic zvláštního o počtu shluků nebo struktuře dat.
  • Výsledky shlukové analýzy nejsou použitelné, data nebylo možné vůbec seskupit.
  • Dendrogram ukazuje, že všechny body jsou si velmi podobné, protože existují pouze dvě hlavní skupiny.
  • Dendrogram indikuje, že nejvhodnější počet shluků pro data je dvě, jelikož máme deset bodů.
  • Ve vzdálenosti 5 od sebe můžeme rozlišit dva hlavní shluky, což naznačuje, že by bylo vhodné rozdělit data do dvou skupin.

Question 80

Question
Které z následujících tvrzení nejlépe popisuje nulovou statistickou hypotézu?
Answer
  • Nulová statistická hypotéza je metoda pro výpočet pravděpodobnosti.
  • Nulová statistická hypotéza potvrzuje výzkumnou hypotézu bez jakýchkoliv testů.
  • Nulová statistická hypotéza tvrdí, že mezi pozorovanými daty existuje významný rozdíl.
  • Nulová statistická hypotéza je předpoklad, že mezi skupinami neexistují žádné rozdíly nebo vztahy.

Question 81

Question
Který z následujících statistických testů se používá k posouzení vhodnosti dat pro faktorovou analýzu?
Answer
  • t test
  • Bartlettův test sféricity
  • scree test
  • z test
  • ANOVA

Question 82

Question
Co označují standardizované regresní koeficienty (standardized estimates) ve vícenásobné lineární regresi?
Answer
  • Míru změny závislé proměnné v jednotkách nezávislých proměnných.
  • Rozdíl v průměrných hodnotách závislé proměnné pro různé kategorie nezávislých proměnných.
  • Relativní důležitost každé nezávislé proměnné ve vztahu k závislé proměnné, když jsou všechny proměnné měřeny ve směrodatných odchylkách.
  • Absolutní velikost každého regresního koeficientu bez ohledu na měřítko nezávislých proměnných.

Question 83

Question
Která vícerozměrná statistická metoda patří do metod internální analýzy?
Answer
  • Kanonická korelační analýza
  • Faktorová analýza
  • Vícenásobná regresní analýza
  • Diskriminační analýza

Question 84

Question
Při analýze dat o vztahu mezi kouřením a výskytem určitého zdravotního problému byl použit chí-kvadrát test na data zaznamenaná v kontingenční tabulce. Jak správně formulujete nulovou a alternativní hypotézu pro tento test?
Answer
  • Nulová hypotéza (H₀): Frekvence kouření a nekouření jsou stejné u jedinců s daným zdravotním problémem. Alternativní hypotéza (H₁): Frekvence kouření a nekouření se liší u jedinců s daným zdravotním problémem.
  • Nulová hypotéza (H₀): Existuje vztah mezi kouřením a výskytem zdravotního problému. Alternativní hypotéza (H₁): Neexistuje žádný vztah mezi kouřením a výskytem zdravotního problému.
  • Nulová hypotéza (H₀): Kouření způsobuje zdravotní problém. Alternativní hypotéza (H₁): Kouření nezpůsobuje zdravotní problém.
  • Nulová hypotéza (H₀): Neexistuje žádný vztah mezi kouřením a výskytem zdravotního problému. Alternativní hypotéza (H₁): Existuje vztah mezi kouřením a výskytem zdravotního problému.

Question 85

Question
Provedli jste první fázi faktorové analýzy s následujícím výsledkem uvedeným v tabulce. Jako vstup byla použita korelační matice. Tabulka ukazuje vlastní čísla 16 faktorů, které vysvětlují 100 % variability původních proměnných. Jakou část variability vysvětlují první tři faktory?
Answer
  • 40,21 %
  • 52,81 %
  • 6,71 %
  • 29,77 %
  • 6,58 %
Show full summary Hide full summary

Similar

Teorie Statistika 2018
Milana Semenova
Teorie Statistika 2018 - ano/ne
Milana Semenova
Diskretne slucajne spremenljivke
Aleksandra Franc
Lekce 10: Časové řady
Daniil Filatov
Lekce 11: Indexy
Daniil Filatov
stat 1-50
Mitsuki Mitsu
Statistika mõisted
Tiina Vilberg