Skriptá ke Statistickým metódam
Popis:
Cílem průzkumové analýzy dat (také známé pod zkratkou EDA - z anglického názvu exploratory data analysis) je nalezení zvláštností statistického chování dat a ověření jejich předpokladů pro následné statistické zpracování (MELOUN - MILIT-KÝ 1994).
Proč tyto vlastnosti potřebujeme zkoumat? Většina běžně používaných statistic-kých metod předpokládá určité vlastnosti zpracovávaných souborů nebo výběrů, nej-důležitější z nich jsou následující:
• minimální rozsah výběru,
• normalita (tj. splnění předpokladu, že výběr pochází ze základního souboru s normálním rozdělením),
• absenci silně vychýlených hodnot,
• vzájemná nezávislost prvků výběru.
Klíčová slova:
statistika
analýza
soubor
průzkum
analýza
Obsah:
- 8 Průzkumová analýza dat 1
8.1 Základní grafické metody průzkumové analýzy dat 3
8.1.1 Graf rozptýlení 4
8.1.2 Krabicový graf 5
8.1.3 Vrubový krabicový graf 5
8.1.4 Graf rozptýlení s kvantily 6
8.1.5 Kvantil - kvantilový graf (q-q graf) 7
8.1.6 Graf hustoty pravděpodobnosti 8
8.2 Ověření předpokladů o datech 18
8.2.1 Určení minimální velikosti výběru 18
8.2.2 Ověření normality výběru 18
8.2.3 Ověření předpokladu nezávislosti prvků výběru 21
8.2.4 Ověření homogenity výběru 21
8.3 Transformace dat 28
9 Analýza rozptylu (anova) 33
9.1 Jednofaktorová analýza rozptylu 35
9.1.1 Základní model a výpočet tabulky analýzy rozptylu 35
9.1.2 Mnohonásobná porovnání 37
9.1.2.1 Tukeyho metoda mnohonásobného porovnání 39
9.1.2.2 Scheffeho metoda mnohonásobného porovnání 40
9.1.2.3 Dunnettova metoda mnohonásobného porovnání s kontrolou 40
9.2 Dvoufaktorová analýza rozptylu 46
9.2.1 Základní model dvoufaktorové analýzy rozptylu a její varianty 46
9.2.2 Dvoufaktorová anova s opakováním a vyváženým modelem 47
9.2.3 Dvoufaktorová anova s opakováním a nevyváženým modelem 54
9.2.4 Dvoufaktorová anova bez opakování měření 54
9.2.5 Využití analýzy rozptylu v plánování pokusů 58
9.2.5.1 Uspořádání základních pokusných plánů 58
9.2.5.2 Vyhodnocení základních pokusných plánů 60
9.3 Neparametrická anova 63
9.3.1 Kruskal-wallisův test (k-w test) 63
9.3.2 Dvoufaktorová neparametrická anova 67
10 Korelační a regresní analýza 71
10.1 Vícerozměrný statistický soubor 71
10.2 Statistická závislost a korelace 72
10.3 Formulace korelačních a regresních modelů 75
10.3.1 Korelační modely 76
10.3.2 Regresní modely 76
10.4 Korelační analýza lineárního modelu 78
10.4.1 Korelační koeficient 78
10.4.1.1 Párový korelační koeficient 80
10.4.1.2 Mnohonásobný korelační koeficient 85
10.4.1.3 Parciální korelační koeficient 86
10.5 Regresní analýza lineárního modelu 90
10.5.1 Základní tvar lineárního regresního modelu 90
10.5.2 Metoda nejmenších čtverců (mnč) 92
10.5.2.1 Princip mnč 92
10.5.2.2 Předpoklady metody nejmenších čtverců 97
10.6 Intervalové odhady parametrů korelace a regrese 99
10.6.1 Intervalový odhad korelačního koeficientu 100
10.6.2 Intervalové odhady regresních koeficientů 102
10.6.3 Intervalový odhad regresního modelu 104
10.6.4 Intervalový odhad měřených hodnot (pás spolehlivosti) 104
10.7 Testování statistických hypotéz v korelační a regresní analýze 106
10.7.1 Test významnosti korelačního koeficientu 107
10.7.2 Test významnosti regresního modelu jako celku 107
10.7.3 Test významnosti jednotlivých regresních koeficientů 108
10.7.4 Testy shody jednoho, dvou a více korelačních koeficientů 112
10.7.4.1 Test shody korelačního koeficientu se zadanou hodnotou (normou) 112
10.7.4.2 Test shody dvou korelačních koeficientů 112
10.7.4.3 Test shody více korelačních koeficientů 113
10.7.5 Testy shody regresních modelů 115
10.7.5.1 Test shody empirického a teoretického modelu přímky 115
10.7.6 Test shody dvou lineárních modelů 118
10.7.7 Test vhodnosti lineárního modelu 121
10.7.8 Test závažnosti multikolinearity 123
10.8 Regresní diagnostika 125
10.8.1 Analýza reziduí 125
10.8.2 Posouzení kvality dat 126
10.8.2.1 Analýza prvků projekční matice 127
10.8.2.2 Grafy identifikace vlivných bodů 127
10.8.3 Posouzení kvality navrženého regresního modelu 130
10.8.3.1 Parciální regresní grafy 130
10.8.3.2 Parciální reziduální grafy 132
10.8.4 Ověření předpokladů mnč 132
10.8.4.1 Heteroskedasticita 133
10.8.4.2 Autokorelace 133
10.8.4.3 Normalita chyb 134
10.8.5 Stanovení vhodného regresního modelu na příkladu 134
10.9 Nelineární regrese 138
11 Použitá a doporučená literatura (pro i. i ii.díl) 143
Zdroje:
- ANDĚL, J., 1978: Matematická statistika. Praha, SNTL -Alfa .
- BENEDÍK, J., 1989: Biostatistika. Brno, UJEP, 233 s.
- CIPRA, T., 1986: Analýza časových řad s aplikacemi v ekonomii. Praha, SNTL-Alfa
- CYHELSKÝ, L., NOVÁK,I., 1967: Statistika. Praha, SNTL, 288 s.
- ČERMÁK, V., 1968: Statistika. Praha, SNTL, 208 s.
- DRÁPELA, K., ZACH, J., 1995: Dendrometrie (dendrochronologie). Skriptum MZLU Brno, 152 s.
- DRÁPELA, K. ZACH, J., 1996: Biometrie (biostatistika) - vybrané části, Skriptum MZLU Brno, 153 s.
- GROFÍK, R. a kol., 1987: Štatistika. Bratislava, Príroda, 520 s.
- HALD, A., 1956: Matematičeskaja statistika s techničeskimi priloženijami. Moskva, Izdavatělstvo inostrannoj litertury, 664 s.
- HÁTLE, J., LIKEŠ, J., 1972: Základy počtu pravděpodobnosti a matematické statistiky, Praha, SNTL, 464 s.
- HAVRÁNEK, T. 1993: Statistika pro biologické a lékařské vědy. Academia, Praha.
- HEBÁK, P., KAHOUNOVÁ, J., 1988: Počet pravděpodobnosti v příkladech. SNTL, Praha, 312 s.
- CHAMBERS. J.M. a kol., 1983: Graphical Methods for Data Analysis. Belmont, Duxburry Press.
- CHATFIELD, C., 1984: The Analysis of Time Series. An Introduction. London, Chapman and Hall, 286 s.
- KENDALL, M. G., STUART, A. 1966: The Advanced Theory of Statistics. New York.
- KUBÁČEK, L., PÁZMAN, A., 1979: Štatistické metódy v meraní. Bratislava, Veda, 148 s.
- LAAR, A., 1979: Biometrische Methoden in der Forstwissenschaft. München, 633 s.
- LEPORSKÝ, A., 1953: Statistické metody. Učební texty vysokých škol. Lesnická fakulta VŠZ Brno, SPN, Praha
- MEAD, R. 1988: The design of experiments. Statistical pronciples for practical application. Cambridge Uneversity Press, Cambridge.
- MELOUN, M., MILITKÝ, J., 1994: Statistické zpracování experimentálních dat. Praha, Plus, 839 s.
O souborech cookie na této stránce
Soubory cookie používáme pro funkční účely, pro shromažďování a analýzu informací o výkonu a používání stránky.