Title: Wyklad 11 Analiza wariancji (ANOVA)
1Wyklad 11Analiza wariancji (ANOVA)
- Sposób analizy danych gdy mamy wiecej niz dwa
zabiegi lub populacje. - Omówimy ANOV-e w najprostszej postaci.
- Te same podstawowe zalozenia/ograniczenia co przy
tescie Studenta - W kazdej populacji badana cecha ma rozklad
normalny - Obserwacje sa niezalezne i losowe
- Bedziemy testowali hipotezy o srednich w
populacjach - ?i
- Zalozenie standardowe odchylenia badanej cechy
w kazdej populacji sa sobie równe (podobne) wiec
mozemy uzyc usrednionego SE
2- Uwaga ANOVA moze byc stosowana takze gdy próby
nie sa niezalezne - Np. W ukladzie zrandomizowanym blokowym
- (zasada podobna do testu Studenta dla powiazanych
par) - Nie bedziemy tego omawiac. Omówimy tylko uklady
zupelne zrandomizowane. - Cel
- Testujemy hipotezy postaci
- H0 ?1 ?2 ?3 ?k
- HA nie wszystkie srednie sa równe
3Dlaczego nie stosujemy wielu testów Studenta?
- Wielokrotne porównania
- P-stwo bledu pierwszego rodzaju (p - stwo
odrzucenia prawdziwej hipotezy) jest trudne do
kontrolowania)
4Korekta Bonferoniego
- Prosta ale na ogól konserwatywna (p-stwo bledu
pierwszego rodzaju mniejsze niz zalozone strata
mocy).
5- Estymacja bledu standardowego
- ANOVA wykorzystuje informacje zawarta we
wszystkich obserwacjach zwykle daje wieksza
precyzje
6Notacja k 3 zabiegi (próby, grupy)
Zabieg 1 Zabieg 2 Zabieg 3
1 48 40 39
2 39 48 30
3 42 44 32
4 43 35
srednia 43 44 34
SS 42 32 46
7- Trzy rodzaje rachunków
- Wewnatrz grup, pomiedzy grupami, calkowite.
- Liczymy trzy wartosci SS, df, MS
SS df MS
Between
Within
Total
8Notacja
k grup (prób, zabiegów) k
n1, n2, n3, , nk rozmiary grup ( obserwacji) n1 , n2 , n3
?y1 , ?y2, ?yk srednie w grupach ?y1 ,?y2 , ?y3
calkowita srednia
n calkowita liczba obserwacji n
9- Dwa podstawowe typy rachunków
- (gdzie konieczne, bedziemy uzywali i do
indeksowania grup a j do indeksowania obserwacji
w kazdej grupie yij ) - Wewnatrz kazdej grupy
- oznacza sume wewnatrz grupy
-
10- Uwzgledniajace wszystkie grupy
- oznacza sume we wszystkich grupach
- np. n
- i
-
11- UWAGA Gdy rozmiary prób nie sa równe
-
- nie jest srednia z k srednich!!!
- Ale mozna ja obliczyc jako
- (n1?y1 n2?y2 n3?y3) / n
12Wewnatrz grup (wypelniamy drugi rzad w tabeli)
- Suma kwadratów wewnatrz grup (SSW)
- Liczymy SS wewnatrz kazdej grupy
- (itd. - SS2,
SS3 , ) - SS1
- SS2 32, SS3 46
13- SSW SS1SS2SSk
- SSW
- Stopnie swobody wewnatrz grup
- dfw n - k dfw
- Srednia suma kwadratów wewnatrz grup
- MSW SSW / dfw MSW
- To samo co usredniona wariancja
- Dla przypomnienia dla
dwóch prób
14- Usrednione standardowe odchylenie
- sc
- Pomiedzy grupami (wypelniamy pierwszy rzad
tabeli) - Porównujemy srednie grupowe do sredniej
calkowitej - Wazone przez rozmiar grupy
- Suma kwadratów pomiedzy grupami (SSB)
- SSB
-
- SSB
15- Stopnie swobody pomiedzy grupami (dfb)
- dfb k 1 dfb
- Srednia suma kwadratów pomiedzy grupami (MSB)
- MSB SSB/dfb MSB
- Calkowite
- Calkowita suma kwadratów (SST)
- SST
SST8212228252348
16- Uwaga SST SSWSSB 348 120 228
- Zwykle nie trzeba liczyc SST z definicji
- Calkowita liczba stopni swobody (dft)
- dft n 1 dft
- Uwaga dft dfbdfw 10 2 8
17Tablica ANOV-y
SS df MS
Between
Within
Total
18Ta tabela bedzie dostepna na kolokwium i
egzaminie
SS df MS
Pomiedzy SSB dfb k 1 SSB/dfb
Wewnatrz SSW dfw n k SSW/dfw
Calkowite SST dft n 1
19Test F
- Dane dla k ? 2 populacji lub zabiegów sa
niezalezne - Dane w kazdej populacji maja rozklad normalny ze
srednia ?i dla populacji i, i tym samym
odchyleniem standardowym ?
20- Testujemy H0 ?1 ?2 ?3 ?k (wszystkie
srednie sa sobie równe) - vs.
- HA nie wszystkie srednie sa sobie równe
- (HA jest niekierunkowa ale obszar odrzucen bedzie
jednostronny) - Kroki
- Obliczenie tabeli ANOV-y
- Testowanie
21Jak opisac F test
- Zdefinowac wszystkie ?
- H0 podac za pomoca wzoru i slownie
- HA tylko slownie
- Statystyka testowa Fs MSB/MSW
- przy H0, Fs ma rozklad Snedecora z dfb, dfw
stopniami swobody - Na kolejnych slajdach podane sa wartosci
krytyczne z ksiazki D.S. Moore i G. P. McCabe
Introduction to the Practice of Statistics - "numerator df" dfb i
- "denominator df" dfw.
22(No Transcript)
23(No Transcript)
24(No Transcript)
25(No Transcript)
26- Odrzucamy H0 gdy zaobserwowane Fs gt Fkrytyczne
- Przykladowy wniosek - Na poziomie istotnosci a
(nie) mamy przeslanki aby twierdzic, ze grupy
róznia sie poziomem badanej cechy.
27- Przyklad Losowa próbe 15 zdrowych mezczyzn
podzielono losowo na 3 grupy skladajace sie z 5
mezczyzn. Przez tydzien otrzymywali oni lekarstwo
Paxil w dawkach 0, 20 i 40 mg dziennie. Po tym
czasie zmierzono im poziom serotoniny. - Czy Paxil wplywa na poziom serotoniny u zdrowych,
mlodych mezczyzn ? - Niech ?1 bedzie srednim poziomem serotoniny u
mezczyzn przyjmujacych 0 mg Paxilu. - Niech ?2 bedzie srednim poziomem serotoniny u
mezczyzn przyjmujacych 20 mg Paxilu. - Niech ?3 bedzie srednim poziomem serotoniny u
mezczyzn przyjmujacych 40 mg Paxilu.
28- H0 ?1 ?2 ?3 sredni poziom serotoniny nie
zalezy od dawki Paxilu - HA sredni poziom serotoniny nie jest ten sam we
wszystkich grupach (albo sredni poziom serotoniny
zalezy od dawki Paxilu). - Zastosujemy F-Test
29(No Transcript)
30- Fs MSB / MSW przy H0 ma rozklad
- Testujemy na poziomie istotnosci ? 0.05.
Wartosc krytyczna F.05 . - Obserwujemy Fs
- Wniosek
31Na jakiej zasadzie to dziala ?
- Dla przypomnienia
- Test Studenta patrzy na róznice miedzy srednimi
(?y1-?y2) - Dzieli ja przez miare rozrzutu tej róznicy
(SE?y1-?y2 ) - Jezeli (?y1-?y2) jest duze w porównaniu do bledu
standardowego to statystyka testu Studenta jest
duza i odrzucamy H0.
32- Dla testu F,
- Liczymy usredniony kwadrat róznicy miedzy
srednimi (MSB) - Dzielimy go przez oszacowanie zróznicowania w
próbie (MSW) - Jezeli MSB jest duze w porównaniu do MSW wówczas
statystyka testu F jest duza i odrzucamy H0. - Test F jest analogiczny do testu Studenta ale
umozliwia jednoczesne porównanie kilku srednich.
33- Test F mozna stosowac równiez gdy mamy tylko dwie
próby - Statystyka testu F dla dwóch prób jest równa
kwadratowi statystyki testu Studenta - Decyzje i p-wartosci sa dokladnie takie same dla
obu testów.