Title: Statistiliste h
1Statistiliste hüpoteeside kontrollimine
2Statistilised hüpoteesid
Statistiliseks hüpoteesiks nimetatakse teatud
teineteist välistavate väidete paari
üldkogumi(te) või tema parameetrite kohta.
Statistilisteks hüpoteesideks võivad olla näiteks
oletused
1) jaotusseaduse tüübi kohta
2) kahe jaotuse parameetrite võrdsusest või
olulisest erinevusest
3) Juhuslike suuruste vahelise lineaarse seose
olemasolust või puudumisest.
3Alternatiivsete hüpoteeside paar
H0 nullhüpotees, mis tavaliselt väljendab
uurijat mittehuvitavat juhtu (üldkogumi vastamine
teatud standardile). Nullhüpoteesi ei ole
võimalik tõestada. Selle vastuvõtmine tähendab,
et kui uurija tahab mingit erinevust, mõju või
seose olemasolu tõestada, siis tuleb tal mõõtmisi
jätkata.
H1 sisukas e. alternatiivne e. konkureeriv
hüpotees, mida uurija soovib tõestada (
tavaliselt mingi erinevuse, mõju või seose
olemasolu).
4Statistilise hüpoteesi kontrollimine
Hüpoteeside kontrollimisel püütakse tõestada
sisukas hüpotees nullhüpoteesi kummutamise teel.
Selleks arvutatakse valimi andmete põhjal teatud
teststatistik, mille teoreetiline jaotus
nullhüpoteesi kehtivuse korral on teada.
Juhul kui leitud teststatistiku väärtus on
ebatõenäoline, võrreldes tema teoreetilise
jaotusega, loetakse nullhüpotees kummutatuks ja
sisukas hüpotees tõestatuks.
Kui sisukat hüpoteesi tõestada ei õnnestu,
jäädakse nullhüpoteesi juurde, mis võib tähendada
nii seda, et 1) olukord vastas nullhüpoteesile
kui ka seda, et 2) valimi maht oli liiga väike
sisuka hüpoteesi tõestamiseks.
5Vead hüpoteeside kontrollimisel
Kuna statistiliste hüpoteeside kontrollimisel
tehakse valimi põhjal järeldusi üldkogumi kohta,
on võimatu vältida vigu. Vigu saab olla kaht
liiki.
1. Esimest liiki viga tekib siis, kui võetakse
vastu sisukas hüpotees, aga tegelikult on õige
nullhüpotees.
See on raske viga, mis tähendab, et uurija
tõestas erinevuse, mõju või seose mida
tegelikult ei ole, vaid mis juhuslikult ilmnes
mõõdetud valimis.
2. Teist liiki viga tekib siis, kui jäädakse
nullhüpoteesi juurde, ehkki tegelikult on õige
sisukas hüpotees.
See on kergem viga, mis enamasti tähendab, et
soovitu tõestamiseks tuleb mõõtmisandmeid juurde
koguda.
6Olulisuse nivoo e. riskiprotsent
Esimest liiki vead on sageli ohtlikud vead, mille
tegemist tuleks võimalikult vältida.
Esimest liiki vea tegemise suurimat lubatavat
tõenäosust nimetatakse olulisuse nivooks e.
riskiprotsendiks.
Olulisuse nivood tähistatakse tähega a.
Olulisuse nivooks valitakse mingi väike arv,
sageli 0,1 0,05 0,01 (sõltuvalt selles, kui
rasketele tagajärgedele võib 1. liiki vea
tegemine viia).
7Kriitilised väärtused (punktid)
Statistiliste hüpoteeside kontrollimine toimub
tavaliselt vahemikhinnangute kaudu.
Olgu näiteks nullhüpoteesiks see, et hinnatav
parameeter z omab etteantud väärtuse z0.
Seega H0 z z0
Alternatiivne hüpotees H1 z ? z0.
Leiame parameetri a jaoks usaldusvahemiku (zal ,
zül), nii et
Kui antud z0 väärtus satub sellesse vahemikku,
loeme nullhüpoteesi õigeks vastasel juhul on
õige aga alternatiivne hüpotees. Usalduspiire zal
, zül nimetatakse hüpoteesi H0 kriitilisteks
väärtusteks e. kriitilisteks punktideks.
8Statistiline kriteerium
Üldisemalt Nullhüpoteesi kontrollimiseks
moodusatatakse teatud juhuslik suurus Z
(statistiline kriteerium), mille täpne või
ligikaudne jaotus on teada.
Statistilise kriteeriumi Z võimalike väärtuste
hulk jagatakse kriitiliste punktide zkr abil
kaheks mittelõikuvaks alamhulgaks
1) kriitiliseks piirkonnaks kui kriteeriumi
väärtus satub kriitilisse piirkonda, siis
lükatakse nullhüpotees tagasi
2) ülejäänud piirkonnaks kui kriteeriumi väärtus
satub sellesse piirkonda, siis pole alust
nullhüpotees tagasi lükata.
9Parempoolne kriitiline piirkond
Kriitilised piirkonnad jagunevad
1) parempoolne kriitiline piirkond kriitiline
punkt zkr leitakse nii, et
Kasutatakse hüpoteeside paari
kontrollimiseks.
Tabelite põhjal leitakse kriitiline punkt zkr
valimi(te) põhjal leitakse teststatistiku
empiiriline väärtus zemp.
Kui zemp gt zkr, siis lükatakse nullhüpotees
tagasi.
Kui zemp ? zkr, siis jäädakse nullhüpoteesi
juurde.
10Vasakpoolne kriitiline piirkond
2) vasakpoolne kriitiline piirkond kriitiline
punkt zkr leitakse nii, et
Kasutatakse hüpoteeside paari
kontrollimiseks.
Kui zemp lt zkr, siis lükatakse nullhüpotees
tagasi.
Kui zemp ? zkr, siis jäädakse nullhüpoteesi
juurde.
11Kahepoolne kriitiline piirkond
3) kahepoolne kriitiline piirkond jääb ühest
kriitilisest punktist z1 vasakule ja teisest
kriitilisest punktist z2 paremale. Kriitilised
punktid leitakse enamasti tingimustest
Kasutatakse hüpoteeside paari
kontrollimiseks.
Kui zemp lt z1 või zemp gt z2, siis lükatakse
nullhüpotees tagasi
Kui z1 ? zemp ? z2 siis jäädakse nullhüpoteesi
juurde.
12Näide
Antud keemiline protsess kulgeb optimaalselt, kui
kasutatava lahuse pH on 8,30. Tehti 5 pH
mõõtmist, mille tulemuseks osutusid 8,29 8,30
8,31 8,30 8,32. Kas võib nende andmete põhjal
5-lise eksimisriskiga lugeda lahuse pH võrdeks
8,30-ga?
Lahendus.
Nullhüpoteesiks H0 olgu väide, et lahuse pH
8,30.
Alternatiivne hüpotees H1 pH ? 8,30.
Arvutame pH keskväärtuse jaoks usaldusvahemiku
valemi
kohaselt .
Valimi andmetel
13Näide