Title: MET 2211 Statistikk og dataanalyse
1MET 2211Statistikk og dataanalyse
- Forelesning 25.09.2003
- Repetisjon, del I
- Metode
2Hovedparadigme
Populasjon
Stikkprøve
Tilfeldig utvalg
3Konfidensintervallfor medianen
- Bestem konfidensnivået
- For eksempel 1 2a 95
- Finn c i tabell 3b
- Finn x(c) og x(c)
4Ensidige og tosidige konfidensintervall
Tosidig intervall
Høyregrenseintervall
Venstregrenseintervall
Sannsynligheten for å havne utenfor en grense a
5Tellinger og målinger
- Dr. Salks observasjoner er et eksempel på
tellinger
- Målinger gir verdier på en tallinje
6Objektivitet
- Spørsmålsformulering bør være så objektiv som
mulig - En objektiv fremstilling
- danner holdninger eller oppfatninger hos
mottakeren - som ikke forandres
- dersom man tar med flere faktiske opplysninger
7Måleskalaer
- Nominalskala
- Kategorisk variabel
- Tellinger
- Eks. kjønn
- Ordinalskala
- Rangering
- Eks. Hva foretrekker du?
- Intervallskala
- Metrisk skala
8Binomialfordelingen
- Sannsynligheten for å få nøyaktig a vellykkete
utfall i en serie på n identiske og uavhengige
forsøk der sannsynligheten for at et tilfeldig
forsøk skal bli vellykket er p
9Den hypergeo-metriske fordeling
- n elementer trekkes uordnet og uten
tilbakelegning fra en populasjon med N elementer
hvorav A er Riktige og resten Gale.
Sannsynligheten for å få nøyaktig a Riktige i
utvalget er
10Hypoteseprøving
- Nullhypotese H0
- Skeptikerens utgangspunkt. Den hypotesen som skal
prøves - Alternativ hypotese H1
- Det spennende alternativet som vi kanskje kan bli
overbevist om - Signifikansnivå (for eksempel 5)
- Den maksimale sannsynlighet for å feilaktig
forkaste nullhypotesen - Denne fastsettes av oss, Ensidig test a 5,
tosidig test 2 a 5 - Testobservator T den størrelse som observeres
- Vi må kjenne Ts fordeling når H0 er riktig
- Kritisk verdi c T må overskride c (nede eller
oppe) for å forkaste H0 - Signifikanssannsynlighet p-verdi
- Ensidig test Halesannsynligheten fra og med T
- Tosidig test 2Halesannsynligheten fra og med T
- Forkast H0 hvis p-verdien er mindre enn
signifikansnivået
11Hypoteseprøvinggrafisk
Kurven viser fordelingen til T under H0 Under
H0 venter vi at T skal havne et sted på
midten. Havner den langt til venstre, (ensidig
test) er det vanskelig å tro på nullhypotesen. c
er kritisk verdi, bestemt av signifikansnivået a
a
T
c
12Aktuelle ikke-parametriske tester
- Binomisk test
- Data Ja-er og Nei-er
- Én kategorisk variabel med to kategorier
- H0 p p0. T er binomial-fordelt under H0
(Antall JA) - Mediantesten
- Data n målinger av x
- Svarer til binomisk test med p0 1/2
- Fortegnstesten
- Data n plusser og minuser
- Svarer til binomisk test med p0 1/2
- Wilcoxons tegnrangtest
- Data n differanser
- Fra to relaterte stikkprøver
- En sterkere test enn fortegnstesten
- Tabell 8b
- Mann-Whitneytesten
- Data to uavhengige stikkprøver med målinger
- Sammenligner to medianer
- Tabell 4b
13Mindre aktuelle ikke-parametriske tester
- Kruskal-Wallis
- Data n uavhengige stikkprøver med målinger
- En direkte utvidelse av Mann-Whitneytesten som
bare har to stikkprøver - Fishers eksakte test
- Data 22-tabeller med tellinger
- Vi har for eksempel en tabell over hvor mange som
røyker og ikke røyker av henholdsvis jenter og
gutter, og ønsker å finne ut om det er
signifikant sammenheng mellom kjønn og røyking.
- Fisher
- H0 p1 p2. Dvs røykeandelen er lik hos jenter
og gutter. - Vi skal senere lære en tilnærmelse til Fishers
eksakte test som kan brukes når vi har mange
observasjoner
Det kreves ikke operative kunnskaper om disse
testene men du skal vite når de er aktuelle
14Oppgaver
- 7-4 Studenters røykevaner, våre data
- 7-6 Dekktrykk
- 8-1 Priser på bilverksted
- 8-2 Menn og kvinners puls, og med våre data
- 8-6 Bruktbilpriser