MET 2211 Statistikk og dataanalyse - PowerPoint PPT Presentation

About This Presentation
Title:

MET 2211 Statistikk og dataanalyse

Description:

MET 2211 Statistikk og dataanalyse Forelesning 25.09.2003 Repetisjon, del I Metode – PowerPoint PPT presentation

Number of Views:34
Avg rating:3.0/5.0
Slides: 15
Provided by: Default
Category:

less

Transcript and Presenter's Notes

Title: MET 2211 Statistikk og dataanalyse


1
MET 2211Statistikk og dataanalyse
  • Forelesning 25.09.2003
  • Repetisjon, del I
  • Metode

2
Hovedparadigme
Populasjon



Stikkprøve

Tilfeldig utvalg
3
Konfidensintervallfor medianen
  • Bestem konfidensnivået
  • For eksempel 1 2a 95
  • Finn c i tabell 3b
  • Finn x(c) og x(c)



4
Ensidige og tosidige konfidensintervall
Tosidig intervall
Høyregrenseintervall
Venstregrenseintervall
Sannsynligheten for å havne utenfor en grense a
5
Tellinger og målinger
  • Dr. Salks observasjoner er et eksempel på
    tellinger
  • Målinger gir verdier på en tallinje

6
Objektivitet
  • Spørsmålsformulering bør være så objektiv som
    mulig
  • En objektiv fremstilling
  • danner holdninger eller oppfatninger hos
    mottakeren
  • som ikke forandres
  • dersom man tar med flere faktiske opplysninger

7
Måleskalaer
  • Nominalskala
  • Kategorisk variabel
  • Tellinger
  • Eks. kjønn
  • Ordinalskala
  • Rangering
  • Eks. Hva foretrekker du?
  • Intervallskala
  • Metrisk skala

8
Binomialfordelingen
  • Sannsynligheten for å få nøyaktig a vellykkete
    utfall i en serie på n identiske og uavhengige
    forsøk der sannsynligheten for at et tilfeldig
    forsøk skal bli vellykket er p

9
Den hypergeo-metriske fordeling
  • n elementer trekkes uordnet og uten
    tilbakelegning fra en populasjon med N elementer
    hvorav A er Riktige og resten Gale.
    Sannsynligheten for å få nøyaktig a Riktige i
    utvalget er

10
Hypoteseprøving
  • Nullhypotese H0
  • Skeptikerens utgangspunkt. Den hypotesen som skal
    prøves
  • Alternativ hypotese H1
  • Det spennende alternativet som vi kanskje kan bli
    overbevist om
  • Signifikansnivå (for eksempel 5)
  • Den maksimale sannsynlighet for å feilaktig
    forkaste nullhypotesen
  • Denne fastsettes av oss, Ensidig test a 5,
    tosidig test 2 a 5
  • Testobservator T den størrelse som observeres
  • Vi må kjenne Ts fordeling når H0 er riktig
  • Kritisk verdi c T må overskride c (nede eller
    oppe) for å forkaste H0
  • Signifikanssannsynlighet p-verdi
  • Ensidig test Halesannsynligheten fra og med T
  • Tosidig test 2Halesannsynligheten fra og med T
  • Forkast H0 hvis p-verdien er mindre enn
    signifikansnivået

11
Hypoteseprøvinggrafisk
Kurven viser fordelingen til T under H0 Under
H0 venter vi at T skal havne et sted på
midten. Havner den langt til venstre, (ensidig
test) er det vanskelig å tro på nullhypotesen. c
er kritisk verdi, bestemt av signifikansnivået a
a
T
c
12
Aktuelle ikke-parametriske tester
  • Binomisk test
  • Data Ja-er og Nei-er
  • Én kategorisk variabel med to kategorier
  • H0 p p0. T er binomial-fordelt under H0
    (Antall JA)
  • Mediantesten
  • Data n målinger av x
  • Svarer til binomisk test med p0 1/2
  • Fortegnstesten
  • Data n plusser og minuser
  • Svarer til binomisk test med p0 1/2
  • Wilcoxons tegnrangtest
  • Data n differanser
  • Fra to relaterte stikkprøver
  • En sterkere test enn fortegnstesten
  • Tabell 8b
  • Mann-Whitneytesten
  • Data to uavhengige stikkprøver med målinger
  • Sammenligner to medianer
  • Tabell 4b

13
Mindre aktuelle ikke-parametriske tester
  • Kruskal-Wallis
  • Data n uavhengige stikkprøver med målinger
  • En direkte utvidelse av Mann-Whitneytesten som
    bare har to stikkprøver
  • Fishers eksakte test
  • Data 22-tabeller med tellinger
  • Vi har for eksempel en tabell over hvor mange som
    røyker og ikke røyker av henholdsvis jenter og
    gutter, og ønsker å finne ut om det er
    signifikant sammenheng mellom kjønn og røyking.
  • Fisher
  • H0 p1 p2. Dvs røykeandelen er lik hos jenter
    og gutter.
  • Vi skal senere lære en tilnærmelse til Fishers
    eksakte test som kan brukes når vi har mange
    observasjoner

Det kreves ikke operative kunnskaper om disse
testene men du skal vite når de er aktuelle
14
Oppgaver
  • 7-4 Studenters røykevaner, våre data
  • 7-6 Dekktrykk
  • 8-1 Priser på bilverksted
  • 8-2 Menn og kvinners puls, og med våre data
  • 8-6 Bruktbilpriser
Write a Comment
User Comments (0)
About PowerShow.com