Statistik Lektion 3 - PowerPoint PPT Presentation

1 / 36
About This Presentation
Title:

Statistik Lektion 3

Description:

Statistik Lektion 3 Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel X er en funktion ... – PowerPoint PPT presentation

Number of Views:90
Avg rating:3.0/5.0
Slides: 37
Provided by: KasperKli
Category:

less

Transcript and Presenter's Notes

Title: Statistik Lektion 3


1
StatistikLektion 3
  • Bernoulli og binomial fordelingerne
  • Kontinuerte stokastiske variable
  • Normalfordelingen

2
Repetition
  • En stokastisk variabel X er en funktion defineret
    på S (udfaldsrummet), der antager værdier på R.
  • Diskret stokastisk variabel Tælleligt antal
    værdier
  • Sandsynlighedsfordeling Tabel med ssh. for hvert
    x,
  • P(X x) P(x) 0.
  • Kumulativ fordelings funktion
  • Middelværdi
  • Varians
  • Standard afvigelse
  • Lineær transformation

3
Bernoulli fordelingen
  • Hvis et eksperiment består af et enkelt forsøg og
    forsøget enten kan være en succes eller en
    fiasko, så kaldes forsøget for et Bernoulli
    forsøg
  • En binær stokastisk variabel X er en Bernoulli
    variabel med sandsynligheds-parameter p, hvis
  • Middelværdi og varians for en Bernoulli variabel
  • E(X)
  • E(X²)
  • Hvis for eksempel p 0,7
  • E(X) V(X)

P(Succes) P(X1) p og P(Fiasko) P(X0)
1-p.
  • E(X2)

4
Flere forsøg
  • Lad X1, X2,, Xn være n uafhængige Bernoulli
    variable, alle med samme sandsynligheds-parameter
    p.
  • Definer X X1X2Xn
  • Fortolkning X er det (tilfældige) antallet af
    succeser i n forsøg.
  • Middelværdi og varians for antal succeser
  • E(X) E(X1X2Xn)
  • V(X) V(X1X2Xn)
  • Hvad er sandsynlighedsfordelingen for X ?

5
Binomial fordeling
  • Binomial fordelingen er resultatet af et
    Binomialt eksperiment
  • Det Binomiale eksperiment består af et fast antal
    (n) Bernoulli forsøg.
  • Så i hvert forsøg er der to mulige udfald, succes
    og fiasko.
  • P(succes)p, dvs. sandsynligheden for success
    er den samme i hvert hvert forsøg. (Ligeledes for
    P(fiasko)1-pq)
  • Forsøgene er uafhængige

6
Binomial fordeling - Eksempler
  • Eksempler
  • Kast med en mønt n gange. S(krone (succes), plat
    (fiasko)). Hvis fair mønt p0,5. Sandsynligheden
    er konstant og forsøgene er uafhængige, da et
    møntkasts udfald ikke påvirker udfaldet af det
    næste kast
  • Træk et kort n gange. S(spar (succes), andet
    (fiasko)). P(spar)0,25 er konstant, hvis vi
    lægger kortet tilbage i bunken igen, ellers ikke.
    Uafhængige. Bemærk! Uden tilbagelægning vil
    P(nummer 2 spar, hvis nummer 1 er en spar)
    12/51 og dermed ikke konstant sandsynlighed

7
Sandsynlighed for Sekvens
  • Vi udfører n5 uafhængige Bernoulli forsøg, hver
    med sandsynlighed p for succes.
  • Lad betegne succes og 0 betegne fiasko.
  • Hvad er sandsynligheden for sekvensen af udfald
  • Svar
  • hvor x er antallet af succeser.
  • Bemærk Sandsynligheden afhænger kun af antal
    succer - ikke hvornår i sekvenser de kommer.

00
Uafhængighed
8
Sandsynlighed for 3 Succeser I 5 Forsøg
  • Vi har stadig n5 uafhængige forsøg som før.
  • Der er 25 32 mulige sekvenser af succeser og
    fiaskoer.
  • Alle sekvenser med 3 succeser
  • 00 00 00 00 00 00
    00 00 00 00
  • Totalt 10 måder at får x3 succeser i n5 forsøg.
  • Sandsynlighed for x3 succeser er

Antal sekvenser med 3 succeser
Sandsynligheden for en given sekvens med 3
succeser
9
Antal Sekvenser
  • Antag vi udfører n Bernoulli forsøg.
  • Hvor mange forskellige sekvenser med x succeser
    findes der?
  • Svar
  • hvor n
    fakultet
  • Eksempel n 5 forsøg og x 3 succeser.

10
Binomial-fordelingen
Binomial sandsynligheds fordeling
hvor p er sandsynligheden for succes i et
enkelt forsøg, n er antallet af forsøg, og x er
antallet af succeser.
Egenskab
Notation
11
Formen På Binomial-fordelingen
p 0.1
p 0.3
p 0.5
n 4
n 10
n 20
  • Binomial-fordelingen bliver mere symmetrisk, når
    n øges og p ? 0.5

12
Middelværdi, varians og standardafvigelse af en
Binomial fordeling
Antag XB(n,p)
Eksempel K tæller antallet af kroner i 5 kast
(n5) med en fair mønt (p0,5)
Middelværdi
Varians
Standardafvigelse
13
Kumulative Binomial-fordeling
  • I Tabel 3 i appendiks (s. 848) er en tabel for
    den kumulative binomial-fordeling for n
    1,..,20.
  • Eksempel n 10 studerende tilbydes en plads.
    Sandsynligheden for at en studerende accepterer
    er 40.
  • Spørgsmål Hvad er sandsynligheden er at højst
    x6 studerende accepterer?
  • Løsning Lad X være antal studerende der
    accepterer tilbuddet. Da gælder X B(10,0.4).
    P(X 6) F(6) 0.945.

14
Kumulative Binomial-fordeling
  • Spørgsmål 20 studerende får tilbudt plads. Hvad
    er sandsynligheden for at mere end 12 studerende
    accepterer?
  • Svar Vi antager at antal accept er X
    B(20,0.4).
  • P(X gt 12) 1 - P(X 12) 1 - 0.979 0.021
  • Spørgsmål 15 studerede får tilbudt plads. Antag
    sandsynligheden for accept er 70. Hvad er
    sandsynligheden for at mindst 12 accepterer?
  • Svar Da vi ikke kan slå p 0.7 op ser vi på
    antal afviste.
  • Antal afviste X B(15, 0.3).
  • P(X 3) 0.297

15
Diskrete og kontinuerte stokastiske
  • En kontinuert stokastisk variabel
  • Måler (højde, vægt, hastighed, løn)
  • Har et uendelig antal af mulige værdier
  • Går kontinuert fra værdi til værdi
  • Har ingen målelig sandsynlighed til hver
    individuel værdi
  • Sandsynlighed er areal
  • Diskret stokastisk variabel
  • Tæller hændelser
  • Har et tællelig antal af mulige værdier
  • Har diskrete hop mellem efterfølgende værdier
  • Har målelige sandsynligheder for hver enkelt
    værdi
  • Sandsynlighed er højde

For eksempel Binomial n3 p.5 x P(x) 0 0.125
1 0.375 2 0.375 3 0.125 1.000
For eksempel Det skraverede område angiver
sandsynligheden for mellem 2 og 3 minutter.
16
Kontinuert Stokastisk Variabel og
Sandsynlighedstæthedsfunktion
Tæthedsfunktionen f(x)
Arealet under kurven f(x) er 1
Sandsynligheden for X mindre end 3 er det røde
areal
17
Kontinuert Stokastisk Variabel og
Sandsynlighedstæthedsfunktion
  • Definition Lad X ? R være en kontinuert
    stokastisk variabel.
  • f(x) er (sandsynligheds)tæthedsfunktionen for X
    hvis

Dvs. kurven f(x) er aldring under x-aksen
Dvs. arealet under kurven f(x) er 1
Dvs. sandsynligheden for X er mindre end a svarer
til arealet under kurven til venstre for a
18
Tæthedsfunktion og Kumulerede Fordelingsfunktion
P(X x) 0
Kumulerede fordelingsfunktion
F(3)
F(2)
Bemærk F(x) ?0, når x ? -8 F(x) ?1, når x ? 8
19
Middelværdi og Varians
  • Stok. Var Diskret Kontinuert
  • Regel
  • Regel
  • Middelværdi
  • E h(X)
  • EX2
  • Varians
  • Bemærk Integralerne kan typisk ikke udregnes.

20
Flere Regneregler
  • Regneregler for middelværdi og varians er præcist
    som for diskrete stokastiske variable.
  • Antag at X er en kontinuert stokastisk variabel
    med middelværdi m og varians s2.
  • Da gælder
  • Eksempel Standardisering

21
Uniform fordeling
uniform a,b tæthed
1/(b a) for a x b f(x)
0 ellers E(X) (a b)/2
V(X) (b a)2/12
Uniform a, b fordeling


f(x)
Arealet under f(x) fra a1 til b1 P(a1X b1)

(b1 a1)/(b a)
1/(b-a)
b
b1
a1
a
x
22
Uniform fordeling
uniform 0,5 tæthed
1/5 for 0 x 5 f(x)
0 ellers E(X) (0 5)/2 V(X)
(5 0)2/12
Uniform a, b fordeling


f(x)
Arealet under f(x) fra 1 til 3 P(1X 3)
(3
1)/(5 0) 2/5 0,4
1/5
3
1
5
0
x
23
Normal-fordelingen
  • Normal-fordelingen er en vigtig fordeling, blandt
    andet fordi mange andre fordelingen, kan
    approksimeres til den.
  • Desuden er mange teststørrelser normal-fordelte
    kommer senere i kurset
  • Bland andre Carl F. Gauss (1777-1855) fandt frem
    til den, derfor kaldes den også den Gaussiske
    fordeling.

Gauss
Gaussfordeling
Må ikke printes -)
24
Normal fordelingen
  • Dens kendetegn er
  • Klokkeformet og symmetrisk omkring dens
    middelværdi
  • Middelværdi median toppunkt
  • Den er karakteriseret ved en middelværdi µ og
    varians s² (eller standard afvigelse s).
  • Notation XN(µ,s²) betyder, at X følger en
    normal fordeling med middelværdi µ og varians s²
  • Arealet under kurven indenfor zs af
    middelværdien, er den samme for enhver normal
    fordeling, uanset middelværdi og standard
    afvigelse.
  • Er uanset parametre værdier, defineret for alle x
    (dvs x kan antage værdier fra minus uendelig til
    plus uendelig)

25
Tæthedsfunktionen for normal-fordelingen
Tæthedsfunktionen for normal-fordelingen
N
o
r
m
al-fordelingen


?



0
,

??



1
0
.
4
0
.
3
)
x
0
.
2
(
f
0
.
1
0
.
0
5
0
-
5
x
26
Eksempler på normal-fordelinger
µ 0.0
µ 1.0
µ 2.0
Samme varians
Samme middelværdi.
s 2.0
s 0.5
s 1.0
27
Standard afvigelsen s når XN(µ,s2)
  • Cirka 68 af all observationer ligger indenfor en
    standard afvigelse fra middelværdien
  • Cirka 95 af alle observationer ligger indenfor
    to standard afvigelser fra middelværdien
  • Cirka 99.7 af alle observationer ligger indenfor
    3 standard afvigelser fra middelværdien

28
68
s
95
2s
99,7
3s
Arealet under kurven indenfor ks af
middelværdien, er den samme for enhver normal
fordeling, uanset middelværdi og standard
afvigelse.
29
Standard normal fordelingen
  • Standard normal fordelingen, er normalfordelingen
    med middelværdi µ0 og standard afvigelse s1,
    ZN(0,1²)

Standard Normal fordeling
0
.
4
0
.
3

?1
)
z
(
f
0
.
2
0
.
1
0
.
0
5
4
3
2
1
0
-
1
-
2
-
3
-
4
-
5
? 0
Z
NB En standard normal fordelt stokastisk
variabel betegnes sædvanligvis Z.
30
Tabellen
  • Den kumulative fordelingsfunktion F(x) for
    standard normal fordelingen er tabellagt i Tabel
    1 i Appendikset, side 841 for positive værdier af
    x.
  • Figuren viser
  • P(Z 1.21) F(1.21)

P(Z1.21)
F(1.21)
F(z) P(Z z)
31
Find P(Z lt 1.21) vha. Tabelopslag
P(Z 1.21 ) F(1.21) 0.8869
88,69
32
Find P(Z lt -1.76)
  • Vi kan ikke slå F(-1.76) op i tabellen
  • Da standard normal-fordelingen er symmetrisk
    omkring nul
  • Vi har også
  • Dvs.

P(Z 1.76)
P(Z -1.76)
P(Z 1.76)
Tabelopslag
P(Z 1.76)
33
Find P(1 Z 2)
  • Der gælder

P(Z 2)
P(1 Z 2)
P(Z 2
34
Transformation til Standardnormal
  • Efter en lineær transformation af normalfordelt
    stokastisk variabel er stadig en normalfordelt
    stokastisk variabel.
  • Lad X N(m,s2) og definer Y aX b, så gælder
  • EY aEX b am b
  • VY a2VX a2s2
  • Y N(am b, a2s2)
  • Lad X N(m,s2) og definer Z (X-m)/s2, så gælder
  • EZ 0
  • VZ 1
  • Z N(0,1)

35
Transformation Eksempel
  • Antag studerende score til eksamen er
    normalfordelt med middelværdi 60 og
    standardafvigelse 15.
  • Dvs. score X N(60,152)
  • Spørgsmål Hvor stor en andel af de studerende
    har en score under 95? P(X 95) ?
  • Ide Transformer problemet til et, der vedrører
    en standard normal-fordelt stokastisk variabel.
  • Dvs. 99.01 af de studerende har en score under
    95.

36
Kumulative fordeling i Rcmdr
1
2
De R-kommadoer jeres peg-og-klik svarer til.
3
Output fra kommandoer
Write a Comment
User Comments (0)
About PowerShow.com