Title: Statistik Lektion 3
1StatistikLektion 3
- Bernoulli og binomial fordelingerne
- Kontinuerte stokastiske variable
- Normalfordelingen
2Repetition
- En stokastisk variabel X er en funktion defineret
på S (udfaldsrummet), der antager værdier på R. - Diskret stokastisk variabel Tælleligt antal
værdier - Sandsynlighedsfordeling Tabel med ssh. for hvert
x, - P(X x) P(x) 0.
- Kumulativ fordelings funktion
- Middelværdi
- Varians
- Standard afvigelse
- Lineær transformation
3Bernoulli fordelingen
- Hvis et eksperiment består af et enkelt forsøg og
forsøget enten kan være en succes eller en
fiasko, så kaldes forsøget for et Bernoulli
forsøg - En binær stokastisk variabel X er en Bernoulli
variabel med sandsynligheds-parameter p, hvis - Middelværdi og varians for en Bernoulli variabel
- E(X)
- E(X²)
- Hvis for eksempel p 0,7
- E(X) V(X)
P(Succes) P(X1) p og P(Fiasko) P(X0)
1-p.
4Flere forsøg
- Lad X1, X2,, Xn være n uafhængige Bernoulli
variable, alle med samme sandsynligheds-parameter
p. - Definer X X1X2Xn
- Fortolkning X er det (tilfældige) antallet af
succeser i n forsøg. - Middelværdi og varians for antal succeser
- E(X) E(X1X2Xn)
- V(X) V(X1X2Xn)
- Hvad er sandsynlighedsfordelingen for X ?
5Binomial fordeling
- Binomial fordelingen er resultatet af et
Binomialt eksperiment - Det Binomiale eksperiment består af et fast antal
(n) Bernoulli forsøg. - Så i hvert forsøg er der to mulige udfald, succes
og fiasko. - P(succes)p, dvs. sandsynligheden for success
er den samme i hvert hvert forsøg. (Ligeledes for
P(fiasko)1-pq) - Forsøgene er uafhængige
6Binomial fordeling - Eksempler
- Eksempler
- Kast med en mønt n gange. S(krone (succes), plat
(fiasko)). Hvis fair mønt p0,5. Sandsynligheden
er konstant og forsøgene er uafhængige, da et
møntkasts udfald ikke påvirker udfaldet af det
næste kast - Træk et kort n gange. S(spar (succes), andet
(fiasko)). P(spar)0,25 er konstant, hvis vi
lægger kortet tilbage i bunken igen, ellers ikke.
Uafhængige. Bemærk! Uden tilbagelægning vil
P(nummer 2 spar, hvis nummer 1 er en spar)
12/51 og dermed ikke konstant sandsynlighed
7Sandsynlighed for Sekvens
- Vi udfører n5 uafhængige Bernoulli forsøg, hver
med sandsynlighed p for succes. - Lad betegne succes og 0 betegne fiasko.
- Hvad er sandsynligheden for sekvensen af udfald
- Svar
- hvor x er antallet af succeser.
- Bemærk Sandsynligheden afhænger kun af antal
succer - ikke hvornår i sekvenser de kommer.
00
Uafhængighed
8Sandsynlighed for 3 Succeser I 5 Forsøg
- Vi har stadig n5 uafhængige forsøg som før.
- Der er 25 32 mulige sekvenser af succeser og
fiaskoer. - Alle sekvenser med 3 succeser
- 00 00 00 00 00 00
00 00 00 00 - Totalt 10 måder at får x3 succeser i n5 forsøg.
- Sandsynlighed for x3 succeser er
Antal sekvenser med 3 succeser
Sandsynligheden for en given sekvens med 3
succeser
9Antal Sekvenser
- Antag vi udfører n Bernoulli forsøg.
- Hvor mange forskellige sekvenser med x succeser
findes der? - Svar
- hvor n
fakultet - Eksempel n 5 forsøg og x 3 succeser.
10Binomial-fordelingen
Binomial sandsynligheds fordeling
hvor p er sandsynligheden for succes i et
enkelt forsøg, n er antallet af forsøg, og x er
antallet af succeser.
Egenskab
Notation
11Formen På Binomial-fordelingen
p 0.1
p 0.3
p 0.5
n 4
n 10
n 20
- Binomial-fordelingen bliver mere symmetrisk, når
n øges og p ? 0.5
12Middelværdi, varians og standardafvigelse af en
Binomial fordeling
Antag XB(n,p)
Eksempel K tæller antallet af kroner i 5 kast
(n5) med en fair mønt (p0,5)
Middelværdi
Varians
Standardafvigelse
13Kumulative Binomial-fordeling
- I Tabel 3 i appendiks (s. 848) er en tabel for
den kumulative binomial-fordeling for n
1,..,20. - Eksempel n 10 studerende tilbydes en plads.
Sandsynligheden for at en studerende accepterer
er 40. - Spørgsmål Hvad er sandsynligheden er at højst
x6 studerende accepterer? - Løsning Lad X være antal studerende der
accepterer tilbuddet. Da gælder X B(10,0.4).
P(X 6) F(6) 0.945.
14Kumulative Binomial-fordeling
- Spørgsmål 20 studerende får tilbudt plads. Hvad
er sandsynligheden for at mere end 12 studerende
accepterer? - Svar Vi antager at antal accept er X
B(20,0.4). - P(X gt 12) 1 - P(X 12) 1 - 0.979 0.021
- Spørgsmål 15 studerede får tilbudt plads. Antag
sandsynligheden for accept er 70. Hvad er
sandsynligheden for at mindst 12 accepterer? - Svar Da vi ikke kan slå p 0.7 op ser vi på
antal afviste. - Antal afviste X B(15, 0.3).
- P(X 3) 0.297
15Diskrete og kontinuerte stokastiske
- En kontinuert stokastisk variabel
- Måler (højde, vægt, hastighed, løn)
- Har et uendelig antal af mulige værdier
- Går kontinuert fra værdi til værdi
- Har ingen målelig sandsynlighed til hver
individuel værdi - Sandsynlighed er areal
- Diskret stokastisk variabel
- Tæller hændelser
- Har et tællelig antal af mulige værdier
- Har diskrete hop mellem efterfølgende værdier
- Har målelige sandsynligheder for hver enkelt
værdi - Sandsynlighed er højde
For eksempel Binomial n3 p.5 x P(x) 0 0.125
1 0.375 2 0.375 3 0.125 1.000
For eksempel Det skraverede område angiver
sandsynligheden for mellem 2 og 3 minutter.
16Kontinuert Stokastisk Variabel og
Sandsynlighedstæthedsfunktion
Tæthedsfunktionen f(x)
Arealet under kurven f(x) er 1
Sandsynligheden for X mindre end 3 er det røde
areal
17Kontinuert Stokastisk Variabel og
Sandsynlighedstæthedsfunktion
- Definition Lad X ? R være en kontinuert
stokastisk variabel. - f(x) er (sandsynligheds)tæthedsfunktionen for X
hvis -
-
-
Dvs. kurven f(x) er aldring under x-aksen
Dvs. arealet under kurven f(x) er 1
Dvs. sandsynligheden for X er mindre end a svarer
til arealet under kurven til venstre for a
18Tæthedsfunktion og Kumulerede Fordelingsfunktion
P(X x) 0
Kumulerede fordelingsfunktion
F(3)
F(2)
Bemærk F(x) ?0, når x ? -8 F(x) ?1, når x ? 8
19Middelværdi og Varians
- Stok. Var Diskret Kontinuert
- Regel
- Regel
- Middelværdi
- E h(X)
- EX2
- Varians
- Bemærk Integralerne kan typisk ikke udregnes.
20Flere Regneregler
- Regneregler for middelværdi og varians er præcist
som for diskrete stokastiske variable. - Antag at X er en kontinuert stokastisk variabel
med middelværdi m og varians s2. - Da gælder
- Eksempel Standardisering
21Uniform fordeling
uniform a,b tæthed
1/(b a) for a x b f(x)
0 ellers E(X) (a b)/2
V(X) (b a)2/12
Uniform a, b fordeling
f(x)
Arealet under f(x) fra a1 til b1 P(a1X b1)
(b1 a1)/(b a)
1/(b-a)
b
b1
a1
a
x
22Uniform fordeling
uniform 0,5 tæthed
1/5 for 0 x 5 f(x)
0 ellers E(X) (0 5)/2 V(X)
(5 0)2/12
Uniform a, b fordeling
f(x)
Arealet under f(x) fra 1 til 3 P(1X 3)
(3
1)/(5 0) 2/5 0,4
1/5
3
1
5
0
x
23Normal-fordelingen
- Normal-fordelingen er en vigtig fordeling, blandt
andet fordi mange andre fordelingen, kan
approksimeres til den. - Desuden er mange teststørrelser normal-fordelte
kommer senere i kurset - Bland andre Carl F. Gauss (1777-1855) fandt frem
til den, derfor kaldes den også den Gaussiske
fordeling.
Gauss
Gaussfordeling
Må ikke printes -)
24Normal fordelingen
- Dens kendetegn er
- Klokkeformet og symmetrisk omkring dens
middelværdi - Middelværdi median toppunkt
- Den er karakteriseret ved en middelværdi µ og
varians s² (eller standard afvigelse s). - Notation XN(µ,s²) betyder, at X følger en
normal fordeling med middelværdi µ og varians s² - Arealet under kurven indenfor zs af
middelværdien, er den samme for enhver normal
fordeling, uanset middelværdi og standard
afvigelse. - Er uanset parametre værdier, defineret for alle x
(dvs x kan antage værdier fra minus uendelig til
plus uendelig)
25Tæthedsfunktionen for normal-fordelingen
Tæthedsfunktionen for normal-fordelingen
N
o
r
m
al-fordelingen
?
0
,
??
1
0
.
4
0
.
3
)
x
0
.
2
(
f
0
.
1
0
.
0
5
0
-
5
x
26Eksempler på normal-fordelinger
µ 0.0
µ 1.0
µ 2.0
Samme varians
Samme middelværdi.
s 2.0
s 0.5
s 1.0
27Standard afvigelsen s når XN(µ,s2)
- Cirka 68 af all observationer ligger indenfor en
standard afvigelse fra middelværdien - Cirka 95 af alle observationer ligger indenfor
to standard afvigelser fra middelværdien - Cirka 99.7 af alle observationer ligger indenfor
3 standard afvigelser fra middelværdien
2868
s
95
2s
99,7
3s
Arealet under kurven indenfor ks af
middelværdien, er den samme for enhver normal
fordeling, uanset middelværdi og standard
afvigelse.
29Standard normal fordelingen
- Standard normal fordelingen, er normalfordelingen
med middelværdi µ0 og standard afvigelse s1,
ZN(0,1²)
Standard Normal fordeling
0
.
4
0
.
3
?1
)
z
(
f
0
.
2
0
.
1
0
.
0
5
4
3
2
1
0
-
1
-
2
-
3
-
4
-
5
? 0
Z
NB En standard normal fordelt stokastisk
variabel betegnes sædvanligvis Z.
30Tabellen
- Den kumulative fordelingsfunktion F(x) for
standard normal fordelingen er tabellagt i Tabel
1 i Appendikset, side 841 for positive værdier af
x. - Figuren viser
- P(Z 1.21) F(1.21)
P(Z1.21)
F(1.21)
F(z) P(Z z)
31Find P(Z lt 1.21) vha. Tabelopslag
P(Z 1.21 ) F(1.21) 0.8869
88,69
32Find P(Z lt -1.76)
- Vi kan ikke slå F(-1.76) op i tabellen
- Da standard normal-fordelingen er symmetrisk
omkring nul - Vi har også
- Dvs.
P(Z 1.76)
P(Z -1.76)
P(Z 1.76)
Tabelopslag
P(Z 1.76)
33Find P(1 Z 2)
P(Z 2)
P(1 Z 2)
P(Z 2
34Transformation til Standardnormal
- Efter en lineær transformation af normalfordelt
stokastisk variabel er stadig en normalfordelt
stokastisk variabel. - Lad X N(m,s2) og definer Y aX b, så gælder
- EY aEX b am b
- VY a2VX a2s2
- Y N(am b, a2s2)
- Lad X N(m,s2) og definer Z (X-m)/s2, så gælder
- EZ 0
- VZ 1
- Z N(0,1)
35Transformation Eksempel
- Antag studerende score til eksamen er
normalfordelt med middelværdi 60 og
standardafvigelse 15. - Dvs. score X N(60,152)
- Spørgsmål Hvor stor en andel af de studerende
har en score under 95? P(X 95) ? - Ide Transformer problemet til et, der vedrører
en standard normal-fordelt stokastisk variabel. - Dvs. 99.01 af de studerende har en score under
95.
36Kumulative fordeling i Rcmdr
1
2
De R-kommadoer jeres peg-og-klik svarer til.
3
Output fra kommandoer