Test di ipotesi

About This Presentation

Title:

Test di ipotesi

Description:

Title: Distribuzioni campionarie Author: A. Biggeri Last modified by: annibale Created Date: 10/16/2000 8:27:04 AM Document presentation format: Presentazione su schermo –

Number of Views:95

Avg rating:3.0/5.0

Slides: 37

Provided by: A785

Learn more at: http://tek43.altervista.org

Category:

more less

Transcript and Presenter's Notes

Title: Test di ipotesi

1
Test di ipotesi

Annibale Biggeri
Dipartimento di Statistica

2
Richiami Definizioni

La distribuzione di probabilità di una statistica
campionaria è chiamata la distribuzione
campionaria della statistica
La deviazione standard della distribuzione
campionaria è chiamata errore standard

3
Teorema del Limite Centrale

Se Y è una variabile casuale con media ? e
varianza ?2 allora basato su campioni di
dimensione n sarà distribuito Gaussianamente con
media ? e varianza ?2 / n ,
per n sufficientemente
grande.

I campioni sono diversi PERCHE i membri della
popolazione da cui sono tratti sono diversi circa
la caratteristica (variabile) rilevata
(variabilità del fenomeno in studio)
Le medie campionarie sono diverse in ragione
della variabilità del fenomeno e della dimensione
campionaria (variabilità campionaria)

8
Esempio

Qual è la probabilità che lIQ medio di una
classe di 25 studenti superi 106 ?

9
Un esempio dalla letteratura

Bennett et al. hanno condotto uno Studio Clinico
Controllato Randomizzato per valutare la
sicurezza delluso di lidocaina in soggetti con
infarto miocardico acuto.
216 pazienti sono stati assegnati con procedura
casuale a due gruppi (di 110 e 106 soggetti)
trattati con lidocaina o con la miglior terapia
disponibile.
I decessi osservati nei due gruppi nel periodo di
follow-up sono stati 7 e 3.

Lipotesi scientifica da saggiare è la seguente
La lidocaina è un farmaco sicuro ed efficace nel
prevenire aritmie nella fase iniziale
dellinfarto miocardico acuto ?

Per saggiare lipotesi il ricercatore confronta i
dati empirici con le previsioni teoriche.
La percentuale di decessi osservata nel gruppo
trattato con lidocaina non deve essere maggiore
di quella osservata nel gruppo di controllo

12
Ipotesi statistica

Una ipotesi statistica è una affermazione circa
il valore di un parametro di una distribuzione di
probabilità

13
Test statistico

Un test statistico è una procedura volta a
saggiare la verità o falsità di una ipotesi
statistica.
E costruito secondo il ragionamento per assurdo
(se A è falso allora B).

La strategia fondamentale nel test dipotesi
consiste nel misurare quanto è distante il valore
osservato di una statistica campionaria dal
valore ipotizzato.
Se la distanza è grande concluderemo che il
valore ipotizzato è incompatibile con i dati
osservati e saremo portati a rifiutare lipotesi.

Per valutare la grandezza della distanza terremo
in conto della variabilità delle osservazioni
(?2) e della dimensione del campione (n)
In generale se la statistica campionaria
osservata è a più di due errori standard dal
valore ipotizzato siamo portati a rifiutare
lipotesi.

16
Esempio

Il peso medio alla nascita di 78 neonati deceduti
per SIDS era di 2994 gr. La
deviazione standard del peso alla nascita nella
popolazione è di 800 gr. , lerrore standard è
pertanto 800/?7890.6 gr.
Ci si chiede se i bambini con SIDS hanno peso
medio alla nascita diverso dalla media della
popolazione (3300 gr.)

17
Esempio (segue)

La distanza tra 2994 e 3300 è pari a 306 gr.
Lerrore standard è 90.6 gr. Per cui la distanza
osservata è a 306/90.63.38 errori standard.
Concluderemo che i dati osservati sono
incompatibili con lipotesi che il peso medio
alla nascita dei bambini con SIDS sia uguale a
quello della popolazione.

18
Esempio (Lidocaina trial)

7/110 6.36 vs 3/106 2.83 sono una
differenza di 3.53 , con un campione totale di
216 soggetti e 10 decessi e una percentuale di
decessi totale di 4.63
err.standard ? (0.0463 x (1 0.0463) / 216 )
0.0143
La distanza osservata in unità di err.standard è
0.0353/0.0143 2.469
Concludiamo che i dati osservati non supportano
lipotesi di eguale rischio di morte nei due
gruppi

19
Commenti

La distanza è stata espressa in unità pari
allerrore standard. In modo equivalente possiamo
associare un valore di probabilità per valori più
estremi di quello osservato. Nel caso gaussiano a
1.96 corrisponde una probabilità (area) del 2.5

20
Commenti (segue)

Se, prima di eseguire il test, avessimo deciso di
non rifiutare lipotesi se il valore della
statistica campionaria fosse caduto entro due
errori standard dal valore ipotizzato, allora
avremmo suddiviso lo spazio campionario della
nostra statistica in tre regioni.

21
Definizione 1

Lipotesi nulla specifica un determinato valore
per un parametro della popolazione

22
Definizione 2

La regione di rifiuto consiste nellinsieme di
tutti i valori della statistica test per i quali
lipotesi nulla viene rifiutata. I limiti della
regione sono definiti i valori critici (soglia/e)

23
Definizione 3

Lerrore di primo tipo si verifica quando
lipotesi nulla viene rifiutata pur essendo vera.

24
Definizione 4

Lipotesi alternativa specifica un determinato
valore per un parametro della popolazione da
considerarsi quando lipotesi nulla viene
rifiutata.

25
Definizione 5

Lerrore di secondo tipo si verifica quando
lipotesi nulla NON viene rifiutata pur essendo
FALSA.

26
Definizione 6

La potenza di un test è la probabilità di
rifiutare lipotesi nulla quando essa è falsa.

27
Definizione 7

Il valore p nel contesto del test di ipotesi è il
valore di probabilità in base al quale, qualora
risulti inferiore ad ?, lipotesi nulla è
rifiutata, oppure, qualora risulti maggiore di ?,
non rifiutata.

28
Notazioni

Lipotesi nulla è indicata con H0
lipotesi alternativa con Ha o H1
La probabilità di errore di primo tipo è indicata
con ? e la probabilità di errore di secondo tipo
con ?. La potenza è perciò

29
Formalizzazione

Lipotesi nulla e quella alternativa possono
essere scritte nel modo seguente

Le regioni di rifiuto e non rifiuto derivano
dalla scelta sulla dimensione della distanza.
Supponiamo di lasciare il valore 2 errori
standard, allora la regione di rifiuto sarà
delimitata da

In termini di probabilità di errore di primo tipo

Mentre la probabilità di errore di secondo tipo
sarà calcolabile solo avendo specificato un
valore per lipotesi alternativa. Supponendo
Ha?3000gr. Abbiamo

La potenza è pertanto 1-0.0950.905
Queste valutazioni vengono fatte a priori, se i
bambini con SIDS avessero peso medio alla nascita
di 3000 gr. Allora un campione di solo 78 bambini
avrebbe una potenza di crica il 90 di mettere in
evidenza questa differenza (3000-3300)

35
Schema riassuntivo

H0?3300gr. ?800gr. (noto)
Ha?3000gr. n78
Regione di rifiuto2 errori standard da 3300gr
?0.0456 ?0.095 1- ?0.905
Si osserva quindi si rifiuta H0

Di solito si specifica a priori il valore ?
(0.05, 0.01, 0.001). E chiamato il livello di
significatività
Lipotesi alternativa può essere direzionale o
no. A queste opzioni corrispondono test a
una o due code. Queste dipendono dalle condizioni
sperimentali.

Write a Comment

User Comments (0)