Test di ipotesi - PowerPoint PPT Presentation

About This Presentation
Title:

Test di ipotesi

Description:

Title: Distribuzioni campionarie Author: A. Biggeri Last modified by: annibale Created Date: 10/16/2000 8:27:04 AM Document presentation format: Presentazione su schermo – PowerPoint PPT presentation

Number of Views:88
Avg rating:3.0/5.0
Slides: 37
Provided by: A785
Category:

less

Transcript and Presenter's Notes

Title: Test di ipotesi


1
Test di ipotesi
  • Annibale Biggeri
  • Dipartimento di Statistica

2
Richiami Definizioni
  • La distribuzione di probabilità di una statistica
    campionaria è chiamata la distribuzione
    campionaria della statistica
  • La deviazione standard della distribuzione
    campionaria è chiamata errore standard

3
Teorema del Limite Centrale
  • Se Y è una variabile casuale con media ? e
    varianza ?2 allora basato su campioni di
    dimensione n sarà distribuito Gaussianamente con
    media ? e varianza ?2 / n ,
    per n sufficientemente
    grande.

4

5
  • I campioni sono diversi PERCHE i membri della
    popolazione da cui sono tratti sono diversi circa
    la caratteristica (variabile) rilevata
    (variabilità del fenomeno in studio)
  • Le medie campionarie sono diverse in ragione
    della variabilità del fenomeno e della dimensione
    campionaria (variabilità campionaria)

6

7

8
Esempio
  • Qual è la probabilità che lIQ medio di una
    classe di 25 studenti superi 106 ?

9
Un esempio dalla letteratura
  • Bennett et al. hanno condotto uno Studio Clinico
    Controllato Randomizzato per valutare la
    sicurezza delluso di lidocaina in soggetti con
    infarto miocardico acuto.
  • 216 pazienti sono stati assegnati con procedura
    casuale a due gruppi (di 110 e 106 soggetti)
    trattati con lidocaina o con la miglior terapia
    disponibile.
  • I decessi osservati nei due gruppi nel periodo di
    follow-up sono stati 7 e 3.

10
  • Lipotesi scientifica da saggiare è la seguente
  • La lidocaina è un farmaco sicuro ed efficace nel
    prevenire aritmie nella fase iniziale
    dellinfarto miocardico acuto ?

11
  • Per saggiare lipotesi il ricercatore confronta i
    dati empirici con le previsioni teoriche.
  • La percentuale di decessi osservata nel gruppo
    trattato con lidocaina non deve essere maggiore
    di quella osservata nel gruppo di controllo

12
Ipotesi statistica
  • Una ipotesi statistica è una affermazione circa
    il valore di un parametro di una distribuzione di
    probabilità

13
Test statistico
  • Un test statistico è una procedura volta a
    saggiare la verità o falsità di una ipotesi
    statistica.
  • E costruito secondo il ragionamento per assurdo
    (se A è falso allora B).

14
  • La strategia fondamentale nel test dipotesi
    consiste nel misurare quanto è distante il valore
    osservato di una statistica campionaria dal
    valore ipotizzato.
  • Se la distanza è grande concluderemo che il
    valore ipotizzato è incompatibile con i dati
    osservati e saremo portati a rifiutare lipotesi.

15
  • Per valutare la grandezza della distanza terremo
    in conto della variabilità delle osservazioni
    (?2) e della dimensione del campione (n)
  • In generale se la statistica campionaria
    osservata è a più di due errori standard dal
    valore ipotizzato siamo portati a rifiutare
    lipotesi.

16
Esempio
  • Il peso medio alla nascita di 78 neonati deceduti
    per SIDS era di 2994 gr. La
    deviazione standard del peso alla nascita nella
    popolazione è di 800 gr. , lerrore standard è
    pertanto 800/?7890.6 gr.
  • Ci si chiede se i bambini con SIDS hanno peso
    medio alla nascita diverso dalla media della
    popolazione (3300 gr.)

17
Esempio (segue)
  • La distanza tra 2994 e 3300 è pari a 306 gr.
  • Lerrore standard è 90.6 gr. Per cui la distanza
    osservata è a 306/90.63.38 errori standard.
  • Concluderemo che i dati osservati sono
    incompatibili con lipotesi che il peso medio
    alla nascita dei bambini con SIDS sia uguale a
    quello della popolazione.

18
Esempio (Lidocaina trial)
  • 7/110 6.36 vs 3/106 2.83 sono una
    differenza di 3.53 , con un campione totale di
    216 soggetti e 10 decessi e una percentuale di
    decessi totale di 4.63
  • err.standard ? (0.0463 x (1 0.0463) / 216 )
    0.0143
  • La distanza osservata in unità di err.standard è
    0.0353/0.0143 2.469
  • Concludiamo che i dati osservati non supportano
    lipotesi di eguale rischio di morte nei due
    gruppi

19
Commenti
  • La distanza è stata espressa in unità pari
    allerrore standard. In modo equivalente possiamo
    associare un valore di probabilità per valori più
    estremi di quello osservato. Nel caso gaussiano a
    1.96 corrisponde una probabilità (area) del 2.5

20
Commenti (segue)
  • Se, prima di eseguire il test, avessimo deciso di
    non rifiutare lipotesi se il valore della
    statistica campionaria fosse caduto entro due
    errori standard dal valore ipotizzato, allora
    avremmo suddiviso lo spazio campionario della
    nostra statistica in tre regioni.

21
Definizione 1
  • Lipotesi nulla specifica un determinato valore
    per un parametro della popolazione

22
Definizione 2
  • La regione di rifiuto consiste nellinsieme di
    tutti i valori della statistica test per i quali
    lipotesi nulla viene rifiutata. I limiti della
    regione sono definiti i valori critici (soglia/e)

23
Definizione 3
  • Lerrore di primo tipo si verifica quando
    lipotesi nulla viene rifiutata pur essendo vera.

24
Definizione 4
  • Lipotesi alternativa specifica un determinato
    valore per un parametro della popolazione da
    considerarsi quando lipotesi nulla viene
    rifiutata.

25
Definizione 5
  • Lerrore di secondo tipo si verifica quando
    lipotesi nulla NON viene rifiutata pur essendo
    FALSA.

26
Definizione 6
  • La potenza di un test è la probabilità di
    rifiutare lipotesi nulla quando essa è falsa.

27
Definizione 7
  • Il valore p nel contesto del test di ipotesi è il
    valore di probabilità in base al quale, qualora
    risulti inferiore ad ?, lipotesi nulla è
    rifiutata, oppure, qualora risulti maggiore di ?,
    non rifiutata.

28
Notazioni
  • Lipotesi nulla è indicata con H0
    lipotesi alternativa con Ha o H1
  • La probabilità di errore di primo tipo è indicata
    con ? e la probabilità di errore di secondo tipo
    con ?. La potenza è perciò

29
Formalizzazione

30
  • Lipotesi nulla e quella alternativa possono
    essere scritte nel modo seguente

31
  • Le regioni di rifiuto e non rifiuto derivano
    dalla scelta sulla dimensione della distanza.
  • Supponiamo di lasciare il valore 2 errori
    standard, allora la regione di rifiuto sarà
    delimitata da

32
  • In termini di probabilità di errore di primo tipo

33
  • Mentre la probabilità di errore di secondo tipo
    sarà calcolabile solo avendo specificato un
    valore per lipotesi alternativa. Supponendo
    Ha?3000gr. Abbiamo

34
  • La potenza è pertanto 1-0.0950.905
  • Queste valutazioni vengono fatte a priori, se i
    bambini con SIDS avessero peso medio alla nascita
    di 3000 gr. Allora un campione di solo 78 bambini
    avrebbe una potenza di crica il 90 di mettere in
    evidenza questa differenza (3000-3300)

35
Schema riassuntivo
  • H0?3300gr. ?800gr. (noto)
  • Ha?3000gr. n78
  • Regione di rifiuto2 errori standard da 3300gr
  • ?0.0456 ?0.095 1- ?0.905
  • Si osserva quindi si rifiuta H0

36
  • Di solito si specifica a priori il valore ?
    (0.05, 0.01, 0.001). E chiamato il livello di
    significatività
  • Lipotesi alternativa può essere direzionale o
    no. A queste opzioni corrispondono test a
    una o due code. Queste dipendono dalle condizioni
    sperimentali.
Write a Comment
User Comments (0)
About PowerShow.com