Title: APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA 4
1APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA
MEDICINA4
2IDENTIFICAZIONE DI TUMORI POLMONARI BASATA SU
ENSEMBLE DI RETI NEURALI
- Chiave della cura del tumore polmonare è la
diagnosi precoce. La diagnosi automatica diventa
quindi sempre più importante. - Diversi esempi di reti neurali sono stati
sviluppati a questo scopo. - Descriviamo qui la Neural Ensemble-based
Detection (NED). - Utilizza le immagini di agobiopsie.
-
3ENSEMBLE DI RETI NEURALI
- Hansen e Salamon (1990) hanno dimostrato le
ottime prestazioni di ensemble di ANN, ossia di
varie reti le cui predizioni vengono combinate. - Applicazione al riconoscimento di caratteri con
20-25 di prestazioni in più rispetto ad una
singola rete. - E necessario un metodo sia per generare diverse
reti da addestrare, sia per combinare diverse
predizioni. - Diversi metodi sono stati proposti, dalla
combinazione per semplice media alluso della
varianza e della correlazione. -
4ENSEMBLE DI RETI NEURALI
- Ensemble di ANN sono state usate per
- - riconoscimento di caratteri
- - riconoscimento di volti
- - classificazione di segnali sismici
- - diagnosi di tumore della mammella
- .
-
5ENSEMBLE DI RETI NEURALI NED
- NED segue il metodo di diagnosi LCDS , che si
abbina alla lastra del torace quando ci sono dei
dubbi. - Una telecamera riprende le immagini
dellagobiopsia, poi un sistema di filtri
migliora limmagine. - Tecniche colorimetriche e morfologiche estraggono
diverse features perimetro, area, rotondità,
componenti rossa,verde, blu, proporzioni fra i
colori. - Un modulo a parte analizza le features e dà la
diagnosi e il tipo di cellula.
6ENSEMBLE DI RETI NEURALI NED
-
- Il data set comprende 552 immagini di biopsie
già etichettate - 75 tumori
- Il set è stato diviso in 5 gruppi omogenei
- Ogni esperimento è stato ripetuto 5 volte, con 4
set per il training e 1 per il testing. - Allinizio fu usata una sola rete usando FANNC
- FANNC è un classificatore adattivo veloce (Fast
Adaptive NN Classifier).
7ENSEMBLE DI RETI NEURALI - NED
- Ai risultati dei 5 esperimenti è stata aggiunta
la loro media. - Sono stati valutati
- errore false identificazioni/numero di immagini
- errorefn numero di falsi negativi/numero
cellule test - errorefp numero di falsi positivi/numero di
cellule test. -
- I risultati erano insoddisfacenti (accuratezza
lt60) -
8ENSEMBLE DI RETI NEURALI NED
- Sono stati provati due tipi di ensemble
- 1) combinazione delle predizioni via plurality
voting - Se ad es. due reti predicono NORMALE e due
ADENOCARCINOMA, lidentificazione è data
sbagliata. - Se la cellula è tumorale vengono accresciute di
uno sia gli errori che i falsi negativi. - Se la cellula è normale vengono accresciuti di
uno sia gli erroi che i falsi positivi. - In questo modo i risultati migliorano molto
rispetto alla singola rete - Gli errori vengono dimezzati
- Ma i falsi negativi sono ancora il 7.3
9ENSEMBLE DI RETI NEURALI NED
-
- 2) Viene fatta una variazione della proposta di
Sharkey ( due ensemble di cui uno con un set di
esempi con prevalenza di reperti positivi ) per
abbassare i falsi positivi - Vengono addestrati 5 ensemble, ciascuno con 5
reti ciascuna con esempi positivi nel 75 dei
casi. - Poi gli output dei 5 ensemble vengono combinati
in modalità winner-take-all. - In questo modo scende lerrore globale a 13.6 e
scende lerrorefp fino a 2.9.
10ENSEMBLE DI RETI NEURALI -NED
- Per abbassare i falsi negativi viene proposta
NED, architettura ensemble a due livelli. - Il primo livello giudica se una cellula è
cancerosa - Viene utilizzata la tecnica di predizione
combinata full voting - una predizione è data per valida quando tutte le
reti individuali la convalidano. - Questo avviene anche fra clinici per decidere se
un paziente è sano. - E utile quando ci sono solo due scelte e uno è
molto più importante dellaltra. -
11ENSEMBLE DI RETI NEURALI
- Per usare full voting le classi di output vengono
ridotte a due - 75 cellule cancerose / 25 cellule sane.
- Le cellule giudicate sane dal primo ensemble
vengono passate al secondo ensemble per la
classificazione. - Nel secondo si usa il plurality voting come
descritto. - I risultati sono un miglioramento netto di tutti
gli errori -
- Errore 11.6
- Errorefn 2.7
- Errorefp 4.5
-
- Si pensa di migliorare il sistema utilizzando
visulaizzazioni 3D. -
12UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
-
- Lischemia del miocardio è una fornitura di
sangue insufficiente al muscolo cardiaco. - Lo ECG presente in questo caso delle alterazioni
(deviazione del segmento ST e/o dellonda T). - La diagnosi di ischemia via ECG rileva il battito
ischemico e lepisodio ischemico come sequenza
di battiti ischemici. - Sono stati proposti sistemi basati su regole,
ANN, fuzzy logic, varie tecniche di analisi dei
segnali. - Poiché il rumore nellECG è una presenza
importante, le ANN possono essere lo strumento
adeguato.
13UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- La procedura proposta parte con un preprocessing
dellECG eliminando rumore, interferenze
elettriche e contaminazione elettromiografica. - Un algoritmo di edge detection trova il punto J
di inizio del ciclo cardiaco. - A valle una rete neurale viene addestrata per
classificare ogni battito cardiaco. - Si cercano intervalli di circa 30s in cui almeno
il 75 dei battiti sono ischemici. - La percentuale 74 offre flessibilità nel caso di
presenza di rumore. -
14UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- Per la classificazione dei battiti viene usata
una rete feed-forward - - 4 unità di input
- - 10 unità nascoste 1 unità di output.
- I pattern di input durano 400ms a partire da
ogni punto J - comprendono sia tratto ST che onda T.
- Per ridurre la dimensionalità dellinput viene
usata lanalisi delle componenti principali - Elimina le componenti che danno la minor
varianza al training set. - Vengono utilizzate le prime 4 componenti
principali, che contengono il 95 della varianza.
15UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- La rete viene addestrata secondo la tecnica di
regolarizzazione Bayesiana, che minimizza -
- E a1 S (ti oi)2 a2 S wi2
-
- dove ti sono gli output desiderati, oi gli output
durante il training, wi i pesi. - I pesi vengono aggiornati secondo la legge
-
- wi1 wi JT J mI-1 JT
-
- dove J è lo Jacobiano, I la matrice unitaria, e
il vettore degli errori e m un parametro scalare.
16UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- Per costruire il dataset sono state utilizzate 11
ore di registrazioni ECG. - 86.384 battito sono stati classificati come
normali, ischemici o artefatti. Gli artefatti
sono stati eliminati, e sono rimasti 76.989
battiti. - Di questi 1936 sono stati usati per il learning e
il resto per il testing. - Sono stati provati diversi strati hidden e
diverse tecniche di apprendimento..
17UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- Le prestazioni delle reti così ottenute sono
state valutate usando sensibilità (se) e
specificità (sp). - Sensibilità è la probabilità che un battito
anomalo risulti positivo al test - Specificità è la probabilità che un battito sano
risulti negativo al test - La rete con le migliori prestazioni è stata usata
come classificatore nel secondo stadio
dellalgoritmo, sostituendo il sistema di regole.
18UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
- Le migliori prestazioni risultano quelle con
metodo Bayesiano con 10 nodi hidden. - Il risultato è Se90, Sp90 (backpropagation
89 e 88) - contro Se70 e Sp63 del sistema di regole.
- Le prestazioni possono essere perfezionate da
- miglioramento della tecnica di edge detection
per J o per T - miglioramento delle tecniche di filtraggio del
rumore. - Svantaggio del metodo è che non fornisce alcuna
interpretazione delloutput, utile al cardiologo.
19DUE TECNICHE DI RULE EXTRACTION APPLICATE A
DISTURBI EPATOBILIARI
- Gli algoritmi di estrazione di regole da reti
neurali danno modo di capire la classificazione
ottenuta in output. - Le regole possono essere verificate da un esperto
- Le regole possono dare nuove informazioni sui
dati - Sono utili per il clinico che utilizza la rete
- Sono utili a scopo didattico.
-
20DUE TECNICHE DI RULE EXTRACTION
- Sono stati utilizzati i due algoritmi,
NeuroLinear e NeuroRule, che hanno in comune i
seguenti punti - - Addestrano e semplificano (pruning) reti
con un unico strato nascosto - - Raggruppano i valori di attivazione
dello strato nascosto - - Generano regole che esplicano loutput
della rete - - Generano regole che esplicano i
raggruppamenti di attivazione in funzione degli
input - - Compongono i set di regole sopra
esposti in un set di regole esplicative dei dati
di input. -
21DUE TECNICHE DI RULE EXTRACTION
- La differenza fra i due metodi sta nel fatto che
NeurRule assume dati discreti, NeuroLinear non
impone questa restrizione. - I dati vengono discretizzati suddividendoli in 3
subrange. - Non si rileva diversa accuratezza nella rete ad
input discreto - Ma la rete ad input continuo ha minori
connessioni, - quindi ci si aspettano meno regole.
22DUE TECNICHE DI RULE EXTRACTION
- Le reti sono due feedforward ad uno strato
nascosto. - Ci si attende che dove le connessioni non sono
utili a classificare un pattern il loro peso sia
basso. - Di fatto minimizzando un errore si effettua un
problema di ottimizzazione non lineare. - A questo scopo gli autori hanno sviluppato un
metodo ad hoc (BFGS) al posto della
backpropagation. - Questo algoritmo sembra convergere più
velocemente.
23DUE TECNICHE DI RULE EXTRACTION
- Si crea una matrice che è linversa dellHessiana
della funzione di errore. - Si ottiene un passo di minimizzazione
multiplicando la matrice per il negativo del
gradiente della funzione. - Usando un algoritmo di ricerca lineare, si
calcola la misura opportuna dello step
decrescente. - Usando BFGS si garantisce la discesa dellerrore
totale ad ogni iterazione. - Questa proprietà non è posseduta dalla
backpropagation. -
24DUE TECNICHE DI RULE EXTRACTION
- Una volta addestrata la rete, vengono
identificate le connessioni ridondanti per
rimuoverle. - La classificazione non viene alterata da questo
procedimento. - Ogni record è costituito dal sesso del paziente
e da 9 test biochimici (GOT, GPT, LDH,) - Il dataset è di 536 pazienti.
- I pazienti, esaminati dai clinici, presentavano
4 tipi di disturbi - -danno epatico da alcol (ALD)
- - epatoma primario (PH)
- - cirrosi (LC)
- - colelitiasi (C )
25DUE TECNICHE DI RULE EXTRACTION
- Il training set è stato posto a 373 records e il
test set a 163. - Per il programma NeuroLinear sono state
addestrate 30 reti, ciascuna con 11 input (10
valori più 1 bias), 5 hidden e 4 output. -
- Per il programma NeuroRule sono state addestrate
altre 30 reti, discretizzando linput in tre
subrange per variabile. I nodi di input erano
quindi 9x31129. -
- Laccurateza trovata e dell85.64 e 84.64
rispettivamente, e non varia dopo il pruning. - Varia però la complessità delle reti dopo il
pruning 75 connessioni per NeuroLinear e 165
per NeuroRule. -
26REGOLE DI ESTRAZIONE
- Data una rete, per ciascun record viene
registrato quale unità di output ha lattivazione
più alta e quale ha la seconda più alta
attivazione. - Si raggruppano poi i valori di attivazione dello
strato hidden generando regole di decisione che
distinguono i vari output. -
- Gli input rilevanti risultano essere solo
x1,x3,x5,x8,x9,x12. -
27REGOLE DI ESTRAZIONE
- Si sviluppa un albero di decisione
-
- H1 lt -.80
- H3 gt0
- prima scelta PH, seconda scelta ALD
-
- H3lt0
- H3lt-.70
- prima scelta ALD, seconda scelta C
- H3gt-.70
- prima sceltaALD, seconda sceltaPH
- H1 gt -.80
- H3lt .20
- ..
-
28REGOLE DI ESTRAZIONE
- Secondo passo.
- Si riuniscono le regole riscrivendole in questa
forma - H1 lt -.80.
- H1 è connessa solo agli input x1 e x12, ossia
paziente maschio e GGTgt60. - H3gt0
- H3 è connessa a x3,x5,x8,x9,x12, ossia se il
paziente è maschio con GGTgt60, x91 cioè
LDHgt500.
29REGOLE DI ESTRAZIONE
- Si conclude che se il paziente è maschio, con
GGTgt60, e LDH gt500, il suo disturbo è un epatoma
(prima scelta) o un danno epatico da alcol
(seconda scelta). - NeuroLinear
- Dopo il pruning restano solo 15 connessioni, con
4 hidden. - La prima unità hidden riceve input da GPT, la
seconda e la terza da GGT, la quarta da GOT,GPT e
LDH. - Il numero di regole completo è alla fine molto
ristretto.
30REGOLE DI ESTRAZIONE
- Sono stati confrontati i risultati di reti
neurofuzzy e dellanalisi discriminante. - I risultati di NeuroRule e NeuroLinear sono molto
più alti (es. per ALD 87.9 e 97.0 contro 57.6
dellanalisi discriminante e 69.7 della rete
neurofuzzy). - Oltre a produrre regole, i sistemi dicono quali
variabili sono predittive e quali no. - Ad esempio si è visto che i parametri importanti
erano GOT, GPT,LDH e GGT.