Title: INDICE DELL
1INDICE DELLINCONTRO
- Analisi di segmentazione per Obiettivi
- La segmentazione ad Albero Chaid
- Cenni alle Reti Neurali
2SEGMENTAZIONE PER OBIETTIVI CHAID
perché la Segmentazione ad Albero?...
Consideriamo per esempio le domande d4-13 tot
del file dati caffarel.sav, vale a dire la spesa
che ciascun intervistato sarebbe disposto a
sostenere per acquistare il gianduiotto. Relativa
mente alle variabili socio demo possiamo
evidenziare delle differenze significative? Se
consideriamo il gradimento per il prodotto (dom
4_6) e/o per la confezione (dom 4_7) e/o il
percepito per la marca Caffarel (dom 4_10) e/o
per il giunduitto stesso (dom 4_14), quali
conclusioni possiamo trarre relativamente al
gradimento complessivo? Proviamo in base a
quanto visto sino ad ora a procedere (analisi
bivariate, multivariate regressione-.)
3SEGMENTAZIONE PER OBIETTIVI CHAID
- Il metodo CHAID permette di analizzare TUTTI gli
incroci possibili evidenziandone solo quelli
significativi - Si basa su una procedura iterativa
- nella prima fase, la popolazione viene divisa in
due o più gruppi sulla base della variabile
esplicativa più significativamente legata alla
variabile dipendente prescelta - ciascuno di questi gruppi ottenuti nella prima
fase viene ulteriormente diviso in sottogruppi
più piccoli sulla base delle rimanenti variabili
esplicative. Il processo di divisione termina
quando non possono più essere individuati
predittori statisticamente significativi i
sottogruppi finali (segmenti) vengono quindi
rappresentati in un diagramma ad albero.
4SEGMENTAZIONE PER OBIETTIVI CHAID
I segmenti individuati sono mutuamente esclusivi
ed esaustivi. In altre parole, i segmenti non
si sovrappongono e ciascuna unità della
popolazione è contenuta in un unico segmento.
Dal momento che ogni segmento è definito da
combinazioni delle variabili esplicative, è
possibile riclassificare ogni osservazione
(azienda/clienti/prospect) nel segmento
appropriato semplicemente conoscendo tali
variabili
5SEGMENTAZIONE PER OBIETTIVI CHAID
I segmenti individuati sono mutuamente esclusivi
ed esaustivi. In altre parole, i segmenti non si
sovrappongono e ciascuna unità della popolazione
è contenuta in un unico segmento. Dal momento
che ogni segmento è definito da combinazioni
delle variabili esplicative, è possibile
riclassificare ogni osservazione
(azienda/clienti/prospect) nel segmento
appropriato semplicemente conoscendo tali
variabili Da un punto di vista marketing
limpiego di tale tecnica risulta molto
interessante per studiare/individuare
sottoinsiemi di clienti nellaccezione più
ampia del termine latenti, ossia rappresentati
come risultato dellanalisi congiunta di più
variabili. Esempio sempre con riferimento al
gianduiotto Caffarel analizziamo il prezzo che
gli intervistati sarebbero disposti a
spendere file dati Caffarel questionario
Caffarel sintassi CHAID_DESCRITTIVA.sps
6SEGMENTAZIONE PER OBIETTIVI CHAID
Esempio proviamo quindi a rispondere alle
domande precedenti file caffarel.sav,
variabili d4_13tot d4_6_1- d4_6_7,
d4_7_1-d4_7_2, d4_10_1-d4_10_9,
d4_14_1-d4_14_7, UOMO, SIGLE, BAMBINI, LAUREA,
MEDIE, età. Come e perchè ricodificate le
variabili socio-demo.
7SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
Le reti neurali traggono ispirazione dalle
scienze biologiche. Si tratta infatti di
uninsieme connesso di unità che agiscono in modo
equivalente ad un insieme di neuroni biologici.
Lorigine dello studio delle reti neurali si
può far risalire alla fine degli anni 40, quando
D.O. Hebb propose una legge di apprendimento che
sta alla base delle modello di analisi delle
reti neurali. Durante gli anni 50 e 60 si
assistette ad una vera e propria esplosione di
studi relativi alle reti neurali, studi che
portarono al Perceptron, che sembrò rappresentare
la risposta ottimale alla domanda che
maggiormente stava a cuore dei ricercatori
dellepoca come poter riprodurre artificialmente
lintelligenza umana. In realtà si trattò di
una pura illusione infatti tale modello, il
Perceptron, era in grado solo di riprodurre
alcune capacità del cervello umano. Per esempio
risultò particolarmente efficacie nelle
previsioni meteorologiche. Per circa un
ventennio le reti neurali restarono un dominio
per pochi studiosi almeno fino alla metà degli
anni 80 quando grazie ai nuovi algoritmi
(Back-propagation, 1986), ma soprattutto allo
sviluppo delle capacità di calcolo degli
elaboratori, si tornò a parlare delle possibili
applicazioni delle reti neurali. Le reti
neurali sono state originariamente create con
lintento di studiare il comportamento del
sistema nervoso. Come è noto, tale sistema è
costituito da un numero elevatissimo di cellule
nervose (neuroni), collegati da connessioni dette
sinapsi. Ogni neurone è in grado di eccitarsi e
di trasmettere uno stimolo elettrico in risposta
alle combinazioni di stimoli che riceve dagli
altri neuroni. La trasmissione degli stimoli
dipende dalla natura delle sinapsi e tale natura
si modifica durante la crescita per effetto
dellapprendimento.
8SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
La struttura generale La struttura generale di
una rete neurale è costituita da una serie di
nodi di entrata (unità di input), una o più serie
di nodi intermedi (livelli e unità nascoste) e
una serie di nodi di uscita (unità di uscita).
Qualora non esistano livelli nascosti si parlerà
di percettroni, altrimenti di reti multistrato.
9SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
- Un modello di rete neurale viene specificato
attraverso 5 caratteristiche -
- il modello generale del neurone
- larchitettura della rete
- la modalità di attivazione dei neuroni
- il paradigma di apprendimento
- la legge di apprendimento
-
- 1) Il modello generale del neurone il neurone
viene specificato attraverso - canali di ingresso sono le fonti di informazioni
del neurone - pesi delle connessioni riproducono le sinapsi
del cervello umano e hanno il compito di mediare
il segnale trasmesso da un neurone ad un altro
w(ij) - funzione di attivazione associa attraverso una
funzione (solitamente una somma) i pesi e i
segnali in arrivo al neurone NETj - funzione di uscita rappresenta il reale valore
di uscita dal neurone verso il neurone successivo
(può essere una funzione lineare o no e può
contenere un valore di soglia per cui il neurone
trasmette linformazione solo se tale valore
viene superato). OUT f(NET)
10SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
2) Larchitettura della rete è definita in
funzione del tipo di neuroni e di connessioni
esistenti fra gli stessi. Si parla di reti
stratificate quando i neuroni sono connessi solo
con quelli dello stato adiacente viceversa si ha
una rete cosiddetta completamente connessa quando
ogni neurone è connesso con qualunque altro
neurone della rete. Le più usate in ambito di
previsionale sono quelle stratificate. RETI
MULTISTRATO In relazione al numero ottimale di
strati nascosti in generale 1o 2 strati risultano
più che sufficienti per quanto riguarda il
numero dei nodi per ciascun strato in letteratura
vengono forniti diversi proposte - Media tra
il numero di nodi di input e nodi di output -
Radice quadrata della somma del numero dei nodi
di input e di output - Metà del numero dei nodi
di input -.... esperienza e soprattutto tante
prove! In generale il secondo livello nascosto
ha un numero di nodi superiori al primo.
11SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
3) La modalità di attivazione dei neuroni
stabilisce il modo in cui i neuroni vengono
attivati. Esistono due tipologie di attivazione
dei neuroni, il modo parallelo (sincrono) in cui
ad ogni istante t i neuroni si attivano e al
tempo t1 modificano il loro stato il modo
sequenziale (asincrono) in cui i neuroni vengono
aggiornati uno alla volta. In generale la
funzione di attivazione è quella funzione
attraverso la quale i neuroni trasmettono le
informazioni ricevute dai neuroni precedenti
(NET )ai neuroni successivi (OUT
f(NET)). Le principali funzioni di attivazione
impiegate sono quella lineare, quella a soglia,
quella logistica (in assoluto la più usata) la
gaussiana e la tangente iperbolica.
12SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
- 4) Il paradigma di apprendimento caratterizza il
modo in cui una rete apprende. - Esistono 3 tipologie di apprendimento supervised
learning (apprendimento con supervisione mediante
esempi), unsupervised learning (apprendimento
senza sueprvisione) e reinforcemente learning
(apprendimento mediante rinforzo). -
- In generale un paradigma di apprendimento può
essere definito come - inizializzazione dei pesi delle connessioni
(casuale) - sottomissione alla rete di un pattern di input e
corrispondente output desiderato - calcolo del output della rete
- aggiornamento dei pesi
- riproposta del pattern di input fino a quando
lerrore non è inferiore ad prefissato valore.
13SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
La rete adatta i pesi in funzione della
differenza fra il valore di output ottenuto e
quello desiderato d Y - Y il paradigma è
soddisfatto se d è moltiplicato per il valore di
ciascun input x(i) e questo prodotto e aggiunto a
ciascun peso. Negli anni 70 e 80 viene
proposta lalgoritmo di apprendimento per reti
multistrato denominato Back-propagation In
generale gli strati nascosti vengono addestrati
ri-propagando allindietro lerrore rilevato
sulloutput La funzione di attivazione
impiegata è quella logistica (sigmoide) per
cui ?w(ij) ?d (j)x(i) ove d è legato alla
differenza tra il valore stimato e quello
ottenuto dal modello (errore)
14SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
- Alcune considerazioni relative allalgoritmo
della Back-propagation -
- i pesi iniziali, scelti in modo casuale, non
devono essere troppo elevati - è opportuno scegliere un tasso di apprendimento h
alto allinizio per favorire lapprendimento
diminuendone poi il valore con il procedere della
fase di apprendimento. - in alternativa si può introdurre un altro
parametro (Momentum alt1) cosicché il
cambiamento dei pesi risulti proporzionale al
cambiamento precedente - ?w(ij) ?d (j)x(i) awn-1(ij)
-
-
- Per ottimizzare lalgoritmo nel 1987 è stato
proposto di normalizzare i dati in entrata
nellintervallo -1/21/2 - La Scatola Nera il principale limite allimpiego
di tale metodologia nellanalisi dei dati di
marketing è legato alla difficoltà di spiegare
il comportamento di una rete. - Infatti una volta ottenuta una struttura che sia
in grado non solo di fittare al meglio
linsieme dei dati forniti, ma anche di
generalizzare interpretando delle nuove
osservazioni, resta sempre il problema di poter
valutare il ruolo delle diverse variabili
indipendenti. A differenza delle tecniche
statistiche non è possibile, se non in via
approssimata, attribuire un peso alle diverse
variabili esplicative.