INDICE DELL - PowerPoint PPT Presentation

About This Presentation
Title:

INDICE DELL

Description:

INDICE DELL INCONTRO Analisi di segmentazione per Obiettivi La segmentazione ad Albero: Chaid Cenni alle Reti Neurali SEGMENTAZIONE PER OBIETTIVI: CHAID perch la ... – PowerPoint PPT presentation

Number of Views:38
Avg rating:3.0/5.0
Slides: 15
Provided by: Gnec
Category:
Tags: dell | indice | hebb

less

Transcript and Presenter's Notes

Title: INDICE DELL


1
INDICE DELLINCONTRO
  • Analisi di segmentazione per Obiettivi
  • La segmentazione ad Albero Chaid
  • Cenni alle Reti Neurali

2
SEGMENTAZIONE PER OBIETTIVI CHAID
perché la Segmentazione ad Albero?...
Consideriamo per esempio le domande d4-13 tot
del file dati caffarel.sav, vale a dire la spesa
che ciascun intervistato sarebbe disposto a
sostenere per acquistare il gianduiotto. Relativa
mente alle variabili socio demo possiamo
evidenziare delle differenze significative? Se
consideriamo il gradimento per il prodotto (dom
4_6) e/o per la confezione (dom 4_7) e/o il
percepito per la marca Caffarel (dom 4_10) e/o
per il giunduitto stesso (dom 4_14), quali
conclusioni possiamo trarre relativamente al
gradimento complessivo? Proviamo in base a
quanto visto sino ad ora a procedere (analisi
bivariate, multivariate regressione-.)
3
SEGMENTAZIONE PER OBIETTIVI CHAID
  • Il metodo CHAID permette di analizzare TUTTI gli
    incroci possibili evidenziandone solo quelli
    significativi
  • Si basa su una procedura iterativa
  • nella prima fase, la popolazione viene divisa in
    due o più gruppi sulla base della variabile
    esplicativa più significativamente legata alla
    variabile dipendente prescelta
  • ciascuno di questi gruppi ottenuti nella prima
    fase viene ulteriormente diviso in sottogruppi
    più piccoli sulla base delle rimanenti variabili
    esplicative. Il processo di divisione termina
    quando non possono più essere individuati
    predittori statisticamente significativi i
    sottogruppi finali (segmenti) vengono quindi
    rappresentati in un diagramma ad albero.

4
SEGMENTAZIONE PER OBIETTIVI CHAID
I segmenti individuati sono mutuamente esclusivi
ed esaustivi. In altre parole, i segmenti non
si sovrappongono e ciascuna unità della
popolazione è contenuta in un unico segmento.
Dal momento che ogni segmento è definito da
combinazioni delle variabili esplicative, è
possibile riclassificare ogni osservazione
(azienda/clienti/prospect) nel segmento
appropriato semplicemente conoscendo tali
variabili
5
SEGMENTAZIONE PER OBIETTIVI CHAID
I segmenti individuati sono mutuamente esclusivi
ed esaustivi. In altre parole, i segmenti non si
sovrappongono e ciascuna unità della popolazione
è contenuta in un unico segmento. Dal momento
che ogni segmento è definito da combinazioni
delle variabili esplicative, è possibile
riclassificare ogni osservazione
(azienda/clienti/prospect) nel segmento
appropriato semplicemente conoscendo tali
variabili Da un punto di vista marketing
limpiego di tale tecnica risulta molto
interessante per studiare/individuare
sottoinsiemi di clienti nellaccezione più
ampia del termine latenti, ossia rappresentati
come risultato dellanalisi congiunta di più
variabili. Esempio sempre con riferimento al
gianduiotto Caffarel analizziamo il prezzo che
gli intervistati sarebbero disposti a
spendere file dati Caffarel questionario
Caffarel sintassi CHAID_DESCRITTIVA.sps
6
SEGMENTAZIONE PER OBIETTIVI CHAID
Esempio proviamo quindi a rispondere alle
domande precedenti file caffarel.sav,
variabili d4_13tot d4_6_1- d4_6_7,
d4_7_1-d4_7_2, d4_10_1-d4_10_9,
d4_14_1-d4_14_7, UOMO, SIGLE, BAMBINI, LAUREA,
MEDIE, età. Come e perchè ricodificate le
variabili socio-demo.
7
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
Le reti neurali traggono ispirazione dalle
scienze biologiche. Si tratta infatti di
uninsieme connesso di unità che agiscono in modo
equivalente ad un insieme di neuroni biologici.
Lorigine dello studio delle reti neurali si
può far risalire alla fine degli anni 40, quando
D.O. Hebb propose una legge di apprendimento che
sta alla base delle modello di analisi delle
reti neurali. Durante gli anni 50 e 60 si
assistette ad una vera e propria esplosione di
studi relativi alle reti neurali, studi che
portarono al Perceptron, che sembrò rappresentare
la risposta ottimale alla domanda che
maggiormente stava a cuore dei ricercatori
dellepoca come poter riprodurre artificialmente
lintelligenza umana. In realtà si trattò di
una pura illusione infatti tale modello, il
Perceptron, era in grado solo di riprodurre
alcune capacità del cervello umano. Per esempio
risultò particolarmente efficacie nelle
previsioni meteorologiche. Per circa un
ventennio le reti neurali restarono un dominio
per pochi studiosi almeno fino alla metà degli
anni 80 quando grazie ai nuovi algoritmi
(Back-propagation, 1986), ma soprattutto allo
sviluppo delle capacità di calcolo degli
elaboratori, si tornò a parlare delle possibili
applicazioni delle reti neurali. Le reti
neurali sono state originariamente create con
lintento di studiare il comportamento del
sistema nervoso. Come è noto, tale sistema è
costituito da un numero elevatissimo di cellule
nervose (neuroni), collegati da connessioni dette
sinapsi. Ogni neurone è in grado di eccitarsi e
di trasmettere uno stimolo elettrico in risposta
alle combinazioni di stimoli che riceve dagli
altri neuroni. La trasmissione degli stimoli
dipende dalla natura delle sinapsi e tale natura
si modifica durante la crescita per effetto
dellapprendimento.
8
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
La struttura generale La struttura generale di
una rete neurale è costituita da una serie di
nodi di entrata (unità di input), una o più serie
di nodi intermedi (livelli e unità nascoste) e
una serie di nodi di uscita (unità di uscita).
Qualora non esistano livelli nascosti si parlerà
di percettroni, altrimenti di reti multistrato.
9
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
  • Un modello di rete neurale viene specificato
    attraverso 5 caratteristiche
  •  
  • il modello generale del neurone
  • larchitettura della rete
  • la modalità di attivazione dei neuroni
  • il paradigma di apprendimento
  • la legge di apprendimento
  •  
  • 1) Il modello generale del neurone il neurone
    viene specificato attraverso
  • canali di ingresso sono le fonti di informazioni
    del neurone
  • pesi delle connessioni riproducono le sinapsi
    del cervello umano e hanno il compito di mediare
    il segnale trasmesso da un neurone ad un altro
    w(ij)
  • funzione di attivazione associa attraverso una
    funzione (solitamente una somma) i pesi e i
    segnali in arrivo al neurone NETj
  • funzione di uscita rappresenta il reale valore
    di uscita dal neurone verso il neurone successivo
    (può essere una funzione lineare o no e può
    contenere un valore di soglia per cui il neurone
    trasmette linformazione solo se tale valore
    viene superato). OUT f(NET)

10
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
2) Larchitettura della rete è definita in
funzione del tipo di neuroni e di connessioni
esistenti fra gli stessi. Si parla di reti
stratificate quando i neuroni sono connessi solo
con quelli dello stato adiacente viceversa si ha
una rete cosiddetta completamente connessa quando
ogni neurone è connesso con qualunque altro
neurone della rete. Le più usate in ambito di
previsionale sono quelle stratificate. RETI
MULTISTRATO In relazione al numero ottimale di
strati nascosti in generale 1o 2 strati risultano
più che sufficienti per quanto riguarda il
numero dei nodi per ciascun strato in letteratura
vengono forniti diversi proposte - Media tra
il numero di nodi di input e nodi di output -
Radice quadrata della somma del numero dei nodi
di input e di output - Metà del numero dei nodi
di input -.... esperienza e soprattutto tante
prove! In generale il secondo livello nascosto
ha un numero di nodi superiori al primo.
11
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
3) La modalità di attivazione dei neuroni
stabilisce il modo in cui i neuroni vengono
attivati. Esistono due tipologie di attivazione
dei neuroni, il modo parallelo (sincrono) in cui
ad ogni istante t i neuroni si attivano e al
tempo t1 modificano il loro stato il modo
sequenziale (asincrono) in cui i neuroni vengono
aggiornati uno alla volta. In generale la
funzione di attivazione è quella funzione
attraverso la quale i neuroni trasmettono le
informazioni ricevute dai neuroni precedenti
(NET )ai neuroni successivi (OUT
f(NET)). Le principali funzioni di attivazione
impiegate sono quella lineare, quella a soglia,
quella logistica (in assoluto la più usata) la
gaussiana e la tangente iperbolica.  
12
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
  • 4) Il paradigma di apprendimento caratterizza il
    modo in cui una rete apprende.
  • Esistono 3 tipologie di apprendimento supervised
    learning (apprendimento con supervisione mediante
    esempi), unsupervised learning (apprendimento
    senza sueprvisione) e reinforcemente learning
    (apprendimento mediante rinforzo).
  •  
  • In generale un paradigma di apprendimento può
    essere definito come
  •  inizializzazione dei pesi delle connessioni
    (casuale)
  • sottomissione alla rete di un pattern di input e
    corrispondente output desiderato
  • calcolo del output della rete
  • aggiornamento dei pesi
  • riproposta del pattern di input fino a quando
    lerrore non è inferiore ad prefissato valore.

13
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
La rete adatta i pesi in funzione della
differenza fra il valore di output ottenuto e
quello desiderato   d Y - Y   il paradigma è
soddisfatto se d è moltiplicato per il valore di
ciascun input x(i) e questo prodotto e aggiunto a
ciascun peso. Negli anni 70 e 80 viene
proposta lalgoritmo di apprendimento per reti
multistrato denominato Back-propagation   In
generale gli strati nascosti vengono addestrati
ri-propagando allindietro lerrore rilevato
sulloutput   La funzione di attivazione
impiegata è quella logistica (sigmoide) per
cui   ?w(ij) ?d (j)x(i) ove d è legato alla
differenza tra il valore stimato e quello
ottenuto dal modello (errore)    
14
SEGMENTAZIONE PER OBIETTIVI le Reti Neurali
  • Alcune considerazioni relative allalgoritmo
    della Back-propagation
  •  
  • i pesi iniziali, scelti in modo casuale, non
    devono essere troppo elevati
  • è opportuno scegliere un tasso di apprendimento h
    alto allinizio per favorire lapprendimento
    diminuendone poi il valore con il procedere della
    fase di apprendimento.
  • in alternativa si può introdurre un altro
    parametro (Momentum alt1) cosicché il
    cambiamento dei pesi risulti proporzionale al
    cambiamento precedente
  • ?w(ij) ?d (j)x(i) awn-1(ij)
  •  
  •  
  • Per ottimizzare lalgoritmo nel 1987 è stato
    proposto di normalizzare i dati in entrata
    nellintervallo -1/21/2
  • La Scatola Nera il principale limite allimpiego
    di tale metodologia nellanalisi dei dati di
    marketing è legato alla difficoltà di spiegare
    il comportamento di una rete.
  • Infatti una volta ottenuta una struttura che sia
    in grado non solo di fittare al meglio
    linsieme dei dati forniti, ma anche di
    generalizzare interpretando delle nuove
    osservazioni, resta sempre il problema di poter
    valutare il ruolo delle diverse variabili
    indipendenti. A differenza delle tecniche
    statistiche non è possibile, se non in via
    approssimata, attribuire un peso alle diverse
    variabili esplicative.
Write a Comment
User Comments (0)
About PowerShow.com