Title: Metodi Quantitativi per Economia, Finanza e Management Lezione n
1Metodi Quantitativi per Economia, Finanza e
ManagementLezione n12
2Analisi fattoriale
- Quante componenti considerare?
- metodo degli autovalori gt1
- rapporto tra numero di componenti e variabili
(circa 1/3) - percentuale di varianza spiegata (almeno 60)
- lo SCREE PLOT (plot di autovalore vs il numero di
fattori) - Se il plot mostra un gomito è plausibile
ipotizzare lesistenza di una struttura latente,
se la forma è quasi rettilinea significa che i
fattori sono solo una trasformazione delle
variabili manifeste. I fattori rilevanti sono
quelli al di sopra del gomito (a discrezione
anche quello in corrispondenza del gomito). Se
non ci sono fattori predominanti il criterio è
inadatto.
3Analisi fattoriale
- Quante componenti considerare?
- Comunalità
- - confronto tra le comunatità di più soluzioni
- - la quota di varianza spiegata di ciascuna
variabile dalla soluzione scelta deve essere
soddisfacente
4Analisi fattoriale
- Come interpretarle?
- rotazione delle componenti
- La rotazione ortogonale nello spazio dei fattori
non influenza la validità del modello sfruttiamo
questa caratteristica per ottenere dei fattori
più facilmente interpretabili. - The Varimax method of rotation, suggested by
Kaiser, has the purpose of minimizing the number
of variables with high saturations (correlations)
for each factor - The Quartimax method attempts to minimize the
number of factors tightly correlated to each
variable - The Equimax method is a cross between the
Varimax and the Quartimax - correlazioni tra componenti principali e
variabili originarie
5Esempidi Analisi Fattorialedi vecchi lavori di
gruppo
6EsempioImportanza dellInformazione e modalità
di acquisizione
Obiettivo della ricerca è comprendere quali siano
i principali mezzi informativi, il relativo
indice di gradimento e quali siano gli argomenti
di maggior interesse. Analisi fattoriale Le
variabili considerate sono i 14 parametri che
influenzano la scelta del canale e quelli che
influenzano la scelta relativa al tipo di fonte
7In funzione di cosa scegli il canale? Su una
scala da 1 a 10 (dove 1 per niente e 10
moltissimo) esprimi un giudizio sullimportanza
semplicità semplicità 1 2 3 4 5 6 7 8 9 10
costo 1 2 3 4 5 6 7 8 9 10
velocità di acquisizione velocità di acquisizione velocità di acquisizione velocità di acquisizione 1 2 3 4 5 6 7 8 9 10
comodità comodità 1 2 3 4 5 6 7 8 9 10
tempo di aggiornamento tempo di aggiornamento tempo di aggiornamento tempo di aggiornamento 1 2 3 4 5 6 7 8 9 10
In funzione di cosa scegli le fonti? Su una scala
da 1 a 10 (dove 1 per niente e 10 moltissimo)
esprimi un giudizio sullimportanza
orientamento politico orientamento politico 1 2 3 4 5 6 7 8 9 10
temi trattati 1 2 3 4 5 6 7 8 9 10
area geografica di interesse area geografica di interesse 1 2 3 4 5 6 7 8 9 10
direttore 1 2 3 4 5 6 7 8 9 10
formato / stile formato / stile 1 2 3 4 5 6 7 8 9 10
con chi vivi 1 2 3 4 5 6 7 8 9 10
redazione 1 2 3 4 5 6 7 8 9 10
giornalisti/speaker giornalisti/speaker 1 2 3 4 5 6 7 8 9 10
qualità servizi qualità servizi 1 2 3 4 5 6 7 8 9 10
8EsempioImportanza dellInformazione e modalità
di acquisizione
Le variabili considerate sono i parametri che
influenzano la scelta del canale e quelli che
influenzano la scelta relativa al tipo di fonte
9Esempio Importanza dellInformazione e modalità
di acquisizione
10Esempio Importanza dellInformazione e modalità
di acquisizione
11Esempio Importanza dellInformazione e modalità
di acquisizione
CONFRONTO CUMUNALITA FINALI
12Esempio Importanza dellInformazione e modalità
di acquisizione
Schema fattoriale Schema fattoriale Schema fattoriale Schema fattoriale Schema fattoriale Schema fattoriale Schema fattoriale
Factor1 Factor2 Factor3 Factor4 Factor5
D_17_s semplicità 0.56626 . . . 0.46051
D_17_c costo 0.35685 . 0.65469 . 0.3875
D_17_v velocità 0.75292 . . . .
D_17_com comodità 0.68764 -0.36206 . . .
D_17_tda tempo di aggiornamento 0.5326 -0.43612 . . -0.38524
D_20_orp orientamento politico . 0.54298 . 0.53024 .
D_20_tt temi trattati 0.41299 . . 0.53419 .
D_20_ag area geografica di interesse . . -0.5248 . 0.38026
D_20_d direttore . 0.74874 . . .
D_20_fs formato/stile 0.38261 . . -0.43544 .
D_20_ccv con chi vivi . 0.50515 . . .
D_20_r redazione . 0.72899 . . .
D_20_gs giornalisti/speaker 0.58604 0.49902 . . .
D_20_qs qualità servizi 0.63683 . . . .
I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati.
Lo schema fattoriale a 5 fattori, così come si
presenta, è di difficile interpretazione per
questo risulta opportuno ruotare i fattori
attraverso un apposito metodo (VARIMAX).
13Esempio Importanza dellInformazione e modalità
di acquisizione
SCHEMA FATTORIALE RUOTATO SCHEMA FATTORIALE RUOTATO Factor1 Factor1 Factor2 Factor2 Factor3 Factor3 Factor4 Factor4 Factor5 Factor5
D_17_v velocità 0.8578 0.8578 . . . . . . . .
D_17_tda tempo di aggiornamento 0.7885 0.7885 . . . . . . . .
D_17_com comodità 0.70345 0.70345 . . . . 0.39398 0.39398 . .
D_20_qs qualità servizio 0.53133 0.53133 . . . . . . . .
D_20_r rapidità . . 0.74824 0.74824 . . . . . .
D_20_fs formato/stile . . 0.71171 0.71171 . . . . . .
D_20_ccv con chi vivi . . 0.70059 0.70059 . . . . . .
D_20_gs giornalisti/speaker . . 0.62098 0.62098 0.36737 0.36737 . . . .
D_20_orp orientamento politico . . . . 0.8923 0.8923 . . . .
D_20_d direttore . . . . 0.77647 0.77647 . . . .
D_17_c costo . . . . . . 0.83334 0.83334 . .
D_17_s semplicità . . . . . . 0.65037 0.65037 0.45187 0.45187
D_20_ag area geografica di interesse . . . . . . . . 0.7622 0.7622
D_20_tt temi trattati . . . . . . . . 0.71198 0.71198
I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati. I valori minori di 0.35 non sono stampati.
Rapidità di acquisizione e qualità del servizio
offerto.
Esposizione dell informazione
Affinità politica/ ideologica
Accessibilità al sevizio
Attrattività argomenti trattati
14Coffee Consumption in Italy
15Factor Analysis
- We ran a Factor Analysis on two numerical
questions from the survey that we felt might have
correlated variables Q15 (What are you general
coffee preferences?) and Q16 (If you drink your
coffee outside (in a bar/coffee place) which are
the main factors that, in general, influence your
decision on where you drink your coffee?). - We used the Principal Components Method that was
supposed to solve the multicollinearity problem
among our variables and provide us with
summarized number of variables/factors which are
not correlated (standardized by definition, with
mean 0, standard deviation 1) to better explain
and understand the specific situation of coffee
consumption. - This represents a preliminary phase for cluster
analysis and regression analysis.
16Initial Variables used for analysis
On the right, there are our initial 21 variables
(taken from Q15 and Q16) that we selected for
running the factor analysis. Judging by the SPSS
Correlation Matrix (that is not present in the
slide because of its big size please see the
output for the check), we have many variables
which are significantly correlated.
Need for FACTOR REDUCTION! Start real Factor
Analysis!
17Choosing the right number of factors
- 1/3 criteria 21/3 7 factors
- Variance explained (60-75) 7, 8, 9, 10
factors - Scree Plot 6, 8, 10 factors
- Eigenvalues 6, 7, 8 factors
The optimal values seem to be 7 or 8 factors.
18Choosing the right number of factors continued -
The present Scree Plot represents the number 3
criteria of number of factors selection from the
previous slide.
19 Factor Analysis with 8 Factors
- After analyzing the Communalities table, we
identified one variable that is not properly
explained by our 8 selected factors (0.387 is not
satisfying)! This variable is Price which we
consider an important variable in our analysis!
Decreasing the number of factors to 7, will not
improve the explanatory power of the variables
for the price!
We decided to exclude the Price variable from
this factor analysis and consider it as a
separate factor (given its very high importance
from our qualitative point view) in the future
analysis cluster regression analysis.
20 Factor Analysis with 20 FactorsAfter
elimination of the Price variable
- 1/3 criteria 20/3 6 factors
- Variance explained (60-75) 7, 8, 9 factors
- Scree Plot 6, 7, 9 factors
- Eigenvalues 6, 7, 8 factors
The optimal choice seems to be 7 factors.
21 Factor Analysis with 20 FactorsAfter
elimination of the Price variable-continued-
The present Scree Plot represents the number 3
criteria of number of factors selection from the
previous slide.
22Factor Analysis with 7 Factors
- After analyzing the Communalities table, we that
so far the 7 factors properly explain the initial
variables. All communalities are over 0.400,
which is a good result.
We are ready to take a look at the Rotated
Component Matrix to see if the factors make
sense/can be explained!
23 Factors - explained
- The method used for rotation was Varimax.
- After closely analyzing the Rotated Component
Matrix, we tried to give meaning to our 7
factors. - The names of the respective factors are the
following - Socialization factor
- Internet/ Trendiness factor
- Close meeting place factor
- Intellectual/ non-smoking factor
- Familiarity factor
- Variety/To Go factor
- Traditionality Addiction factor
24 Factors explained - continued -
1. Socialization Factor Socialize, sit down, being with friends, cozy atmosphere
2. Internet/Trendiness Factor Wi-Fi availability, internet, trendy place
3. Close meeting place Factor Close to home/work/school, ability to meet people, quality of coffee not important
4. Intellectual/Non-smoking Factor Non-smokers, usually snack, love to read
5. Familiarity Factor Go to the same bar, do not like trying new places, concerned about quality of coffee
6. Variety/To-go Factor Variety and coffee to go, non traditional Italian coffee, preference for taking coffee alone
7. Traditionality/Addiction Factor Italian coffee preference, addicts
25The consumption of Digital Music and its impact
on the Music Industry
26Factor Analysis
- Home
- Car
- Outside in general
- Office/University
- Shops
- Restaurants
- Bars/discoteque
- Record player
- Cassette player
- CD player
- Digital player
- Car stereo
- House stereo
- Radio
- Mobile phone
- USE record player
- USE cassette player
- USE CD Player
- USE digital player
- We have taken into consideration questions n
4,9,10 and therefore we have 24 variables - We asked interviewees to give a score from 1 to 9
(1 I dont like it 9 I love it) - or to use percentages
- Quest.n.4 score
- Quest.n.9 score
- Quest.n.10
27Factor Analysis
Number of factors 9 Extraction Principal
Component Analysis Max number of interaction
25 Rotation Varimax
First hypothesis
28Factor Analysis
Ratio between component number and variable number ADEQUATE For a set of 17 variables, the ideal number of components is 4-5. In this case for a set of 24 variables, we have considered 9 components
global explained variance OK About 68 - the optimal range is 60 - 70
Communalities ADEQUATE The values vary among 0,456 and 0,917
We found a problem looking at the rotated
component matrix CORRELATION AMONG COMPONENTS
AND ORIGINAL VARIABLES NON OPTIMAL
problematic 9th component
29Factor Analysis
Number of factors 8 Extraction Principal
Component Analysis Max number of interaction
25 Rotation Varimax
Second hypothesis
30Factor Analysis
Ratio between component number and variable number ADEQUATE For a set of 17 variables, the ideal number of components is 4-5. In this case for a set of 24 variables, we have considered 8 components
global explained variance OK About 63 - the optimal range is 60 - 70
Communalities ACCEPTABLE The values vary among 0,431 and 0,870
31Factor Analysis
Scree plot ADEQUATE Quite linear slope
From the 9th component , there is little increase
in significance explained.
32Factor Analysis Interpretation
- Problems with the 9th component its over.
- We choosed Varimax option to minimize the number
of variables that have elevated saturations for
each factor
WE CHOOSE THE SECOND HYPOTHESIS
33(No Transcript)
34Factor Analysis Interpretation
Office/University Shops Restaurants Bars/Discoteque OUTSIDE LISTENING
Record player Use record player Cassette player Use cassette player STEREO
Digital player Use digital player DIGITAL PLAYER
Radio Use radio RADIO
Car Car stereo CD player Use CD player CAR LISTENING
Home House stereo Use house stereo HOUSE LISTENING
Outside in general Use PC PC
Mobile phone Use mobile phone MOBILE PHONE