Title: Metodi Quantitativi per Economia, Finanza e Management Lezione n
1Metodi Quantitativi per Economia, Finanza e
ManagementLezione n8
2Test F per la verifica di ipotesi sulla
differenza tra medie
- Si prende in considerazione la scomposizione
della varianza qui - H0 le medie sono tutte uguali tra loro
- H1 esistono almeno due medie diverse tra loro
- La statistica test da utilizzare, sotto lipotesi
H0, si distribuisce come una F di Fisher con
(c-1,n-1) gradi di libertà. Tende a crescere
allaumentare della varianza tra medie e al
diminuire della variabilità interna alle
categorie. Cresce inoltre allaumentare
dellampiezza campionaria.
3Test F per la verifica di ipotesi sulla
differenza tra medie
- La regione di rifiuto cade nella coda di destra
della distribuzione, cioè è caratterizzata da
valori relativamente elevati di F se il livello
di significatività è 5, si rifiuta per Fgt F0,95
0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
Regione di rifiuto
0 0.7 1.4 2.1 2.8 3.5
4.2 4.9
4Test F per la verifica di ipotesi sulla
differenza tra medie
5(No Transcript)
6Univariate Analysis
7Bivariate Analysis
- Objective
- To describe the relationship between two
variables jointly. - qualitative variables Analysis of Connection
- quantitative variables Analysis of Correlation
- mixed variables Analysis of Variance
8Bivariate Analysis
9Modelling
visiting_starbucks(Q25) 1.299
.437starbucks_appeals_atmosphere
0.281characteristic_rate_brand
0.676socialization factor
0.978spend_actual
- In our interpretation, we cannot make a
straightforward connection between importance of
brand of coffee bought for home consumption and
expected frequency of visiting Starbucks. What we
can infer is that there is some negative
correlation with brand loyalty. In addition, the
variable that incorporated the rating of the
appeal of the atmosphere in Starbucks has the
highest explanatory power of the variability in
the dependent variable, which means that the
atmosphere is one of the strong aspects of
Starbucks to be leveraged in the Italian market. - The other two factors that have significant
explanatory power are actual spending per coffee
and socialization, which are positively
correlated with expected frequency of visiting
Starbucks. The latter means that people who on
average spend more per coffee expect to visit
Starbucks more if given the opportunity, which is
logical considering the higher level of prices
there. People that score high on the
socialization factor, meaning they like to sit
and spend time with friends while drinking
coffee, also expect higher frequency of visits. - Starbucks can successfully apply its
international established image of a place for
meeting friends as a strategy for penetrating
the Italian market.
10Multivariate Analysis
- Objective
- To describe the relation between more than two
variables jointly, in terms of - Analysis of Dependence
- Y Quantitative , X Quantitative Multiple Linear
Regression - Y Quantitative , X Qualitative Conjoint Analysis
- Y Qualitative , X Quantitative Discriminant
Analysis - Analysis of Inter-Dependence
- Classification, X Quantitative Cluster Analysis
- Reduction of Dimensions, X Quantitative Factor
Analysis
11Factor Analysis
12Factor Analysis
13Factor Analysis
- If the information is spread among many
correlated variables - we may have several different problems.
- Apparent information
- Miss- understanding
- Difficulties in the interpretation phase
- Robustness of the results
- Efficiency of the estimates
- Degrees of freedom
- ..
14Factor Analysis
- The high number and the correlation between
variables lead to analysis problems - gt its necessary to reduce their number, however
making sure not to loose any valuable
information. - The Factor Analysis (FA) is a multivariate
technique used to perform the analyses of
correlation between quantitative variables. - Considering a data matrix X(nxp), with n
observations and p original variables, the use
of the FA allows to summarize the information
within a restricted set of transformed variables
(the so called Factors or latent factors).
15Factor Analysis
16Factor Analysis
17Analisi fattoriale
- Quando le variabili considerate sono numerose
spesso risultano tra loro correlate. - Numerosità e correlazione tra variabili porta a
difficoltà di analisi gt ridurre il numero
(semplificando lanalisi) evitando, però, di
perdere informazioni rilevanti. - LAnalisi Fattoriale E una tecnica statistica
multivariata per lanalisi delle correlazioni
esistenti tra variabili quantitative. - A partire da una matrice di dati nxp con p
variabili originarie, consente di sintetizzare
linformazione in un set ridotto di variabili
trasformate (i fattori latenti).
18Analisi fattoriale
- Perché sintetizzare mediante limpiego della
tecnica? - Se linformazione è dispersa tra più variabili
correlate tra loro, le singole variabili faticano
da sole a spiegare il fenomeno oggetto di studio,
mentre combinate tra loro risultano molto più
esplicative. - Esempio lattrattività di una città da cosa è
data? Dalle caratteristiche del contesto, dalla
struttura demografica della popolazione, dalla
qualità della vita, dalla disponibilità di
fattori quali capitale, forza lavoro, know-how,
spazi, energia, materie prime, infrastrutture,
ecc. - I fattori latenti sono concetti che abbiamo in
mente ma che non possiamo misurare direttamente.
19Analisi fattoriale
- Le ipotesi del Modello Fattoriale
Variabili Quantitative x1, x2, ......, xi,
......... xp
Info xi Info condivisa Info
specifica Var xi Communality Var
specifica xi f(CF1, ....,CFk) UFi
Corr (UFi , UFj) 0 per i j Corr (CFi ,
CFj) 0 per i j Corr (CFi , UFj) 0
per ogni i,j
20Analisi fattoriale
- Factor Loadings Factor Score Coefficients
xi li1CF1 li2CF2 .... likCFk
UFi li1, li2,........,lik factor loadings i
1, ........., p significato fattori
CFj sj1x1 sj2x2 ..............
sjpxp sj1, sj2,........,sjp factor score
coeff. j 1, ....., k ltlt p costruzione fattori
21Analisi fattoriale
- Metodo delle Componenti Principali
- Uno dei metodi di stima dei coefficienti (i
LOADINGS) è il Metodo delle Componenti
Principali. - Utilizzare tale metodo significa ipotizzare che
il patrimonio informativo specifico delle
variabili manifeste sia minimo, mentre sia
massimo quello condiviso, spiegabile dai fattori
comuni. - Per la stima dei loadings si ricorre agli
autovalori e agli autovettori della matrice di
correlazione R di fatto i loadings coincidono
con le correlazioni tra le variabili manifeste e
le componenti principali.
22Analisi fattoriale
Metodo delle Componenti Principali
- I fattori calcolati mediante il metodo delle CP
sono combinazioni lineari delle variabili
originarie -
- Sono tra loro ortogonali (non correlate)
- Complessivamente spiegano la variabilità delle p
variabili originarie - Sono elencate in ordine decrescente rispetto alla
variabilità spiegata
CPj sj1x1 sj2x2 .............. sjpxp
23Analisi fattoriale
Metodo delle Componenti Principali
- Il numero massimo di componenti principali è pari
al numero delle variabili originarie (p). - La prima componente principale è una combinazione
lineare delle p variabili originarie ed è
caratterizzata da varianza più elevata, e così
via fino allultima componente, combinazione
sempre delle p variabili originarie, ma a
varianza minima. - Se la correlazione tra le p variabili è elevata,
un numero kltltp (k molto inferiore a p )di
componenti principali è sufficiente rappresenta
in modo adeguato i dati originari, perché
riassume una quota elevata della varianza
totale.