Date post: | 01-May-2015 |
Category: |
Documents |
Upload: | giuseppe-costanzo |
View: | 215 times |
Download: | 2 times |
1
ANALISI DELLA COVARIANZA
Per stabilire come varia la domanda di un bene in funzione non solo del reddito disponibile, ma
anche di fattori sociali o ambientali si può impiegare l’analisi della covarianza, che combina
il modello di regressione con l’analisi della varianza, consentendo di valutare gli effetti dei
fattori sia quantitativi che qualitativi.
2
Con l’analisi della covarianza si cerca di vedere se il consumo di un bene obbedisce alla stessa legge per
diversi gruppi di famiglie.
Scopo dell’ANCOVA
3
Il consumo del prodotto o del gruppo di prodotti in esame si può esprimere secondo il modello:
ijijiiij uxbay
i=1,2,…,q individua la modalità di raggruppamento delle famiglie;j=1,2,…,p individua la singola famiglia all’interno di ciascun gruppo;
Yij è spesa totale della famiglia j-
ma appartenente al
gruppo i-mo
xij è spesa per il consumo del prodotto
in esame della famiglia j-ma appartenente al
gruppo i-mo
uij è la componente erratica della famiglia j-ma
appartenente al gruppo i-mo
ai e bi sono i parametri incogniti
che dipendono dal gruppo i
4
In base ai valori che possono assumere i parametri
ai e bi nell’ambito dei vari gruppi, le situazioni che si
possono presentare sono sintetizzate nella seguente tabella:
5
ai = tra loro ai ≠ tra loro
bi =tra loro 1 2
bi ≠ tra loro 3 4
6
ai
bi
Quadrante 1
7
ai
bi
ai bi
Quadrante 2
8
ai ai
bi bi
Quadrante 3
9
ai bi
ai bi
Quadrante 4
10
L’analisi consiste nel sottoporre a verifica se vi è convenienza a suddividere l’insieme delle famiglie in
gruppi. Si ipotizza che la suddivisione in gruppi delle famiglie non ha alcun effetto sulla variabile dipendente, cioè
all’interno di ciascun gruppo si assiste allo stesso andamento dei consumi in relazione a tutte le famiglie.
Tale ipotesi si verifica attraverso il test F di Fisher-Snedecor.
I TEST DI IPOTESI
11
La verifica del test si basa sulla seguente considerazione:
la variabilità della componente erratica nel modello di la variabilità della componente erratica nel modello di
regressione senza la suddivisione in gruppi è maggiore regressione senza la suddivisione in gruppi è maggiore
dell’analoga variabilità nel modello con suddivisione in dell’analoga variabilità nel modello con suddivisione in
gruppi.gruppi.
12
Per la proprietà della scomposizione della devianza si ha:
Devianza totaledell’errore
Devianza interna
Devianzaesterna
q
i
n
j
q
iijij
q
i
n
jij
jj
uuuuuu1 1 1
22
1 1
2)(
13
Essendo:
si ha che:
la devianza del modello senza suddivisione in gruppi è la devianza del modello senza suddivisione in gruppi è
maggiore di quella calcolata con la suddivisione.maggiore di quella calcolata con la suddivisione.
01
2
q
ii uu
q
i
n
jjij
q
i
n
jij
jj
uuuu1 1
2
1 1
2)(
14
Tale considerazione resta valida se dalle devianze si passa alle varianze.
Con le varianze è possibile effettuare il test di verifica utilizzando la F di Fisher-Snedecor, in cui viene ad essere testato l’incremento di varianza nel passare dal modello con suddivisione al modello senza, in corrispondenza di
due ipotesi.
15
H0 : b1 = b2 = b3 =…= bt
La suddivisione in gruppi è ininfluente, avendosi lo stesso andamento della spesa per il consumo del bene in analisi.
H1 : b1 b2 b3 ... bt
esiste un diverso andamento del consumo all’interno dei gruppi.
16
Per il calcolo delle varianze da utilizzare nel test F, si parte dal modello iniziale con la suddivisione in gruppi:
yij=ai+bixij+uij [1]
Si calcolano le medie del primo e del secondo membro ottenendosi:
iiiii uxbay
Modello con suddivisione
Sottraendo la prima equazione alla seconda si passa al modello centrato:
2iijiijiiij uuxxbyy
17
Il modello senza suddivisione in gruppi può essere così
formulato: yj=at+bt xj+uj
Modello senza suddivisione
...... uxbay tt
Sottraendo la prima equazione alla seconda si ottiene il modello centrato: 3uuxxbyy jjtj ......
Effettuando le medie, si ha:
In cui:
- y.. e x.. sono le medie delle rispettive variabili calcolate su tutte le famiglie;
- at e bt sono i coefficienti che si ottengono utilizzando nella stima
le osservazioni concernenti tutte le modalità di raggruppamento.
18
ESS2 =
Indicando con ESS2 la somma delle devianze di ciascun
gruppo, nota anche come devianza interna,
i j iij uu 2
e con ESS3 la devianza totale dell’errore del modello senza
suddivisione in gruppi, 2
jj uu ..ESS3 =
qkE
qEEF
SS
SSSS
2/
22/
2
231
q
iink
1
F1 è uguale a:
dove: (2q-2) e (k-2q) sono i gradi di libertà e
indica il numero complessivo delle osservazioni.
19
FF11<F<F11**
accetto H0: la suddivisione delle famiglie in gruppi è
perfettamente inutile, c’è omogeneità di comportamento.
FF11>F>F11**
rigetto H0: all’interno di ciascun gruppo di famiglie c’è una
relazione spesa totale-consumo diversa.
20
Accertata la significativa diversità dal modello senza
suddivisione in gruppi (F1>F1*) si possono avere due
possibilità:
-le intercette dei modelli che descrivono le varie modalità sono tra loro diverse, ma i coefficienti angolari
sono statisticamente uguali fra loro, ma diversi da bt;
per cui le diversità nei comportamenti consistono in differenti livelli di consumo;
- oltre alle ai sono statisticamente diverse tra loro anche
le bi ; per cui le diverse modalità di raggruppamento
sottintendono comportamenti di consumo completamente diversi.
21
Al fine di verificare in quale delle 2 situazioni ci si trovi si può supporre che i coefficienti angolari siano
uguali ad un particolare valore bw (w sta per within)
comune a tutti i gruppi.
22
Per verificare tale ipotesi vanno considerate:
a) la devianza dei residui di tale modello, che può scriversi:
yij=ai+bwxij+uij
Calcolando le medie si ha:iiwii uxbay
Sottraendo membro a membro si perviene al relativo modello centrato:
iijiijwiiiij uuxxbaayy
b) la devianza del modello iniziale con suddivisione in gruppi opportunamente centrato, come nel caso visto in precedenza, che risulta inferiore alla devianza calcolata sub a).
23
Occorre verificare la significatività dell’incremento della varianza che si ha passando dal modello in cui i vari gruppi
presentano coefficienti angolari bi statisticamente uguali
tra loro a quello in cui i gruppi sono caratterizzati da coefficienti angolari statisticamente diversi tra loro.
Si calcola il test F:
H0 : b1=b2=b3=……=bw
H1 : b1b2b3……bw
24
Indicando con ESS2 la somma dei quadrati dei residui del
modello con suddivisione in gruppi e con ESS4 la devianza
totale dell’errore del modello con suddivisione in gruppi
caratterizzati da un coefficiente angolare comune bw.
qkE
qEEF
SS
SSSS
2/
1/
2
242
Dove (q-1) e (k-2q) sono i gradi di libertà e k indica il numero totale delle osservazioni.
25
FF22<F<F22**
si accetta H0: l’eterogeneità dei gruppi si traduce soltanto nelle
differenze fra le intercette
FF22>F>F22* *
Si accettata H1: il criterio di raggruppamento sottintende una
completa eterogeneità del comportamento di consumo nei gruppi di famiglie individuati dalle i modalità
26
ai = tra loro ai tra loro
(1) Accettazione (2) Accettazione Ho di F1. Ho di F2 bi=
(3) Accettazione (4) Accettazione H1 di F1 H1 di F2 bi