- 1. ANALISI DELLAUDIENCE MEDIA DELLE DIRETTE DELLA SERIE A DI
BASKET
- La regressione lineare una metodologiastatistica che tenta di
individuare una relazione tra una variabile Y ed una o pi variabili
X che si presume la determinano.
- E' chiaro che non tutti i fenomeni possono essere spiegati con
la regressione lineare senza errori "eccessivi". Per cui esistono
una serie di indici che testano la "bont" del modello stimato.
2.
- fascia oraria e giornata di programmazione (sabato sera,
domenica ore 11.45/12.00, domenica 18.15, domenica
20.00/21.00);
- numerosit dei tifosi delle squadre coinvolte nella partita (il
dato stato preso da SportFans);
- posizione in classifica delle squadre prima di disputare il
match (1, 2, 3, , ultima, etc.);
Variabili analizzate (1 di 3) La variabile dipendente inserita
nel nostro modello lAudience Media delle dirette del campionato di
serie A trasmesse da Sky nelle ultime 4 RG (2007-08, 2008-09,
2009-10, 2010-11 fino alla 16 giornata inclusa). Per tentare di
spiegare a cosa sono dovuti livelli elevati o ridotti dellAudience
Media sono state testate le seguenti variabili: 3.
- differenza punti in classifica fra le squadre prima di
disputare il match;
- appeal della gara ( un indicatore costruito per combinare
assieme le variabili posizioni in classifica e differenza
punti);
- BIG (presenza di almeno una fra le prime cinque squadre come
numero di tifosi: Milano, Treviso, Siena, Roma, Virtus
Bologna);
- presenza di ognuna delle squadre del campionato di serie A
2010-2011 (lArmani Jeans Milano stata considerata sia nella modalit
in casa che nella modalit in trasferta);
- contemporanea presenza di una partita della serie A di calcio
che vedeva in campo almeno una fra Juventus, Inter o Milan (le
squadre con il maggior numero di tifosi nel calcio);
- equilibrio della gara inteso come scarto in termini di punti
alla conclusione della gara stesso (es. risultato: 90 a 80, scarto
10 punti; abbiamo analizzato classi di scarto).
Variabili analizzate (2 di 3) 4.
- Mese dellanno in cui si sono disputati i match di Regular
Season (da settembre a maggio)
- Natale: stato considerato il periodo natalizio (dal 25/12 fino
al 5/1) per valutare lanon sovrapposizionedel Campionato di Serie A
di Basket con quello della Serie A di calcio
- Derby: Milano-Cant, Milano-Varese, Cant-Varese,
Fortitudo-Virtus, Pesaro-Montegranaro, Napoli-Avellino,
Avellino-Caserta
Variabili analizzate (3 di 3) 5. Il modello di regressione stato
costruito sulla base di 328 partite (tutte le partite delle
stagioni 2007-08, 2008-2009 e 2009-2010, pi le prime 48 dirette
della stagione 2010-2011). Il miglior modello per spiegare
lAudience stato ottenuto includendo queste 17 variabili (sono
ordinate in base allimportanza che il modello gli attribuisce nella
spiegazione dellAudience): Il modello VARIABILI COEFFICIENTI Milano
13949,9 "Natale" 13933,0 Derby 8644,9 Siena 7148,1 Roma 4915,8
Diff.pti -678,8 Treviso -3303,1 Teramo -4304,6 Montegranaro -4793,3
Pesaro -4810,1 Cant -4934,5 Caserta -6446,9 Juve - Inter Milan
-7772,8 Brindisi -10760,7 Biella -11318,6 Avellino -11701,7 Cremona
-12154,0 (Constant) 41464,0 6. Interpretazione dei risultati (1 di
3)
- Le variabili numero di tifosi, BIG, e quelle riferite alle
singole squadre risultano evidentemente correlate, ovvero esprimono
sostanzialmente il medesimo contenuto informativo. La correlazione
fra i regressori causa problemi al modello in quanto peggiora la
significativit e la precisione delle stime dei coefficienti
rendendo pi difficoltosa linterpretazione dei risultati. Per
ottimizzare il modello, evitando la ridondanza nel contenuto
informativo dei dati, sono state incluse nel modello solamente le
variabili relative alle squadre ed escluse le variabili numero di
tifosi e BIG. Queste ultime due risultano anchesse significative
nello spiegare lAudience Media, tuttavia linformazione contenuta
nelle variabili Squadra risultata pi completa ed il modello di
regressione che le include il migliore.
- Un discorso analogo vale per le variabili Posizione in
classifica, Differenza punti in classifica ed Appeal. Fra queste
tre la caratteristica che meglio aiuta a comprendere la dinamica
dellAudience risultata essere la Differenza Punti che quindi stata
inserita nel modello a scapito delle altre due.
7. Interpretazione dei risultati (2 di 3)
- La variabile Scarto a fine gara , utilizzata per misurare
lequilibrio della gara, non risultata significativa nello spiegare
lAudience Media delle dirette. Ci in parte spiegato dalla natura
stessa della variabile Audience che rappresenta una misura di
sintesi calcolata sullintera durata della partita, pertanto vistosi
cali dellAudience nel finale di gara possono essere
contro-bilanciati dallascolto registrato nei primi due quarti del
match. In questottica si nota come le misure ex-ante (posizione in
classifica, differenza punti in classifica) siano decisamente pi
utili di questa misura ex-post al fine di ottenere una migliore
comprensione dellAudience.
- Sulla base del modello ottenuto si pu concludere inoltre che
anche lafascia orariae lagiornata di programmazionenon sono fattori
determinanti per il fenomeno Audience Media.
VARIABILI NON SIGNIFICATIVE 8. Interpretazione dei risultati (3
di 3)
- I valori dei coefficienti delle 17 variabili significative
incluse nel modello rappresentano limpatto di ciascuna variabile
sullAudience. Ad esempio il coefficiente dell AJ Milano , pari a
13.950, significa che la presenza di Milano nel match porta (in
media) un contributo positivo di 13.950 spettatori.
- La presenza in contemporanea di una partita di calcio diJuve,
Inter o Milancausa invece un calo di circa 7.800 spettatori alla
diretta del basket.
- La squadra che in assoluto porta la diminuzione pi elevata nel
livello dellAudience e laVanoli-Braga Cremona , la cui presenza
nella gara porta (in media) un contributo negativo di 12.150
spettatori.
- Per ogni per ogni punto didifferenza in classificafra le due
squadre che disputano il match si ha in media un calo di 679
spettatori (se ad esempio la differenza punti uguale a 6 si ha un
calo di 679x6 = 4.074 spettatori).
VARIABILI SIGNIFICATIVE 9. IndicatoreR 2
- Questo particolare indicatore fornisce una misura di quanto le
variabili inserite nel modello (Milano, Siena, diff.pti,
Juve-Inter-Milan, ecc.) spiegano lAudience. Ovvero un indicatore
della bont del modello stimato.
- Nel nostro casoR 2= 0.40 , ci significa che il modello
realizzato in grado di spiegare il 40% dellAudience Media
(variabile dipendente). Il restante 60% spiegato da variabili non
incluse nel modello poich non individuate o non direttamente
osservabili.
10. Confronto fra le squadre (dal 2007/08 alla 16giornata della
stagione 2010-11) Squadre Partite % Audience Media Diff. Rispetto
allAudience Media totale Dev.Std. Aud. Share medio Contatti netti
medi Milano 44 22% 50.566 15.636 19.778 0,29% 211.135 Virtus 38 19%
34.738 -192 17.239 0,20% 181.462 Roma 37 18% 42.864 7.934 17.651
0,23% 196.426 Caserta 27 13% 28.138 -6.792 15.833 0,15% 166.620
Cant 26 13% 34.193 -737 23.687 0,18% 177.872 Avellino 26 13% 25.317
-9.613 14.660 0,13% 150.947 Treviso 25 12% 29.462 -5.468 20.564
0,15% 164.738 Siena 24 12% 40.825 5.895 17.040 0,23% 196.887 Pesaro
22 11% 30.993 -3.937 17.659 0,17% 170.551 Teramo 20 10% 33.437
-1.493 13.815 0,17% 173.622 Biella 20 10% 26.990 -7.940 12.152
0,14% 155.267 Montegranaro 18 9% 30.562 -4.368 16.559 0,16% 172.756
Varese 12 6% 32.138 -2.792 19.929 0,19% 165.561 Cremona 11 5%
27.201 -7.729 13.159 0,16% 156.457 Sassari 3 1% 45.126 10.196 7.888
0,25% 205.731 Brindisi 2 1% 32.758 -2.172 1.981 0,18% 238.805
TOTALE 201 100% 34.930 0 18.780 0,19% 177.791 11. Confronto fra le
fasce orarie (dal 2007/08 alla 16giornata della stagione 2010-11)
Squadre Partite % Audience media Differenza Audience Media totale
Dev.Std. Audience Share medio Contatti netti medi Sabato sera 55
27% 20.950 -13.980 11.059 0,09% 163.558 Domenica 12.00 60 30%
48.907 48.907 17.728 0,31% 189.255 Domenica pomeriggio 46 23%
35.041 35.041 17.744 0,19% 175.002 Domenica sera 25 12% 35.028
35.028 15.514 0,13% 198.451 Altre 15 7% 33.059 33.059 12.491 0,21%
159.326 TOTALE 201 100% 34.930 0 18.780 0,19% 177.791 12.
Interpretazione della Deviazione Standard (1 di 2)
- La deviazione standard (Dev.Std.) un indicatore della
variabilit di una caratteristica in una determinata popolazione. Pi
risulta elevata maggiormente differenti sono i valori di tale
caratteristica fra gli individui appartenenti alla
popolazione.
- Nel nostro studio la caratteristica oggetto di indagine
lAudience Media e la popolazione di riferimento sono le
partite.
13.
- Fra le squadre con che sono state trasmesse in diretta almeno
20 volte quella con la deviazione standard maggiore Cant (23.687),
mentre quella con deviazione standard minore Biella (12.152). Le
due squadre in questione non hanno una differenza di Audience Media
molto elevata (circa 7200 spettatori in meno per Biella), ma le
partite di Cant presentano unAudience maggiormente variabile.
- Ci significa che le avversarie di turno influenzano
maggiormente lAudience di Cant rispetto a quanto non siano in grado
di fare le avversarie di Biella.
- In termini pratici trasmettendo in diretta una partita fra una
BIG e Cant si hanno possibilit pi elevate di ottenere unAudience
medio/alta rispetto a quella che si potrebbe ottenere in un match
fra una BIG e Biella (i cui ascolti in generale sono bassi e poco
variabili).
Interpretazione della Deviazione Standard (2 di 2) 14. La
previsione (1 di 3) Uno degli obiettivi dellanalisi di regressione
prevedere i valori futuri della variabile dipendente (lAudience
Media) attraverso le variabili indipendenti incluse nel modello.
Per farlo, la regressione multipla deve rendere massima la capacit
previsiva delle variabili indipendenti considerandole globalmente.
La regressione multipla permette di sfruttare molte opzioni, sia
nella forma, sia nella specificazione delle variabili indipendenti,
che consentono di modificare lequazione in modo tale da accrescere
la sua capacit previsiva. Spesso, per, questa viene potenziata a
scapito dellinterpretazione. Attualmente stiamo tentando di
realizzare ulteriori specificazioni del modello che consentano di
individuare oltre ai fattori maggiormente determinanti per
comprendere al meglio i dati storici dellAudience anche le
variabili pi utili per prevederne i valori futuri sulla base delle
informazioni disponibili ex-ante la gara (squadre coinvolte,
contro-programmazione, posizione in classifica, differenza punti in
classifica, ecc.). 15. La previsione (2 di 3) Il miglior modello
previsivo ottenuto al momento attuale (31/01/2011) stato ottenuto
calibrando il modello di regressione sulle ultime due stagioni di
Regular Season(135 dirette; tutta la stagione 2009/10 pi le prime
48 dirette della stagione in corso). IlMAE uno degli indicatori
utilizzabili per valutare la bont previsiva di un modello e per il
confronto fra modelli. E ottenuto calcolando media degli errori di
previsione in valore assoluto (errore di previsione = valore vero
valore previsto dal modello). Nel nostro caso il MAE assume valore
pari a 10.395, ovvero in media la differenza fra il numero reale di
spettatori che seguono la diretta ed il numero previsto dal modello
(ex-ante la partita) pari a 10.395. 16. La previsione (3 di 3)
Nella tabella seguente sono indicate le variabili incluse nel
modello previsivo ed i relativi coefficienti: LindicatoreR 2in
questo modello (calibrato su 135 partite) risulta pari a0,47 .
VARIABILI COEFFICIENTI "Natale" 14249,5 Milano 13899,2 Roma 8681,8
Siena 8412,5 Varese 3720,1 Virtus 2300,7 Derby 730,2 Pesaro 320,8
Pti.POS 309,9 Diff.pti -305,2 Cant -1056,6 Caserta -3436,4 Teramo
-3609,3 Treviso -4087 Cremona -4615,7 Brindisi -6160,2
Juve,Inter,Milan -7282,6 Biella -8008 Montegranaro -10429,3
Avellino -11453,8 (Constant) 26867,8