Tecniche di analisi multivariata per studi di source apportionment del particolato atmosferico:
prestazioni, accuratezza e stabilità dei risultatiD. Cesari
ISAC-CNR, Str. Prv. Lecce-Monteroni km 1.2, Lecce, Italy
Gruppo di ricercaD. Contini, D. Cesari, A. Donateo,
C. Elefante, F. M. Grasso
Aula “Riccardo Guzzardi”Istituto IFC-CNR, Lecce
Giovedì 15 Dicembre 2011
Sommario
Aerosol, caratterizzazione delle sorgenti e strumenti per pianificazione di risanamento di qualitàambientale Modelli a recettore per il Source Apportionment Positive Matrix Factorization (PMF)Principal Component Analysis (PCA)Metodologie da supporto a SA: Enrichment Factor, Coefficiente di correlazione, Cluster AnalysisPresentazione di casi studioAnalisi delle prestazioni dei modelli PCA e PMF
Aerosol, caratterizzazione delle sorgenti e strumenti per pianificazione di risanamento di qualità ambientale I
Il particolato atmosferico è composto da particelle, solide o liquide, presenti in sospensione nell’aria, di natura sia organica che inorganica.
Dimensioni delle particelle: range dimensionale che copre 4 ordini di grandezza da circa 3 nm a circa 30000 nm.
Aerosol Technology. Hinds W.C., 2nd Edition, Wiley Interscience
Composizione chimica: generalmente è composto da “black-carbon”, ioni inorganici, metalli e centinaia di composti organici molti dei quali ancora ignoti.
Le dimensioni e la composizione riflettono solo in parte le caratteristiche delle sorgenti in quanto il particolato non è un inquinante passivo e subisce quindi
trasformazioni.Le distribuzione dimensionale e la composizione determinano inoltre gli altri
parametri caratteristici della dinamica del particolato tra cui la mobilità, la reattivitàed il tempo di permanenza in atmosfera.
Atmospheric Chemistry and Physics. Seinfeld, John H. ; Pandis, Spyros N. © 1998 John Wiley & Sons
Aerosol, caratterizzazione delle sorgenti e strumenti per pianificazione di risanamento di qualità ambientale II
Il particolato atmosferico è estremamente complesso e può provenire da diverse tipologie di sorgenti sia naturali sia antropiche. Queste sono poi suddivisibili in sorgenti primarie e secondarie.
Trasporto, dispersione, trasformazioni chimiche e fisiche.
EFFETTI NON-LINEARI tra sorgente e recettore
CONCENTRAZIONI OSSERVATE IN UNO
SPECIFICO SITO DI MISURA ?
Trasportolong-range
Emissioni in Puglia, Arpa Puglia, PRQA, 2007
Aerosol, caratterizzazione delle sorgenti e strumenti per pianificazione di risanamento di qualità ambientale III
Misure in uno o più siti.
Individuazione e caratterizzazione delle sorgenti che contribuiscono
all’inquinamento atmosferico osservato nel sito/siti di misura.
Aerosol e caratterizzazione delle sorgenti
Source Apportionment con diverse tecniche ( es. back-trajectories models; correlazione PM - pattern vento;
correlazione PM - inquinanti gassosi; misure in real time; isotopic mass balance using 14C; Lenschow approach).
I modelli a recettore utilizzano l’analisi multivariata per identificare e stimare il contributo delle sorgenti (Source Apportionment, SA) di inquinanti sulla base di database di vari composti chimici misurati
presso un sito recettore.
Modelli a recettore per il Source Apportionment I
calcoli relativamente
semplici
non richiedono informazioni sulla meteorologia locale
Principio fondamentale:
Principio di conservazione della massa
Tuttavia:sorgenti con un profilo di emissione simile o carenza di dati relativi ad
esso; origine “mista” di un inquinante;non appropriati per specie chimiche molto reattive ma offrono performance migliori in aree relativamente vicine alle sorgenti.
eij = residuo per ciascun campione xij
gik = contributo della sorgente k-esimafkj = profilo chimico della sorgente k-esima
Modelli a recettore per il Source Apportionment II
Per le tecniche basate sulla composizione chimica sono necessari diversi livelli di approfondimento “a priori” delle
sorgenti che insistono in uno specifico sito.
Viana et al. Journal of Aerosol Science, 39, 2008.
Modelli a recettore per il Source Apportionment III
Attualmente, circa il 60% dei lavori di SA utilizza modelli a recettore e il modello più utilizzato è la
Positive Matrix Factorization (PMF), seguito da CMB e PCA
Belis & Karagulian, Meeting Norrkoping 16-16 June2011.
Molti degli studi di Source Apportionment disponibili sono relativi a siti di Urbanbackground in Europa, focalizzando principalmente l’attenzione sulla frazione PM10.
Viana et al. Journal of Aerosol Science, 39, 2008
Modelli a recettore per il Source Apportionment IV
Positive Matrix Factorization
Analisi multivariata che decompone una matrice di dati in due matrici: matrice 1: contributo dei fattori matrice 2: profilo dei fattori.
In particolare, avendo una matrice di campioni X (i x j) (i: numero dei campioni; j: specie chimiche),la PMF identifica il numero di fattori p, il profilo di ciascuna sorgente f e la massa gche contribuiscono al singolo campione:
eij = residuo per ciascun campione
La soluzione della PMF ha l’obiettivo di minimizzare la funzione Q, definita come:
uij= incertezza associata al dato xij
Principal Component Analysis
Analisi multivariata che sostituisce il set originario di variabili intercorrelate con un nuovo set di variabili non correlate, combinazione lineare delle variabili originarie. Il set originale di dati a disposizione X è quindi trasformato in un nuovo set Z in maniera tale da avere media nulla e deviazione standard unitaria:
zij=(xij-<xi>)/σi xij= j-esimo dato dell’elemento i-esimo; i=1,...n; j=1,...m;
In particolare, la PCA è descritta dalla nuova matrice:bkj= loadgik= score
Si definisce:
Varianza F: λij=autovalori di Z
Comunalità:
∑=
=n
kkjikij bgZ
1
nF p
n
p λλλλλλλλλ +++
=+++
+++=
............ 21
21
21
∑=
=p
kkji bh
1
22
PCA
Vantaggi:
non è richiesto a priori alcun dato sulle sorgenti o sui relativi profili di emissione.
Svantaggi:
per sorgenti con simili profili di emissione risulta difficile estrarre informazioni utili;
può fornire soluzioni con contributi di sorgente negativi che possono presentare una difficile interpretazione fisica.
PCA vs PMF
PMF
Vantaggi:
non è richiesto a priori alcun dato sulle sorgenti o sui relativi profili di emissione;
il profilo prodotto dal modello può essere direttamente confrontato con la matrice di input senza trasformazioni;
ha una “costrizione” positiva dei risultati;
ciascun dato è “pesato” con la relativa incertezza.
Svantaggi:
non ha un criterio oggettivo per la scelta del numero dei fattori.
Metodologie di supporto a SA: Enrichment Factor, Coefficiente di correlazione, Cluster Analysis
suoloREFX
aerosolREFXX CC
CCEF)/()/(
=
Enrichment Factor (EF)Grandezza adimensionale che esprime il fattore di arricchimento di ogni elemento rispetto alla sua naturale concentrazione media presente nella crosta terrestre superficiale.
YX
XYrσσ
σ∗
=
Coefficiente di correlazione (r)Parametro statistico che può offrire informazioni sulla maggiore o minore correlazione tra elementi di un set di dati: esso rappresenta la misura in cui le serie di dati tendono a variare in sincronia.
Cluster Analysis (CA)Tecnica statistica multivariata avente come obiettivo l’individuazione di una o piùpartizioni dell’insieme di n unità statistiche in gruppi (cluster) tali che abbiano le caratteristiche di “coesione interna” (le unità assegnate ad uno stesso gruppo devono essere tra loro simili, gruppi omogenei) e di “separazione esterna” (i gruppi devono essere il più possibile distinti tra loro). Tra i metodi più utilizzati per analisi di PM abbiamo la CA gerarchica, aggregativa basata sul metodo di Ward.
r > 0 diretta,
r < 0 inversa,
r = 1 perfetta diretta,
r = -1 perfetta inversa,
r = 0 assenza
Primo caso studio:
SA in un sito di fondo urbano
Sito di background urbano(N 40°20’10.8’’, E 18°07’ 21.0’’)
le sorgenti sopravento al sito: • attività interne al Campus;• emissioni diffuse dalla città di Lecce e da altri
piccoli centri limitrofi;• influenze dai grossi centri industriali di Ta e Br;
L’analisi della direzione prevalente del vento:• 4% casi DP da Lecce;• 13% casi DP da Brindisi;• 7% casi DP da Taranto.
E’ stato studiato il sito di background urbano del Campus Universitario di Lecce, in collaborazione con l’Università del Salento.
I risultati sono riportati in Contini et al. (Atmospheric Research 95, pp. 40-54, 2010)
Sampling site, set-up, LOD e LOQ
Sito di background urbano
PM10 (gravimetrico su filtro);
Campionatori 1°: Bravo H Plus TCR-Tecora
2°: Charlie TCR-Tecora
Filtri in fibra di quarzon° campioni: 115
n° bianchi campo: 33(Quartz-Microfibre DiscsFT31109047 Sartorius)
Filtri in Teflon n° campioni: 102
n° bianchi campo: 33(2.0 mm porosity, Teflo R2PJ047,
Gelman Sciences)
0.3 – 1.52.40.7PM10 Teflon
1.0 – 3.07.72.3PM10 quarzo
Incertezza (µg/Nm3)
LOQ (µg/Nm3)
LOD (µg/Nm3)
Background urbano
y = 1.016xR2 = 0.9603
0.0
10.0
20.0
30.0
40.0
50.0
60.0
70.0
80.0
90.0
0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0PM10 (postazione 1) µg/Nm3
PM10
(Pos
tazi
one
2) µ
g/N
m3
R2 > 0.95
EQUIVALENTI!EQUIVALENTI!
Sono stati selezionati 94 campioni simultanei relativi
alle due postazioni dal 15/02/2007 fino al
12/01/2008
F= 767.99.714.915.228.3%
Variance
0.850.90Al
0.420.470.30Cr
0.69-0.79Pb
0.920.94Mn
0.860.91Zn
0.63-0.69Cu
0.40-0.420.360.30Ni
0.700.340.600.39V
0.930.92Fe
0.880.93Ca2+
0.810.540.63Mg2+
0.83-0.460.72K+
0.850.89NH4+
0.880.340.86Na+
0.790.87SO4-
0.660.510.54NO3-
0.790.86Cl-
CommunalityPC5PC4PC3PC2PC1Species
Componente Crostale
Risultati Absolute Principal Component Analysis
Componente Secondaria Inorganica
Componente Marina
Componente da Traffico
Componente Industriale
Risultati Positive Matrix Factorization
16.314.333.635.8PM10
2.38.122.467.2Al
3.933.31.661.2Cr
34.27.745.013.1Pb
8.33.218.869.7Mn
23.114.747.514.6Zn
87.00.00.013.0Cu
11.10.067.421.5Ni
0.01.766.032.3V
22.00.013.764.4Fe
5.511.30.083.2Ca++
0.339.614.245.9Mg++
19.512.521.246.8K+
13.611.174.80.5NH4+
0.067.320.112.6Na+
1.710.875.911.6SO4--
25.431.143.50.0NO3-
11.089.00.00.0Cl-
F4F3F2F1Species
Factor Profiles (% of species)Componente Crostale
Componente Secondaria Inorganica + emissione
industriale
Componente Marina
Componente da Traffico0
10
20
30
40
50
60
70
80
90
100
Cl- NO3- SO4-- Na+ NH4+ K+ Mg++ Ca++ Fe V Ni Cu Zn Mn Pb Cr Al PM10
Fact
or p
rofil
e (%
)
1.0 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1
II° anno di Dottorato in Scienze Ambientali – 20 Novembre 2009
Comparazione risultati Source Apportionment I
1.3 ± 4.3Not explained
16.5 ± 3.0Traffic emission
2.1 ± 2.3Industrial emission
24.1 ± 3.5SIA
6.3 ± 1.9Marine aerosol
49.5 ± 3.0Crustal matter
% PM10Sources
APCA
16.0 ± 1.4Traffic emission
0.3 ± 4.4Not explained
--
33.5 ± 2.6SIA + industrial emission
14.2 ± 2.4Marine aerosol
36.0 ± 2.2Crustal matter
% PM10Sources
PMF
CAPCA = 1.00 CMEAS + 0.00R2 = 0.92
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50 60 70 80 90Measured PM10 (µg/m3)
Rec
onst
ruct
ed P
M10
( µg/
m3 )
(1:1)DataLinear Fit
0
10
20
30
40
50
60
70
80
90
0 20 40 60 80
Measured PM10 (µg/Nm3)
Rec
onst
ruct
ed P
M10
( µg/
Nm
3 )
Data1:1Linear Fit
CPMF = 0.99 CMEAS + 0.00R2 = 0.83
Comparazione Risultati Source Apportionment II
In questo caso le due sorgenti industriali osservate con la APCA sono una sola nel caso del PMF e si osservavo significative differenze su aerosol crostale e secondario.
Anche in questo caso si hanno differenze nelle sorgenti individuate e nei loro contributi.
12Soil
2
25
23
10
16
16PMF (%)
2134Regional + marine
Sulfate
1310Traffic
2Industrial 2
415Industrial 1
4131Clay
CMB (%)APCA (%)PM10
Callen et al, Chemosphere 76, pp. 1120–1129, 2009
Viana et al, Atmospheric Environment 42, pp. 3820–3832, 2008
Hierarchical Cluster Analysis
Fe Mn Al Ca++ K+ NO3-SO4--NH4+ V Ni Cu Pb Zn Cr Cl- Na+ Mg++2
4
6
8
10
12
14
16
Link
age
dist
ance
Componente crostale
(PC1, F1)
Componente Industriale(PC5, F2)
Componente Secondaria Inorganica(PC2, F2)
Componente Marina
(PC3, F3)Componente da Traffico
(PC4, F4)
Lecce data set:
91 samples x 17 species
Cl-, NO3-, SO4
2-, Na+, NH4+, K+, Mg2+,
Ca2+, Fe, V, Ni, Cu, Zn, Mn, Pb, Cr , Al
Characterization of 40% of PM10
Analisi delle prestazioni dei modelli PCA e PMF
Differenze nei contributi di alcune sorgenti identificate con APCA e PMF
Presenza di profili di sorgenti similari
Assenza di specifici markers
PM non caratterizzato completamente
Studio di stabilità dei modelli PCA e PMF in collaborazione con
IDAEA – CSIC (Barcellona)
Primo caso studio:sito di background urbano (Barcellona) [2]
campionamento 669 campioni giornalieri (243 di PM10, 279 di PM2.5 e 147 di PM1);22 specie metalliche:
Al, Ca, K, Na, Mg, Fe, Mn, Ti, P, S, V, Cr, Ni, Cu, Zn, As, Rb, Sr, Cd, Sn, Sb e Pb;
3 specie ioniche: NH4+, NO3
-, Cl- e TC;
Secondo caso studio:sito di background urbano influenzato da
un’area industriale (Algeciras)[3]
campionamento 914 campioni giornalieri (567 di PM10, 347 di PM2.5)23 specie metalliche:
Al, Ca, K, Na, Mg, Fe, Li, P, Ti, V, Cr, Mn, Ni, Cu, Zn, As, Se, Rb, Sr, Sn, Sb, La, Pb;
4 specie ioniche NH4+, NO3
-, SO42-, Cl- e TC;
Nuovi data set:
Completo:PM10: 243 campioni giornalieri;
22 specie metalliche e 3 specie ioniche;caratterizzazione chimica: 55 % circa
Incompleto:14 specie metalliche:
Al, Ca, K, Na, Mg, Fe, Mn, S, V, Cr, Ni, Cu, Zn, Pb; 3 specie ioniche;
caratterizzazione chimica: 34 % circa
Nuovi data set:
Completo:PM10: 567 campioni giornalieri;
23 specie metalliche e 4 specie ioniche;caratterizzazione chimica: 60 % circa
Incompleto:16 specie metalliche:
Al, Ca, K, Na, Mg, Fe, Li, P, Ti, V, Cr, Mn, Ni, Cu, Zn, Pb;
4 specie ioniche;caratterizzazione chimica: 48 % circa[2] Amato et al., Atmos. Environ. 43, 2770-2780, 2009.
[3] Pandolfi et al., Environ. Sci.Poll. Res. DOI 10.1007/s11356-010-0373-4, 2010
Analisi delle prestazioni dei modelli PCA e PMF
Analisi delle prestazioni dei modelli PCA e PMF: Contributi e incertezze stimate
Analogie tra i siti di BU di Lecce e BCN: l’aumento del numero degli elementi nel data set non porta a significativi miglioramenti nel confronto APCA/PMF.
Analisi delle prestazioni dei modelli PCA e PMF: masse ricostruite
Ottima correlazione tra le masse ricostruite APCA/PMF, anche se nel
dettaglio delle sorgenti esistonodifferenze nei contributi…
Analisi delle prestazioni dei modelli PCA e PMF: profili chimici diversi per stessa sorgente
Contributo marino “fresco”
Contributo marino “invecchiato”
Analisi delle prestazioni dei modelli PCA e PMF: effetto di esclusione di specie I
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
AlCa K Na M
g FeM
n Ti P S V Cr NiCu Zn As Rb Sr Cd Sn Sb Pb
NO3- Cl-NH4+ TC
APC
A T
raff
ic F
acto
r L
oadi
ng Complete Data set (Barcelona)
Incomplete Data set (Barcelona)
0
10
20
30
40
50
60
70
80
90
100
AlCa K NaM
g FeM
n Ti P S V Cr NiCu Zn AsRb SrCd Sn Sb Pb
NO3- Cl-NH4+ TC
EPA
PM
F 3.
0 Tr
affic
Fac
tor
Prof
ile (%
)Complete Data set (Barcelona)
Incomplete Data set (Barcelona)
La sorgente “Traffico” èquella che risente di piùdell’esclusione di alcune
specie. Infatti, TC, Sb e Snsono presenti nei profili di
emissione (diretta e indiretta) di tale sorgente.
Difficoltà nell’identificare la sorgente “Traffico”:
il nuovo profilo di emissione è simile, in contenuto di metalli, alle emissioni
industriali.
Analisi delle prestazioni dei modelli PCA e PMF: effetto di esclusione di specie II
APCA: Simili contributi per tutte le sorgenti ad eccezione della
sorgente “Traffico” che subisce un decremento.
PMF: Simili contributi per tutte le sorgenti.
PMF: PMF:
Meno sensibile al Meno sensibile al
datasetdataset analizzato.analizzato.
Analisi delle prestazioni dei modelli PCA e PMF: effetto di esclusione di specie III
0.0
2.0
4.0
6.0
8.0
10.0
12.0
14.0
16.0
18.0
20.0
Crusta
l
Traffic
In
dustrial
Mari
ne
SIAIn
dustrial
2Not
expl. m
ass
PMF
3.0
Sour
ce c
ontr
ibut
ion
( µg/
m3 ) Algeciras complete data set
Algeciras incomplete data set
APCA: Simili contributi per tutte le sorgenti ad eccezione della
sorgente “Traffico” che subisce un decremento.
PMF: Simili contributi per tutte le sorgenti.
PMF: PMF:
Meno sensibile al Meno sensibile al
datasetdataset analizzato.analizzato.
Crustal source
0102030405060708090
1 22 43 64 85 106 127 148 169 190 211 232 253 274 295 316 337 358 379 400 421 442 463 484 505 526 547
Sour
ce c
ontri
butio
n ( µ
g/m
3 )
PMFAPCA
Analisi del pattern giornaliero delle sorgenti individuate
Traffic source
05
101520253035404550
1 22 43 64 85 106 127 148 169 190 211 232 253 274 295 316 337 358 379 400 421 442 463 484 505 526 547
Sour
ce c
ontri
butio
n ( µ
g/m
3 )
PMFAPCA
pattern simili
sottostima PMF
Analisi delle prestazioni dei modelli PCA e PMF: conclusioni
I modelli a recettore, associati a tools per l’analisi qualitativa dei datasets, rappresentano ottimi mezzi per analisi approfondite di qualità dell’aria e per la caratterizzazione delle sorgenti.Lo studio di stabilità dei modelli indica che il modello APCA è piùsensibile ai cambiamenti nelle specie chimiche presenti nellacaratterizzazione chimica del PM; mentre il PMF appare più stabile, entrol’intervallo di incertezza, con risultati che non dipendono dalla scelta del dataset.Entrambi i modelli sono in grado di ricostruire in modo simile le concentrazioni giornaliere di PM10, ma i contributi delle singole sorgenti individuati possono essere diversi, come pure il numero di sorgenti identificate.Sorgenti nominalmente simili potrebbero avere diversi profili associati a APCA e PMF. Per entrambi i modelli, l'eliminazione del TC provoca una difficoltà a individuare la sorgente "Traffico“.
Analisi delle prestazioni dei modelli PCA e PMF: sviluppi futuri
Analisi del pattern giornaliero delle diverse sorgenti individuate;Analisi del contributo medio alla singola specie chimica;Analisi degli andamenti giornalieri dei contributi alle singole specie chimiche ricostruite mediante i modelli APCA e PMF;Applicazione dei modelli a recettore a dati di caratterizzazione chimicasize-segregated raccolti mediante impattore a cascata MOUDI (MSP) per analisi approfondite delle singole mode;Applicazione dei modelli a recettore a dati di caratterizzazione chimicasize-segregated per minimizzare il mixing delle sorgenti mediante l’analisi
della distribuzone di specifici markers tra le varie mode (es. nitrati nelsecondario e nel marino “invecchiato”).
GRAZIE PER L’ATTENZIONE!!!