+ All Categories
Home > Documents > Relazione sull’attività del primo anno di dottorato in...

Relazione sull’attività del primo anno di dottorato in...

Date post: 26-Jun-2020
Category:
Upload: others
View: 6 times
Download: 1 times
Share this document with a friend
20
Sviluppo di strumenti web-oriented per monitorare la qualità dei dati di CMS Relazione sull’attività del primo anno di dottorato in fisica, XXIII ciclo C did t D t G id Candidato Dott. G. Antonio Pierro Docente Guida Prof. Giorgio Pietro Maggi Dott. Domenico Giordano 12/3/2008 1 Antonio Pierro
Transcript
Page 1: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Sviluppo di strumenti web-oriented per monitorare la qualità dei dati di CMS

Relazione sull’attività del primo anno di dottorato in fisica, XXIII ciclo

C did t D t G idCandidato

Dott. G. Antonio Pierro

Docente GuidaProf. Giorgio Pietro MaggiDott. Domenico Giordano

12/3/20081 Antonio Pierro

Page 2: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Descrizione delle attività

Attività didatticaPartecipazione a seminari/scuolePartecipazioni a Conferenze o Workshopp pAttività del primo anno di dottorato

Riduzione, senza perdita di dati, della dimensione du o e, se a pe d a d da , de a d e s o edell’evento prelevato dal tracciatore di CMSSviluppo di uno strumento web-oriented per il monitoraggio della qualità dei dati di CMSProspettive future

12/3/20082 Antonio Pierro

Page 3: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Attività didatticaAttività didatticaAttività didattica svolta

L b t i di t t i di fi i l b l d llLaboratorio di strumentazione di fisica nucleare e subnucleare dellalaurea specialistica - Prof. Spinelli (prevedo di fare esame entro gennaio-febbraio 2009)Linguaggi avanzati di programmazione: il C++ Dr Francesco CafagnaLinguaggi avanzati di programmazione: il C++ - Dr. Francesco Cafagna(esame superato) (corso obbligatorio)Teoria di campo a temperatura finita - Prof. Paolo Cea (prevedo di fare esame entro fine anno) (corso obbligatorio)esame entro fine anno) (corso obbligatorio)Formazione del segnale nei rivelatori e filtraggio del rumore - Dr. Mazziotta (prevedo di fare esame entro fine anno) (corso obbligatorio)Fisica protone-protone a LHC - Dr ssa Anna COLALEO (esame superato)Fisica protone protone a LHC Dr.ssa Anna COLALEO (esame superato) (corso caratterizzante)

Atti ità did tti d lAttività didattica da svolgereElaborazione di Segnali di segnali e immagini della laurea specialistica in fisica - Prof. Bellotti

12/3/2008Antonio Pierro3

Page 4: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Partecipazione a seminari/scuole

CERN School of Computing 2008 Scuola di computing per la fisica delle alte energie organizzate dal CERN.

Grid TechnologiesBase Technologies (Computer Security, Computer Architecture and Performance Tuning, Networking QoS and Performance, Creating secure software)

Physics Computing (General Introduction to Physics Computing, Introduction to ROOT, Experiment Simulation)

XXI Seminario di Fisica Nucleare e Subnucleare -XXI Seminario di Fisica Nucleare e Subnucleare -OTRANTO, Serra degli Alimini, dal 19 al 25 Settembre 2008.

Oscillazioni e massa dei neutrini.Acceleratori di particelleCamere a bolleMetodologie Fisiche per i Beni CulturaliMetodologie Fisiche per i Beni CulturaliSviluppo di rivelatori per la diagnostica medica alle nuove terapie del cancro.Struttura degli adroni e quark pesantiFenomenologia del Quark Gluon Plasmae o e o og a de Qua G uo as a

12/3/20084 Antonio Pierro

Page 5: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Partecipazioni e Conferenze/WorkshopPartecipazioni e Conferenze/WorkshopBiomed Grid Summer School 2007 - Varenna - 12-16 May 2008

Attività di rassegna sugli strumenti di monitoraggio dell’ i f t tt GRID i ti ll’ d liinfrastruttura GRID e una sessione pratica sull’uso degli stessi strumenti.

Italian e Science 2008 IES08 Napoli 27 28Italian e-Science 2008 IES08, Napoli – 27-28 maggio 2008

Presentazione di un poster su GridICE (tool di monitoringPresentazione di un poster su GridICE (tool di monitoringdella grid).

Bari – 15-16 maggio 2008 - Riunione CMS ItaliaBari 15 16 maggio 2008 Riunione CMS ItaliaTorino – 27-28 novembre 2008 – Riunione CMS ItaliaItalia

12/3/20085 Antonio Pierro

Page 6: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Attività del primo anno di dottoratoAttività del primo anno di dottoratoStudio del rivelatore di tracciamento dell’esperimentoCMS e del software del rivelatore di CMS (CMSSW)Riduzione, senza perdita di dati, della dimensione dell’evento prelevato dal tracciatore di CMSSviluppo degli strumenti di monitoraggio e analisi dei dati provenienti dal sistema di tracciamento - DQM e H-DQM.

12/3/2008Antonio Pierro6

Page 7: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Studio del rivelatore di tracciamento dell’esperimento CMS (1/2)CMS (1/2)

La funzione del tracciatore centrale è quella di fornire una misura accurata dell‘ imp lso delle particelle cariche che emergono dal p nto di intera ione dei fasci e dipulso delle particelle cariche che emergono dal punto di interazione dei fasci e diindividuare la presenza di vertici di decadimento.

• Tracker Inner Barrel (TIB) la parte(TIB), la parte cilindrica più interna;• Tracker Inner Discs (TID) le corone(TID), le corone circolari poste all'estremità del TIB;• Tracker Outer Tracker Outer Barrel (TOB), la struttura cilindrica esterna;esterna;• Tracker Endcaps (TEC), le corone circolari più esterne.

12/3/2008Antonio Pierro7

Le parti che costituiscono il tracciatore di CMSp

Page 8: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Studio del rivelatore di tracciamento dell’esperimento CMS (2/2)CMS (2/2)

Il funzionamento di un rivelatore al silicio può essere schematizzato con unIl funzionamento di un rivelatore al silicio può essere schematizzato con un insieme di diodi contropolarizzati posti uno accanto all'altro. Un diodo contropolarizzato è una giunzione pn alla quale è applicata una tensione (bias), che permette di svuotare la regione di contatto tra p e n dalle ( ), p g pcariche di conduzione.Quando una particella carica attraversa il materiale del rivelatore, perde parte della propria energia a causa dell'interazione con i materiali. p p gL'energia ceduta consente il passaggio di alcuni elettroni del semiconduttore dalla banda di valenza alla banda di conduzione,producendo coppie elettrone-lacuna (hole). Le coppie elettrone-lacuna diffondono (drift), sotto l'azione del campo elettrico generato dalla tensione di bias, rispettivamente verso anodo e catodo. Nel SST di CMS i catodi sono costituiti da sottili microstrisce di silicio (drogato di tipo p); la carica raccolta viene letta, tramite condensatori di disaccoppiamento, dall'elettronica di front-end , consentendo la ricostruzione spaziale del passaggio della particella.

12/3/2008Antonio Pierro8

Page 9: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Riduzione, senza perdita di dati, della dimensione dell’evento prelevato dal tracciatore di CMSdell’evento prelevato dal tracciatore di CMS

Introduzione all’elettronica di lettura del tracciatore CMSL'elettronica di lettura del tracciatore di CMS è basata su di un circuito analogico con 128 canali indipendenti, l'APV25 (o in breve APV), realizzato con tecnologia CMOS per essere resistente alle radiazioni. Ogni modulo contiene 4 o 6 chip APV25, secondo il numero di strip che devono essere lette Ogni strip è collegata ad un canale dell'APV25numero di strip che devono essere lette. Ogni strip è collegata ad un canale dell APV25.I segnali di corrente in ingresso vengono campionati alla frequenza di LHC (40MHz) e mantenuti in un buffer. I corrispondenti dati del buffer vengono comunicati al sistema di acquisizione, tramite un segnale trasmesso su una linea a fibre ottiche lunga oltre 100 m che raggiunge la counting room fuori dalla caverna dell'esperimento, dove i dati vengono digitalizzati dalle schede FED (Front-End Driver )

Compattamento dei dati del tracciatore CMSIl tracker contiene 75376 APV => 128*75376 = 9648128 canali di lettura => le informazioni gestite dal Tracker ad ogni trigger sono molto grandi (in media 2 byte per ogni canale di lettura)L i di i t i hi d t d t l i t iLe esigenze di esperimento richiedono una rate adeguata per la ricostruzione dell’evento e l’analisi dei dati => necessità di ottimizzare i dati del tracker (ridurre la memory occupancy e i tempi per la movimentazione dei dati) => ridurre i BIT necessari a ricostruire l’evento senza perdita di informazione e trasformare tutti i dati grezzi

12/3/2008Antonio Pierro9

(RAW data) in un flusso di dati binari

Page 10: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Riduzione dei BIT necessari a ricostruire l’evento senza perdita di informazionel evento senza perdita di informazione

Tramite l’utilizzo di operatori logici bit a bit, ho realizzato due procedure che chiamerò di codifica (per compattare i dati) e decodifica (per scompattare i dati) simili ai (p p ) (p p )programmi di compressione e archiviazione dei fileI dati codificati vengono trasformati in un stream binario e trasferiti nella base di dati come unico record (notevoli vantaggi nei tempi di lettura e scrittura del db di circa 4 ordini di grandezza, piccolo overhead nella codifica per la scrittura e decodifica per la lettura)

Unico Stream binario per tutti i dati letti dagli APV

Vettore di short (16 Byte)Vettore di char (9 Byte)

Rid i d ll di f tt d l 40%

12/3/2008Antonio Pierro10

Riduzione della mamory occupancy di un fattore del 40%

Page 11: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Test di performanceTest di performanceSiamo sicuri che, nella catena di ricostruzione dell’evento prelevato dal tracciatore di CMS la codifica e decodifica delle informazioni non introducatracciatore di CMS, la codifica e decodifica delle informazioni non introduca un overhead maggiore dei vantaggi derivanti dalla riduzione della memoryoccupancy e trasformazione dei dati in un unico stream binario?Tramite l’utilizzo di tool sviluppati al CERN come IgProf e profiler gprof èTramite l utilizzo di tool sviluppati al CERN come IgProf e profiler gprof è stato possibile studiare le performance del codice appena sviluppato

Codice ottimizzato (trasferimento in un unico stream binario con codifica) Ridurre i numeri di bit per rappresentare i dati e

Memory occupancy CPU Time Wall Time

Codice originale (trasferimento record per record senza codifica)Overhead dovuto alla codifica e decodifica e trasformazione in un stream binario dei dati del tracker

rappresentare i dati e impacchettare i dati in un unico strem binario comporta un notevole riduzione dei tempi di lettura e scrittura , circa 4

1 1 1

del tracker ordini di grandezza; Invece, con il codice originale la lettura e scrittura avviene record per record

0 10000000 20000000Byte

0 50 100 0 5000 10000 15000

SecondSecond

12/3/2008Antonio Pierro11

Page 12: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Il DQMIl DQMIl DQM è stato progettato in CMS al fine di compiere un’analisi delle prestazioni dei vari rivelatori e del trigger sia online che offline e quindi conprestazioni dei vari rivelatori e del trigger, sia online che offline, e quindi con lo scopo sia di verificare, in tempo reale, il corretto funzionamento dell’apparato sperimentale che di compiere analisi offline, dettagliate, delle performance dei vari sottosistemi.performance dei vari sottosistemi.Questo processo rientra nel processo della “data certification” il cui obiettivo è quello di fornire agli utenti una lista di run buoni per la successiva analisi di alto livelloanalisi di alto livello.Il DQM è suddiviso in tre stadi logici:

il source, dove sono selezionati gli eventi desiderati e compiuta l'analisi d i d i d il i i d li li d bdei dati ed il riempimento degli eventuali database.il collector, che raccoglie tutti i risultati e li smista ai tutti i clients che li richiedonoLa GUI-DQM, che serve a visualizzare tutti i risultati e gli istogrammi ed a generare gli allarmi e gli eventuali stati anomali del rivelatore

12/3/2008Antonio Pierro12

Page 13: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Collocazione del DQM all’interno di CMSCMSDQM Per ciascuno evento viene creata una banca

d ti d tt t t tt l tContiene osservabili di qualsiasi tipo(eventi fisici ricostruiti e informazionisu rivelatore) memorizzati in istogrammi e database ORACLE

dati adatta a contenere tutte le tracce dell’evento (componenti dell'impulso; le coordinate del punto da cui la traccia e' partita; l'energia della particella; la carica

l tt i il di ``hit '' il hi d d l

Ricostruzione RECO

istogrammi e database ORACLE elettrica; il numero di ``hits''; il chi-quadro del fit della traccia attraverso gli hits…).

Modulo rivelatore

CavernaHLT – Filter Farm

Ricostruzione RECO

sori

APV

APV

APV M

fibra ottica lunga oltre 100 m

FED: Front End Driver

Sen

APV

APV

APV

MU

X

RAW data (dati grezzi)

Zero suppression

12/3/2008Antonio Pierro13

APV

Page 14: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Limiti del DQM attualeLimiti del DQM attualeIl sistema di DQM di CMS è uno strumento stabile e ampiamente utilizzato ma tuttora in fase di sviluppoutilizzato ma tuttora in fase di sviluppo

Il DQM attuale è basato su ROOTNon è web-oriented, l’uso del DQM attuale richiede:,

la presenza fisica al P5l’utilizzo di piattaforme linux predefinite con potenti processoriL’esecuzione di script a linea di comando da shell linux (poco user-friendly)L esecuzione di script a linea di comando da shell linux (poco user-friendly)

Sono stati fatti tentativi di rendere la piattaforma web-orientedportando ROOT su web, ma si è visto che il sistema non scala:

Tempi di attesa lunghi per avere un report grafico (circa 60 secondi) Crash continui del web server

Non è presente un sistema di flag di qualità che sintetizzi p g qulteriormente lo stato di funzionamento del rivelatore CMS:

è richiesta una certa laboriosità per capire lo stato del rivelatorea volte è neccesario correlare/confrontare diverse grandezze e plota volte è neccesario correlare/confrontare diverse grandezze e plot.

12/3/2008Antonio Pierro14

Page 15: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Possibili sviluppi del DQM 1/2Possibili sviluppi del DQM 1/2Sviluppo di un framework interamente web-oriented:

CherryPy come framework per lo sviluppo webconsente agli sviluppatori di costruire applicazioni web in modo molto simile a un programma Python ad oggetti. Questo solitamente risulta in meno linee diun programma Python ad oggetti. Questo solitamente risulta in meno linee di codice sviluppato in meno tempo.integra un web server leggero e potente abbastanza da gestire discreti carichi. E' stato stimato che CherryPy possa gestire circa 500 richieste/secondo su una macchina con specifiche hardware discrete. consente di “avvolgere” (to wrap) in maniera semplice librerie di un altro linguaggio di programmazione, per esempio il C++ (codice con cui è scritto CMSSW) f i ll li i i i bi ( iCMSSW) senza fare ricorso alle appliazioni cgi-bin (poco sicure, poco performanti, causano frequenti crash del sistema)

Python vs altri linguaggi di scriptPython è più performante rispetto al PHP e Perl: infatti, Python ha una fase in più nel processo nel senso che durante l’avvio del web server, viene compilato in bytecode e caricato in memoria, mentre linguaggi come Perl o PHP vengono i t t ti di tt tinterpretati direttamente.

12/3/2008Antonio Pierro15

Page 16: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Possibili sviluppi del DQM 2/2Possibili sviluppi del DQM 2/2Sviluppo di un framework interamente web-oriented:

Utilizzo di librerie grafiche web-orientedProduzione di report grafici senza l’overhead di un’applicazione non web-oriented (per esempio ROOT)web-oriented (per esempio ROOT)L’utente potrà visualizzare nuovi istogrammi, man mano che si mostreranno necessari, semplicemente interrogando la base di dati in maniera opportuna tramite un semplice web form (attualmente i reportmaniera opportuna tramite un semplice web form (attualmente i report definiti nel DQM sono predefiniti e l’aggiunta di nuovi report comporta la scrittura di nuovo codice C++ per generare nuovi file di ROOT)

O l b k d d t bOracle come backend database Possibilità di fare interessanti correlazioni in maniera rapida (per esempio con i parametri ambientali) Ad i fi i i l d d i fil di ROOTAdesso i report grafici vengono generati leggendo dei file di ROOT con una struttura ad albero => tempi di accesso più lunghi e impossibilità di fare correlazioni in automatico (deve essere l’utente a richiedere e confrontare i grafici opportuni)grafici opportuni)

12/3/2008Antonio Pierro16

Page 17: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Architettura del nuovo DQMArchitettura del nuovo DQM

The user

Matplotlib is used to produce  chart

Cherrypy is runnig behind Apache.

The user connects to Apache 

CherryPy executes python code

Python binding to a CMSSW package using boost‐python. oracle

d b

CMSSW packages

databases

12/3/2008Antonio Pierro17 17

CMSSW packages

Page 18: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Web server interface (1/2)( / )

Moving the mouse over the plot it’s possible to see the exact numerical position.

Can be chosen : Subdetector, What to plot, The quantities to be extractedquantities to be extracted

By filling in the webform you can retrieve the chart with python plot lib without read or create ROOT

Can be chosen the begin and last value according the list of since of the destination tag

12/3/2008Antonio Pierro18

lib, without read or create ROOT files.

destination tag.

Page 19: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Web server interface (2/2)Web server interface (2/2)La GUI fornisce un web form in

cui è possibile selezionare:Numero di HIT ricostruiti per tracce con l’algoritmo di ricostruzione deicui è possibile selezionare:

Tipo di statistica da visualizzare:Efficienze rispetto ai segmenti

con l algoritmo di ricostruzione dei cosmici in funzione dell’IOV

Numero di HIT ricostruiti per traccecon i diversi algoritmi diricostruzioneCHI-quadro del fit della tracciaCHI-quadro del fit della traccia attraverso gli hits….

le diverse parti del rivelatore CMSle diverse parti del rivelatore CMS (PIXEL, STRIP, ECAL…)La granularità delle diverse parti del rivelatore (per esempio per le (p p pSTRIP: Tracker, TEC, TIB, TOB…)Intervalli di tempo (IOV - intervallo divalidità)

12/3/2008Antonio Pierro19

Page 20: Relazione sull’attività del primo anno di dottorato in …didatticait.altervista.org/Didattica/fisica/PhD/presenta...Sviluppo di strumenti web-oriented per monitorare la qualità

Prospettive futureProspettive futureEvoluzione del DQM:

G i ll’ lti Gl b l R h t t i l’ t t fi l tiGrazie all’ultimo Global Run ho potuto capire come l’utente finale gestisce e si interfaccia con il sistema, esercizio istruttivo per migliorare la GUI della nuova DQM e la gestione delle risorse da parte del sistema. Questa attività non riguarda solo il tracciatore ma coinvolge tutti i sottorivelatori diattività non riguarda solo il tracciatore ma coinvolge tutti i sottorivelatori di CSM (oltre al tracciatore, il sistema calorimetrico, il sistema di rivelazione di muoni.).P t’ lti tti ità h t t i i t l’ b t t llPer quest’ultima attività ho, recentemente, inviato l’abstract alla conferenza sul calcolo per la Fisica delle alte Energie, CHEP 2009

il cui titolo è CMS conditions database web application service ed è stato classificato all’interno del seguente argomento di discussione: Distributed Processing and Analysis.

Titolo tesi proposta:p pSviluppo di strumenti web-oriented per monitorare la qualità dei dati di CMS

12/3/2008Antonio Pierro20


Recommended