+ All Categories
Home > Documents > Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

Date post: 19-Jan-2016
Category:
Upload: nyx
View: 42 times
Download: 0 times
Share this document with a friend
Description:
Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia. Outline. Infrastruttura: risorse e servizi che permettano di accedervi e condividerle I centri di calcolo italiani Quali servizi per soddisfare i requisiti degli utenti? - PowerPoint PPT Presentation
21
CMS 1 . Biasotto – Bologna 20/01/2005 Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia
Transcript
Page 1: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

1 M. Biasotto – Bologna 20/01/2005

Infrastruttura di calcolo per CMS-Italia

M.Biasotto – INFN Legnaroe i gestori dei centri CMS Italia

Page 2: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

2 M. Biasotto – Bologna 20/01/2005

Outline

• Infrastruttura: risorse e servizi che permettano di accedervi e condividerle

• I centri di calcolo italiani

• Quali servizi per soddisfare i requisiti degli utenti?

• servizi locali e servizi distribuiti (Grid)

• Grid.it: struttura e modalita' per entrare in Grid

• configurazione minima e configurazione raccomandata

• farm in configurazione “ibrida” (locale + grid)

• Situazione attuale dei siti CMS

Page 3: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

3 M. Biasotto – Bologna 20/01/2005

Ruolo dei Tiers nel Computing Model

• Tier-1:• Storage e custodia (MSS) di parte dei dati ufficiali di

CMS• Storage e custodia di dati simulati• Re-processing dei dati in custodia• Processamento dei dati con codice dei Physics Groups• Processamento dei dati con codice degli utenti• Limitato supporto locale ad utenti singoli

• Tier-2:• Risorse di calcolo per produzione dati simulati• Supporto locale a Physics Groups e utenti singoli• Storage di limitate quantita’ di dati (non in custodia)

• Tier-3 :• Supporto locale a utenti singoli

Page 4: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

4 M. Biasotto – Bologna 20/01/2005

Attivita' correnti

• Data Storage• Gestione MSS e storage locale

• Produzioni locali• Production manager locale, utilizzo di un local resource

manager e di storage locale, nodo principale di PhedEx• R&D

• Sviluppo tool di analisi per CMS• Condivisione risorse e dati utilizzando i tools di LCG

• Supporto locale• Accesso al local resource manager e storage locale ma

anche accesso a cataloghi e risorse su grid

Page 5: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

5 M. Biasotto – Bologna 20/01/2005

Risorse hardware

Valori approssimati (estate 2004 e stime 2005)

  CPU (KSI2000) Disk (TB)

  2004 2005 2004 2005

CNAF 164,0 204,0 60,0 72,0

LNL 127,0 127,0 46,0 50,0

PI 16,8 50,8 5,0 13,0

BA 13,6 21,6 4,0 6,0

BO 13,2 21,2 5,8 5,8

PD 35,0 35,0 3,8 5,8

RM 12,4 16,4 5,0 9,0

CT 10,8 10,8 1,0 3,0

FI 7,2 11,2 5,2 5,2

MI 12,4 12,4 1,0 1,0

NA 6,0 6,0 1,0 3,0

PV 0,0 4,0 0,0 2,0

PG 14,4 14,4 2,4 2,4

TO 10,4 10,4 2,8 4,0

Totale 443,2 545,2 143,0 182,2

Page 6: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

6 M. Biasotto – Bologna 20/01/2005

Risorse hardware

CPU 2005 (KSI2000)CNAF

LNL

PI

BA

BO

PD

RM

CT

FI

MI

NA

PV

PG

TO

Disk 2005 (TB)CNAF

LNL

PI

BA

BO

PD

RM

CT

FI

MI

NA

PV

PG

TO

Page 7: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

7 M. Biasotto – Bologna 20/01/2005

Centri di calcolo italiani

• Ruoli attuali:• Tier-1 (data storage, produzioni locali, R&D)

• CNAF• Tier-2++ (produzioni locali, R&D, supporto locale)

• LNL (anche data storage), Pisa• Tier-2 (R&D, supporto locale)

• Bari, Bologna, Padova, Roma• Tier-3 (supporto locale)

• Catania, Firenze, Milano, Napoli, Pavia, Perugia, Torino

• Considerazione:• Non c'e' una grossa distinzione tra T2 e T3; visti gli

obblighi dei T2 verso la comunita’ CMS, potrebbe aver senso considerare come T2 solo LNL e Pisa

Page 8: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

8 M. Biasotto – Bologna 20/01/2005

Supporto agli utenti

• Partendo da quello che vuole vedere l’utente finale, in ordine di priorita’:

1. accedere a risorse di calcolo per sviluppo codice e analisi

2. conoscere i dati disponibili localmente3. analizzare i dati disponibili localmente (sa

interattivamente che in modo batch)4. conoscere i dati disponibili globalmente5. copiare localmente i dati necessari6. analizzare dati remoti7. condividere con utenti remoti i risultati prodotti

localmente8. dare accesso ad utenti remoti ai dati locali9. dare accesso ad utenti remoti alle risorse locali

Page 9: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

9 M. Biasotto – Bologna 20/01/2005

Servizi localiA. L'accesso alle risorse locali avviene tramite un

tradizionale loginB. Sulle macchine di login sono disponibili l'ambiente

di sviluppo ed il software applicativo1. e' soddisfatto (accesso a risorse per sviluppo codice)

C. Localmente e' disponibile un database contenente cataloghi POOL di dati2. e' soddisfatto (elenco dati locali)

D. Localmente e' disponibile un batch system che da' accesso ai nodi di calcolo

E. Le aree di storage locali ed il software applicativo sono visibili dalle macchine di login e dai nodi batch3. e' soddisfatto (analisi dati locali)

Fin qui sono stati utilizzati solamente tool e servizi locali...

Page 10: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

10 M. Biasotto – Bologna 20/01/2005

Servizi gridF. Dalle macchine di login si puo' accedere ad un

sistema che conosce i dati di CMS (RefDB/Phedex)4. e' soddisfatto (elenco dati remoti)

G. Le macchine di login sono User Interfaces di LCG5. e' soddisfatto, se i dati sono su server opportuni (import dati)

6. e' soddisfatto (analisi dati remoti)

7. e' soddisfatto, posto che si possa scrivere sui server (condivisione dati locali)

H. Le aree di storage locali sono servite da uno Storage Element di LCG e i dati sono registrati nel servizio F)7. e 8. sono soddisfatti (condivisione e accesso ai dai locali)

I. Il sistema batch locale e' visto da un Computing Element di LCG9. e' soddisfatto (accesso da remoto alle risorse locali)

L'aggiunta dei tools grid non elimina le funzionalita' locali

Page 11: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

11 M. Biasotto – Bologna 20/01/2005

Configurazione minimale• I servizi A.-E. sono la richiesta base per qualsiasi

sito, in quanto senza di essi sarebbe preclusa la possibilita’ di analizzare dati (requisiti 1.-3.)

• C richiede l’installazione di un server MySQL• Il servizio F. e’ fornito da CMS• Il servizio G. e’ implementato semplicemente

rendendo disponibile sulle macchine di login il software di UI di LCG (nessun server e’ necessario!) Sono quindi soddisfatti i requisiti 4.-7. cioe’ la possibilita’ di analizzare tutti i dati di CMS

Per CMS-Italia la configurazione minimale per qualsiasi sito e’ quella che fornisce i servizi A)-G), cioe’ che soddisfa i requisiti 1.-7. (accesso a dati e risorse locali e globali).

Page 12: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

12 M. Biasotto – Bologna 20/01/2005

Configurazione raccomandata• I siti che ospitano dati di CMS devono fornire anche

il servizio H. (SE) in modo da consentire la copia dei dati ad altri siti.

• E’ raccomandato che i siti che ospitano i dati implementino anche il servizio I. (CE) in modo che utenti di altri siti possano soddisfare il requisito 6. (analisi remota dei dati).

• Implementare il servizio I. paradossalmente potrebbe semplificare la vita ai gestori locali

• l’installazione del software applicativo potrebbe essere fatta da remoto (software manager)

• la gestione del sito puo’ essere affidata ad un servizio calcolo non necessariamente CMS-specific (che e’ forse piu’ semplicemente disponibile in sezione!)

Page 13: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

13 M. Biasotto – Bologna 20/01/2005

Produzioni e Data Storage• I siti che garantiscono la possibilita’ di fare

produzioni locali (CNAF, LNL, PI) non sono influenzati dal fatto di essere configurati con tutti i servizi LCG (CE, SE, UI).

• La presenza di servizi SE semplifica la configurazione del sito come nodo PhedEx garantendo quindi la possibilita’ di trasferire dati in input/output al sistema di distribuzione di dati di CMS (vedi talk D. Bonacorsi)

• La presenza di servizi di CE rende i dati prodotti immediatamente disponibili per l’analisi remota da parte di tutti i fisici di CMS-Italia (vedi talk S. Lacaprara)

• Tutti gli altri siti, se configurati con CE ed SE, possono essere utilizzati per produzioni distribuite.

• Il Tier-1 e i Tier-2++ devono fornire tutti i servizi di CE ed SE. Si raccomanda che almeno gli altri Tier-2 lo facciano.

• CMS-Italia partecipera' al deployment di un sistema di produzioni distribuite basato su LCG (Grid.it).

Page 14: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

14 M. Biasotto – Bologna 20/01/2005

La struttura di Grid.it• Dal punto di vista organizzativo, gerarchia di diversi

organismi per i vari compiti previsti:• Coordinamento operazioni, supporto ai servizi, supporto

agli utenti, gestione release e documentazione, ecc.• Gestione di una release del middleware specifica per

Grid.it• e' in pratica un super-set di LCG: alla release base di

LCG si aggiungono customizzazioni specifiche per la grid italiana e alcune funzionalita' in piu' (ad es. VOMS, DAG jobs)

• Deployment di servizi specifici per la grid italiana: Resource Brokers, Information Index, Monitoring, ecc.

• Buon livello di supporto sia per i site admin che per gli utenti finali:

• Sito web con documentazione, knowledge base, sistema di ticketing per gestione dei problemi

• http://grid-it.cnaf.infn.it

Page 15: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

15 M. Biasotto – Bologna 20/01/2005

Grid.it: struttura organizzativa

Page 16: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

16 M. Biasotto – Bologna 20/01/2005

Come entrare in Grid.it (I)• Livello minimo: solo User Interface

• Installazione middlware UI su una macchina: download di un tar con script di setup, disponibile per RH7.3 e SL, richiede java

• Certificato personale + registrazione alla VO di CMS• Condividere la farm locale CMS con un sito Grid.it gia'

presente in sezione• La gestione sistemistica della farm potrebbe essere

demandata ad altri, occupandosi solo della parte CMS-specific locale

• Naturalmente si vuole tenere un certo livello di controllo sulle proprie risorse:

• Gateway con home locali e sw applicativo custom gestito in proprio

• Area storage locale oltre a quella su SE• Coda batch locale con priorita' sui propri nodi di calcolo

Page 17: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

17 M. Biasotto – Bologna 20/01/2005

Come entrare in Grid.it (II)

• Diventare a tutti gli effetti un sito Grid.it

• Maggiore controllo ma ovviamente maggiore impegno

• Al momento (release 2.3) supportata solo installazione con LCFG, dalla prossima release e' prevista solo l'installazione manuale del middleware (in buona parte automatizzata da script), senza tool sofisticati come LCFG (o il suo successore Quattor)

• Notevole lo sforzo richiesto inizialmente per partire, ma una volta avviati la gestione non e' particolarmente onerosa, anzi c'e' il vantaggio di trovarsi tante cose gia' pronte (security updates, sw applicativo, ecc.)

• Farm in configurazione “ibrida” per poter essere usata anche localmente come prima

Page 18: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

18 M. Biasotto – Bologna 20/01/2005

Configurazione farm “ibrida” (I)• La macchina “gateway” della farm locale viene

mantenuta, con le home degli utenti locali e un'area con il software applicativo “locale” (codice CMS custom, ecc.), entrambe esportate via NFS

• Si aggiunge una macchina nuova a fare da CE (gateway per la grid)

• Almeno un server viene reinstallato come SE, l'area di storage puo' essere partizionata come si vuole: parte dedicata a grid e parte ad uso esclusivamente locale

• ma in teoria e' anche possibile non avere un SE o puntare verso un SE remoto in un altro sito

• I nodi di calcolo sono reinstallati col middleware di grid e montano via NFS sia le aree grid (da CE ed SE) che quelle locali (dal vecchio gateway e da SE o server locali):

• possono runnare sia in modo grid che locale

Page 19: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

19 M. Biasotto – Bologna 20/01/2005

Configurazione farm “ibrida” (II)• Nel batch system si crea una coda riservata agli utenti

locali, dove si possono dinamicamente cambiare priorita', uso esclusivo di certe macchine, ecc.

• Dal punto di vista pratico la cosa richiede una certa customizzazione della configurazione di default fornita dalle release di Grid.it

• Un punto importante e' che la migrazione da farm locale a grid si puo' fare in maniera graduale:

• Creazione di una piccola farm grid-only (cioe' configurata come da default) con un pool minimo di macchine (CE, SE, 1-2 WN), senza modificare la farm locale

• Si prova poi ad applicare le modifiche per la configurazione ibrida e solo quando si e' certi che tutto funziona si procede via via a reinstallare i nodi di calcolo come WN di grid

Page 20: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

20 M. Biasotto – Bologna 20/01/2005

Configurazione farm “ibrida”

FastEthFastEth

GE backboneGE backbone

SWITCHSWITCH

N1FastEthFastEth

SWITCHSWITCH

S1S1 SE1SE1

N24

FastEthFastEth

SWITCHSWITCH

SnSn

To WANTo WAN

SE2SE2 SE3SE3

ComputingComputingNodesNodes

ComputingComputingNodesNodes

LocalLocalServersServers

Grid StorageGrid StorageElementsElements

GWGW G1G1 UIUI

LocalLocalGatewayGateway

LocalLocalLoginLogin

CECE

N1 N1N24 N24

Page 21: Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro

CMS

21 M. Biasotto – Bologna 20/01/2005

Situazione attuale dei siti CMSStato Grid Servizi

Sito Sito LCG Sito Grid.it farm condivisa User Interface PhedEx PubDB

CNAF X     X X X

LNL X     X - /

PI X      X - -

BA   X   X X X

BO   X   X - X

PD   X   X - X

Roma       - - -

CT       - - -

FI     ? - - -

MI       - - -

NA       - - -

PV       - - -

PG       - - -

TO       - - -


Recommended