Upgrade of the INFN DataCloud distributed infrastructure

Tecnologia sviluppata: Potenziamento dell’infrastruttura distribuita INFN-DataCloud con nuove risorse di calcolo e archiviazione (CPU/GPU e Storage), ammodernamento di spazi e impianti dei data center (raffreddamento e distribuzione elettrica) e realizzazione di un Data Lake distribuito, accessibile e utilizzabile dai diversi siti.

I dettagli del progetto

Sintesi del progetto

Il progetto aggiorna l’INFN-DataCloud, una rete di centri di calcolo collegati tra loro, composta da un sito principale, nove siti territoriali e un nuovo centro dedicato alla resilienza in caso di guasti o emergenze. L’infrastruttura mette a disposizione risorse Grid e Cloud per più comunità di utenti e contribuisce allo Spoke 0 come risorsa abilitante per costruire una piattaforma federata dedicata a HPC e Big Data.

Obiettivo

Il intende rafforzare la capacità di calcolo e di gestione dei dati per sostenere, nel prossimo decennio, attività che richiedono analisi ad alte prestazioni e flussi di lavoro basati su intelligenza artificiale. Rendere possibile archiviare grandi quantità di dati e accedervi in modo distribuito, così da lavorare dagli stessi dataset anche da sedi diverse.

Problemi e necessità

Nei prossimi anni la quantità di dati prodotti da ricerca, industria e istituzioni cresce e diventa più difficile estrarre informazioni utili. Servono quindi risorse che permettano simulazioni, analisi avanzate e gestione di archivi molto estesi, con l’idea di poter integrare in futuro anche tecnologie emergenti quando disponibili, senza dover riprogettare da zero l’infrastruttura.

Soluzioni sviluppate

L’aggiornamento effettuato dal progetto consolida i siti esistenti lungo due direttrici: migliorare le strutture dei data center, intervenendo su spazi, raffreddamento e distribuzione elettrica; acquisire nuovo hardware per calcolo e storage tramite procedure pubbliche. L’infrastruttura viene messa in esercizio valorizzando l’esperienza INFN nella gestione di piattaforme distribuite affidabili, in modo da rendere le nuove risorse subito utilizzabili dalle comunità.

Impatti

L’infrastruttura aggiornata amplia le risorse disponibili per progetti scientifici e applicazioni che lavorano su grandi volumi di dati, offrendo una dotazione complementare rispetto ai grandi siti di supercalcolo. La distribuzione su più sedi migliora la continuità del servizio e rende più semplice far crescere i carichi di lavoro quando aumentano utenti e richieste, con ricadute pratiche per programmi e attività provenienti anche dagli altri Spoke ICSC.

Settori di applicazione

La piattaforma è pensata per uso multidisciplinare e condiviso tra progetti diversi, quindi adatta a ricerca fondamentale, Software e Artificial Intelligence, oltre a servizi che richiedono accesso efficiente a molti dati e contesti dove la Sicurezza è un requisito operativo. Le capacità sviluppate possono supportare in modo diretto i settori della Security, dell’Artificial Intelligence, della Material Science e dell’Environment. Più in generale, il progetto rafforza il dominio del Computing and storage infrastructure, fornendo una base solida per servizi di calcolo e dati a supporto di numerose comunità scientifiche e industriali.

Collabora con ICSC

Hai un progetto, una competenza o una visione che può contribuire alla trasformazione digitale del Paese?

Siamo sempre alla ricerca di nuovi partner per ampliare il nostro impatto.

institutional-logos