Sintesi del progetto
Il progetto aggiorna l’INFN-DataCloud, una rete di centri di calcolo collegati tra loro, composta da un sito principale, nove siti territoriali e un nuovo centro dedicato alla resilienza in caso di guasti o emergenze. L’infrastruttura mette a disposizione risorse Grid e Cloud per più comunità di utenti e contribuisce allo Spoke 0 come risorsa abilitante per costruire una piattaforma federata dedicata a HPC e Big Data.
Obiettivo
Il intende rafforzare la capacità di calcolo e di gestione dei dati per sostenere, nel prossimo decennio, attività che richiedono analisi ad alte prestazioni e flussi di lavoro basati su intelligenza artificiale. Rendere possibile archiviare grandi quantità di dati e accedervi in modo distribuito, così da lavorare dagli stessi dataset anche da sedi diverse.
Problemi e necessità
Nei prossimi anni la quantità di dati prodotti da ricerca, industria e istituzioni cresce e diventa più difficile estrarre informazioni utili. Servono quindi risorse che permettano simulazioni, analisi avanzate e gestione di archivi molto estesi, con l’idea di poter integrare in futuro anche tecnologie emergenti quando disponibili, senza dover riprogettare da zero l’infrastruttura.
Soluzioni sviluppate
L’aggiornamento effettuato dal progetto consolida i siti esistenti lungo due direttrici: migliorare le strutture dei data center, intervenendo su spazi, raffreddamento e distribuzione elettrica; acquisire nuovo hardware per calcolo e storage tramite procedure pubbliche. L’infrastruttura viene messa in esercizio valorizzando l’esperienza INFN nella gestione di piattaforme distribuite affidabili, in modo da rendere le nuove risorse subito utilizzabili dalle comunità.
Impatti
L’infrastruttura aggiornata amplia le risorse disponibili per progetti scientifici e applicazioni che lavorano su grandi volumi di dati, offrendo una dotazione complementare rispetto ai grandi siti di supercalcolo. La distribuzione su più sedi migliora la continuità del servizio e rende più semplice far crescere i carichi di lavoro quando aumentano utenti e richieste, con ricadute pratiche per programmi e attività provenienti anche dagli altri Spoke ICSC.
Settori di applicazione
La piattaforma è pensata per uso multidisciplinare e condiviso tra progetti diversi, quindi adatta a ricerca fondamentale, Software e Artificial Intelligence, oltre a servizi che richiedono accesso efficiente a molti dati e contesti dove la Sicurezza è un requisito operativo. Le capacità sviluppate possono supportare in modo diretto i settori della Security, dell’Artificial Intelligence, della Material Science e dell’Environment. Più in generale, il progetto rafforza il dominio del Computing and storage infrastructure, fornendo una base solida per servizi di calcolo e dati a supporto di numerose comunità scientifiche e industriali.