Sintesi del progetto
Il progetto mira a realizza un modulo di verifica indipendente per la pipeline di analisi dei dati acquisiti dalla missione Gaia attraverso l’implementazione di un algoritmo alternativo per la definizione delle caratteristiche principali (astrometriche) delle sorgenti stellari “primarie”, così da aumentare l’affidabilità del catalogo della Via Lattea e del riferimento globale usato dalla missione.
Obiettivo
Obbiettivo del progetto è ottenere risultati con accuratezza elevate e in tempi compatibili con l’acquisizione dei dati da parte dell’osservatorio spaziale Gaia, facendo crescere l’efficienza del calcolo al crescere della dimensione dei dataset.
Problemi e necessità
Le campagne di osservazioni di Gaia producono dati relativi a elevati numeri di sistemi stellati. Le dimensioni attese per l’ultimo dataset che sarà rilasciato dalla missione è infatti tale da rendere ingestibile un’analisi accurata, C’è quindi bisogno di un framework in grado di selezionare i soli segnali stellari e gestire volumi di dati nell’ordine di decine di terabyte.
Soluzioni sviluppate
Il solutore sviluppato è stato portato e ottimizzato su acceleratori (GPU) con incrementi di rispetto alla versione CPU, riducendo trasferimenti di dati e migliorando l’esecuzione asincrona. È stata inoltre sviluppata una pipeline per calcolare varianze e covarianze tramite file condivisi, senza rallentare in modo significativo l’elaborazione. Per rendere il software utilizzabile su architetture diverse, sono state testate più soluzioni “portabili” su architetture di calcolo diverse.
Impatti
Gli strumenti sviluppati consentono di ridurre i tempi di calcolo e i costi computazionali associati all’analisi dei dataset acquisiti dalla missione GAIA, garantendo inoltre maggiore riusabilità del software e trasferibilità delle tecniche a contesti che usano sistemi solutori per equazioni e grandi dataset, dalla ricostruzione di immagini radio a casi in geofisica, medicina e industria.
Settori di applicazione
Il sistema trova ricadute dirette nella Space e Fundamental research e in generale nelle attività di ricerca caratterizzati da flussi di lavoro su dati massivi. Le capacità sviluppate possono supportare in modo diretto i settori della Security, dell’Artificial Intelligence, della Material Science e dell’Environment. Più in generale, il progetto rafforza il dominio del Computing and storage infrastructure, fornendo una base solida per servizi di calcolo e dati a supporto di numerose comunità scientifiche e industriali.