DISCORSIVO – AI-assisted Interpretation of Visual and Textual Astrophysical Data

Tecnologia sviluppata: Pipeline di Retrieval Augmented Generation (RAG) basata su Large Languege Model (LLM) e vector database per l’analisi della letteratura astrofisica
Stazione appaltante: INFN
Beneficiari: Tinvention S.r.l.

I dettagli del progetto

Sintesi del progetto

DISCORSIVO, attraverso lo sfruttamento degli LLM, vuole fornire risposte nell’ambito della ricerca osservativa al problema riguardante l’analisi di volumi di dati ormai troppo vasti per essere gestiti con metodi tradizionali. La soluzione sviluppata utilizza un framework di Retrieval Augmented Generation fondato su un corpus continuamente aggiornato di articoli scientifici da arXiv.org, garantendo risposte tracciabili e basate su fonti peer-reviewed.

Obiettivi

Il progetto mira a sviluppare un assistente AI per la ricerca astrofisica capace di interrogare grandi insiemi di letteratura e fornire risposte accurate corredate da riferimenti verificabili attraverso la un’interfaccia semplice e intuitiva per gli utenti e l’integrazione della pipeline con piattaforme visuali esterne.

Problemi e necessità

Il ritmo di crescita della letteratura scientifica e dei dataset astrofisici rende impossibile affidarsi esclusivamente alla lettura manuale. Strumenti AI non controllati possono introdurre errori o allucinazioni, rendendo necessarie soluzioni che uniscano automazione e rigore scientifico, garantendo trasparenza e affidabilità delle informazioni restituite.

Soluzioni sviluppate

DISCORSIVO integra un LLM con un vector database facilmente interrogabile. Le informazioni rilevanti vengono recuperate da un corpus scientifico aggiornato e restituite all’utente tramite RAG, insieme all’elenco delle fonti. È stato sviluppato un prototipo pienamente funzionante, dotato di chatbot e API, validato su compiti sia generativi sia di information retrieval. Lo strumento è già in grado di restituire risposte robuste e verificabili.

Impatti

DISCORSIVO può migliorare significativamente l’efficienza del lavoro dei ricercatori, accelerando l’accesso a conoscenze complesse e facilitando la scoperta di pattern e anomalie nei dati. Contribuisce inoltre alla formazione di professionisti e studenti, fornendo un supporto affidabile nella consultazione della letteratura.

Settori di applicazione

Oltre all’astrofisica, DISCORSIVO è applicabile a qualsiasi campo scientifico basato su grandi quantità di dati e bibliografia: Intelligenza Artificiale, Education and Training, Software, Data-intensive research, Space science, grazie alla sua architettura modulare e replicabile.

DISCORSIVO – AI-assisted Interpretation of Visual and Textual Astrophysical Data

Sintesi del progetto

Obiettivi

Problemi e necessità

Soluzioni sviluppate

Impatti

Settori di applicazione

OSM – Oil Spill Monitoring Software – Predictive modeling of pollutant propagation following an oil spill accident in the sea

RETE – Resilience of the Electric Transmission grid to Extreme events

TS – Time Series in the Banking Sector

ATS – Anomalies in time series

SCP – Serial Code Porting on HPC & Quantum Computing

HMMA – HaMMon-Advance: Integrated AI for Enhanced Seasonal Forecasting and Environmental Risk Management

HAEQ – HaMMon-EQ: Merging data and AI for improving Seismic Risk assessment and Management in populated areas

HAMMON – Hazard Mapping and vulnerability Monitoring

SAFE – Secure anomaly detection edge AI system For critical Environments

PMIP – Harnessing the power of Artificial Intelligence for predictive maintenance of industrial plants

ML – Blending Machine Learning with advanced numerical simulations: application to the sustainable exploitation of natural resources

JDP – Job duration prediction

Collabora con ICSC