Lo Spoke 8 di ICSC: il Supercalcolo per la caratterizzazione e la cura delle malattie

Le tecniche di analisi genomica

Una aspettavia che oggi, giunto nel frattempo a compimento il processo di acquisizione e consolidamento delle tecniche di analisi genomica, a cui si sono aggiunte quelle in seguito nate nell’ambito delle cosiddette discipline omiche, risulta pienamente realizzata: soprattutto alla luce di una sempre maggiore richiesta da parte del settore medico di adeguate infrastrutture di supercalcolo e storage capaci di far fronte alle crescente quantità di dati biologici ottenibili da ogni singolo paziente, l’analisi dei quali, condotta in tempi utili, costituisce il fattore abilitante della medicina di precisione, termine che ha negli anni affiancato quello di medicina personalizzata. Sono proprio questi i presupposti su cui si basa il lavoro di ricerca svolto dallo Spoke 8 di ICSC – Centro Nazionale di Ricerca in High Performance Computing, Big data e Quantum Computing, denominato ‘Medicina in Silico e Dati Omici’ (In Silico Medicine and Omics Data). Grazie alle competenze interdisciplinari di cui si compone, lo Spoke intende avvalersi dell’infrastruttura di supercalcolo distribuita realizzata dal Centro Nazionale per elaborare, mediante algoritmi di machine learning, bioinformatica e intelligenza artificiale, i dati clinici prodotti attraverso le indagini omiche, al fine di comprendere meglio le patologie e di sviluppare metodologie per la creazione di percorsi di prevenzione, diagnostici e terapeutici mirati, in grado di avere un impatto diretto sulla salute e sull’intero sistema sanitario e di essere attrattive nei confronti dell’industria farmaceutica. Sulla strada verso il raggiungimento di tali obiettivi, lo Spoke 8, nel suo primo anno di attività, può già contare su una prova di validità delle proprie tecniche, ottenuta attraverso un caso studio verticale che ha riguardato la caratterizzazione del profilo genetico di un paziente oncologico.

La prossimità tra settore medico e soluzioni

Il rapporto e la prossimità tra settore medico e soluzioni per l’elaborazione automatica dei dati non rappresentano di certo delle novità. All’interno dei campi della diagnostica quali la radiomica e l’imaging, i metodi di intelligenza artificiale e machine learning sono stati infatti da tempo accolti, e il loro utilizzo standardizzato. L’adozione di simili strumenti costituisce inoltre un capitolo importante anche nella storia dei traguardi ottenuti dalla genomica, avendo contribuito a migliorare l’individuazione delle anomalie genetiche associate alle patologie ereditarie e rare, le quali rappresentano ancora oggi uno dei principali oggetti di studio della disciplina. Ben più recente risulta invece l’ingresso, in ambito medico, delle risorse informatiche di supercalcolo, determinato dal recente cambio di scala raggiunto nell’acquisizione di dati biologici relativi ai singoli individui grazie alle tecniche di analisi messe a punto dalla genomica, a cui si stanno iniziando ad aggiungere anche quelle provenienti dalle altre discipline cosiddette omiche.

Pratica comune nella genetica medica

“Se fino a poco tempo fa”, spiega Andrea Cavalli, leader dello Spoke 8 e ricercatore dell’Istituto Italiano di Tecnologia (IIT), “la pratica comune nella genetica medica consisteva nell’analizzare solo un limitano numero di pannelli di geni – corrispondenti a un’informazione abbastanza limitata dal punto di vista dei byte e delle risorse di calcolo necessario per l’elaborazione -, siamo passati in tempi più recenti all’indagine sugli esomi, ovvero su tutta quella parte del DNA codificante per la produzione delle proteine – che rappresenta il 2 o 3 per cento dell’intero genoma -, fino ad arrivare oggi a metodi più all’avanguardia in grado di analizzare l’intero genoma, composto da 3,4 miliardi di coppie di base di acidi nucleici. Ciò rappresenta tuttavia solo alla punta di un iceberg estremamente più grande e complesso, perché a fianco della genomica possono essere elencate discipline capaci di generare moli di dati altrettanto elevate: la trascrittomica, che studia l’Rna prodotto dai geni; la proteomica, che a sua volta si concentra sulle proteine codificate dall’Rna; la lipidomica, la quale analizza l’ambiente lipidico all’interno del tessuto e delle cellule – in grado di fornirci informazioni sullo stato di avanzamento di alcune patologie – ; senza dimenticare la metagenomica, altro settore molto ampio che indaga la composizione genetica del microbioma intestinale. Ci troviamo perciò per la prima volta di fronte a quelli che possiamo senz’altro definire Big Data in medicina, sui quali si fonda la medicina di precisione, i quali necessitano di strumenti computazionali con alte prestazioni sia per quanto riguarda la loro archiviazione che soprattutto per quanto concerne la loro analisi.”

L’estrazione di informazioni utili

Oltre a risultare imprescindibili per l’estrazione di informazioni utili alla caratterizzazione medica dei singoli individui, poter disporre di adeguate risorse di supercalcolo e storage potrà garantire lo sviluppo di modelli di medicina di precisione usufruibili dall’intera società, attraverso i quali si concretizzerebbe l’effettivo valore di cui sono oggi portatori di dati omici. Allargare la platea di pubblico in grado di beneficiare della medicina di precisione rappresenta quindi il principale traguardo che lo Spoke 8 intende raggiungere. Per farlo, lo Spoke coinvolgerà l’insieme delle diverse competenze necessarie presenti a livello nazionale e si avvarrà dell’estesa infrastruttura di calcolo e Big Data di ICSC per sviluppare tecniche e piattaforme informatiche in grado di accelerare e facilitare l’intero processo di estrazione di valore dai dati omici dei pazienti: a partire dalla loro corretta e sicura acquisizione e archiviazione, passando per la loro elaborazione, per finire con l’individuazione delle specificità biologiche e conseguente pianificazione delle terapie, affinché la medicina di precisione possa diventare una realtà all’interno del paese.

La sfida più grande dello Spoke 8

“La sfida più grande che lo Spoke 8 è chiamato ad affrontare”, sottolinea Cavalli, “riguarda la democratizzazione della medicina di precisione, la cui applicazione è oggi limitata ai soli progetti di ricerca. La produzione e lo storage delle grandi moli di dati omici, oltre alle opportune risorse informatiche, presuppone infatti anche l’intervento di operatori a cui viene richiesto un importante impegno in termini di tempo. Con democratizzazione della medicina di precisione, faccio quindi riferimento a quella serie di soluzioni che permetteranno di rendere questo processo molto più rapido e automatizzato, affinché l’applicazione della medicina di precisione sia estendibile a tutta la popolazione. Altro fattore decisivo a questo scopo riguarda infine il potenziamento dei sistemi e delle reti per il trasferimento dei dati, i quali devono essere spostati in maniera efficiente dai centri di raccolta a quelli di elaborazione. Tutto ciò non sarebbe ovviamente possibile senza il lavoro di ricercatori e professionisti provenienti da ambiti disciplinari diversi, come per esempio oncologi – perché attualmente i progetti su cui stiamo operando verticalmente riguardano la oncogenomica – e anatomopatologi, ma anche biologi molecolari e cellulari, bioinformatici, chimici, matematici, computer scientist e ingegneri informatici, nonché tecnici informatici che possano aiutare a costruire i repository e le interfacce per la consultazione di questi data base.”

La medicina di precisione è distribuita

Al momento attuale, in Italia, la medicina di precisione è distribuita, in maniera non strutturata e con risorse limitate, a macchia di leopardo in alcuni centri, e dipende in buona misura dall’iniziativa personale di quei medici consapevoli delle sue potenzialità disposti a dedicare tempo alle procedure di cui essa necessita, come la raccolta dei tessuti su cui effettuare le analisi genomiche o il lavoro di pseudoanonimizzazione dei dati raccolti e il loro trasferimento in apposite banche dati, che devono garantire la sicurezza di dati estremamente sensibili come quelli medici. Per invertire questa tendenza, c’è perciò bisogno di studi e progetti di ricerca pilota con cui fornire prove di concetto in grado di dimostrare la validità delle soluzioni e delle infrastrutture per lo storage, il calcolo, il data transfer e la cybersicurezza sviluppate ad hoc per il raggiungimento dell’obbiettivo, curare meglio i pazienti in modo mirato e personalizzato. È in questa direzione che si stanno concentrando gli sforzi del Centro nazionale ICSC attraverso lo Spoke 8, che ha già prodotto risultati incoraggianti tramite alcuni casi studio che hanno riguardato lo sfruttamento dei dati genomici in ambito oncologico.

I grandi benefici dello Spoke 8

“Il campo in cui la genomica può avere un’applicazione immediata dal punto di vista clinico e dal punto di vista del cittadino è sicuramente l’oncologia. Proprio per questo motivo, all’interno dello Spoke 8 di ICSC, siamo recentemente stati in grado di analizzare il profilo genomico di alcuni pazienti oncologici, facendo delle scoperte su alcuni geni coinvolti nell’evoluzione del tumore.” Prosegue Cavalli. “Le analisi che hanno riguardato sia il tumore che il genoma cosiddetto mendeliano, ovvero quello ereditato dai nostri genitori, ci hanno infatti consentito di trovare una serie di mutazioni che hanno pienamente giustificato e aiutato a comprendere la risposta ai trattamenti farmacologici dei pazienti. Oltre a queste analisi retrospettive, siamo in grado di identificare delle varianti per nuove eventuale linee chemioterapiche che non erano state ipotizzate in precedenza.”
I grandi benefici che l’attività dello Spoke 8 può apportare nel medio lungo periodo, che si configurano soprattutto in un aumento della capacità di curare le persone, non si estendono ai soli sistemi sanitari nazionali, ma anche alle aziende di settore, che potrebbero avvantaggiarsi dei metodi e degli strumenti per la pratica della medicina di precisione individuati per migliore le proprie performance o per la progettazione puntale e precisa dei trial clinici dedicati a testare l’efficacia e la sicurezza di nuovi farmaci per il trattamento delle malattie. Attraverso la completa e profonda caratterizzazione di ogni singolo caso tramite le nuove metodologie, potrebbe infatti essere possibile stratificare e creare popolazioni di pazienti omogenee per un determinato trial clinico, aumentando la probabilità di successo e diminuendo i costi per la sua realizzazione.

i trial clinici

“Prendendo in esame i trial clinici rivolti allo sviluppo di terapie volte a contrastare l’Alzheimer condotti negli ultimi anni, notiamo come molti di essi abbiano fallito, mostrando un tasso di successo molto basso. Se fossimo tuttavia in grado di individuare tra i partecipanti ai trial clinici quelli con la stessa variante dell’Alzheimer che risponde a una determinata molecola, avremmo la possibilità di aumentare il tasso di successo dei test e di individuare farmaci adatti al trattamento delle varie forme della malattia, che si sta rivelando sempre più come un insieme di patologie che conducono a una stessa condizione finale. Ciò rappresenterebbe un grande vantaggio per le aziende farmaceutiche, le quali spendono oggi centinaia di milioni di dollari per ogni trial clinico. Concentrandosi su queste tematiche, e viste le ingenti risorse necessarie per la produzione di nuovi farmaci, le attività dello Spoke 8, che vede tra i suoi partner un ospedale e un’azienda che si occupa di sanità digitale – le quali stanno già collaborando allo sviluppo delle metodologie descritte -, possono quindi avere un grande impatto sulle aziende farmaceutiche, che, una volta reso sistematico l’utilizzo delle nuove tecniche, saranno sicuramente interessate a rivolgersi al Centro Nazionale”, conclude Cavalli.