WP3: Studio computazionale con tecniche di MD classica e ML della struttura dei miRNA isolati ed in interazione per formare complessi.

La Dr.sa A. Casavola (CNR-ISM) con la sua esperienza nella modellizzazione ab-initio delle proprietà strutturali ed elettroniche di molecole di interesse biologico e di cluster molecolari aromatici e in DM classica di proteine sarà la responsabile del WP. A questo WP parteciperanno A. Cartoni (Sapienza Università Roma) e Assegnista di ricerca 1, postdoc (esperienza su applicazioni di DM e tecniche di ML). Per le attività di DM e ML ci si avvarrà della consulenza di A. Grottesi (CINECA sede di Roma).
L’ attività computazionale affiancherà quelle dei WP1 e WP2 con la finalità di 1) mettere a punto una metodologia computazionale predittiva della struttura dei miRNA isolati e in complessi con molecole target [10] e 2) identificare con tecniche di ML [11,12] le sequenze di frammenti che possano aiutare a confermare ed eventualmente quantificare l’avvenuta complessazione e dare indicazioni sulle modifiche strutturali indotte dal processo di complessazione. Questo WP si articola in 2 attività:
Task 3.1 Metodologia computazionale predittiva della struttura dei miRNA isolati e in complessi con molecole target.
L’attività prevede la messa a punto di una metodologia computazionale per lo studio, con simulazioni di DM, dell’effetto dell’interazione tra miRNA e molecole target. Nella definizione della metodologia computazionale verranno utilizzati miRNA costituiti da 16-24 nucleotidi e come prototipo di molecola target la proteina Ago2, selezionata per i test nel WP2, o suoi frammenti significativi o sequenze complementari. La scelta di questi sistemi è dovuta alla possibilità di simulare il comportamento di queste molecole in condizioni reali. In particolare, verrà individuato il force-field più adatto per la trattazione dell’interazione tra i vari atomi del sistema sia per il miRNA isolato sia in presenza del solvente usato nella produzione dello spray della sorgente ESI. La metodologia verrà validata mediante un confronto con i dati sperimentali e di letteratura.
Per le simulazioni di DM si utilizzerà la workstation acquistata nell’ambito del precedente progetto finanziato dalla regione Lazio, DESIR, e dotata di un sistema multiprocessore con scheda grafica GPU per calcolo parallelo intensivo secondo lo schema ibrido CPU/GPU, e il software open-source GROMACS, con licenza gratuita LGPL (Lesser General Public License). 
Task 3.2 Applicazione di tecniche di ML per identificare negli spettri di massa dei fingerprint dei complessi formati.
Per poter interpretare in modo affidabile i set di dati di spettrometria di massa nel caso di sistemi complessi come le molecole biologiche è necessario poter raggruppare ed assegnare gruppi di frammenti alle strutture di interesse. Per questo tipo di classificazione i metodi di ML rappresentano una risorsa fondamentale [11,12]. Nel caso specifico, si utilizzeranno i risultati della simulazione di MD per sviluppare un algoritmo non supervisionato che identifichi delle figure di merito con cui interpretare i risultati sperimentali di spettrometria di massa dei complessi miRNA-molecola target. Diversi metodi di clustering verranno testati e verrà adottato quello che nel training del modello su dati di letteratura fornirà il risultato migliore.