ML4NGP
Non-globular proteins in the era of Machine Learning

Acronimo: ML4NGP
Tipo di progetto Internazionale
Tipologia finanziamento Europeo
Aree tematiche progetti di ricerca Computational and Structural Biology
Stato del progetto di ricerca Attivo
Grant Agreement Number: CA21160
Data avvio: 25 October 2022
Data termine: 24 October 2026
Durata: 48 mesi
Importo: 629.813,15 €
Website progetto: https://ml4ngp.eu/
Abstract:
Versione in inglese:
Protein structure prediction has long been considered the “Holy Grail” of structural biology. The recent success of AlphaFold has ushered in a new era of highly accurate structure prediction, bringing to light the secrets hidden in the three-dimensional structures of globular proteins, increasing our understanding about their structural features and molecular function. However, a large proportion of the proteomes from all domains of life are rich in sequences that do not fold into regular structures, commonly known as nonglobular proteins (NGPs). NGPs comprise intrinsically disordered regions, repeats, low-complexity sequences, aggregation-prone and phase-separating sequences, and are implicated in a range of agerelated diseases. Their heterogeneous structural states and low sequence complexity challenge current experimental structure determination techniques and machine learning (ML) methods for structure prediction, making the molecular understanding of their sequence-structure-dynamics-function relationship difficult. The recent improvements of ML approaches and advances in determining NGP structural ensembles call for a timely re-assessment of the interplay between experiments and computation. The ML4NGP Action aims to establish an interdisciplinary pan-European network to favour this interplay, fostering experimental frameworks designed to provide information to computational methods, and novel computational methods developed, trained and benchmarked with experimental data. ML4NGP will enhance the primary experimental data generation (WG1), promote integrative structural biology approaches (WG2), benchmark the state-of-the-art ML methods (WG3) and improve the functional characterization of NGPs (WG4). The Action will support its scientific objectives through policies that sustain free knowledge exchange, inclusiveness and training of young researchers who will lead future innovations in this field.
Versione in italiano:
La predizione della struttura proteica è stata a lungo considerata il "Santo Graal" della biologia strutturale. Il recente successo di AlphaFold ha inaugurato una nuova era di predizione strutturale altamente accurata, portando alla luce i segreti nascosti nelle strutture tridimensionali delle proteine globulari e aumentando la nostra comprensione delle loro caratteristiche strutturali e della loro funzione molecolare. Tuttavia, una grande proporzione dei proteomi di tutti i domini della vita è ricca di sequenze che non si ripiegano in strutture regolari, comunemente note come proteine non globulari (NGP). Le NGP comprendono regioni intrinsecamente disordinate, ripetizioni, sequenze a bassa complessità, sequenze inclini all'aggregazione e alla separazione di fase, e sono implicate in una serie di malattie legate all'età. I loro stati strutturali eterogenei e la bassa complessità di sequenza rappresentano una sfida per le attuali tecniche sperimentali di determinazione della struttura e per i metodi di apprendimento automatico (ML) per la predizione della struttura, rendendo difficile la comprensione molecolare della loro relazione sequenza-struttura-dinamica-funzione. I recenti miglioramenti degli approcci di apprendimento automatico (ML) e i progressi nella determinazione degli insiemi strutturali delle proteine non giganti (NGP) richiedono una tempestiva rivalutazione dell'interazione tra esperimenti e calcolo. L'azione ML4NGP mira a creare una rete paneuropea interdisciplinare per favorire tale interazione, promuovendo framework sperimentali progettati per fornire informazioni ai metodi computazionali e nuovi metodi computazionali sviluppati, addestrati e validati con dati sperimentali. ML4NGP potenzierà la generazione di dati sperimentali primari (WG1), promuoverà approcci integrativi di biologia strutturale (WG2), valuterà i metodi ML all'avanguardia (WG3) e migliorerà la caratterizzazione funzionale delle NGP (WG4). L'azione sosterrà i suoi obiettivi scientifici attraverso politiche che promuovano il libero scambio di conoscenze, l'inclusività e la formazione di giovani ricercatori che guideranno le future innovazioni in questo campo.

Funded by the European Union through the COST Action (European Cooperation in Science and Technology) Agreement number: CA21160. Views and opinions expressed are however those of the author(s) only and do not necessarily reflect those of the European Union or the COST Action. Neither the European Union nor the granting authority can be held responsible for them.
Contatti: alexander.monzon@unipd.it; silvio.tosatto@unipd.it; diana.battistella@unipd.it

