L’Istituto europeo di Bionformatica (EMBL-EBI) ha potenziato la sua banca dati EMPIAR sulle immagini 2D grezze con una nuova risorsa in grado di accogliere le immagini ad alta risoluzione ottenute con tecniche di imaging cellulare. Il bioimaging sta rapidamente accrescendo i dati disponibili sulle strutture biologiche: se fino a pochi anni fa la determinazione delle strutture proteiche passava necessariamente attraverso la cristallografia a raggi X, oggi tecniche come la crio-microscopia elettronica o la SEM (scanning electron microscopy) forniscono sempre nuove informazioni sulla forma e le caratteristiche funzionali delle macromolecole biologiche.

EMPIAR, la banca dati pubblica di immagini grezze 2D di EMBL-EBI, fornisce dati utili per sviluppare nuovi approcchi al data processing, all’interpretazione e alla validazione, attività essenziali per l’archiviazione e il controllo qualità (credits: EMBL-EBI)
EMPIAR, la banca dati pubblica di immagini grezze 2D di EMBL-EBI, fornisce dati utili per sviluppare nuovi approcchi al data processing, all’interpretazione e alla validazione, attività essenziali per l’archiviazione e il controllo qualità (credits: EMBL-EBI)

L’iniziativa di EMBL-EBI, descritta nel dettaglio in una articolo su Nature Methods, ha lo scopo di raccogliere, organizzare e rendere più facilmente fruibili la gran mole di dati sperimentali che ogni giorno viene prodotta dei laboratori di ricerca.

Tra le tecniche supportate dalla banca dati intergovernativa vi è la tomografia a raggi X molli, in grado di colmare il gap di risoluzione e di scala tra la microscopia ottica e la tomografia elettronica, e la cosiddetta CLEM (Correlative light and electron microscopy), in cui i marcatori fluorescenti in grado di evidenziare determinati eventi cellulari vengono utilizzati congiuntamente alla microscopia elettronica ad alta risoluzione. “Lavoriamo da pionieri in questo settore per trovare la via migliore per conservare e correlare queste tipologie di dati, che si dimostreranno uno strumento molto potente per la ricerca”, ha commentato il coordinatore della Protein Data Bank europea di EMBL-EBI, Ardan Patwardhan.

I dati grezzi archiviati in EMPIAR potrebbero essere utilizzati, ad esempio, per rendere pubblici i dati originali che si riferiscono a studi controversi. La struttura di EMPIAR si colloca all’interno del quadro più grande della Electron Microscopy Data Bank (EMDB) e può gestire set di dati molto ampi. Attualmente la grandezza media delle informazioni depositate si aggira intorno ai 700 GB, con un massimo di 6 TB.