Il ruolo del supercalcolo in ambito meteo e clima

I sistemi di calcolo ad alte prestazioni (HPC) forniscono un grande contributo alla meteorologia e climatologia, principalmente nella realizzazione di simulazioni numeriche per le previsioni del tempo e le indagini sul clima. I dati necessari per elaborare le previsioni del tempo provengono da diverse fonti di rilevazione e osservazione, da sonde e stazioni meteorologiche, radar. Le variabili raccolte tramite queste fonti sono tante ed eterogenee: l’umidità nell’aria, la temperatura, la pressione atmosferica, l'intensità e la direzione dei venti. Inoltre, i dati vengono confrontati con le serie storiche. L’analisi dei dati, infine, si basa su modelli matematici molto complessi: ecco perché per ottenere informazioni in tempi brevi sono richieste grandi capacità di calcolo.

Nuovi paradigmi di elaborazione delle previsioni

La richiesta di previsioni meteorologiche sempre più accurate, insieme allo sviluppo scientifico dei modelli atmosferici, ha portato negli anni ad un aumento della complessità delle parametrizzazioni fisiche dei modelli stessi. La conseguenza è stata un aumento della risoluzione delle mappe, implicando così una richiesta ancora maggiore di risorse di elaborazione e archiviazione necessarie per la gestione delle simulazioni.

Inoltre, al fine di migliorare  le previsioni con informazioni sulla loro attendibilità e aumentare l'intervallo di tempo della previsione stessa, negli ultimi anni è stata introdotta l’elaborazione di previsioni probabilistiche, ensemble forecasting, ovvero il modello meteorologico viene eseguito più volte in condizioni leggermente diverse, inserendo elementi “perturbanti” che modificano le condizioni iniziali, data la natura caotica delle equazioni che governano il modello stesso. Anche in questo caso, al fine di ridurre i tempi di esecuzione sono necessarie elevate risorse computazionali, perché l'insieme delle simulazioni  del modello deve essere eseguito il più possibile in modalità parallela (più simulazioni eseguite contemporaneamente).

Con la comparsa del modello di previsione di tipo probabilistico, dunque, la quantità di dati necessari per processare  le previsioni è cresciuta di un ordine di grandezza rispetto al metodo di previsione deterministica. Oggi la necessità di utilizzare le risorse di supercalcolo sorge non solo nella fase di integrazione delle equazioni del modello, ma si estende anche  alla fase successiva della post-elaborazione dei risultati.

L’infrastruttura di calcolo a supporto delle previsioni meteo

La tipologia di servizi che solitamente vengono richiesti nel campo meteo-idrologico integra le tipiche problematiche dei sistemi di supercalcolo, quindi in particolare la potenza di calcolo, con quelle dei servizi ad elevata criticità, quindi in particolare rapidità, disponibilità e alta affidabilità. L’operatività di un servizio previsionale che utilizza il supercalcolo deve funzionare in modalità automatica 365 giorni all’anno, con tempistiche rigorose e con un’aspettativa di affidabilità e infallibilità notevolmente elevata. Per erogare un servizio di questo genere, ogni elemento dell’infrastruttura deve essere estremamente affidabile e in ridondanza, l’ambiente informatico deve essere stabile nel tempo e resistere ad ogni evento critico che può compromettere la sua funzionalità.

Cineca e meteo: una collaborazione trentennale

Per poter garantire un servizio così complesso e critico come quello delle previsioni del tempo, dunque, sono necessarie competenze e risorse di comprovata affidabilità ed efficienza, e un’esperienza consolidata nel tempo.  L’esperienza di Cineca in questo ambito è di lunga data. Da oltre 30 anni, i supercomputer del Cineca elaborano e  forniscono previsioni meteorologiche dettagliate per l’Italia, in particolare per il Centro funzionale centrale per la gestione del rischio  della Protezione Civile Nazionale e le sue unità di crisi, in collaborazione con il Servizio Meteorologico Regionale dell'Emilia-RomagnaARPA Piemonte e Aeronautica Militare Italiana.

Dal 1993 Cineca è partner di Arpae nelle attività relative al servizio di previsioni meteorologiche nazionali e adempie alla funzione di centro di supercalcolo  per le previsioni meteorologiche. 
Inoltre Cineca collabora attivamente da molto tempo anche con l’Istituto Nazionale di Oceanografia e di Geofisica Sperimentale (OGS) di Trieste, che produce i dati relativi alle analisi biogeochimiche relativi al  mare Mediterraneo nell’ambito del progetto "Copernicus: marine environment monitoring service": un servizio a livello europeo che fornisce informazioni sulla qualità del mare e sulle condizioni ambientali dei mari ed oceani che costeggiano il continente.

Cineca collabora anche con Arpa Piemonte mettendo a disposizione risorse di calcolo dedicate per la modellistica di previsione della qualità dell’aria. Grazie alla collaborazione con Arpa Piemonte, Cineca ha partecipato attivamente allo sviluppo della versione parallela del modello di qualità dell’aria FARM di proprietà della società ARIANET.

Cineca fornisce servizi di supercalcolo anche alla Fondazione Centro Euro-Mediterraneo sui Cambiamenti Climatici (CMCC) e CIMA Research Foundation

Le competenze di Cineca in ambito meteo e clima

Le competenze dei ricercatori Cineca nell’ambito delle previsioni meteorologiche e climatologiche riguardano cinque fronti principali:

  • gestione e amministrazione di sistemi di supercalcolo;
  • parallelizzazione, ottimizzazione, profiling e debugging dei codici;
  • conoscenza dei modelli previsionali dal punto di vista informatico;
  • gestione di servizi ad alta frequenza ed elevata criticità di utilizzo in ambienti di supercalcolo;
  • gestione, elaborazione e postprocessing  di grosse moli di dati.

Per mantenere un alto livello di affidabilità, l’infrastruttura tecnologica ed operativa è stata impostata su soluzioni specifiche.

Il workflow operativo

Per la gestione del servizio meteo, i ricercatori di Cineca hanno progettato e sviluppato una catena operativa ad hoc, ovvero un flusso di comandi, un workflow, completamente automatizzato, dove l’intervento dell’uomo risulta occasionale e necessario solo in casi di criticità. Il workflow esegue in autonomia una serie di comandi che gestiscono le diverse fasi del flusso ovvero la pre-elaborazione dei dati di input, l’esecuzione dei modelli previsionali, la post-elaborazione dei dati di output e infine la loro archiviazione per l’elaborazione successiva. La catena operativa è stata  integrata perfettamente con diverse tipologie di sistemi operativi disponibili sui supercomputer.

Per Arpae e Protezione Civile Cineca gestisce diverse catene operative, che utilizzano oltre 1000 core dei supercomputer. I dati finali vengono resi disponibili entro due ore dalla ricezione dei dati di input: Cosmo-5M: previsioni a 18 e 72 ore sul territorio dell’area mediterranea su aree con un’estensione di 5 km; Cosmo-I2: previsioni a 48 ore sul territorio nazionale italiano, su aree con estensione di 2.2 km; SWAN-MED-ITA-RE: previsioni dello stato del mare, fino a 72 ore, per il Mare Mediterraneo e su cinque aree geografiche a ridosso delle coste italiane.

Inoltre vengono fornite ingenti risorse di calcolo (130 nodi in dedicato, 4680 cores, su due cluster differenti, senza tempi di attesa) per la gestione delle altre catene operative: LAMI-ENDA: produzione di frequenti analisi della situazione meteorologica attuale e previsioni a brevissimo termine, facendo anche uso di osservazioni satellitari e radar mediante tecniche di ensemble data assimilation, e LAMI-ENS: procedure operative finalizzate alla previsione probabilistica mediante tecniche di ensemble forecasting (esecuzione contemporanea di diverse simulazioni con configurazioni perturbate).

Le collaborazioni internazionali e i progetti

Le competenze Cineca in ambito meteo-clima sono riconosciute a livello internazionale, anche grazie alla partecipazione a numerosi progetti di carattere tecnico scientifico inerenti le tematiche della meteorologia e della climatologia. In questi anni il Cineca ha avviato anche diverse collaborazioni con partner internazionali. 

ICTP e il progetto CORDEX

In questi anni il Cineca ha avviato anche diverse collaborazioni nel settore meteo – clima con partner internazionali. Di recente avvio,  la collaborazione con ICTP, International Centre for Theoretical Physics, una storia di successo per la ricerca sul clima e la collaborazione nella ricerca globale. Anche in questo caso, decisive si sono rivelate le risorse di calcolo e le competenze che il Cineca ha messo a disposizione dei climatologi coinvolti in un progetto di collaborazione mondiale, denominato Coordinated Climate Climate Downscaling Experiment (CORDEX) e incentrato sul downscaling del clima regionale: passando da modelli che considerano il pianeta in blocchi di 100 chilometri a modelli regionali, che considerano la variazione su distanze di pochi chilometri. 
Il ridimensionamento dei modelli è infatti l’elemento necessario per stimare l'impatto dei cambiamenti climatici su pericoli e rischi in luoghi diversi. La partnership fra ICTP e Cineca è stata avviata perché l’aumento della risoluzione spaziale e l’inclusione di molti più dettagli regionali richiedono molta potenza di elaborazione e spazio di archiviazione: le elaborazioni richieste dal progetto non sarebbero state possibili con le sole capacità di calcolo di ICTP.

Le risorse di calcolo di Cineca sono state rapidamente rese disponibili anche per eseguire modelli e scenari per i Paesi che non dispongono di risorse di elaborazione. ICTP ha collaborazioni con gruppi di lavoro a Pechino, Hong Kong e negli Stati Uniti, ma nel progetto si è fatto carico di gestire domini per i Paesi in via di sviluppo che non dispongono di risorse di elaborazione sufficienti, come ad esempio i modelli per i domini dell'America centrale e meridionale e per l'Africa. 
Il progetto CORDEX è importante per le decisioni politiche relative a inondazioni, siccità, diffusione delle malattie, sanità pubblica, agricoltura e molte altre, soprattutto nei Paesi in via di sviluppo che saranno i più colpiti dai cambiamenti climatici.

Nel contesto della collaborazione con  ICTP Cineca è entrato  a far parte della rete ESGF (Earth System Grid Federation), una collaborazione che mantiene software e infrastruttura informatica per i dati scientifici dei sistemi terrestri. Come nodo ESGF, Cineca gestisce e ospita i dati climatici prodotti dal gruppo di fisica del sistema terrestre dell'ICTP, fornendo accesso aperto agli scienziati di tutto il mondo e offre una serie di servizi sulla qualità dei dati, formattazione uniforme, semplificando l'utilizzo e il confronto con altri dati. I dati del progetto CORDEX dell'ICTP sono ora interamente pubblicati sul nodo Cineca  ESGF e i risultati globali di CORDEX saranno presentati in un prossimo numero speciale di Climate Dynamics.

ECMWF

Nel 2018, Cineca ha sostenuto la candidatura di Bologna ad ospitare il centro ECMWF (European Centre for Medium-Range Weather Forecasts). Il data center del Centro meteo ECMWF, finanziato con 40 milioni di euro, farà definitivamente dell’Italia, e di Bologna in particolare, la capitale europea dei dati sulla meteorologia. Una scelta dell’Unione Europea che ha tenuto conto del ricco tessuto di infrastrutture digitali, centri di ricerca e università presenti in Emilia-Romagna, che consentono all’Italia di confrontarsi a livello internazionale sui temi dell’innovazione.
Oltre a sostenere la candidatura di Bologna, il Cineca ha avviato anche diverse collaborazioni con il prestigioso centro europeo.

MISTRAL

Iniziativa italiana che ha ottenuto dei finanziamenti europei nel bando Connecting European Facility nel 2018, coordinata dal Cineca e in collaborazione con i principali stakeholder nazionali nel settore meteo, come Protezione Civile Nazionale, Arpae, Arpa Piemonte e Dedagroup. Partner internazionale è ECMWF, che ha il compito di realizzare il servizio Italy Flash Flood, per identificare gli episodi di alluvione. 

L’obiettivo è quello di facilitare e favorire il riutilizzo dei set di dati da parte della comunità meteorologica. A questo scopo è stata realizzata una piattaforma nazionale di dati aperti meteorologici per raccogliere e mettere a disposizione degli addetti ai lavori e della società dati meteorologici provenienti da reti osservative, analisi e previsioni storiche e in tempo reale. I dati saranno disponibili in termini di campi grigliati, prodotti probabilistici (come previsioni di pioggia per la previsione di inondazioni) o serie temporali puntuali provenienti dalla catena di modellizzazione delle previsioni operative italiane e campi di post-elaborazione (come probabilità di temporale).

Inoltre, il progetto ha l'obiettivo di fornire servizi a valore aggiunto attraverso l'uso delle risorse di supercalcolo, creando nuove opportunità commerciali. La prima versione della piattaforma, in cui è possibile accedere a diversi servizi realizzati grazie alla collaborazione fra vari partner, è già disponibile.

Cinque regioni, Emilia Romagna, Piemonte, Lazio, Campania e Calabria, hanno aderito al progetto che prevede lo sviluppo di una piattaforma che aggreghi, armonizzi e post-processi tutti i dati meteo osservati delle stazioni al suolo a livello nazionale. I dati osservati dalle stazioni a terra delle regioni stesse sono messi a disposizione in modalità open access. Ultima novità, ma non ultima in termini di importanza, è la partnership fra il progetto Mistral ed il progetto Highlander, che si fonda su ottimi presupposti.

Highlander 

A partire dalla fine 2019, Mistral è stato affiancato ed integrato da Highlander, un altro importante progetto dedicato ai dati meteorologici e climatici che si concluderà nel 2022. Il progetto Highlander, rispetto a Mistral, ha un legame più diretto con il territorio. In particolare, attraverso l’uso dell’High Performance Computing, l'obiettivo del progetto Highlander è quello di generare previsioni climatiche che contribuiscano a ridurre i rischi associati ai cambiamenti climatici per una gestione migliore e più sostenibile delle risorse naturali e del territorio. (highlanderproject.eu)
Cineca coordina il progetto, e mette a disposizione la potenza di calcolo dei sistemi HPC per  generare, post-processare, ospitare, distribuire e rendere accessibile e sfruttabile, da quanti più utenti possibile, sia i dati esistenti che quelli appena generati. I Il team di Cineca dovrà anche occuparsi dello sviluppo di una piattaforma   per la gestione di dati e metadati, della conversione di dati grezzi in un formato strutturato, dell’integrazione di strumenti di deep learning e machine learning per il rilevamento e il riconoscimento delle immagini sfruttando le risorse HPC, creando applicazioni personalizzate per la visualizzazione interattiva dei dati scientifici.

 

 

CYBELE

Focalizzato sui temi dell’agricoltura, dell’allevamento e della acquacoltura di precisione, come Highlander, il progetto CYBELE è attento alla questione dei cambiamenti climatici. 

CYBELE ha l'obiettivo di generare innovazione e creare valore nel campo dell'agroalimentare, attraverso casi d’uso industriali. Poiché l'agricoltura è un'attività ad alto volume con bassa efficienza operativa, il progetto aspira a dimostrare come la convergenza tra HPC, Big Data, Cloud Computing e IoT possa rivoluzionare l'agricoltura, ridurre la scarsità e aumentare l'offerta di cibo, apportando benefici sociali, economici e ambientali. Inoltre, il progetto intende garantire che le parti interessate abbiano un accesso integrato e non mediato a una vasta quantità di dati provenienti da una varietà di fonti, e siano in grado di generare valore, fornendo informazioni sicure e accesso diretto non mediato alle infrastrutture HPC che supportano il rilevamento, l'elaborazione, la combinazione e la visualizzazione dei dati.

Nell'ambito del progetto saranno sviluppati servizi specifici e generici di dominio in aggiunta all'ambiente di ricerca virtuale, per facilitare  l’acquisizione di conoscenze da grandi moli di dati relativi all'agroalimentare, affrontando la questione dell'aumento della reattività e del potenziamento della decisione assistita dall'automazione, dando alle parti interessate la possibilità di utilizzare le risorse in modo più responsabile dal punto di vista ambientale, migliorare l'approvvigionamento, e implementare soluzioni di economia circolare nella catena alimentare.
Oltre a contribuire allo sviluppo della piattaforma, Cineca collabora con GMV Aerospace and Defence e CACV (Cooperatives Agroalimentàries de la Comunitat Valenciana) allo sviluppo di un progetto pilota che ha l’obiettivo di creare un sistema di allarme per eventi meteorologici estremi (gelo, e grandine) combinando simulazioni meteo e tecnologie di Intelligenza Artificiale. Il fine è fornire agli agricoltori uno strumento in grado di anticipare i tempi delle previsioni, per dare un tempo di preavviso sufficiente a mettere in atto misure di riduzione del danno (come teli antigrandine) al fine di salvare i raccolti. 

Prospettive future

Modelli di Intelligenza Artificiale per Nowcasting Radar con applicazioni alle capacità di allerta real-time

L’applicazione di modelli di Intelligenza Artificiale nelle previsioni meteo sarà il prossimo step su cui lavorerà Arpae assieme a Fondazione Bruno Kessler e Cineca. L’obiettivo è di migliorare le capacità di nowcasting meteo attraverso l’utilizzo di strumenti di Deep Learning per early warning (15-60 minuti di lead time) e di definire modelli di integrazione tra algoritmi nowcasting di Deep Learning e modelli numerici, per previsioni real-time fino a 3-6 ore, di eventi meteo estremi per la regione Emilia Romagna. Il sistema sarà basato su metodi di Intelligenza Artificiale  applicati a dati da sorgenti radar multiple, anche in combinazione con dati storici e real-time relativi a fulminazioni, rete pluviometrica, e altre sorgenti meteo previsionali.

Dal punto di vista tecnologico, i modelli saranno sviluppati in ambiente di calcolo ad alte prestazione in collaborazione con Cineca, e saranno messi a disposizione tramite una soluzione cloud che permetterà di sperimentare nuove funzioni di early warning, come strumenti innovativi per servizi di allerta, analisi e previsione di eventi estremi, in particolare di precipitazioni intense con impatto sulla sicurezza umana ed ambientale (Protezione Civile, Agricoltura, Turismo, Mobilità).  

 

  • Nel corso dell'evento di presentazione del supercomputer Leonardo, Stefano Tibaldi e Tiziana Paccagnella, rispettivamente ex direttore e attuale direttore del Servizio IdroMeteoClima di ARPAE, hanno parlato del ruolo del supercalcolo nel contesto delle previsioni meteorologiche, e delle prospettive che può aprire una risorsa come Leonardo (al minuto 18 e al minuto 31). 

 

 

 

Glossario minimo

  • parametrizzazioni fisiche: algoritmi parametrizzati che simulano (definiscono) la fisica del sistema (atmosferico);
  • la natura caotica delle equazioni: le equazioni di Navier-Stokes che descrivono l'atmosfera sono equazioni di tipo non lineare, pertanto in fisica in alcuni casi vengono definite caotiche. Questo significa che il sistema dinamico dell'atmosfera ha una sensibilità esponenziale a piccole variazione delle condizioni iniziali. Pertanto una piccola incertezza delle condizioni iniziali fa si che il sistema può evolvere in modo del tutto imprevedibile nel tempo. Due simulazioni con piccole incertezze sulle condizioni iniziali possono evolvere in modo del tutto differente e ottenere nel tempo risultati completamente differenti.
  • previsioni degli ensemble previsioni di tipo probabilistico (per saperne di più)