Tu sei qui

Risorse Lab Big Data Analytics

Oltre a mettere a disposizione risorse di calcolo, piattaforme software (principalmente open source dei progetti di Apache.org), nel contesto della Big Data Analytics il Cineca esprime una competenza di primo ordine sull’analisi dati, grazie ad un team di lunga esperienza di Data Scientists. In particolare su Data Mining, Machine Learning, statistica inferenziale e Text Mining.

Cineca è membro della Big Data Value Association (BDVA), associazione Europea che collabora con la Comissione Europea per promuovere la ricerca, lo sviluppo e l'innovazione nel contesto dei Big Data.

Infrastruttura tecnologica

HPC IBM NeXtScale server appositamente progettata per i casi di calcolo “data-intensive”:

  • 70 nodi IBM NeXtScale con interconnessione a 56 Gigabit/sec Processore Intel Ivy Bridge 20 core per nodo;
  • 128 GB RAM per nodo;
  • 1480 core in totale
  • 40 TB disco a stato solido locale al nodo,
  • 16 PB di storage in linea (4PB disponibili e 12 PB su tape)

Piattaforme software 

  • IBM Big Insights
  • Hortonworks Data Platform

Architetture

  • Data Streaming Analysis
  • In-memory Database
  • Machine Learning @ scale

Tecnologie

  • Hadoop (HDFS, MapReduce),
  • YARN, Spark SQL, Spark Streaming
  • Hive e HBase
  • Storm
  • Kafka
  • Distributed R