Il Cineca si trova in una posizione privilegiata per offrire servizi di Data Mining in quanto integra in un solo centro le diverse funzioni e competenze necessarie per sviluppare un intero processo di estrazione di conoscenza.
Si tratta infatti di un Centro di Calcolo dotato di grande potenza di elaborazione e capacità di trattare enormi quantità di informazioni con algoritmi complessi. Tra i vari ambiti in cui ha sviluppato competenze, quelli maggiormente coinvolti in un processo di data mining riguardano: lo sviluppo di applicazioni informatiche avanzate, l'analisi dati, l'accesso alle sorgenti informative di tutto il mondo (con adeguamento tecnologico alla forma in cui si presenta l'informazione), l'integrazione di informazioni provenienti da fonti diverse e l'uso dell'informazione per capire i fenomeni sottostanti.
Queste stesse competenze sono tradizionalmente impiegate all'interno del Cineca per lo sviluppo di servizi a valore aggiunto, volti cioè ad aumentare il valore dell'informazione rendendola più fruibile: migliorandone l'accesso, l'organizzazione e la possibilità d'interpretazione (tramite sviluppo di tecniche di esplorazione/navigazione ad hoc, di strumenti di analisi e di rappresentazioni grafiche e sintetiche dell'informazione, specifiche per progetto). Alcuni esempi di servizi a valore aggiunto riguardano: Servizi di Monitoraggio, Servizi di Supporto alla Decisione, Data Warehouse e sviluppo di Sistemi Informativi.
Il servizio di Data Mining si inserisce in questo contesto ed usufruisce di:
Potenza di calcolo
- Sistema Cray XD 1
- Sistema IBM SP4 parallelo a 48 nodi
- Sistema IBM 1350 (Cluster Linux a 256 nodi)
- Compaq Alpha Server ES45 a 32 nodi
- Sistema Silicon Graphics (Altix3000)
Networking
- Polo primario rete GARR
- Internet via satellite
Accesso alle banche dati
- Accesso alle banche dati internazionali (circa 1000)
- Centro Nazionale EINS (European Information Network Service) per l'Italia
- Hosting di banche dati di interesse nazionale (circa 50) e di alcune banche dati EINS
- Servizio di Information Retrieval
Software
- Database Oracle
- Software statistico (SPSS, SAS, STATA)
- Software grafico
- Software di Data Mining (prodotto da IBM, Silicon Graphics e altri)
Tecnologie intranet/extranet
- Sviluppo di servizi via rete
- Sicurezza e controllo degli accessi
Competenze
- Informatiche
- Informative (sia dal punto di vista della gestione dell'informazione, che dell'analisi e della capacità interpretativa)
- In vari ambiti scientifici (chimica, farmaceutica, economia, sociologia, ecc.)
- Know-how specifico di Data Mining
