Tu sei qui

Il monitoraggio degli articoli scientifici

Esempio di servizio ontology-based per la gestione della conoscenza

Il Cineca si occupa di gestione della conoscenza tramite la costruzione semiautomatica di ontologie e tassonomie. Uno dei primi progetti che lo ha visto direttamente coinvolto è stato realizzato per un importante Ente di ricerca europeo; il progetto ha riguardato l'organizzazione della conoscenza di una base documentale composta dagli articoli scientifici d'interesse. Il servizio realizzato si occupa del monitoraggio dei temi trattati negli articoli.

Per questo progetto è stata utilizzata la combinazione di tecnologie e metodologie che guidano CINECA nella costruzione dell'ontologia e l'implementazione dei servizi che da essa derivano. La costruzione è avvenuta con un metodo bottom-up: la conoscenza viene estratta a partire dalla base documentale a disposizione dell'esperto di dominio.

Il primo passo è stato perciò la creazione della base documentale, composta in questo caso da articoli sia digitali che cartacei. Il contenuto è stato acquisito, controllato per rilevanza e omogeneità quindi trasformato nel formato adatto ad essere processato.

Il passo successivo ha visto l'estrazione della conoscenza attraverso strumenti che guidano l'esperto di dominio nel processo di organizzazione della conoscenza esplicitandone gli elementi rappresentativi; attraverso tecniche di NLP vengono estratti tutti i termini citati nella collezione di documenti che concorreranno a formare i concetti e le istanze dell'ontologia. In tale progetto è stata formalizzata una tassonomia sugli argomenti degli articoli e un'ontologia che organizza la conoscenza degli stessi secondo determinati elementi in essi contenuti. Le due rappresentazioni sono poi state organizzate in un'unica gerarchia che è stata formalizzata in un linguaggio per le ontologie. I macroconcetti identificati sono: luoghi, organizzazioni, topic, titoli dei paper, ricercatori e argomenti affrontati nei paper. Essi sono stati espansi al fine di creare una gerarchia e collegati tramite relazioni orizzontali in modo da rappresentare al meglio la conoscenza contenuta negli articoli scientifici.

Il servizio realizzato presenta diverse funzionalità integrate:

  • un motore di ricerca semantico che permette il recupero dei documenti rilevanti in base al concetto selezionato, componente fondamentale dei nostri servizi basati su ontologie; il motore è stato creato per interrogare ed esplorare la base di conoscenza
  • browsing della gerarchia della conoscenza, sempre disponibile e visualizzabile con espansione dei rami interni
  • navigazione tra gli elementi della base di conoscenza seguendo i percorsi di esplorazione che le relazioni mettono a disposizione lungo l'organizzazione formalizzata
  • analisi delle connessioni: navigazione delle relazioni non gerarchiche; a partire da una qualunque istanza dell'ontologia vengono esplorate le relazioni successive verso nuove istanze. Il numero massimo di passi è selezionabile dall'utente
  • monitoraggio tematico dei concetti della base documentale: per ogni concetto selezionato con il mouse una tabella presenta l'elenco ordinato per rilevanza di tutti gli altri concetti presenti nei documenti insieme ad esso; è quindi possibile navigare il corpus attraverso i suoi concetti avvalendosi di una misura oggettiva della loro attinenza.