vai al contenuto
 

Manuale per l'interazione con gli utenti del Web culturale
Prima edizione (Aprile 2009)
a cura di Pierluigi Feliciati e Maria Teresa Natale
MINERVA EC Working Group “Quality, Accessibility and Usability”


4.5      Verso l’integrazione semantica

Il Web è qualcosa di più di un insieme di documenti, è un insieme di “luoghi” in un paesaggio virtuale. I ‘luoghi’ nel Web sono punti di interazione tra individui e individui, tra individui e organizzazioni o tra organizzazioni e organizzazioni.

L’interazione avviene mediante accesso a servizi e scambio di informazioni e documenti.

Uno dei problemi fondamentali del Web è reperire i siti più adeguati e valorizzare le informazioni e i servizi disponibili.

I motori di ricerca (generici, OPAC o moduli predefiniti per la ricerca su cataloghi di beni culturali disponibili sul Web) sono essenziali per il “Web surfing”, ma si rivelano ben presto inadeguati. Tradizionalmente, infatti, il meccanismo utilizzato per la ricerca si basa sulla presenza, all’interno dei documenti, di parole o di frasi specificate dall’utente, e di conseguenza talvolta si ottengono liste troppo lunghe di risultati, molti dei quali non interessanti (effetto “rumore”), altre volte, semplicemente perché è stato utilizzato un vocabolario non adeguato, si possono perdere informazioni pertinenti alla domanda (effetto “silenzio”).

Per esempio, in una ricerca di informazioni sui marsupiali, il motore di ricerca testuale troverebbe tutte le pagine in cui compare la parola “marsupiale”, esattamente come scritta nella domanda formulata dall’utente, con i ben noti accorgimenti dei sistemi di ricerca testuale (troncamento, mascheramento di caratteri). L’utente, però, molto probabilmente preferirebbe che il motore di ricerca adottasse non un approccio meramente sintattico (identificazione delle parole) ma uno più semantico (identificazione dei concetti). Nel caso in esempio, l’utente preferirebbe che il motore di ricerca restituisca pure pagine in cui appare una foto del lupo di Tasmania, anche se in esse non è contenuta esplicitamente la parola “marsupiale”.

Vanno anche considerate le sottigliezze e le ambiguità del linguaggio (vedi anche 2.7). Per esempio, la parola “rete” assume un significato profondamente diverso per un progettista web o per un pescatore, un violinista fa parte di un’orchestra, e le sue dita sono una sua parte, ma possiamo affermare che queste dita facciano parte dell’orchestra? Se diciamo “il cucchiaino è nella tazza” intendiamo dire che il cucchiaino è situato nella parte concava della tazza, oppure che fa parte del materiale di cui è fatta la tazza? Un lettore umano è sempre in grado di disambiguare le frasi perché ragiona per deduzione, ma possiamo dire lo stesso per un computer?

Il problema deriva dal fatto che il World Wide Web è stato inizialmente progettato per essere utilizzato da esseri umani e, anche se qualunque suo contenuto può essere letto da una macchina (vedi 2.4.2.1), questo non significa che tale contenuto sia compreso da questa. La quantità di informazione disponibile sul Web è enorme e in continua crescita e non è possibile gestirla in maniera unicamente manuale.

Una soluzione possibile potrebbe essere quella di creare metadati per descrivere i dati contenuti nel Web. È opportuno ricordare che sul Web la distinzione tra dati e metadati non è assoluta; talvolta la risorsa può essere interpretata contemporaneamente in entrambi i modi, e i metadati sono essi stessi dei dati, che possono essere descritti da altri metadati, e così via. Quasi sempre, per evitare ambiguità, dati e metadati sono basati su una sintassi specifica (struttura logica). Una soluzione migliore potrebbe essere quella di insegnare alle macchine a disambiguare tutte le affermazioni esistenti sul Web, per esempio concependo e condividendo “documenti” che contengono ed esprimono tutti i concetti che costituiscono la base della nostra conoscenza, le ontologie.

Ontologia è un termine derivato dalla filosofia, dove viene inteso come una spiegazione sistematica dell’essere, e indica la scienza della descrizione dei tipi di entità del mondo e di come queste sono in relazione tra di loro. Le ontologie sembrano essere il mezzo più efficiente per rappresentare la conoscenza con una descrizione non ambigua dei concetti in uno specifico dominio, una descrizione delle relazioni tra i concetti e le regole necessarie per ottenere ulteriore conoscenza. Spesso le ontologie sono ristrette a domini specifici, per cui un’entità assume uno tra i possibili significati che potrebbe avere.

Esistono molte definizioni di ontologia, ma questo non deve far ritenere che possa sorgere confusione sul significato che la comunità scientifica che opera nel settore attribuisce a questo termine. Le varie definizioni enfatizzano di volta in volta alcuni aspetti, ma in realtà forniscono una serie di punti di vista complementari. Va piuttosto posto l’accento su come le ontologie mirino a catturare la conoscenza consensuale, e possano essere condivise e riutilizzate tra applicazioni e gruppi di persone diversi. Le ontologie vengono costruite in genere mediante un processo cooperativo e distribuito, e utilizzano varie tecniche di modellazione della conoscenza e diversi tipi di linguaggi. Possono perciò essere molto informali, semi-informali, semi-formali o rigorosamente formali a seconda che siano espresse in linguaggio naturale, in linguaggio naturale ristretto, in un linguaggio artificiale e definito formalmente, o fornendo una descrizione meticolosa dei termini, utilizzando una semantica formale, teoremi e dimostrazioni di proprietà. Nella classificazione delle ontologie basata sulla ricchezza della loro struttura interna, i vocabolari controllati e i thesauri si collocano nella parte bassa delle ontologie informali, mentre le ontologie in cui vengono espressi dei vincoli sui possibili valori si collocano nella parte alta delle ontologie formali. È stato osservato come le ontologie semi-formali si siano dimostrate in pratica molto utili per raggiungere diversi obiettivi importanti, in particolare l’information integration. Rispetto alle ontologie rigorosamente formali, le ontologie semi-formali sono più diffuse e spesso più utili, perché possono essere realizzate a una scala adeguata per le applicazioni reali e richiedono uno sforzo di sviluppo certamente minore. La loro diffusione è legata alla necessità di dover rappresentare informazione parziale (quindi incompleta) e talvolta non completamente coerente, in particolare per quanto concerne le asserzioni.

La soluzione tecnologica per codificare, scambiare e riutilizzare metadati strutturati, esprimendo dati e rappresentando regole sui dati, esportando tutta questa conoscenza e rendendola condivisa e utlizzabile da qualunque applicazione è denominata “Semantic Web”.

4.5.1     Il Semantic Web

Tim Berners-Lee, James Hendler e Ora Lassila hanno definito il Semantic Web «Una nuova forma di contenuti web comprensibili ai computer» (The Semantic Web, «Scientific American», maggio 2001).

Ma cosa significa precisamente? Il suo obiettivo è consentire il ritrovamento di informazioni e servizi usando concetti piuttosto che parole chiave, consentendo l’automazione di servizi, assumendo che ogni risorsa sia identificata da uno Uniform Resource Identifier (URI).

Per descrivere i dati presenti sul Web in maniera comprensibile alle macchine (è questo il significato attribuito dai ricercatori alla parola “semantico”) occorre definire dei modelli per rappresentare la conoscenza. Il semantic Web è costituito da un insieme di principi di progettazione, da gruppi di lavoro e da un ampio numero di tecnologie abilitanti, per la maggior parte definite dalla Semantic Web Activity del W3C.

Gli ostacoli più rilevanti nella realizzazione del Semantic Web sono la definizione e la disseminazione universale di formati standard per assicurare l’interoperabilità tra le applicazioni e l’implementazione di capacità di ragionamento deduttivo in forma totalmente automatica, grazie all’esportazione delle regole da una qualunque base di conoscenza.

Ma a che punto siamo? Alcuni elementi del Semantic Web devono ancora essere implementati, e il Semantic Web immaginato da Tim Berners-Lee molto probabilmente non sarà un fatto compiuto ancora per alcuni anni. Tuttavia, sono già numerosi i siti web, le intranet e le extranet che possono fornire servizi informativi. Le tecnologie basate sula logica descrittiva sono già in grado di rappresentare la conoscenza in forma testuale e fornire servizi di ragionamento automatico. Ne consegue che è già possibile muovere i primi passi verso il Semantic Web, creando applicazioni semplici, basate sulla logica descrittiva, che forniscano servizi per i nostri siti web.

Il Semantic Web è un ambiente dichiarativo che usa standard e strumenti basati su XML Namespace e XML Schema2. Questi standard W3C forniscono una sintassi di base per descrivere la struttura dei documenti, ma non associano nessuna semantica ai contenuti.

La tecnologia W3C per codificare, scambiare e riutilizzare metadati strutturati sul Web è il Resource Description Framework (RDF). RDF è un linguaggio universale che consente agli utenti di usare il loro vocabolario per descrivere le risorse e per questo motivo non formula nessuna assunzione su qualunque dominio applicativo specifico, né ne definisce la semantica. Per esprimere vincoli e restrizioni sulle associazioni, in modo da evitare di codificare asserzioni (statement) sintatticamente corrette, ma prive di senso, è necessario un meccanismo per rappresentare classi di oggetti. Per questo motivo è stato definito l’RDF Vocabulary Description Language o RDF Schema (RDFS), che consente di esprimere fatti e condizioni non solo sui singoli oggetti, ma anche sulle classi che definiscono i tipi di oggetto (una classe può essere vista come un insieme di elementi, che vengono indicati come istanze della classe).

Per poter effettuare dei ragionamenti, per definire le classi e per varie altre esigenze, però, RDFS non è sufficiente e occorre un modo per rappresentare la conoscenza e le regole che permettono di dedurre ulteriore conoscenza. Poiché il Web è intrinsecamente distribuito, occorre un linguaggio che non solo permetta di esprimere dati e regole sui dati, ma che consenta anche di esportare questa conoscenza (ontologia) per renderla disponibile a qualunque applicazione. Il W3C ha definito, per questa esigenza, il Web Ontology Language (OWL).

Tutti questi componenti fanno parte della cosiddetta “Pila del Semantic Web” (Semantic Web stack): al di sopra di XML (utile per dare una struttura alle risorse) e RDF (per esprimere i significati, o meglio per definire che certi elementi hanno certe proprietà), troviamo il livello ontologico, cioè l’area in cui definire formalmente le relazioni tra i termini. Il livello ancora superiore è il livello logico, in cui le asserzioni presenti sul Web possono essere usate per derivare nuova conoscenza, senza richiedere la presenza di un reasoning system unico e universale, ma facendo ricorso a una logica unificante per rappresentare tutte le dimostrazioni affidabili (trusted).

Grafico: Semantic web stack
Semantic web stack

W3C Semantic Web Activity
http://www.w3.org/2001/sw/

4.5.2      Resource Description Framework Data Model

Resource Description Framework (RDF) è lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati e consente l’elaborazione automatica delle risorse reperibili sul Web e di conseguenza l’interoperabilità tra applicazioni che si scambiano sul Web informazioni machine-understandable.

Il data model RDF, che consente di rappresentare asserzioni RDF in modo sintatticamente neutro, è molto semplice ed è basato su tre tipi di oggetti: risorse (resources), proprietà (properties) e asserzioni (statements). I primi due sono identificati univocamente da un URI.

Risorse: Qualunque cosa descritta da una espressione RDF viene detta risorsa (resource). Una risorsa può essere una pagina web, o una sua parte, o un elemento XML all’interno del documento sorgente. Una risorsa può anche essere un’intera collezione di pagine web, o anche un oggetto non direttamente accessibile via Web (per es. un libro, un dipinto, una persona, ecc.).

Proprietà: Una proprietà (property) è un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata per descrivere una risorsa. Ogni proprietà ha un significato specifico, definisce i valori ammissibili, i tipi di risorse che può descrivere, e le sue relazioni con altre proprietà. Le proprietà associate alle risorse sono identificate da un nome e assumono dei valori.

Asserzioni: Una risorsa, con una proprietà distinta da un nome e un valore della proprietà per la specifica risorsa, costituisce un RDF statement (asserzione). Uno statement è quindi una tripla composta da un soggetto (risorsa), un predicato (proprietà) e un oggetto (valore), normalmente denominata “tripla s-p-o”. L’oggetto di uno statement (cioè il property value) può essere un’espressione (sequenza di caratteri o qualche altro tipo primitivo definito da XML) oppure un’altra risorsa.

Un insieme di proprietà che fanno riferimento alla stessa risorsa viene detto descrizione (description).

Il fatto che le risorse e le proprietà siano individuate univocamente da un URI costituisce il punto di forza del modello, perché postula un ambiente totalmente decentralizzato, dove in un qualunque punto del Web si può dire qualunque cosa su una risorsa localizzata in qualunque punto.

Graficamente, le relazioni tra Resource, Property e Value vengono rappresentate mediante grafi orientati etichettati, in cui le risorse vengono identificate come nodi (graficamente delle ellissi), le proprietà come archi orientati etichettati, e i valori corrispondenti a sequenze di caratteri come rettangoli. In realtà la rappresentazione sotto forma di grafo è la più semplice e intuitiva, mentre le altre rappresentazioni differiscono solo per la sintassi adottata (RDF, N3, Turtle).

Il data model RDF
Il data model RDF

Per esempio, la proposizione che asserisce che una risorsa web intitolata “William Shakespeare” contenente informazioni sullo scrittore inglese William Shakespeare è pubblicata da Wikipedia può essere espressa graficamente come:

e serializzata in XML/RDF come:

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1">
<rdf:Description rdf:about="http://en.wikipedia.org/wiki/William_Shakespeare">
<dc:publisher>Wikipedia</dc:publisher>
<dc:title>William_Shakespeare</dc:title>
</rdf:Description>
</rdf:RDF>

Un’iniziativa interessante è stata la codifica (encoding) di DCMES (vedi 4.3) in XML usando RDF e pubblicando una DTD e un W3C XML Schema.

L’obiettivo principale di questo lavoro è stato «fornire una codifica semplice, con alcune restrizioni, in cui non siano ammessi elementi extra, qualificatori, parti opzionali o variabili».

Un effetto delle restrizioni è che questa codifica non crea documenti che possono essere inseriti all’interno di pagine HTML. Tuttavia, sono state create delle codifiche per DC qualificati (qualified DC), come per esempio Expressing Qualified Dublin Core in RDF / XML.

Resource Description Framework (RDF):
Concepts and Abstract Syntax, W3C Recommendation, 2004

http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/

Expressing Simple Dublin Core in RDF/XML
http://dublincore.org/documents/dcmes-xml/

Qualified DC in RDF/XML
http://dublincore.org/documents/dcq-rdf-xml/

4.5.3      RDF Vocabulary Description Language, o RDF Schema (RDFS)

RDF Schema è un vocabolario per descrivere le proprietà e le classi di risorse RDF, con una semantica per esprimere le relazioni gerarchiche delle proprietà e delle classi, e fornisce gli elementi di base per descrivere le ontologie (vocabolari RDF) necessarie per strutturare le risorse RDF.

Le proprietà RDF possono essere viste come attributi delle risorse, e in questo senso corrispondono alle tradizionali coppie attributo-valore. Le proprietà RDF possono rappresentare anche le relazioni tra risorse. Tuttavia, RDF non fornisce alcun meccanismo per descrivere queste proprietà né per descrivere le relazioni tra queste proprietà e altre risorse.

Questo è invece il ruolo di RDF Vocabulary Description Language o RDF Schema. RDF Schema definisce le classi e le proprietà che possono essere usate per descrivere classi, proprietà ed altre risorse.

Il vocabolario utilizzato da RDF per descrivere classi e proprietà è simile a quello adottato da linguaggi di programmazione object oriented come Java.

In RDF possiamo specificare la relazione tra istanze e classi e il meccanismo delle classi può essere utilizzato per imporre restrizioni sulle proposizioni che possono essere enunciate in un documento RDF che usi quello schema. Per rendersi conto della funzione di RDFS, basta riflettere sul fatto che in RDF i vincoli sono puramente sintattici, e quindi è possibile, legittimamente, formulare proposizioni (triple s-p-o) che hanno senso come:

Leonardo autoreDi Gioconda
Cimabue maestroDi Giotto

e anche altre proposizioni quali:

Michelangelo autoreDi Leonardo
Cimabue maestroDi Gioconda

che sono invece prive di senso, perché un artista non può essere autoreDi un altro artista, e un’opera non può essere autoreDi un’altra opera. Invece, un artista può essere maestroDi un altro artista, e un’opera può essere in relazione con un’altra opera perché ne è una versione diversa o una copia. In maniera più formale, possiamo dire che è necessario poter restringere dominio e codominio (domain e range) delle proprietà.

Una volta definite le classi, può risultare utile definire delle relazioni tra di esse. Per esempio, potremmo aver definito le classi:

  • Artista
  • Persona

e aver asserito che: “Michelangelo” è un artista (cioè è un’istanza della classe Artista).

Per un essere umano è evidente a tutti che “Michelangelo” è una persona, ma, se vogliamo che le macchine siano in grado di comprendere questi fatti, e operare dei ragionamenti, dobbiamo essere in grado di asserire in modo formale la conoscenza che “ogni artista è una persona”.

Questo genere di relazioni tra classi è conosciuto come “gerarchia di classi”, che non è necessariamente una gerarchia ad albero semplice, nel senso che una classe può essere una sottoclasse di più classi.

Uno degli effetti più importanti di questa modellazione in termini di classi e sottoclassi è l’ereditarietà (inheritance), per cui gli elementi di una sottoclasse ereditano le proprietà della superclasse.

Per esempio, supponiamo di aver definito le classi Persona, Artista, OggettoArtistico, Dipinto, Statua, con le ovvie gerarchie di classe (Artista è sottoclasse di Persona, e OggettoArtistico è superclasse sia di Dipinto che di Statua). Se definiamo la proprietà autoreDi con dominio Persona e codominio OggettoArtistico, ne consegue che un Artista può essere autoreDi un Dipinto o una Statua, perché le sottoclassi ereditano le proprietà delle rispettive superclassi.

Si noti che è anche possibile definire relazioni gerarchiche tra proprietà: per esempio, scultoreDi è una sottoproprietà di autoreDi.

È compito dell’utente definire i vincoli sulle classi e sulle proprietà, e le eventuali gerarchie di sottoclasse.

RDF Vocabulary Description Language 1.0: RDF Schema
http://www.w3.org/TR/rdf-schema/
(see in particular the Introduction to the document)

4.5.4      Rappresentazione dei thesauri in RDF: SKOS

Simple Knowledge Organisation Systems o SKOS è una specifica del W3C che definisce uno standard per supportare l’uso dei sistemi per l’organizzazione della conoscenza (knowledge organisation systems - KOS) come thesauri, schemi di classificazione, soggettari e tassonomie nel contesto del Semantic Web. SKOS è basato su RDF e RDFS ed il suo obiettivo principale è agevolare la pubblicazione di vocabolari strutturati controllati per il Semantic Web.

SKOS, adottato spesso nel settore dei beni culturali, è una specifica tuttora in corso di definizione, e i principali documenti che lo descrivono – SKOS Core Guide, SKOS Core Vocabulary Specification e Quick Guide to Publishing a Thesaurus on the Semantic Web – sono ancora nello stato di W3C Working Draft. Il Semantic Web Deployment Working Group ha tra i suoi obiettivi l’avanzamento di SKOS nel processo di conseguimento del livello di W3C Recommendation.

SKOS Simple Knowledge Organization System Primer
http://www.w3.org/TR/skos-primer
 

4.5.5      The Web Ontology Language (OWL)

RDF e RDF Schema presentano dei limiti di espressività, in quanto RDF consente unicamente di specificare predicati binari e RDF Schema consente unicamente di definire gerarchie di classi e proprietà e di imporre vincoli per dominio e codominio. Applicazioni sofisticate richiedono di poter “ragionare” sui dati. Il Semantic Web deve quindi essere supportato da ontologie e disporre di un linguaggio che consenta di definire la terminologia usata, le caratteristiche logiche e i vincoli delle proprietà, l’equivalenza dei termini, le cardinalità delle associazioni, ecc. Un’ulteriore complessità deriva dal fatto che il Web è intrinsecamente distribuito, e di conseguenza applicazioni diverse possono usare ontologie diverse o le stesse ontologie, ma espresse in lingue diverse. Il W3C, sfruttando anche i risultati di altri progetti, quali DAML e OIL, ha definito un linguaggio, denominato OWL, che permette di esportare le ontologie in modo interoperabile.

Un buon ontology language dovrebbe avere un certo numero di caratteristiche sofisticate, ma quanto più è espressivo il linguaggio, tanto meno efficiente è il ragionamento, e, in particolar modo nel definire un linguaggio da utilizzare sul Web, occorre trovare un compromesso tra espressività e computabilità.

Mentre in RDFS, che pure può essere considerato un ontology language semplice, è possibile unicamente specializzare le classi esistenti in sottoclassi, in OWL è possibile costruire classi a partire da quelle esistenti, mediante enumerazione, intersezione, complemento, restrizioni delle proprietà.

Il W3C ha definito tre sottolinguaggi di OWL, di crescente potenza espressiva, progettati per specifiche comunità di utenti e implementatori: OWL Lite, OWL DL e OWL Full. Ognuno di questi linguaggi è un’estensione del precedente, in termini di ciò che può essere espresso e della validità delle conclusioni.

OWL Lite: indicato principalmente per utenti che hanno bisogno di rappresentare classificazioni gerarchiche e vincoli semplici. Consente una migrazione agevole per thesauri e altre tassonomie. Ha una complessità formale inferiore a OWL DL e non consente alcuni costrutti, come cardinalità arbitrarie o statement di disgiunzione.

OWL DL (OWL Description Logic): indicato per gli utenti che desiderano la massima potenza espressiva garantendo comunque che tutte le conclusioni siano computabili (computational completeness) e concluse in un tempo finito (decidability). OWL DL offre un ragionevole supporto per il ragionamento (reasoning), ma non è perfettamente compatibile con RDF. Per ottenere un documento OWL DL corretto da un documento RDF, è necessario ricorrere ad alcune restrizioni e ad alcune estensioni. Tuttavia, qualunque documento OWL DL corretto è un documento RDF corretto.

OWL Full: indicato per gli utenti che desiderano la massima potenza espressiva e la libertà sintattica di RDF, senza garanzie sui tempi di computazione. Qualunque documento RDF corretto è un documento OWL Full corretto, perché OWL Full è perfettamente compatibile con RDF, sia sotto l’aspetto sintattico che sotto quello semantico. Tuttavia, il linguaggio è indecidibile, non esistono strumenti che supportino il ragionamento in maniera efficiente o completa e difficilmente sarà supportato nella sua interezza da software che implementano il ragionamento.

Secondo alcuni, il Semantic Web e i sistemi basati sulla logica descrittiva non sembrano essere parte del nostro immediato futuro, a causa della riluttanza di molte comunità a realizzare sistemi completamente interoperabili, ma sono già disponibili sul mercato numerosi software (spesso gratuiti):

  • per l’utilizzo di ontologie RDF o OWL da parte di applicazioni software (es. Jena)
  • per la definizione e la gestione di ontologie RDF o OWL ontologies (es. Protégé, SWOOP, Altova Semantic Works)
  • per l’esecuzione automatica di ragionamenti deduttivi in OWL DL (es. Racer, Pellet)

OWL Web Ontology Language Overview
http://www.w3.org/TR/owl-features/

Jena
http://www.jena.sourceforge.net

Protegé
http://protege.stanford.edu

SWOOP
http://www.mindswap.org/2004/SWOOP/

Altova
http://www.altova.com/

Racer
http://www.racer-systems.com

Pellet
http://clarkparsia.com/pellet/

4.5.6     Semantica per il patrimonio culturale: CIDOC Conceptual Reference Model

Come applicare la logica descrittiva nel contesto del patrimonio culturale? Il patrimonio culturale è un dominio di conoscenza molto complesso, contraddistinto dalla presenza di una terminologia ambigua e trasversale e caratterizzato dall’esistenza di una grande ricchezza di legami associativi, sia tra i singoli documenti che verso documenti o concetti tipici di altre discipline (storia, religione, politica).

L’iniziativa forse più rilevante nel settore del patrimonio culturale è il CIDOC Conceptual Reference Model (CIDOC CRM), promosso dell’International Committee for Documentation di ICOM (International Council of Museums), giunto ora ad un punto stabile dopo un decennio di lavoro. Dal 2006 ha raggiunto il livello di standard internazionale (ISO 21127:2006) per lo scambio controllato di informazioni pertinenti al patrimonio culturale.

CIDOC CRM si pone l’obiettivo di promuovere la conoscenza condivisa delle informazioni sul patrimonio culturale fornendo un quadro di riferimento semantico comune ed estensibile, nel quale può essere rappresentata qualunque informazione relativa a questo contesto. Si propone quindi come linguaggio condiviso per gli esperti di dominio e gli implementatori, per formulare i requisiti per i sistemi informativi e fungere da guida per una buona prassi di modellazione concettuale.

CIDOC CRM è una core ontology che contiene le entità di base e le relazioni comuni tra vocabolari di metadati diversi e può essere utile per integrare le informazioni contenute in vocabolari eterogenei e uniformare l’elaborazione tra fonti informative eterogenee. L’obiettivo essenziale di una core ontology è infatti fornire un modello globale ed estensibile in cui possono essere messi in corrispondenza ed integrati i dati provenienti da fonti eterogenee. Questa forma canonica è in grado di fornire una singola base di conoscenza per strumenti e servizi cross-domain (resource discovery, browsing, data mining), riducendo la complessità combinatoria che deriverebbe dal tentativo di mettere in corrispondenza a due a due i singoli formati di metadati o le ontologie.

Esiste una distinzione sottile, ma importante, tra una core ontology e la definizione di core metadata (come Dublin Core). Entrambi sono finalizzati all’integrazione dell’informazione, ma differiscono per l’importanza attribuita alla comprensibilità da parte di un lettore umano. I metadati sono compilati e utilizzati principalmente da esseri umani, mentre una core ontology è un modello formale utilizzato da strumenti che provvedono all’integrazione di varie fonti di dati e svolgono varie altre funzioni. Di conseguenza, mentre i fattori umani, e principalmente la leggibilità, costituiscono un elemento cardine nella definizione dei core metadata, una core ontology può accettare un livello di complessità maggiore, privilegiando la completezza e la correttezza logica rispetto alla comprensibilità umana.

In this approach metadata can be used not only to describe and to link to resources, but also to indicate where and why you can go from the resource itself4.

In questo approccio si possono usare i metadati non solo per descrivere le risorse e raggiungerle con un link, ma anche per indicare a quali altre risorse è collegata e perché (in un approccio semantico i link sono “tipati”).

È auspicabile che le istituzioni culturali adottino CIDOC CRM per migliorare l’accessibilità alle informazioni museali e alla conoscenza.

Un interessante esempio di applicazione delle tecnologie semantiche nel settore del patrimonio culturale è il “Finnish Museums on the Semantic Web” (FMS) che si pone come principale obiettivo rendere semanticamente interoperabili i metadati delle collezioni che provengono da basi di dati eterogenee e offrire possibilità di browsing semantico e ricerca nella base di conoscenza combinata dei musei partecipanti.

The CIDOC Conceptual Reference Model
http://cidoc.ics.forth.gr/


2 Vedi in particolare le informazioni sulla W3C Semantic Web Activity, <http://www.w3.org/2001/sw/>.


cover of  handbook

 

About

Structure

Interoperability

Quality, accessibility, usability

Best Practices