Path: Home » Publications » Linee guida tecniche » Indice » Il reperimento delle risorse digitali
vai al contenuto
 

WP4 - Gruppo di lavoro italiano "Interoperabilità e servizi"
Linee guida tecniche per i programmi di creazione di contenuti culturali digitali
Edizione italiana 2.0

IL RIPERIMENTO DELLE RISORSE DIGITALI

Le collezioni create da un progetto di digitalizzazione fanno parte di un più ampio insieme di risorse. Per agevolare la localizzazione delle risorse all’interno del corpus, i progetti devono pensare a esporre metadati per ciascuna collezione di risorse da essi sviluppata, in modo tale che essa possa essere utilizzata da altre applicazioni e altri servizi attraverso uno o più dei protocolli o interfacce descritti nei paragrafi seguenti.
L’esatta identificazione di quali metadati debbano essere offerti e del modo in cui esporli dipenderà dalla natura delle risorse create e dalle applicazioni e servizi con i quali tali metadati vanno condivisi.
I progetti dovrebbero esporre una o più registrazioni di metadati a livello della collezione, che cioè descrivano le loro collezioni come un unico insieme. I progetti possono esporre in aggiunta registrazioni di metadati descrittivi delle singole risorse digitali nel contesto delle loro collezioni.
Tanto le registrazioni di metadati di livello collezione che quelle di livello oggetto dovrebbero includere una dichiarazione sulle condizioni e i termini d’uso della risorsa.
Per facilitare i possibili scambi e l’interoperabilità fra i servizi, i progetti dovrebbero essere in grado di fornire descrizioni a livello di oggetto sotto forma di registrazioni di metadati Dublin Core semplici non qualificati e possono fornire descrizioni di livello oggetto secondo lo schema DC Culture (vedi § 6.2.1).
Quando gli oggetti sono risorse per l’apprendimento o risorse di interesse per le comunità della formazione e dell’insegnamento, i progetti dovrebbero anche tener conto della possibilità di fornire descrizioni secondo lo schema IEEE Learning Object Metadata.
I progetti dovrebbero inoltre essere al corrente di eventuali requisiti supplementari per i metadati, imposti dal loro contesto operativo (ad esempio, standard di metadati del governo nazionale).
I progetti dovrebbero mantenersi al corrente di ogni questione giuridica in grado di riguardare le loro registrazioni di metadati.


Standard

Dublin Core Metadata Element Set, Version 1.1
<http://dublincore.org/documents/dces/>

DC.Culture
<http://www.minervaeurope.org/DC.Culture.htm>

IEEE Learning Object Metadata
<http://ltsc.ieee.org/wg12/>

9.1  La raccolta automatica (harvesting) dei metadati

La raccolta o harvesting dei metadati rende disponibili nel Web i metadati così da consentire la ricerca contestuale tra più depositi (repository) di metadati. L’harvesting è reso possibile da un protocollo tecnico; lo standard più noto e diffuso è l’OAI-PMH (Open Archives Iniziative Protocol for Metadata Harvesting).
La Open Archives Iniziative (OAI) ha elaborato un quadro di riferimentoche, inizialmente (Santa Fe, ottobre 1999) progettato per promuovere la diffusione e l’interoperabilità degli archivi aperti di tipo e-prints, si è poi affermato come modello di riferimento per l’architettura della biblioteca digitale.

 I componenti del modello OAI sono:

  • i data provider che gestiscono i depositi (digital repository) che contengono gli oggetti digitali ai quali sono associati i metadati
  • i service provider che effettuano la cattura dei metadati esposti dai data provider e che forniscono agli utenti servizi a valore aggiunto, come l’aggregazione e l'indicizzazione dei metadati provenienti da repository diversi, la predisposizione di interfacce di ricerca e di navigazione di liste (virtual reference desk), l’integrazione con altri servizi di ricerca, accesso, collegamento e citazione
  • il Protocol for Metadata Harvesting (OAI-PMH), attualmente nella versione 2, che viene utilizzato dai service provider per interrogare i data provider attraverso richieste PMH le cui risposte sono documenti XML contenenti i metadati catturati, codificati in base allo schema Dublin Core non qualificato, definito in accordo con la Dublin Core Metadata Initiative.

Le istituzioni pubbliche che intendono valorizzare gli oggetti digitali realizzati per un uso pubblico devono tenere in considerazione l’estrema rilevanza del modello OAI. Per usare il protocollo PMH non è necessario avere un deposito di e-print e neppure si richiede di garantire l’accesso aperto all’oggetto digitale.
Il protocollo OAI-PMH è stato adottato per l’harvesting dei metadati e l’interoperabilità di depositi (repository) tanto dal progetto internazionale MICHAEL (Multilingual Inventory of Cultural Heritage in Europe) che dal progetto nazionale di Portale della cultura italiana (PICO).
I progetti dovrebbero dimostrarsi consapevoli del fatto che il protocollo per l’harvesting dei metadati della Open Archives Iniziative (OAI-PMH) costituisce uno strumento per mettere i loro metadati a disposizione dei fornitori di servizi.
I progetti possono voler rendere i propri metadati disponibili per l’harvesting costituendo depositi di metadati conformi allo standard OAI. I progetti che istituiscono tali depositi dovrebbero valutare l’opportunità di includervi una dichiarazione dei diritti detenuti sui propri metadati per garantirsi la titolarità dei diritti di proprietà su di essi.


standard

Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)
<http://www.openarchives.org/> - <http://www.openarchives.org/OAI/openarchivesprotocol.html>

Dublin Core Collection Description Application Profile
<http://dublincore.org/groups/collections/collection-application-profile/2006-08-24/>

Dublin Core Collection Description Application Profile Summary
<http://dublincore.org/groups/collections/collection-ap-summary/2006-08-24/>

esempi, raccomandazioni e linee guida

Guida ai repository digitali OAI-PMH nel mondo
<http://www.openarchives.eu>

MICHAEL, Multilingual Inventory of Cultural Heritage in Europe
<http://www.michael-culture.org> - <http://www.michael-culture.eu>

Documento di sintesi del progetto tecnico-scientifico per il Portale della cultura italiana
<http://www.otebac.it/siti/realizzare/PICO_2_1sintesi.pdf>

Linee guida per lo sviluppo di sistemi informatici interoperabili con CulturaItalia
<http://www.otebac.it/siti/realizzare/LineeguidaintegrazioneCulturaItalia.pdf>

9.2  La ricerca in architettura distribuita

I progetti possono aver bisogno di conoscere lo standard Z39.50, un protocollo di rete che consente la ricerca su database eterogenei, generalmente remoti, e il recupero dei dati tramite un’unica interfaccia utente. Z39.50 è prevalentemente impiegato per ricercare schede bibliografiche, ma esistono anche implementazioni non bibliografiche. I progetti che adottano il protocollo Z39.50 devono essere a conoscenza del Profilo di Bath (Bath Profile) in rapporto all’interoperabilità fra i diversi settori.
I progetti possono anche aver bisogno di conoscere il protocollo dei servizi web di ricerca e recupero (SRW/SRU: Search/Retrieve Web Service) che si basa sulla semantica di Z39.50 per offrire funzionalità simili impiegando tecnologie Web Service.


standard

Z39.50 Maintenance Agency
<http://www.loc.gov/z3950/agency/>

The Bath Profile. An International Z39.50 Specification for Library Applications and Resource Discovery
<http://www.collectionscanada.ca/bath/tp-bath2-e.htm>

SRW: Search/Retrieve Web Service
<http://www.loc.gov/standards/sru/srw/>

esempi, raccomandazioni e linee guida

Z 39.50 for All
<http://www.ariadne.ac.uk/issue21/z3950/>

9.3  Alerting

Può essere utile ai progetti conoscere la famiglia di specifiche per i web feed RSS (acronimo diversamente sciolto in Really Simple Syndication, Rich Site Summary, RDF Site Summary).
I web feed possono essere adottati per trasmettere automaticamente aggiornamenti e nuovi contenuti confezionati in un formato standard ad altri siti web o a utenti che abbiano richiesto al sito il servizio di alerting. RSS fornisce un meccanismo semplice basato su XML per la condivisione dei metadati descrittivi, generalmente sotto forma di una lista di elementi, ciascuno dei quali contenente una breve descrizione testuale con un collegamento (link) alla fonte dei dati.
Un’altra famiglia di standard per i web feed basati su XML è quella di Atom (Atom Syndication Foprmat, Atom Publishing Protocol). L’Atom Syndication Format è stato adottato dalla Internet Engineering Task Force.


standard

RSS Advisory Board
<http:www.rssboard.org/>

RDF Site Summary (RSS) 1.0
<http://web.resource.org/rss/1.0/spec>

RSS 2.0 Specifications
<http://www.rssboard.org/rss-specification>

ATOM
<http://www.atomenabled.org/>

Atom Syndication Format,
<http://www.atomenabled.org/developers/syndication/atom-format-spec.php>

esempi, raccomandazioni e linee guida

Syndicated content: it's more than just some file formats
<http://www.ariadne.ac.uk/issue35/miller/>

9.4  I web services

I progetti dovrebbero dimostrare di conoscere la famiglia di specifiche per i web services, in particolare SOAP (Simple Object Access Protocol) versione 1.2 e il Web Services Description Language (WSDL).
Per i servizi di rete non coperti dai protocolli specifici sopra menzionati, si dovrebbe prendere in considerazione l’uso di SOAP, anche se talora può essere opportuno usare lo stile di architettura REST (Representational State Transfer) attraverso richieste HTTP 1.1 GET o POST per reperire documenti XML.
Ai progetti può anche essere necessario essere al corrente delle specifiche Universal Description, Discovery & Integration (UDDI).


standard

SOAP Version 1.2 Part 1: Messaging Framework
<http://www.w3.org/TR/soap12-part1/>

Web Services Description Language (WSDL) 1.1
<http://www.w3.org/TR/wsdl>

Hypertext Transfer Protocol, overview
<http://www.w3.org/Protocols/>

UDDI Specifications
<http://www.oasis-open.org/committees/uddi-spec/doc/tcspecs.htm>

esempi, raccomandazioni e linee guida

SOAP Version 1.2 Part 0: Primer
<http://www.w3.org/TR/soap12-part0/>

XML Protocol Working Group
<http://www.w3.org/2000/xp/Group/>

9.5  RDF e ontologie web

I progetti possono far uso di ontologie per il Web.
Un’ontologia è una definizione esplicita, condivisa e socialmente accettata di una porzione della realtà (dominio di conoscenza) per mezzo di un modello concettuale. Questo modello può essere immerso in un software o sistema informativo, in un oggetto o in un processo. Ciò permette che il modello sia recepito e utilizzato da un’ampia gamma di utenti potenziali, siano essi persone, organizzazioni o agenti software. Mentre un thesaurus definisce e mette in relazione termini, un’ontologia ha l’obiettivo di definire ed esplicitare relazioni fra concetti. Un’ontologia può essere considerata come un thesaurus arricchito dove, oltre alla definizione di termini di un determinato dominio e delle loro relazioni, viene rappresentata una conoscenza più concettuale. Un’ontologia si limita alla descrizione dei concetti necessari per la modellazione di domini (diversamente da una base di conoscenza, che, in aggiunta, include la conoscenza necessaria per modellare ed elaborare un problema specifico)
Un’ontologia si compone di:

  • un insieme di concetti (entità, attributi, processi…) riguardanti un dato     dominio
  • le definizioni di tali concetti
  • le relazioni che interconnettono le entità o classi all’interno di un dato dominio.

La costruzione di un’ontologia implica una serie di passi, e più precisamente:

  • esaminare il vocabolario utilizzato per descrivere oggetti e processi caratteristici del dominio
  • sviluppare definizioni rigorose dei termini principali di tale vocabolario
  • caratterizzare le connessioni logiche esistenti fra tali termini.

Le ontologie possono rappresentare un importante strumento di mediazione semantica che contribuisce alla realizzazione del Web semantico, in cui non più solo documenti ma anche informazioni e dati ad essi relativi (metadati) possono essere scambiati, interpretati ed elaborati automaticamente.
I progetti possono prendere in considerazione l’adozione di ontologie, in particolare, in relazione allo sviluppo di portali, siti web che aggregano informazioni e offrono servizi basati sull’individuazione di contenuto interessante.
I progetti possonotrarre vantaggio dalle funzionalità di condivisione e riuso dei dati sul Web offerte dallo standard Resource Description Framework (RDF).
RDF è un linguaggio di ontologia rilasciato come raccomandazione dal World Wide Web Consortium  e usato per rappresentare l’informazione e scambiare la conoscenza in sul Web. In particolare, RDF è orientato alla rappresentazione di metadati che descrivono risorse web, quali ad esempio “titolo”, “autore” e “data di modifica” di una pagina web. La struttura di RDF è abbastanza semplice, essendo basata su tre elementi, “risorsa”, “attributo” e “valore”, e permette di definire la semantica dei tag XML.
Nel momento in cui si scrive, non è possibile specificare standard per interfacce di interrogazione su basi di dati RDF, ma indicazioni ulteriori potranno essere fornite in seguito.
Per creare un’ontologia si può usare il linguaggio OWL  (Web Ontology Language), anch’esso rilasciato e raccomandato dal W3C. OWL si serve di schemi RDF per arricchire il vocabolario che descrive proprietà e classi e per facilitare la creazione di definizioni di concetti base e delle loro relazioni, che possono essere trattate automaticamente.
I progetti possonoesplorare il potenziale per l’interoperabilità semantica offerto da ontologie già definite, come il CIDOC Conceptual Reference Model (CRM) o il modello per ontologie ABC sviluppato nell’ambito del progetto Harmony.
Il CRM propne un quadro semantico comune ed estensibile che può essere adattato a ogni tipo di informazione sul patrimonio culturale e che può offrire un modello per la mediazione fra diverse fonti d’informazione.
Il modello di metadati ABC è una ontologia top-level che mira a facilitare l’interoperabilità fra schemi di metadati nell’ambito delle biblioteche digitali.


standard

Resource Description Framework (RDF)
<http://www.w3.org/RDF/>

OWL Web Ontology Language Reference
<http://www.w3.org/TR/owl-ref> - <http://www.w3.org/2001/sw/WebOnt/>

CIDOC Conceptual Reference Model (CRM) = Standard ISO 21127:2006 Information and documentation -- A reference ontology for the interchange of cultural heritage information
<http://cidoc.ics.forth.gr/>

ABC Ontology and Model
<http://metadata.net/harmony/> - <http://metadata.net/harmony/Results.htm>

esempi, raccomandazioni e linee guida

RDF Primer
<http://www.w3.org/TR/rdf-primer/>

OWL Web Ontology Language Overview
<http://www.w3.org/TR/owl-features/>

OWL Web Ontology Language Guide
<http://www.w3.org/TR/owl-guide/>

C. Lagoze, J. Hunter, The ABC Ontology and Model,
«Journal of Digital Information», 2 (2), article n. 77, 6 November 2001
<http://jodi.ecs.soton.ac.uk/Articles/v02/i02/Lagoze/>

W3C Semantic Web
<http://www.w3.org/2001/sw/>

N. Shadbolt, W. Hall, T. Berners-Lee, The Semantic Web Revisited,
IEEE Intelligent Systems 21(3) p. 96-101, May/June 2006
<http://eprints.ecs.soton.ac.uk/12614/01/Semantic_Web_Revisted.pdf>


 

About

Structure

Interoperability

Quality, accessibility, usability

Best Practices