| |
Path: Home » Publications » Manuale per l'interazione con gli utenti del Web culturale »Indice » Capitolo 4 » Capitolo 4.5
| |
Manuale per l'interazione con gli utenti del Web culturale
|
4.5 Verso l’integrazione semanticaIl Web è qualcosa di più di un insieme di documenti, è un insieme di “luoghi” in un paesaggio virtuale. I ‘luoghi’ nel Web sono punti di interazione tra individui e individui, tra individui e organizzazioni o tra organizzazioni e organizzazioni. L’interazione avviene mediante accesso a servizi e scambio di informazioni e documenti. Uno dei problemi fondamentali del Web è reperire i siti più adeguati e valorizzare le informazioni e i servizi disponibili. I motori di ricerca (generici, OPAC o moduli predefiniti per la ricerca su cataloghi di beni culturali disponibili sul Web) sono essenziali per il “Web surfing”, ma si rivelano ben presto inadeguati. Tradizionalmente, infatti, il meccanismo utilizzato per la ricerca si basa sulla presenza, all’interno dei documenti, di parole o di frasi specificate dall’utente, e di conseguenza talvolta si ottengono liste troppo lunghe di risultati, molti dei quali non interessanti (effetto “rumore”), altre volte, semplicemente perché è stato utilizzato un vocabolario non adeguato, si possono perdere informazioni pertinenti alla domanda (effetto “silenzio”). Per esempio, in una ricerca di informazioni sui marsupiali, il motore di ricerca testuale troverebbe tutte le pagine in cui compare la parola “marsupiale”, esattamente come scritta nella domanda formulata dall’utente, con i ben noti accorgimenti dei sistemi di ricerca testuale (troncamento, mascheramento di caratteri). L’utente, però, molto probabilmente preferirebbe che il motore di ricerca adottasse non un approccio meramente sintattico (identificazione delle parole) ma uno più semantico (identificazione dei concetti). Nel caso in esempio, l’utente preferirebbe che il motore di ricerca restituisca pure pagine in cui appare una foto del lupo di Tasmania, anche se in esse non è contenuta esplicitamente la parola “marsupiale”. Vanno anche considerate le sottigliezze e le ambiguità del linguaggio (vedi anche 2.7). Per esempio, la parola “rete” assume un significato profondamente diverso per un progettista web o per un pescatore, un violinista fa parte di un’orchestra, e le sue dita sono una sua parte, ma possiamo affermare che queste dita facciano parte dell’orchestra? Se diciamo “il cucchiaino è nella tazza” intendiamo dire che il cucchiaino è situato nella parte concava della tazza, oppure che fa parte del materiale di cui è fatta la tazza? Un lettore umano è sempre in grado di disambiguare le frasi perché ragiona per deduzione, ma possiamo dire lo stesso per un computer? Il problema deriva dal fatto che il World Wide Web è stato inizialmente progettato per essere utilizzato da esseri umani e, anche se qualunque suo contenuto può essere letto da una macchina (vedi 2.4.2.1), questo non significa che tale contenuto sia compreso da questa. La quantità di informazione disponibile sul Web è enorme e in continua crescita e non è possibile gestirla in maniera unicamente manuale. Una soluzione possibile potrebbe essere quella di creare metadati per descrivere i dati contenuti nel Web. È opportuno ricordare che sul Web la distinzione tra dati e metadati non è assoluta; talvolta la risorsa può essere interpretata contemporaneamente in entrambi i modi, e i metadati sono essi stessi dei dati, che possono essere descritti da altri metadati, e così via. Quasi sempre, per evitare ambiguità, dati e metadati sono basati su una sintassi specifica (struttura logica). Una soluzione migliore potrebbe essere quella di insegnare alle macchine a disambiguare tutte le affermazioni esistenti sul Web, per esempio concependo e condividendo “documenti” che contengono ed esprimono tutti i concetti che costituiscono la base della nostra conoscenza, le ontologie. Ontologia è un termine derivato dalla filosofia, dove viene inteso come una spiegazione sistematica dell’essere, e indica la scienza della descrizione dei tipi di entità del mondo e di come queste sono in relazione tra di loro. Le ontologie sembrano essere il mezzo più efficiente per rappresentare la conoscenza con una descrizione non ambigua dei concetti in uno specifico dominio, una descrizione delle relazioni tra i concetti e le regole necessarie per ottenere ulteriore conoscenza. Spesso le ontologie sono ristrette a domini specifici, per cui un’entità assume uno tra i possibili significati che potrebbe avere. Esistono molte definizioni di ontologia, ma questo non deve far ritenere che possa sorgere confusione sul significato che la comunità scientifica che opera nel settore attribuisce a questo termine. Le varie definizioni enfatizzano di volta in volta alcuni aspetti, ma in realtà forniscono una serie di punti di vista complementari. Va piuttosto posto l’accento su come le ontologie mirino a catturare la conoscenza consensuale, e possano essere condivise e riutilizzate tra applicazioni e gruppi di persone diversi. Le ontologie vengono costruite in genere mediante un processo cooperativo e distribuito, e utilizzano varie tecniche di modellazione della conoscenza e diversi tipi di linguaggi. Possono perciò essere molto informali, semi-informali, semi-formali o rigorosamente formali a seconda che siano espresse in linguaggio naturale, in linguaggio naturale ristretto, in un linguaggio artificiale e definito formalmente, o fornendo una descrizione meticolosa dei termini, utilizzando una semantica formale, teoremi e dimostrazioni di proprietà. Nella classificazione delle ontologie basata sulla ricchezza della loro struttura interna, i vocabolari controllati e i thesauri si collocano nella parte bassa delle ontologie informali, mentre le ontologie in cui vengono espressi dei vincoli sui possibili valori si collocano nella parte alta delle ontologie formali. È stato osservato come le ontologie semi-formali si siano dimostrate in pratica molto utili per raggiungere diversi obiettivi importanti, in particolare l’information integration. Rispetto alle ontologie rigorosamente formali, le ontologie semi-formali sono più diffuse e spesso più utili, perché possono essere realizzate a una scala adeguata per le applicazioni reali e richiedono uno sforzo di sviluppo certamente minore. La loro diffusione è legata alla necessità di dover rappresentare informazione parziale (quindi incompleta) e talvolta non completamente coerente, in particolare per quanto concerne le asserzioni. La soluzione tecnologica per codificare, scambiare e riutilizzare metadati strutturati, esprimendo dati e rappresentando regole sui dati, esportando tutta questa conoscenza e rendendola condivisa e utlizzabile da qualunque applicazione è denominata “Semantic Web”.
2 Vedi in particolare le informazioni sulla W3C Semantic Web Activity, <http://www.w3.org/2001/sw/>. |
Copyright Minerva Project 2008-09,
last revision 2008-09-17, edited by Minerva
Editorial Board. |