Autore: Serie B consulting group
Lo scopo di ogni approfondimento dovrebbe essere quello di chiarire attraverso la presentazione di nuove informazioni un argomento trattato in precedenza e che rappresenti motivo di interesse per il corso e il percorso di studi. Con il proposito di mantenermi fedele a questa premessa cercherò di trattare il tema del Web semantico da studente di scienze della comunicazione ( perché lo sono e nonostante le critiche ne sono fiero ), evidenziando le caratteristiche concettuali e tralasciando, nei limiti del possibile, gli elementi più tecnici, per i quali rimando alle fonti citate.
Il termine Web semantico, questo per fare un po’ di chiarezza sulle origini, appare sulla scena internazionale nel 2001 alla decima edizione del International World Wide Conference di Hong Kong. Nello stesso periodo esce un articolo di Tim Berners-Lee, che per la sua diffusione può essere considerato il manifesto programmatico di questo concetto di Web. Di concetto e quindi di teoria infatti si tratta o per lo meno lo è ancora in larga parte.
Al di là del significato letterale del termine, quando si parla di Web semantico, ci si riferisce ad una visione, meglio, una auspicabile evoluzione del Web contemporaneo, che, nelle intenzioni del W3C, sia in grado di rendere più agevole ed efficace la ricerca, la condivisione e la combinazioni delle informazioni. L’idea di fondo è quella di traslare il concetto di Web dal machine-readable al machine-understandable, in parole molto più semplici rendere la rete “capace” di capire le nostre richieste. Ovviamente non in senso proprio: il Web semantico non implica nessuna “magica intelligenza artificiale in grado di capire le confabulazioni umane” (www.W3C.com), piuttosto propone la realizzazione di documenti che possano essere compresi e riconosciuti dalle macchine e dai loro applicativi. Dei documenti, dunque, costituiti da informazioni organizzate in modo tale che, gli agenti software siano in grado di distinguerle.
Attualmente se inserisco in un motore di ricerca la parola pesca ( come suggeriva efficacemente una collega a lezione ) ottengo una varietà di risultati estremamente vaghi ed eterogenei, che spaziano dalle canne da pesca e gli ami, a le divagazioni ortofrutticole.
“La morale che ne vorremmo trarre è che Internet è un insieme di testi collegati tra loro ma questi collegamenti sono deboli, nel senso che sono troppo generici e vaghi” (www.webdesign.html.it) almeno in termini semantici, ovvero legati alla capacità di descrivere un collegamento. Questo perché il linguaggio HTML, il linguaggio con cui comunemente vengono formattati e visualizzati i testi in rete, esprime su uno stesso livello i dati, i loro collegamenti e la formattazione, rendendo irreperibile la relazione semantica tra i dati stessi. Un testo su una penna a sfera scritto in HTML e che probabilmente conterrà al suo interno i termini “tappo” e “inchiostro” non è in grado di comunicare al motore di ricerca la relazione tra i due termini così che probabilmente troverete risultati anche a proposito delle ricariche per le stampanti.
Come è possibile allora aggirare questa rigidità della rete? Come è possibile scrivere un codice in grado di effettuare operazioni semantiche?
Attraverso un sistema di marcatura dei documenti, un linguaggio gestibile da tutte le applicazioni e l’introduzione di vocabolari specifici.
Il Web semantico funziona proprio così, si basa su delle informazioni strutturate e su regole di deduzione per gestirle. Ovvero dovrebbe suddividere le informazioni in tre livelli: al più basso troviamo i dati semplici, al secondo dei metadati che strutturano i dati in concetti, al terzo uno schema ( chiamato ontologia ) che esprime le relazioni tra i concetti.
Come avviene o come dovrebbe avvenire tutto questo in termini pratici?
Mio malgrado dobbiamo addentrarci in argomenti un pochino più tecnici. Il primo livello appena citato è oggi gestibile attraverso l’XML. Questo altro non è, che un linguaggio di marcatura in grado collocare i dati “puri” su un livello diverso rispetto alla loro struttura, ovvero, il contenuto è indipendente dalla sua organizzazione. Questo rende possibile l’ adattamento di un contenuto a device diversi.
Il secondo livello sarà affidato al linguaggio RDF ( Resources description Frameworks ), un linguaggio di descrizione dei metadati pensato per affiancare XML. RDF permette di creare asserzioni relativamente ai contenuti di un sito. In particolare consente di esprimere le relazioni fra i dati attraverso la costruzione di “triple” composte da soggetto, predicato e complemento oggetto. In pratica, l’esempio è tratto dal sito del W3C, definiamo la risorsa ( ad es. un pagina di un sito ) soggetto della nostra asserzione, stabiliamo la proprietà da attribuire alla risorsa in questione ( es. il fatto di essere stata creata da qualcuno ), stabiliamo l’ oggetto dell’asserzione ( es. il nome del creatore ).
Stabilite le relazioni, ci rimane ancora da stabilire il loro significato: ho individuato la relazione tra un luigi e la pagina x che ha creato ma non so ancora il significato di “luigi” (ovvero che è una persona creatrice della pagina piuttosto che un link) e x (che è la pagina di un sito). Per risolvere questo problema ho bisogno di un ulteriore livello, quello delle ontologie. Queste sono una sorta di vocabolario dove serie di frasi sono collegate a concetti. Tutto ciò dovrebbe permettere a un motore di ricerca, dato un elemento, di sapere a quale risorsa si riferisce, la sua relazione con altri elementi e una breve descrizione del suo significato.
La difficoltà tecnica principale è rappresentata dalla scarsa diffusione di questi schemi e dalla necessità di rimappare la maggior parte del Web su di essi ( cosa pressoché impossibile ).
Ne esiste poi una di tipo “concettuale”. Il sistema per essere davvero universale dovrebbe rispondere a schemi referenziali diversi ( ogni ontologia avrebbe validità solo in relazione al proprio dominio di informazioni ). Questo se da una parte consentirebbe la possibilità di non limitare il numero di comprensioni e di definizioni di uno stesso oggetto, renderebbe la ricerca nel Web (semantico) comunque caratterizzata da un inevitabile elemento di vaghezza ed imprecisione.
Tuttavia, se pensare ad un tipo di Web regolato su una struttura semantica appare di difficile realizzazione, la sua applicazione al servizio di comunità di utenti ristrette e ad un nucleo di informazioni ben definite può risultare interessante. Ad esempio l’uso di strutture semantiche, in grado di organizzare i dati in classi e relazioni, relativamente hai contesti di Knowledge Management, che necessitano di un processo di recupero dell’informazione o di parte di essa in contesti e momenti diversi, può risultare molto utile. Molto spesso infatti una stessa unità informativa ha un ruolo cruciale in più processi aziendali. Un sistema capace di organizzare questi oggetti in categorie proprio in base al loro ruolo, sarebbe indispensabile.
Ma questo sarebbe un altro approfondimento…
Spero di esservi stato utile, ciao a tutti.
FONTI
WWW.W3C.COMIl sito ufficiale del World wide web council di Tim Bernatds Lee. La fonte più attendibile del web sull’argomento.
WWW.WEBSEMANTICO.ORGNasce con la missione di diventare la risorsa italiana del web semantico. Potrete trovare molti link al sito del W3C e valide traduzioni dei principali articoli in materia.
WWW.WEBCONTENTMANAGEMENT.ITPotrete trovare su questo sito alcuni articoli ed alcune tesi, meno tecniche e decisamente più discorsive di quelle del W3C, che potrebbero aiutarvi a comprendere l’argomento.
WWW.WEBDESIGN.HTML.ITCome sopra. IN particolare sono presenti alcuni articoli sull’applicazione del Web semantico al knowledge management.
HTTP://BFP.SP.UNIPI.IT/DIDA/TELEMA/WS.HTMLA questo link potrete trovare un breve elenco di definizioni e link sul web semantico.
WWW.XML.COMPer una panoramica sul XML.
Remember Me