Wednesday, October 19, 2005 

The Semantic Blog (or: the revenge of structure :-)

Blogging makes some portions of a traditional (read: old-fashioned) website like mine so obsolete. The "news" section is the first candidate, and the "links" section is just about second. Links age, nobody has enough time to keep them current; and I do mean current, not simply valid (which can be easily automated).
Blogging makes suggesting new links a snap, and thanks to the ephemeral nature of a blog (see my Blogging as Destructuring) nobody expects you to keep the links updated.
Still, something is seriously missing. In a traditional website, users could easily visit the "links" page a get a list of (hopefully relevant) websites. In a modern blog, users would have to sift through all my blurb looking for links. Just about the same for news: I make a few announcements here, like a new release of my UML book, but you have to look for them.
An easy step forward, well within reach, would be to decorate portions of the text with semantic information. We don't need to wait for all the semantic web hype to get true: we can just grab the low fruits right now. Since a well-mannered browser must ignore unknown HTML tags, we can easily add a new one, like <semantic> and use it to (invisibly) decorate text, like in <semantic type="announcement">some announcement</semantic> which would render just as "some announcement". Then, a customized search engine could easily look for posts belonging to specific categories, like links, announcements, etc. Obviously, a post may fall into more than one category.
Naturally, the "type" attribute would open for extension, that is, anybody could invent a new type, like "free time", "deep thought", etc. To avoid any maintenance of the search page (where I would expect to find a combo box for category selection), the search engine should keep track of available types (for that blog) and build the combo box appropriately. This is basically a user-defined ontology, a.k.a. a Folksonomy.
The only trouble is that building all this stuff by myself sounds like work :-). I must pass on this suggestion to the Google guys. After all, I'm using their blogging technology for free, and they may find this idea remotely interesting...
Comments:
In che termini questa idea si collega al progetto di Web Semantico di Tim Berners-Lee? Se capisco bene si vuole trovare uno strumento piu' snello dell'RDF. Tuttavia penso che si potrebbe comunque lasciare alle ontologie costruite in quel progetto la possibilita' di "tradurre" le ontologie definite dall'utente.
 
Il collegamento col semantic web e' molto forte, a partire ovviamente del nome. Diciamo che in realta' la mia e' una idea/provocazione nell'ottica di cio' che dico spesso: grab the low fruits. Si parla di web semantico dal 1998 (almeno io +/- ho iniziato a sentirne parlare in quelle date), ma in larga misura siamo ancora qui a parlarne. Peraltro io uso un blog creato da una terza parte (Google), quindi per appoggiarmi sui risultati del Semantic Web dovrei aspettare che Google adatti corrispondentemente la sua tecnologia.
Quello che vorrei io e' molto piu' semplice, anche perche' nel mio caso la decorazione semantica servirebbe solo a categorizzare ai fini di ricerca. Tra l'altro iniziando a decorare i posting, giusto in attesa di creare un engine di ricerca, ho visto che mi basta molto meno di quanto pensavo: in fondo voglio decorare a livello di intero posting, non di porzione. Grazie al tag invisibile, riesco a decorare senza chiedere nulla di particolare al blog di Google.
Per concludere tutto quanto penso servano 1 - 1.5 ore per definire esattamente cosa voglio che succeda a livello di ricerca e folksonomy, e probabilmente 3-4 ore di codifica PHP e test. Parecchi ordini di grandezza di differenza, e per quanto serve a me qui, 80% del beneficio...
 
Ti posso chiedere perchè non vuoi usare i tag (i link con rel="tag")? Voglio dire, è un sistema già largamente utilizzato che permetterebbe anche a chi non ti conosce di trovare i tuoi articoli con technorati e altri motori simili, mentre nel tuo ci vedo, a occhio, diversi svantaggi:

1. serve solo a chi ti conosce già
2. non funziona per chi ti legge tramite feed (*)
3. non permette l'aggregazione con articoli di altri autori sugli stessi argomenti.

Ora, ovviamente ognuno è libero di cercare un sistema migliore, ma per quanto ne so il semantic web dovrebbe servire soprattutto per il punto 3.

(*) già che ci siamo, potresti per cortesia pubblicare gli articoli interi nel feed? ho un piccolo problema di tempo, nel senso che ho quasi 200 feed nell'aggregatore, e quelli parziali mi costringono ad aprire il browser per ogni articolo, aspettare il caricamento, chiudere il browser, poi non includono i tag ecc.
 
I motivi sono diversi, anche se in fondo non c'e' nulla di eclatante; qualcosa di simile lo trovi discusso anche qui:
comments on rel-tag microformat.
In particolare, i punti 1 e 3 che citi semplicemente non sono il problema che mi interessa risolvere concretamente. Le persone che non mi conoscono mi trovano di solito attraverso un motore di ricerca come google, specificando non una categoria ma facendo ricerche mirate. Una ricerca per categoria come HCI e' troppo generale su internet per dare risultati utili. Viceversa, all'interno di un sito / blog ha molto senso, ed e' cosi' che vorrei usarla.
Peraltro il punto 3 richiederebbe (problema sollevato anche nel blog di cui sopra) una unformita' di significato tra i tag semantici dei vari autori. Troppa fatica :-), e bassa probabilita' di successo...
Sul full contents: sei sicuro di essere rappresentativo, ovvero che ottimizzando per la tua situazione, ottimizzerei per la maggior parte di chi legge tramite feed?
 
Sulla questione tag io la penso piuttosto come il primo commentatore del post che hai linkato. Comunque ho sicuramente posto male il problema: avrei piuttosto voluto puntualizzare che i link rel-tag non ti impediscono di realizzare il tuo motore di ricerca sul tuo sito per i tuoi post, ma possono essere utilizzati da sistemi pre-esistenti e quindi servire anche ad altre cose. Ovviamente c'è il rischio di essere aggregato "a sproposito" :) ma credo ci siano tanti "dipende" e, in sostanza, più da guadagnare che da perdere.

E lo stesso per il full content: chi preferisce leggere sul sito di origine (perchè gli piace com'è formattato il testo o cose del genere) non bada al feed, se riporta solo gli excerpt o i post completi.
Quindi si tratta solo di un di più per quei pazzi come me, o per quelli che scaricano i feed sul palmare/notebook per leggere nel treno o in metropolitana.
 
Post a Comment

<< Home