DBpedia Artworks | Œuvres d’art | Gemälde | Schilderijen | Έργα Ζωγραφικής

Le projet DBpedia Œuvres d’art consiste à rassembler les données œuvres d’art en provenance de plusieurs dbpedia et à offrir une interface de consultation correspondante.

DBpedia est le pendant web de données de Wikipédia. Il s’agit de données structurées selon des modèles précis. Ces données sont pour l’essentiel extraites de ce que l’on appelle des boîtes d’information ou Infobox parfois situées dans les articles de Wikipédia.

Exemple
Article Wikipédia de La Joconde : http://fr.wikipedia.org/wiki/La_Joconde
Page de la ressource de La Joconde dans dbpedia-fr : http://fr.dbpedia.org/page/La_Joconde

Cette logique de structuration est commune à toutes les versions de Wikipédia.
En revanche, comme il existe plusieurs versions de Wikipédia selon les langues, il existe plusieurs versions de dbpedia correspondantes.

Parmi les modèles de structuration on retrouve celui d’Œuvre d’art. Ainsi nommé pour la version francophone, il se décline en Artwork pour l’anglaise, Gemälde pour l’allemande (et on remarque un léger décalage puisque là il ne s’agit que de peintures), Schilderij pour la néerlandaise, Έργα Ζωγραφικής pour la grecque. Ce sont là les versions de dbpedia sur laquelle j’ai travaillé. D’autres versions ont été essayées (tchèque, espagnole, coréenne, japonaise…), sans succès pour le moment.

Si dbpedia se décline en plusieurs versions, il peut exister des liens (semblables aux liens inter-lanques des articles de Wikipédia) entre ces versions. Ainsi la page dbpedia citée plus haut nous indique que cette ressource correspond à la ressource http://dbpedia.org/resource/Mona_Lisa dans la dbpedia anglophone.
Il est alors possible de rassembler les url (adresses web) des ressources œuvres d’art de plusieurs dbpedia et de les dédoublonner (on ne garde qu’une fois La Joconde).

À partir de la liste de références obtenues, une interface de consultation a été créée. Pour chaque url de ressource œuvre d’art on envoie une requête pour obtenir des informations liées. Ici nous recherchons simplement une vignette d’aperçu, le titre, l’auteur, la date et le lieu de conservation, quand ces données sont présentes.

La dimension multilingue de Wikipédia se révèle en outre particulièrement riche et utile. En retournant sur la page http://dbpedia.org/page/Mona_Lisa on trouve une propriété, rdfs:label, correspondant au libellé de la ressource dans plusieurs langues. En s’appuyant sur ces libellés, l’interface peut être déclinée en plusieurs langues ; si le libellé manque on propose celui de la langue de la dbpedia d’où est extraite la ressource. Si cette dimension multilingue, se révèle incomplète, voire très limitée dans certains cas, elle offre néanmoins, entre autres choses, la possibilité de s’appuyer sur tout le travail de la communauté Wikipédia (indexation, traduction, relation) pour réaliser simplement une interface multilingue d’exploration des ressources, ici d’œuvres d’art. Pour notre plus grand bonheur.