Wikidata Enpoint SparQL et les peintures de Goya

En février 2015, le billet Wikidata Query et les peintures de Goya présentait la manière de requêter les données œuvres d’art de Wikidata avec l’API Wikidata Query. Depuis une autre technologie de requête, conforme aux standards du web sémantique (avec quelques ajouts spécifique à Wikidata), a été mise en place : l’Endpoint SparQL de Wikidata.

Afin de faciliter l’utilisation de cet outil, Ash Crow a fait un excellent tutoriel : Mais combien y a-t-il de femmes scientifiques sur Wikipédia ? (this time with SPARQL). À notre tour de montrer comment on peut utiliser cet Endpoint, et une fois encore dans le domaine des œuvres d’art.

L’objectif est comme précédemment de retrouver toutes les peintures de Francisco de Goya sur Wikidata.

LLes peintures de Goya sur Crotos
Les peintures de Goya sur Crotos
(réutilisant les données de Wikidata et les images de Wikimedia Commons)


Les peintures

Tout d’abord nous recherchons les éléments (?item) ayant pour nature (wdt:P31) peinture (Q3305213) ou une sous-classe (aquarelle, peinture murale…, propriété P279) :

PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
SELECT distinct ?item where {
    ?item wdt:P31/wdt:P279* wd:Q3305213 .
}
LIMIT 10


Requête. Résultat total au 18/10/2015 : 107 940 items « peinture ».


Les peintures avec leur titre

La requête précédente nous a permis de retrouver tous les éléments peinture sur Wikidata avec leur numéro d’identifiant (Q plus des chiffres). Si l’on souhaite récupérer le titre associé à ces peintures (en français d’abord, sinon en espagnol ou en anglais), il convient d’ajouter dans notre requête le service ad hoc wikibase qui permet de récupérer le libellé vedette des éléments :

PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX wikibase: <http://wikiba.se/ontology#>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
select distinct ?item ?itemLabel
where {
    ?item wdt:P31/wdt:P279* wd:Q3305213 .
    SERVICE wikibase:label {
       bd:serviceParam wikibase:language "fr,es,en" .
    }
}
LIMIT 10


Résultat avec les libellés


Les peintures crées par Goya

À la requête précédente sur les peintures il suffit d’ajouter en critère de sélections les items créés par (propriété p170) Francisco de Goya (Q5432):

PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX wikibase: <http://wikiba.se/ontology#>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
select distinct ?item ?itemLabel
where {
    ?item wdt:P31/wdt:P279* wd:Q3305213 .
    ?item wdt:P170 wd:Q5432 .
    SERVICE wikibase:label {
        bd:serviceParam wikibase:language "fr,es,en" .
    }
}


Résultat


Les peintures crées par Goya avec image

Dernière étape, on ajoute en critère optionnel la propriété image (p18) pour récupérer le nom d’un éventuel fichier image sur Wikimedia Commons :

PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX wikibase: <http://wikiba.se/ontology#>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
select distinct ?item ?itemLabel ?img
where {
    ?item wdt:P31/wdt:P279* wd:Q3305213 .
    ?item wdt:P170 wd:Q5432 .
    OPTIONAL{
    	?item wdt:P170 ?img.
    }
    SERVICE wikibase:label {
       bd:serviceParam wikibase:language "fr,es,en" .
    }
}

Et voilà le résultat attendu : peintures de Goya avec l’Endpoint SparQL de Wikidata

Ce résultat pourrait bien sûr être complété avec d’autres données disponibles dans les éléments Wikidata (date de création [propriété P571], collection [propriété P195], numéro d’inventaire [propriété P217]… cf. Structure générique d’élément œuvre d’art sur Wikidata). Les données produites par les requêtes peuvent être ensuite récupérées sous divers formats (CSV, TSV, JSON, Simple TSV, Full JSON).


Bonus ! Tout récupérer sans coder

Avec l’outil Œuvres d’art du Lab de Crotos, il est possible de créer une liste d’œuvres selon une collection ou un créateur. La liste produite est paramétrable et téléchargeable au format CSV (compatible avec Excel ou autres tableurs). Et hop :

Liste complète des œuvres de Goya sur Wikidata


L’Endpoint SparQL apparaît déjà comme une avancée notable dans les outils de requête de Wikidata.
Par ailleurs, dans le domaine des œuvres d’art, comme évoqué dans un précédent billet sur les développements de Crotos, le contenu de Wikidata a atteint un volume conséquent et toujours croissant, rassemblant et structurant des informations sur les œuvres dans une large base de données multilingue et collaborative. Si en plus toutes les données sont libres sur Wikidata (en CCO) et que nous disposons également des images libres et reliées de Wikimedia Commons, alors nous avons déjà largement de quoi récupérer, réutiliser, analyser, créer et s’émerveiller.

Doña Isabel de Porcel
Doña Isabel de Porcel, peinture de Francisco de Goya, 1805, National Gallery (NG1473), Q1585399

Enjoy!

Localiser les peintures d’artistes femmes au Louvre grâce à Wikidata

Récemment, nous entendions le regret d’une visiteuse du Louvre de ne pas y avoir trouvé des peintures réalisées par des femmes. Il y en a certes bien peu mais il y en a, pas seulement d’Élisabeth Vigée Le Brun, et il est même possible de les localiser.

Les Attributs de la peinture, de la sculpture et de l'architecture
Les Attributs de la peinture, de la sculpture et de l’architecture,
peinture d’Anne Vallayer-Coster, Louvre, aile Sully, peintures françaises, salle 52

La base Joconde nous permet déjà d’obtenir une liste de peintures en croisant divers critères, comme expliqué dans un billet sur les artistes femmes dans Joconde. On peut ainsi obtenir une liste de 42 œuvres (dont, au passage, une qui n’est plus au Louvre mais au musée d’Orsay, comme cela a été signalé).

Par ailleurs la base Atlas du musée du Louvre nous permet, sous réserve d’être à jour, de localiser les œuvres par salle.

Comment croiser les données de ces deux bases patrimoniales ?
Wikidata !

Wikidata est une base de données libre, coopérative et multilingue, hébergée par la Wikimédia Foundation. Comme la communauté de contributeurs ne dispose pas de jeux de données en open data pour les collections du musée du Louvre, il convient de les éditer peu à peu. Et petit à petit, malgré les nombreux manques, s’est constitué un jeu de données déjà notablement fourni permettant en particulier d’avoir des œuvres du Louvre localisées par salles sur Wikidata.

Alors où trouver les peintures des artistes femmes au Louvre ?

Peintures d'artistes femmes au Louvree
Peintures d’artistes femmes au Louvre

Un deuxième tableau de différence entre la liste ci-dessus et celle de la base Joconde, puisque L’Enfant à la poupée est attribué à Anne-Geneviève Greuze sur la base Atlas mais à son père Jean-Baptiste sur la base Joconde.

En 2014, l’Institut national d’histoire de l’art, le musée du Louvre et l’Université Paris-Est Marne-la-Vallée organisèrent un séminaire de recherche Qu’est-ce que les études de genre font à l’histoire de l’art ? et un cycle de conférences Artistes femmes au musée ? Regards actuels.

La même année, le Louvre accueillait les Ateliers numériques : Tous à l’œuvre organisés par le ministère de la Culture et de la Communication. Le panel très large des domaines de création proposés comprenait notamment une invitation au remix et au partage : « Vous avez envie de participer à la création d’un corpus d’images, de textes, de croquis à diffuser, à réutiliser, à mixer pour mieux partager votre expérience dans le Hall Charles V du musée du Louvre ? »
Nous avons envie, oui, de « créer des corpus d’images à diffuser, à réutiliser, à mixer pour mieux partager » mais encore faudrait-il que nous disposions de ressources librement réutilisables, :-/. Malgré les manques et en souhaitant l’ouverture prochaine en open data des bases patrimoniales publiques, avec Wikidata et WikiCommons nous avons déjà de quoi faire.

Enjoy!

Développements sur le projet Crotos

Depuis le lancement du projet Crotos (présentation) et son passage à Wikidata en avril 2014, de nombreux développements ont été régulièrement apportés. Voici un petit panorama des améliorations notables.


Outil de visualisation des œuvres

Le vent
Le Vent d’ouest, de Winslow Homer, Q20854850, découvert en cherchant le vent en peintures

Le projet est résolument passé de simple moteur de recherche à moteur de recherche et d’affichage d’œuvres d’art. Un clic sur une image de résultat ouvre une lightbox à l’affichage optimisé, comprenant la notice apparaissant au survol et permettant de naviguer directement dans les résultats précédents et suivants.


Recherche d’images en haute définition

Pour filtrer les reproductions d’au moins 2000 pixels de plus grand côté, il suffit de cocher la case HD en mode contribution.
Exemple, les peintures en haute définition.


Recherche d’œuvres avec article sur Wikipédia

Exemple, les estampes avec article Wikipédia
ou les œuvres de Degas.


Notices enrichies

La liste des propriétés a été agrandie. Et l’on peut ainsi avoir le plaisir d’apprécier la « série » (propriété p179) des Trente-six vues du mont Fuji.


Cosmos

Cosmos permet d’explorer le contenu par les principaux index (type d’œuvres, auteur, genre, collection…)

Cosmos - éléments iconographiques
Promenade aléatoire dans les éléments iconographiques


Autocomplétion pour la recherche

Cette fonctionnalité prend également en compte un critère de notoriété.

Botticelli
Combien de « t », de « c » ou de « l » ? « bot » suffira


Style jour ou style nuit

Personnellement je préfère très largement le style en mode nuit, anciennement unique. Néanmoins suivant le principe de moindre surprise, un nouveau style en mode jour a été créé et est proposé par défaut.

Botticelli
Le jour

Botticelli
ou la nuit


La mise en page avec alignement horizontal

La première version de Crotos s’appuyait sur une mise en page de type dit « masonry » avec alignement vertical. C’était joli, en remplissant harmonieusement les espaces et tout à fait approprié au vagabondage ; en revanche lorsqu’il s’agissait de parcourir méthodiquement des résultats, cela devenait particulièrement inconfortable, voire même franchement pénible. Dans la nouvelle mise en page, les résultats sont alignés horizontalement avec des vignettes non recadrées contenues dans des boîtes de 320*240 pixels maximum.

Avant / Après
Avant / Après


Historique des mises à jour (partie Lab)


Évolution du nombre d’œuvres d’art sur Crotos

Comme on peut le voir dans le graphique suivant, le volume d’œuvres d’art avec image est en progression régulière.

Évolution du nombre d'œuvres avec image sur Crotos
Évolution du nombre d’œuvres avec image sur Crotos

Par ailleurs, il y a sur Wikidata un projet spécifiquement sur les peintures : La somme de toutes les peintures. Ce projet a pour formidable ambition explicite de cataloguer toutes les peintures notables du monde. Cela a conduit à des créations massives d’éléments « peinture » sur Wikidata depuis les métadonnées de catalogues. Le hic est que cette montée en charge a été difficilement supportée par l’architecture de Crotos. Or comme pour la plupart de ces versements se sont faits sans lien avec des reproductions d’œuvres, l’intérêt était limité pour le projet Crotos qui a pour ambition première d’offrir des œuvres au regard (… et à la réutilisation puisque toutes les images sont libres). En attendant une éventuelle future refonte technique ainsi que la mise en correspondance massive de ces nouveaux éléments peinture avec les fichiers de WikiCommons, pour les collections importantes ayant moins de 10% d’œuvres avec image, seules les œuvres avec image sont récupérées et utilisées.
Bref, parmi les 66940 peintures retirées en août 2015, aucune peinture avec image n’a été retirée.

Évolution du nombre d'œuvres avec image sur Crotos
Évolution du nombre d’œuvres avec ou sans image sur Crotos


Les œuvres du musée Louvre localisées par salle (partie Lab)


Statistiques sur les collections d’œuvres d’art visuel (partie Lab)


Un outil pour créer des listes d’œuvres (partie Lab)

Les listes, par artiste ou institution, sont paramétrables et téléchargeables au format tableur (csv).
Exemple : Liste des œuvres de la Galerie Tretiakov


Envie de contribuer ?

Crotos s’appuie sur Wikidata pour les entités œuvres d’art avec leurs métadonnées et Wikimedia Commons pour les images ; c’est sur ces deux projets Wikimedia que ça se passe pour éditer, corriger, enrichir, contribuer. Et si vous avez envie de créer de nouveaux projets de réutilisation, vous pouvez y aller, c’est libre !

Pour terminer, un petit tutoriel (merci Coyau pour les sous-titres) sur comment créer et renseigner un élément œuvre d’art sur Wikidata :


Enjoy!

Crotos, a project on visual artworks powered by Wikidata and Wikimedia Commons

Crotos is a search and display engine for visual artworks based on Wikidata and using Wikimedia Commons files.

Français

[Edit 3/9/2015] New developments on Crotos

Crotos - accueil

zone47.com/crotos/


Examples of searches

Simple search

Search with date of creation

Search in others languages

Indexed search

Indexed and free serach, crossed

Searches can be made by free or indexed search. Results are displayed by chrological order with thumbnails. Links on thumbnails open a viewer with the image hosted on Wikimedia Commons.

It is possible to filter the results by type (painting, sculpture, print…) or to specify a period as criterion.

By default, without criterion, a random selection is displayed.

Besides with the Cosmos it is possible to discover the artworks by indexation (par type d’œuvre, creator, movement, genre, collection…).


Descriptions

Under each result image are mentionned the title, the creator(s) (property p170) and the collection (property p195) or the location (property p276) when these information are on Wikidata.

Four icons can be directly associated with the work (when information is on Wikidata):

  • link to Wikidata item
  • link to Wikimedia Commons page (property p18)
  • link to a Wikipedia page about this artwork (same language as interface if it exists)
  • link to artwork’s page on institutional website (property p973)

Properties displayed (when information in Wikidata):

  • date or period (property p571)
  • nature of artwork (property p31)
  • material used (property p186)
  • inventory number (property p217)
  • movement (property p135)
  • genre (property p136)
  • depicts (property p180)
  • main subject of the artwork (property p921)
  • series of whom the artwork is a part (property p179)
  • arwtork of whom the artwork is a part (p361)
  • the work(s) used as basis for subject (p144)
  • the work which inspired the artwork (p941)
  • pendant of the artwork(property p1639)
  • official website for the collection (property p856)
  • link to category on Wikimedia Commons (property p1639)
  • link to Europeana (property p727)
  • link to VIAF (property p214)
  • link to Joconde database of the French Ministry of Culture (property p347)
  • link to Atlas database of artworks of musée du Louvre (property p1212)
  • link to RKDimages database of the Rijksbureau voor Kunsthistorische Documentatie (property p350)
  • link to Reasonator (Wikidata – in pretty!) for a more complete description of the Wikidata item

Indexed informations have links to start a new search.


Multilingualism

The interface is in 34 languages. The information are displayed by default in the language of the interface. In the absence of label in the language indicated, the information is displayed in another language.

To have a partial overview of the language occurrences: Crotos – Languages occurences from labels


Artworks selection

The Wikidata extraction contains currently (April 2015) more than 46 000 artworks (10 000 in May 2014) with more than 20 000 images (7 000 in May 2014). This extraction is regularly automatically updated from Wikidata on the basis of the nature of the items (property p31) and corresponds to the following types of visual artworks:

All data used in Crotos come from Wikidata, free database, collaborative and multilingual.

Data are published on Wikidata manually or via robots, (like this one to migrate data from DBpedia as explained here: Voyage de DBpedia en Wikidata à bord d’un bot [in French]), or by creating new items via robots [in French], or via semi-automated publishing tools like Autolist or Quick Statements.


Contribution mode

The project has a contribution mode, useful for identifying missing information with facets. For example, artworks without English title. So if the envy takes you, do not hesitate to indulge yourselves.


Finally, source is on github and the database of Crotos can be downloaded ; both are under Free Licence.

Do not hesitate to make remarks, criticisms or suggestions to benoit (a) zone47.com or elsewhere.

Enjoy!