3 différences fondamentales entre Wikidata et Wikipédia
1- base de données vs. encyclopédie. Les critères d'admissibilité sont donc beaucoup moins contraignants pour Wikidata que pour Wikipédia. Il y a un ordre de grandeur entre le nombre d'éléments et le nombre d'articles de la plus grosse des Wikipédia. 2- La licence de Wikidata est CC0, alors que c'est CC-BY-SA pour les Wikipédia. Wikidata est ainsi beaucoup plus facile à réutiliser. 3- Le contenu et les liens entre les éléments est beaucoup plus formel que le contenu et les liens entre les articles. Les robots ont ainsi beaucoup plus de facilité avec Wikidata qu'avec Wikipédia.
55 millions d'éléments de toutes sortes liés entre-eux par plus de 6 000 propriétés dans l'ordre Q -> P -> Q (triplets) et, parfois, une association P - > Q supplémentaire à un triplet (quintuplets).
On peut faire du data mining qui n'a pour seules limites que notre imagination (littéralement) ou la capacité de calcul de l'outil de requêtes.
Image de Britannica sur enPour Britannica, près de la moitié des 200 000 entrées sont des directory pages, c'est-à-dire des pages sans entrée propre, équivalentes aux redirections des projets wikis et menant à du contenu présent dans d'autres articles de Britannica (voir, par exemple, Gilles Vigneault).
Le libre amène un concept d'écosystème numérique. Il est ouvert et se nourrit des ressources extérieures, tout en leur faisant redondance.Pour Wikidata, c'est tout l'inverse : en plus de ses connections internes, la base de données libre est liée à plein de contenus externes via des identifiants uniques. De nouvelles propriétés liées à des identifiants uniques sont créées à chaque mois.
Carte des ~8 750 stations météorologiques du Canada. On remarque nettement la ligne DEW.La licence très libre de Wikidata fait en sorte qu'on peut accéder, modifier, réutiliser et rediffuser le contenu d'une multitude de façons. On peut ainsi, par exemple, faire des cartes de stations météo canadiennes et découvrir, notamment, une ligne de défense obsolète, mais encore active niveau météo.
métro de Montréal imaginaire.On peut faire des cartes de lignes de métro actuelles, projetées ou imaginaires.
En équipe de 2 ou 3, choisissez une région, venez l'écrire au tableau afin que d'autres équipes ne choisissent pas la même que vous et créez un ou des éléments Wikidata manquants pour les bibliothèques de cette région.
« maintenant, voici des post-its et crayons. Écrivez ce que vous aimeriez savoir-faire-être à propos des 60 millions d'éléments de Wikidata et collez le post-it sur le mur X. »
Vous pensiez que le wikicode était compliqué ? Attendez de voir le SPARQL...
Introduction à l'outil de requêtes avec x requêtes tirées des post-it, x = selon le feeling.
Requêtes de bases, intermédiaires et avancées
Description de cette requête générale :
#Requête permettant d'obtenir des statistiques#concernant les entrées de Britannica et d'Universalis.#Pour rendre opérante la requête, enlevez, au début#de la ligne, du dièse (#) jusqu'à l'expression ?item#Pour des requêtes qui dépassent les capacités de l'outil #(le message « Limite du temps de requête atteinte » s'affiche), remplacez #la première ligne (SELECT ?item ?itemLabel...[AUTO_LANGUAGE],fr" }) #par SELECT (COUNT(?item) AS ?count) WHERE {SELECTDISTINCT?itemLabel?itemDescription?itemWHERE{SERVICEwikibase:label{bd:serviceParamwikibase:language"[AUTO_LANGUAGE],en"}##Si excède capacités de l'outil SELECT DISTINCT (COUNT(?item) AS ?count) WHERE {#Britannica ?item wdt:P1417 ?britannica . #Universalis ?item wdt:P3219 ?universalis .#natureetsousclasses ?item wdt:P31/wdt:P279* wd:ÉLÉMENT .#localités ?item wdt:P31/wdt:P279* wd:Q486972 .#êtres humains ?item wdt:P31 wd:Q5 . #femmes ?item wdt:P21 wd:Q6581072 .#hommes ?item wdt:P21 wd:Q6581097 .#Allemand-e-s ?item wdt:P27 wd:Q183 .#Américain-e-s ?item wdt:P27 wd:Q30 .#Belges ?item wdt:P27 wd:Q31 .#Britanniques ?item wdt:P27 wd:Q145 .#Canadien-ne-s ?item wdt:P27 wd:Q16 .#Chinois-e-s ?item wdt:P27 wd:Q148 .#Français-e-s ?item wdt:P27 wd:Q142 .#Japonais-e-s ?item wdt:P27 wd:Q17 .#Russes ?item wdt:P27 wd:Q159 .#Russes (1721-1917) ?item wdt:P27 wd:Q34266 .#Soviétiques ?item wdt:P27 wd:Q15180 .#Suisse-sse-s ?item wdt:P27 wd:Q39 .#musicien-ne-s ?item wdt:P106/wdt:P279* wd:Q639669 .#artistes ?item wdt:P106/wdt:P279* wd:Q483501 .#scientifiques ?item wdt:P106/wdt:P279* wd:Q901 .#personnalité politique ?item wdt:P106/wdt:P279* wd:Q82955 .#lien vers une version linguistique OPTIONAL {?article schema:about ?item ; schema:isPartOf <https://CODE_LANGUE.wikipedia.org/> .}##sans lien vers une version linguistique FILTER (!BOUND(?article))#lier au numéro des éléments Wikidata situé entre BORNE_INFÉRIEURE et BORNE_SUPÉRIEURE BIND( xsd:integer( STRAFTER( STR( ?item ), STR( wd:Q ) ) ) AS ?num ) . FILTER( BORNE_INFÉRIEURE < ?num && ?num < BORNE_SUPÉRIEURE ) .}#Classer par VARIABLE. ORDER BY ?VARIABLE#Si temps limite atteint, limiter les résultats à X. LIMIT X#Si temps limite atteint, fractionner les résultats en sautant les X premiers et en affichant les Y suivants. OFFSET X LIMIT Y
Wikidata : Base : 46 résultats. a P17 = 42 résultats, a P625 = 25 résultats, a P571 = 14 résultats, a P856 = 18 résulats, a P856 et P625 = 14 résultats, pas Q31 = 10 résultats, pas P18 = 22 résultats, pas P17 = 4 résultats, a tout ces interwikis : enwiki = 16 résultats, aucun = 30 résultats. Question : comment trouver celles qui on un lien vers un autre projet que enwiki ? réponse : petscan:9180593. Dans une autre langue ? réponse : petscan:9180613
Travail personnel avec assistance ponctuelle des personnes-ressources
Exemple : Britannica : LIMIT 100000 = ok, OFFSET et LIMIT 100000 = non, OFFSET et LIMIT fonctionnent à partir de ~30000, mais ne permet pas d'incrémentation couper auto_language = non, couper descriptions = non, couper les étiquettes = ok, que ne décompter les éléments = ok.
Que tout Britannica soit un jour entièrement associée.
Créer un livre d'ici la fin de la journée. Il y a un manque criant de livres, parmi les plus classiques. Probablement en raison que l'admissibilité d'un article sur frwiki dépend de l'existence de sources secondaires centrées et que les contribut-eur-rice-s peinent à dénicher celles-ci.
L'outil de requête de Wikidata possède certaines restrictions dont il faut tenir compte lors d'une formation. Et le ctrl+espace = génial ! Simon Villeneuve 21:15, 7 June 2019 (UTC)
Contexte : conseiller ou pas à un doctorant de se créer un élément Wikidata. En juin 2019, une discussion sur le Bistro de Wikidata à propos de la notoriété des doctorants dégage le consensus qu'il est possible de créer un élément Wikidata pour ces derniers à la condition qu'ils aient publié au moins un article dans une revue universitaire avec comité de lecture.
Question SPARQL (Pmartinolli2019-07-24) : souvent les éléments ont des propriétés ou des éléments qui ne sont pas normalisés. Cela fait que pour lancer des requêtes assez exhaustives, il faudrait demander "liste-moi tous les éléments qui ont cette propriété OU celle-ci OU celle-là, ET qui ont cet élément OU celui-ci OU celui-là, ainsi que les valeurs de tel élément+propriété)".
#Toutes les bibliothèques du Québecselectdistinct?item?itemLabel(group_concat(distinct?locatedLabel;separator=", ")as?ll)(sample(?image)as?images)?coordo(sample(?site)as?sites)WHERE{?itemwdt:P31/wdt:P279*wd:Q7075;wdt:P17wd:Q16;wdt:P131/wdt:P131*wd:Q176;optional{?itemwdt:P131?located.?locatedrdfs:label?locatedLabel.filter(lang(?locatedLabel)="fr")}optional{?itemwdt:P18?image.}optional{?itemwdt:P625?coordo.}optional{?itemwdt:P856?site.}servicewikibase:label{bd:serviceParamwikibase:language"fr".}}group by?item?itemLabel?coordo