User:Simon Villeneuve/Wikidata
Matériel pour la formation à Wikidata organisée en collaboration avec l'UQÀM et donnée le 7 juin 2019 à la bibliothèque de l'ÉTS.
- Date : vendredi le 7 juin 2019
- Lieu : Bibliothèque de l'École de technologie supérieure (ÉTS), 1110 Rue Notre-Dame Ouest, Montréal
- Déroulement :
- 9h à 9h15 : Accueil
- 9h15 à 10h : Josée
- 10h à 10h15 : Pause-café
- 10h15 à 12h : Simon (introduction + contributions)
- 12h à 13h30 : dîner libre
- 13h30 à 16h30 : Simon (mix'n'match & SPARQL)
Participant-e-s
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
AM
editExemples de réutilisations de Wikidata
editpour qu'il soit instrument d'émancipation d'une communauté, le savoir doit être construit et véhiculé dans la langue de la majorité.[1]
Un vulgarisateur ayant une formation en astro veut naturellement faire voir que l'Univers est bien plus grand que tout ce que l'on peut imaginer.
- Avant de commencer, qui êtes-vous ?
3 différences fondamentales entre Wikidata et Wikipédia
1- base de données vs. encyclopédie. Les critères d'admissibilité sont donc beaucoup moins contraignants pour Wikidata que pour Wikipédia. Il y a un ordre de grandeur entre le nombre d'éléments et le nombre d'articles de la plus grosse des Wikipédia.
2- La licence de Wikidata est CC0, alors que c'est CC-BY-SA pour les Wikipédia. Wikidata est ainsi beaucoup plus facile à réutiliser.
3- Le contenu et les liens entre les éléments est beaucoup plus formel que le contenu et les liens entre les articles. Les robots ont ainsi beaucoup plus de facilité avec Wikidata qu'avec Wikipédia.
- Introduction générale à Wikidata
- 55 millions d'éléments de toutes sortes liés entre-eux par plus de 6 000 propriétés dans l'ordre Q -> P -> Q (triplets) et, parfois, une association P - > Q supplémentaire à un triplet (quintuplets).
- On peut faire du data mining qui n'a pour seules limites que notre imagination (littéralement) ou la capacité de calcul de l'outil de requêtes.
- X % de bibliothécaires, allons voir les bibles : Universalis et Britannica. (avant d'aller plus loin, je vous conseille de naviguer avec plusieurs onglets).
Statistiques sur Universalis et Britannica + L'encyclopédie canadienne et le Dictionnaire biographique du Canada. - Pour Britannica, près de la moitié des 200 000 entrées sont des directory pages, c'est-à-dire des pages sans entrée propre, équivalentes aux redirections des projets wikis et menant à du contenu présent dans d'autres articles de Britannica (voir, par exemple, Gilles Vigneault).
Pour Wikidata, c'est tout l'inverse : en plus de ses connections internes, la base de données libre est liée à plein de contenus externes via des identifiants uniques. De nouvelles propriétés liées à des identifiants uniques sont créées à chaque mois. - La licence très libre de Wikidata fait en sorte qu'on peut accéder, modifier, réutiliser et rediffuser le contenu d'une multitude de façons. On peut ainsi, par exemple, faire des cartes de stations météo canadiennes et découvrir, notamment, une ligne de défense obsolète, mais encore active niveau météo.
- On peut faire des cartes de lignes de métro actuelles, projetées ou imaginaires.
- On peut aussi quantifier le fossé des genres dans des dictionnaires et encyclopédies classiques, faire des listes générales ou particulières d'articles de femmes à créer sur frwiki.
- Finalement, on peut également faire...des listes de bibliothèques du Québec[4].
Utilisation de l'interface utilisateur
edit- Exploration de l'interface via la recherche et création d'une bibliothèque manquante. Exemple : bibliothèque d'Alma (existe déjà). On va ajouter et sourcer des infos.
bibliothèque municipale de Dolbeau-Mistassini = n'existe pas = création !
- Exercice
En équipe de 2 ou 3, choisissez une région, venez l'écrire au tableau afin que d'autres équipes ne choisissent pas la même que vous et créez un ou des éléments Wikidata manquants pour les bibliothèques de cette région.
Tempête d'idées postitées
edit« maintenant, voici des post-its et crayons. Écrivez ce que vous aimeriez savoir-faire-être à propos des 60 millions d'éléments de Wikidata et collez le post-it sur le mur X. »
PM
editOutil de requête
editVous pensiez que le wikicode était compliqué ? Attendez de voir le SPARQL...
- Introduction à l'outil de requêtes avec x requêtes tirées des post-it, x = selon le feeling.
- Requêtes de bases, intermédiaires et avancées
- Description de cette requête générale : Cliquez pour essayer !
#Requête permettant d'obtenir des statistiques #concernant les entrées de Britannica et d'Universalis. #Pour rendre opérante la requête, enlevez, au début #de la ligne, du dièse (#) jusqu'à l'expression ?item #Pour des requêtes qui dépassent les capacités de l'outil #(le message « Limite du temps de requête atteinte » s'affiche), remplacez #la première ligne (SELECT ?item ?itemLabel...[AUTO_LANGUAGE],fr" }) #par SELECT (COUNT(?item) AS ?count) WHERE { SELECT DISTINCT ?itemLabel ?itemDescription ?item WHERE { SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" } ##Si excède capacités de l'outil SELECT DISTINCT (COUNT(?item) AS ?count) WHERE { #Britannica ?item wdt:P1417 ?britannica . #Universalis ?item wdt:P3219 ?universalis . #natureetsousclasses ?item wdt:P31/wdt:P279* wd:ÉLÉMENT . #localités ?item wdt:P31/wdt:P279* wd:Q486972 . #êtres humains ?item wdt:P31 wd:Q5 . #femmes ?item wdt:P21 wd:Q6581072 . #hommes ?item wdt:P21 wd:Q6581097 . #Allemand-e-s ?item wdt:P27 wd:Q183 . #Américain-e-s ?item wdt:P27 wd:Q30 . #Belges ?item wdt:P27 wd:Q31 . #Britanniques ?item wdt:P27 wd:Q145 . #Canadien-ne-s ?item wdt:P27 wd:Q16 . #Chinois-e-s ?item wdt:P27 wd:Q148 . #Français-e-s ?item wdt:P27 wd:Q142 . #Japonais-e-s ?item wdt:P27 wd:Q17 . #Russes ?item wdt:P27 wd:Q159 . #Russes (1721-1917) ?item wdt:P27 wd:Q34266 . #Soviétiques ?item wdt:P27 wd:Q15180 . #Suisse-sse-s ?item wdt:P27 wd:Q39 . #musicien-ne-s ?item wdt:P106/wdt:P279* wd:Q639669 . #artistes ?item wdt:P106/wdt:P279* wd:Q483501 . #scientifiques ?item wdt:P106/wdt:P279* wd:Q901 . #personnalité politique ?item wdt:P106/wdt:P279* wd:Q82955 . #lien vers une version linguistique OPTIONAL {?article schema:about ?item ; schema:isPartOf <https://CODE_LANGUE.wikipedia.org/> .} ##sans lien vers une version linguistique FILTER (!BOUND(?article)) #lier au numéro des éléments Wikidata situé entre BORNE_INFÉRIEURE et BORNE_SUPÉRIEURE BIND( xsd:integer( STRAFTER( STR( ?item ), STR( wd:Q ) ) ) AS ?num ) . FILTER( BORNE_INFÉRIEURE < ?num && ?num < BORNE_SUPÉRIEURE ) . } #Classer par VARIABLE. ORDER BY ?VARIABLE #Si temps limite atteint, limiter les résultats à X. LIMIT X #Si temps limite atteint, fractionner les résultats en sautant les X premiers et en affichant les Y suivants. OFFSET X LIMIT Y
- Description de cette requête générale :
- Exemples : Lister éléments Universalis, ORDER BY ?itemLabel,
- Exemple d'adaptation : Britannica : ?item wdt:P31/wdt:P279* d:Q2472587
WikiProjets
edit- WikiProjets
- Présentation par Miguel Tremblay du WikiProject Weather observations
- Dirac
- Wikimania 2017
- Fichiers d'observations du Service météorologique du Canada (SMC)
- Métadonnées des stations (CSV)
- Exemple QS pour WD
- MSC Weather Stations to Wikidata
- Métadonnées des stations dans Wikidata
- La fondation Mediawiki et le gouvernement ouvert au Canada
- Exercices
- Créer une requête SPARQL.
Au choix
editContributions avec mix'n'match
edit- Outils externes
Il existe une panoplie d'outils externes permettant de fouiller et de contribuer à Wikidata. Nous vous en présentons ici quelques-uns.
- mix-n-match
- mw:Help:OAuth/fr
- Contributions : FemBio (~2 pages par personne)
Utiliser PetScan
edit- PetScan
- Présentation : b:fr:Utilisateur:Simon Villeneuve/Wikipédia en éducation/Étudier avec Wikipédia#PetScan
- Exemple :
- Wikipédia : fr:Catégorie:Bibliothèque au Québec,fr:Catégorie:Montréal,fr:Catégorie:Ville de Québec
- Wikidata : Base : 46 résultats. a P17 = 42 résultats, a P625 = 25 résultats, a P571 = 14 résultats, a P856 = 18 résulats, a P856 et P625 = 14 résultats, pas Q31 = 10 résultats, pas P18 = 22 résultats, pas P17 = 4 résultats, a tout ces interwikis : enwiki = 16 résultats, aucun = 30 résultats. Question : comment trouver celles qui on un lien vers un autre projet que enwiki ? réponse : petscan:9180593. Dans une autre langue ? réponse : petscan:9180613
Travail personnel avec assistance ponctuelle des personnes-ressources
editIl s'agit simplement de laisser du temps libre aux apprenant-e-s pour que ces derni-er-ère-s puissent pratiquer leurs nouvelles connaissances.
Optimisation de requêtes
edit- Mieux délimiter
- LIMIT et OFFSET
- Couper des parties (labels)
- Exemple : Britannica : LIMIT 100000 = ok, OFFSET et LIMIT 100000 = non, OFFSET et LIMIT fonctionnent à partir de ~30000, mais ne permet pas d'incrémentation
couper auto_language = non, couper descriptions = non, couper les étiquettes = ok, que ne décompter les éléments = ok.
Conclusion
editSouhaits
edit- Que tout Britannica soit un jour entièrement associée.
- Créer un livre d'ici la fin de la journée.
Il y a un manque criant de livres, parmi les plus classiques. Probablement en raison que l'admissibilité d'un article sur frwiki dépend de l'existence de sources secondaires centrées et que les contribut-eur-rice-s peinent à dénicher celles-ci.
Ressources
editCommentaires
editInsérez ici vos commentaires.
- L'outil de requête de Wikidata possède certaines restrictions dont il faut tenir compte lors d'une formation. Et le
ctrl+espace
= génial ! Simon Villeneuve 21:15, 7 June 2019 (UTC) - Contexte : conseiller ou pas à un doctorant de se créer un élément Wikidata.
En juin 2019, une discussion sur le Bistro de Wikidata à propos de la notoriété des doctorants dégage le consensus qu'il est possible de créer un élément Wikidata pour ces derniers à la condition qu'ils aient publié au moins un article dans une revue universitaire avec comité de lecture.- exemple, auteur de cet article.
- Question SPARQL (Pmartinolli2019-07-24) : souvent les éléments ont des propriétés ou des éléments qui ne sont pas normalisés. Cela fait que pour lancer des requêtes assez exhaustives, il faudrait demander "liste-moi tous les éléments qui ont cette propriété OU celle-ci OU celle-là, ET qui ont cet élément OU celui-ci OU celui-là, ainsi que les valeurs de tel élément+propriété)".
- J'ai conçu ces deux requêtes pour moissonner plusieurs propriétés (creator, author, etc.) : Query listing all works by an author - Another query
- Maintenant, je cherche comment combiner plusieurs 'wd'.
Notes et références
edit- ↑ gazouillis de juillet 2018
- ↑ quantification du groupe
- ↑ Cliquez pour essayer !
#defaultView:ImageGrid select distinct ?itemLabel ?item ?image ?linkcount ?sexeLabel where {?item wdt:P31 wd:Q5 ; wdt:P1340 wd:Q17122834 ; wikibase:sitelinks ?linkcount ; wdt:P21 ?sexe . #?item wdt:P21 wd:Q6581097 . #?item wdt:P21 wd:Q6581072 . optional {?item wdt:P18 ?image .} SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". } } GROUP BY ?itemLabel ?item ?image ?linkcount ?sexeLabel ORDER BY DESC(?linkcount)
- ↑ Cliquez pour essayer !
#Toutes les bibliothèques du Québec select distinct ?item ?itemLabel (group_concat(distinct ?locatedLabel;separator=", ") as ?ll) (sample(?image) as ?images) ?coordo (sample(?site) as ?sites) WHERE { ?item wdt:P31/wdt:P279* wd:Q7075 ; wdt:P17 wd:Q16 ; wdt:P131/wdt:P131* wd:Q176 ; optional {?item wdt:P131 ?located . ?located rdfs:label ?locatedLabel . filter(lang(?locatedLabel)="fr")} optional {?item wdt:P18 ?image .} optional {?item wdt:P625 ?coordo .} optional {?item wdt:P856 ?site .} service wikibase:label { bd:serviceParam wikibase:language "fr". } } group by ?item ?itemLabel ?coordo