PetScan
PetScan är ett kraftfullt sökfrågeverktyg. En sökfråga förbereds PetScans inlämningsformulär. Läs också syftet med verktyget.
Inledning
PetScan är ett verktyg som kan generera listor från Wikipedia (och relaterade projekt) eller Wikidataobjekt som matchar vissa kriterier, som alla sidor i en viss kategori, eller alla objekt med en viss egenskap, extrahera och analysera data från Wikimediaprojekt. PetScans kan också kombinera vissa temporära listor (kallas här källor) på olika sätt för att skapa en ny. Källor innebär:
Sidor från Wikimedia/Wikipedia
Dessa definieras i flikarna Kategorier, Sidegenskaper och Mallar&länkar. Du kan fråga efter sidor i kategoriträd, med en viss mall eller länkar från/till en sida; begränsa din resultat till en särskild namnrymd, robot-/mänskliga redigeringar, nya redigeringar/sidor, osv. Dessa trädflikar representerar den tidigare CatScan2-funktionaliteten. Dess sökfrågeresultat bevaras därefter i kategorikällan.
Andra källor
I denna flik kan du lägga till fler källor, som sökfrågor i Wikidata SPARQL (WDQS) eller PagePile-länkar. Du kan också definiera hur du kombinerar flera källor; som standard returneras delmängden (det vill säga, endast sidor som förekommer i alla källor) i slutresultatet. Du kan också ange vilken wiki du vill att din lista ska gå till, t.ex. om du kombinerar Wikipedia och Wikidata-resultat.
Wikidata
I denna flik kan du märka eller filtrera dina resultat vidare, t.ex. bara returnera Wikidataobjekt som inte har några uttalanden. Använder du ett av dessa filter konverteras din lista till Wikidata.
Utmatning
Här kan du ange alternativ för din lista, t.ex. formatet (webbsida, wiki, PagePile, osv.). Du kan också ytterligare filtrera dina resultat, t.ex. med reguljära uttryck på sidtitlar/objektetiketter. Du kan också byta ut resultatlistan mot en rankad lista över saknade ämnen ("rödlänkar").
Definiera din sökfråga
Fälten som kan ställas in i frågeformuläret är följande:
Fält | Betydelse | Standard | Not |
---|---|---|---|
Språk | Välj projektspråkets kod, t.ex. "fr" för franska eller "sv" för svenska. Välj "commons" för Wikimedia Commons | "en" | |
Projekt | Wikimediaprojekt som ska sökas igenom (wikipedia, wiktionary, wikiversity, etc.) | "wikipedia" | NOTE: If you choose "Commons," be sure to go to the "Page properties" tab and check the "File" namespace to get useful results. |
Djup | Djup på kategorierna som ska sökas igenom. 0 betyder underkategorier inte ska användas. | "0" | |
Kategorier | Lista över kategorier, en per rad utan "kategori:" delen. | Tom | Lägg till '|' och ett nummer så anges djupet för kategoriträdet, vilket åsidosätter det som valts i Djup-fältet. Genom att ange en kategori kan du koka ner sökresultaten och fokusera på sidor som rör ett visst ämne. |
Negativa kategorier | Lista över kategorier som ovan. Endast artiklar som inte inkluderats i dessa kategorier accepteras. | Tom | |
Kombination | Hur kategorierna ovan bör användas:
Alla tillgängliga alternativ är för närvarande "delmängd" eller "union". |
"delmängd" | |
Namnrymder | Namnrymden som ska användas som potentiella sidor | Artiklar | |
Omdirigeringar | Antingen | ||
Mallar | Endast sidor som
Ange en mall per rad, utan "mall:"-prefix. Varje ruta kan kvalificeras genom att välja "Använd diskussionssida istället" |
Tom | Det här alternativet verkar bara kompatibelt med mallar som definierats i "mall:"-namnrymden. Den kan inte användas med mallar som definierats i "Användare:"-namnrymden. Den kan inte användas i "Creator:"- eller "Institution:"-namnrymden som används på Wikimedia Commons |
Länkas från: | |||
Senaste redigering | Visa sidor vars senaste redigering utfördes, eller inte, av en robot, av en oinloggad användare eller har flaggats. | Antingen, antingen, antingen | |
Senaste ändring | Datum eller tidsperiod för sidans senaste ändring i formatet ÅÅÅÅMMDDTTMMSS (kortare tillåts) | "Endast sidor som skapats under den angivna tidsrymden" låter dig leta efter första ändringen istället | |
Storlek | Filstorlek eller storleksspann i byte | Tom | Tillåter urval av artiklar vars filer är större än ett gränsvärde och/eller mindre än ett annat gränsvärde |
Länkar | Antal eller spann av interna länkar på en sida | Tom | Tillåter urval av artiklar med många eller färre länkar |
Rödlänkar | |||
Toppkategorier | Funktion som ännu inte är tillgänglig. | ||
Sortera | Funktion som ännu inte är tillgänglig som skulle ange sorteringskriterier för utmatnin. | ||
Manuell lista | Låter en ange en lista över (namnrymdsprefigerade) sidnamn eller Wikidataobjekt från särskilda projekt | Det svåra med att ange projekt är vilken kod man ska använda, exempel:
| |
Wikidata | Hämta Wikidata om det går. | ||
Format | Utmatningsformat för sökresultat: HTML: webbsidor CSV: värden i citattecken, separerade av komman TSV: Värden separerade av flikar WIKI: som en wikitabell PHP: som en PHP-fil XML: som en XML-fil |
||
Gör det! | Tryck här att köra sökfrågan du definierat. |
Sakkunskap
PetScan-ID (PSID)
Sedan 2016-04-04 sparas alla sökfrågor som körs i PetScan (anonymt!) och tilldelas en unik, stabil, numerisk identifierare som heter PSID. Du kan använda detta PSID för att
- köra denna PetScan-sökfråga som en inmatning i verktyg som stödjer PSID (som WD-FIST)
- fylla i en "kort URL":
https://petscan.wmflabs.org/?psid=PSID
kommer köra sökfrågan med PSID, med alla dess inställningar - programmatiskt bygga vidare på en tidigare sökfråga genom att "åsidosätta" parametrar:
https://petscan.wmflabs.org/?format=wiki&psid=PSID
kommer köra samma sökfråga som tidigare men utmatningsformatet kommer vara wiki (istället för standard HTML, vilket som valts ursprungligen).
Fotnoter:
- Endast sökfrågan lagras, inte dess resultat!
- Större sökfrågor (t.ex. med många manuella objekt) lagras inte. Då visas inte heller något PSID.
- Resultat med en tom ruta har möjliga matchningar inom Wikidata-delmängen.
- interwiki-länken petscan: kan användas för att generera genvägar för permanenta sökfrågor, t.ex. [[petscan:PSID]]
- sökfrågor som lagras "avdupliceras" inte, så ett nytt PSID genereras varje gång så länge inte en befintlig PSID åkallas utan ändring.
Skapa Wikidataobjekt för Wikipediaartiklar som ännu inte har någon (skaparfunktion)
- Ställ upp en sökfråga som returnerar en lista över Wikipediaartiklar (eller andra, projekt som inte är Wikidata), eller klistra in en lista i "Andra källor/Manuell lista"
Under fliken "Sidegenskaper", ska du välja "Redirects=No"Detta sker automatiskt nu; du kan ändra tillbaka det om du verkligen vill ha omdirigeringar i din lista!- Under fliken "Wikidata", välj "Endast sidor utan objekt" för alternativet "Wikidata"
- Kör sökfråga
- Dina resultat kommer ha ytterligare element bredvid rubriken "resultat" (så länge du inte är inloggad på WiDaR, i sådana fall kommer du se en passande länk istället)
- Alla sidor som det inte finns någon exakt matchning för i varken etikett eller alias på Wikidata kontrolleras som standard.
- Du kan bocka i/ur rutorna manuellt nu, om det behövs.
- Du kan lägga till standarduttalanden i uttalanderutan, som läggs till på ditt nya objekt. Så om du bara vill skapa objekt för människor, lägg till
P31:Q5
. Du kan lägga till flera uttalanden på det här sättet (en per rad). Kom ihåg att P/Q måste vara versaler – annars misslyckas den i tystnad. - Du kan lägga till standardbeskrivningar till nya objekt, såsom
Dde:"some description"
för en beskrivning på tyska. - Klicka på den gröna "Starta QS"-knappen. Detta öppnar en ny sida.
- Du kan klicka på "Kör" för att köra en ny körning i din webbläsare, eller "Kör i bakgrunden" för att köra dem från en Wikimediaserver. Läs Help:QuickStatements för mer information.
Sedan juli 2020, har Kör i bakgrund ett flertalet buggar (till exempel att dubbla objekt kan skapas). Använd frontend-läget om det går! |
Lägg till/ta bort uttalanden på Wikidataobjekt
Det går att lägga till eller ta bort uttalanden från Wikidataobjekt med PetScans. För att göra det är det viktigt att du väljer "Wikidata" i "Andra källor -> Använd Wiki". Sen kommer du se en kommandorad bredvid talet och kan fortsätta som beskrivet i tidigare avsnitt.
Hänvisa
(Bara V2) Om du öppnar PetScan från ett annat verktyg för att låta användaren formulera en sökfråga, kan du passera parametrarna referrer_url
och referrer_name
(leder till referrer_url
). referrer_url
borde ha en {PSID}
-sträng som kommer ersättas av det PSID som användaren ser. När en sökfråga körts kommer en ruta längst upp på sidan uppmana användaren att återvända till det ursprungliga verktyget med det PSID-modifierade referrer_url
.
Exempel
Artiklar på ett WikiProjekt
En begäran på diskussionssidan för denna manual: Hitta alla artiklar i huvudnamnrymden inom "WikiProjekt geografi Storbritannien". Börja med ett standard-PetScan-formulär, och lägg bara till "WikiProjekt geografi Storbritannien" i den första mallraden, och, precis som nedan, välj "Använd diskussionssidor istället". Här är sökfrågan ifylld. Tryck "Gör det!" längst ner. När det kördes den 16 augusti 2015 tog sökfrågan 1.5 sekunder att köra och resulterade i 21,408 artiklar. Listan visas UNDER formuläret (som stannar kvar på din skärm), så du behöver skrolla ner för att se resultaten.
Dablinks inom ett WikiProjekt
Redigerare som arbetar på förgreningar försöker ragga medlemmar i ett innehållsområdes WikiProjekt, speciellt WikiProjekt Kanada, för att hjälpa till. En PetScan-rapport utformas för att hitta alla artiklar som har förgreningslänkar som ligger inom WikiProjektet. Tillämpade kriterier:
- Artiklar som har förgreningslänkar ligger i "Kategori:Alla artiklar med länkar som behöver särskiljas", så klistra in "Kategori:Alla artiklar med länkar som behöver särskiljas" i PetScans kategorifält.
- Djup anges arbiträrt som 9, vilket betyder att artiklar så långt som 9 underkategorier ner från föräldrakategorin "behöver särskiljas" kommer hittas. (Det är inte nödvändigt att söka så långt, men i det här fallet skadar det inte.)
- Artiklar inom WikiProjekt Kanada har "Mall:WikiProjekt Kanada" på sina diskussionssidor, så klistra in "WikiProjekt Kanada" i PetScans fält "Har några av dessa mallar", och precis nedan välj "Använd diskussionssidor istället" som en bestämning.
- Endast vanliga artiklar, inte förgreningar, önskas, och förgreningar särskiljs genom att att ha mall:förgrening, så klistra in "Förgrening" i PetScans fält "Har inga av dessa mallar", och se till att "Använd diskussionssidor istället" inte valts.
- Dessa kriterier tillämpas av detta PetScan-formulär, ifyllt. För att skicka in sökfrågan, välj "Gör det!" längst ner.
- När den skickades in den 16 augusti 2015, tog sökfrågan 31 sekunder att köra, och resulterade i en lista på 255 artiklar. Resultaten visas UNDER formuläret, vilket stannar kvar, så du kanske ser någon skillnad på din skärm. Du behöver veta att du ska skrolla ner för att hitta resultaten! Den begäran kördes med standard
utmatningsformuläret "HTML".
- För att hämta åt resultaten i en wikitabell, för att dela dem på en undersida till WikiProjektet, skulle begäran kunna omarbetas genom att välja formatet "WIKI". Den här gången ersätter resultaten, i wikitabellformat, PetsScan-formuläret på din skärm.
- För att skapa en mer användbar lista för förgreningsarbetare, ställ in så att DabSolver, när ett objekt klickas på, öppnar en flerstegsprocess som kan följas. Här kan resultaten sparas i flik-separerade format istället och sedan tas till Excel, sen byggdes en kolumn som then a column was composed which enkla sammanfogade textsträngar med resultaten, sen kopierades och klistrades den resultattabellen in. Resultaten klistrades över till engelskspråkiga Wikipediaartikeln w:Wikipedia:Canadian Wikipedians' notice board/ArticlesNeedingDisambiguation2015-08-17 och postades också i ett skrollande fönster på diskussion på WikiProjekt Kanadas diskussionssida. --Doncram (diskusison) 19:50, 24 augusti 2015 (UTC) länken har justerats. DexDor (diskussion) 06:58, 29 mars 2016 (UTC)
Upptäcka sidor som har en onormal kombination av namnrymd och kategorier
PetScan kan användas för att hitta sidor som ligger i en kategori (eller kombinationer av kategorier) som inte är lämpliga för sidor i en viss namnrymd - t.ex. Wikipediaadministratörssidor som ligger i en kategori som bara borde innehålla encyklopediska artiklar. Detta kan sedan åtgärdas (t.ex. genom att flytta en artikel till rätt namnrymd eller genom att redigera en diskussion för att lägga ett uteblivet ":" där en kategori åsyftades). Det första steget i denna process är att identifiera kategorier (med PetScan) som orsakar felaktig kategorisering (t.ex. Wikipediaadministratörskategorier som ligger i artikelkategorier).
Hitta okategoriserade bildbidrag på Commons på angivet språk
(Baserat på Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons. Läs motiveringen och en fullständig förklaring där! Tack till wikimediaanvändaren User:Spiritia och andra bidragsgivare/debattörer som bidrog!)
Kör en sökfråga med PetScan med följande inställningar:
Language = commons
Project = wikimedia
Depth = 1
Categories = Icke-kategoriserade filer
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <din språkkod>
Format: ☑ Extended data for files ☑ File usage data
Den svenska språkkoden är "sv"; den rumänska språkkoden är "ro". För att hitta okategoriserade bilder uppladdade av användare som använder rumänska, är en version av sökfrågan (med html-utmatning, och utan autokör):
Den 15 mars 2016, efter att du tryckt "kör" kräver sökfrågan runt 105 sekunder att slutföra och 1748 hittade 1748 okategoriserade bilder.
Fotnoter:
- Fältet "Language =" används inte för att välja önskar språk; önskat språk ställs in i fältet "Template" istället.
- Språkkoden i sökfrågan är skiftlägeskänslig! Så använd till exempel "ro" och inte "RO".
- För att generera resultaten där, valdes Format: ☑ Wiki istället för standardutmatningen, Html.
Ha så kul! Tack än en gång till User:Spiritia!
Objekt utan uttalanden
Alternativet "Har inga uttalanden" kan användas för att hitta:
- objekt utan uttalanden för en kategori på Wikipedia (exempel: en:Category:United States geography stubs)
- objekt utan uttalanden för en hel språkversion av Wikipedia (exempel: "sowiki")
Steg för att importera mallen, vissa med PetScan.
Hämta webbplatslänkar för att visst projekt från en SPARQL-sökfråga
- Indikerar projektet i fliken "Kategorier", t.ex.
de
för Language ochwikipedia
på Project för att använda tyskspråkiga Wikipedia. - Skriv din SPARQL-sökfråga i "Andra källor"
- Se till att välja Från kategorier från alternativen Använd wiki
- Tryck Gör det!
Detta kan vara användbart för att hämta sidvisningar av vissa grupper sidor, baserat på en SPARQL-sökfråga. Du kan spara detta i en Pagepile (kontrollera fliken Utmatning), skriv sedan in Pagepile-ID i Massviews Analysis (välj "Page Pile" i rullgardinsmenyn Källa).
Hämta en list över Wikidataobjekt med undantag baserat på en SPARQL-sökfråga
Låt oss säga att du har en lista över folk med Wikidata-ID:n (QID:n) som du vill lägga till ett yrke (P106) med "smyckesformgivare" (Q2519376), kanske med ett verktyg som QuickStatements. Men du vill inte lägga till den om det redan finns ett yrke där med det värdet. Så här kan du göra det med PetScan:
- Ha din lista över QID:n i en textfil, varje QID på en ny rad
- Klistra in texten i fältet "Manuell lista" i fliken "Andra källor",
- Skriv in strängen
wikidatawiki
i formuläret "Wiki" - Skriv in din SPARQL-sökfråga i fältet "SPARQL". I det här exemplet ger sökfrågan alla människor med yrket "smyckesformgivare":
select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
- Till sist gör du ett undantag, så lägg till strängen
manual NOT sparql
i fältet "Kombination" för att hämta alla QID:n från "manuell lista", men utan objektet från SPARQL-sökfrågan. - Tryck "Gör det!"
Lägg till ditt exempel här...
Felrapporter, funktionsförfrågningar, kodbas
Se även
Externa länkar