PetScan
PetScan es una poderosa herramienta de consulta. En el formulario de envío de PetScan se elabora una consulta. También, echa un vistazo a las razones detrás de esta herramienta.
Introducción
PetScan es una herramienta que permite a los usuarios extraer datos, generar listas de páginas de Wikipedia (y proyectos relacionados) o elementos de Wikidata que coinciden con ciertos criterios, como todas las páginas de una categoría determinada, o todos los elementos con una propiedad determinada y extraer y analizar datos de los proyectos Wikimedia. PetScan también puede combinar listas temporales (llamadas «fuentes») de diferentes maneras para crear una nueva. Las fuentes incluyen:
Páginas de Wiki(m/p)edia
Estas se definen en las pestañas Categorías, Propiedades de la página y Plantillas y enlaces. Puedes consultar páginas en árboles de categorías, con plantillas específicas o enlaces desde/hacia páginas específicas; limitar tus resultados a ciertos espacios de nombres, ediciones de bots/humanos, ediciones recientes/creación de páginas, etc. Estas tres pestañas representan la funcionalidad anterior de CatScan2. El resultado de tu consulta se conserva posteriormente como «fuente de categoría».
Otras fuentes
En esta pestaña, puedes agregar más fuentes, como consultas SPARQL de Wikidata (WDQS) o listas de PagePile. También puedes definir cómo combinar múltiples fuentes; de forma predeterminada, el subconjunto (es decir, solo las páginas que aparecen en todas las fuentes) se devuelve en el resultado final. También puedes especificar a qué wiki deseas que apunte tu lista, por ejemplo, si combinas los resultados de Wikipedia y Wikidata.
Wikidata
En esta pestaña, puedes anotar o filtrar aún más tus resultados, como por ejemplo, devolver sólo elementos de Wikidata que no tengan declaraciones. El uso de cualquiera de estos filtros convertirá tu lista a Wikidata.
Salida
Aquí puedes especificar opciones para tu lista, como por ejemplo, el formato (página web, wiki, PagePile, etc.). También puedes filtrar aún más tus resultados, por ejemplo, con expresiones regulares en títulos de páginas/etiquetas de elementos. También puedes reemplazar la lista de resultados con una lista clasificada de temas faltantes («enlaces rojos»).
Define tu consulta
Los campos que se pueden rellenar en el formulario de consulta son los siguientes:
Campo | Significado | Valor por defecto | Nota |
---|---|---|---|
Idioma | Selecciona el código de idioma del proyecto, por ejemplo, «es» para español o «en» para inglés. Selecciona «Commons» para Wikimedia Commons | "en" | |
Proyecto | Proyecto Wikimedia en el que buscar (wikipedia, wiktionary, wikiversity, etc.) | "wikipedia" | NOTE: If you choose "Commons," be sure to go to the "Page properties" tab and check the "File" namespace to get useful results. |
Profundidad | Profundidad de árboles de categoría a buscar. 0 significa no utilizar subcategorías. | "0" | |
Categorías | Lista de categorías, una por línea sin la parte «categoría:» | Vacío | Al agregar '|' y un número se establecerá la profundidad de este árbol de categorías, anulando lo que se eligió en el campo Profundidad. Al especificar una categoría, puedes limitar los resultados de la búsqueda y centrarte en páginas relacionadas con un tema en particular. |
Categorías a excluir | Lista de categorías como arriba. Solo se aceptarán los artículos que no estén incluidos en estas categorías. | Vacío | |
Combinación | Cómo se deben utilizar las categorías anteriores:
Las opciones disponibles actualmente son "intersección" o "unión". |
"intersección" | |
Espacios de nombres | Los espacios de nombres a utilizar como páginas potenciales | Artículos | |
Redirecciones | Ambos | ||
Plantillas | Utiliza solo las páginas que
Introduce una plantilla por línea, sin el prefijo «plantilla:». Cada cuadro puede calificarse seleccionando «Usar páginas de discusión» |
Vacío | Esta opción sólo parece compatible con las plantillas definidas en el espacio de nombres «plantilla:». No se puede utilizar con plantillas definidas en el espacio de nombres «Usuario:». No se puede utilizar en los espacios de nombres «Creator:» o «Institution:» que se utilizan en Wikimedia Commons. |
Enlazado desde | |||
Última edición | Mostrar las páginas cuya última edición fue o no realizada por un bot, por un usuario anónimo o está marcada | Cualquiera de ellos | |
Última edición | Fecha o período de tiempo de la última edición en la página en el formato YYYYMMDDHHMMSS (se permite formas más cortas) | «Solo las páginas creadas durante la ventana de tiempo anterior» te permite buscar la primera edición en su lugar | |
Tamaño | Tamaño del archivo o rango de tamaño en bytes | Vacío | Permite seleccionar los artículos cuyos archivos son mayores que un límite y/o menores que otro límite |
Enlaces | Número o rango de enlaces internos en la página | Vacío | Permite la selección de artículos con muchos o pocos enlaces |
Enlaces rojos | |||
Categorías superiores | Característica que aún no está disponible. | ||
Ordenar | Característica que aún no está disponible, que permitiría establecer un criterio de ordenamiento para los datos de salida. | ||
Lista manual | Permite ofrecer una lista de nombres de páginas (con su espacio de nombres como prefijo) o elementos de Wikidata desde el proyecto especificado | La parte complicada es especificar los proyectos, los códigos correctos son:
| |
Wikidata | Obtener Wikidata, en caso de estar disponible. | ||
Formato | Formato de salida de los resultados de búsqueda: HTML: páginas web CSV: valores entre comillas, separados por comas TSV: valores separados por tabulaciones WIKI: como una tabla Wiki PHP: como un archivo PHP XML: como un archivo XML |
||
¡Adelante! | Presiona esto para ejecutar la consulta que has definido. |
Conocimientos
Identificador de PetScan (PSID)
A partir del 04/04/2016, cada consulta que se ejecuta en PetScan se registra (¡de forma anónima!) y se le asigna un identificador numérico único y estable llamado PSID. Puedes utilizar el PSID para
- ejecutar esta consulta PetScan como entrada en herramientas que admiten PSID (como WD-FIST)
- completar una «URL corta»:
https://petscan.wmflabs.org/?psid=PSID
ejecutará la consulta con PSID, con todas sus configuraciones - expandir programáticamente en una consulta anterior, «sobrescribiendo» los parámetros:
https://petscan.wmflabs.org/?format=wiki&psid=PSID
ejecutará la misma consulta que antes, pero el formato de salida será wiki (en lugar del HTML predeterminado, o lo que se eligió originalmente).
Notas:
- ¡Solo se almacenará la consulta, no sus resultados!
- Las consultas grandes (por ejemplo, con muchos elementos manuales) no se almacenarán. En ese caso, no se mostrará ningún PSID.
- Los resultados con una casilla de verificación vacía tienen posibles coincidencias dentro del conjunto de Wikidata.
- El enlace interwiki petscan: se puede utilizar para generar accesos directos para consultas permanentes, por ejemplo [[petscan:PSID]]
- las consultas registradas no se deduplican, por lo que se generará un nuevo PSID cada vez, a menos que se llame a un PSID existente sin modificaciones.
Crear elementos de Wikidata para artículos de Wikipedia que aún no tienen uno (función de creador)
- Configura una consulta que devuelva una lista de páginas de Wikipedia (u otro proyecto que no sea Wikidata) o pega una lista en "Otras fuentes/Lista manual"
En la pestaña «Propiedades de la página», debes seleccionar «Redirecciones = No»Esto se hace automáticamente ahora; ¡puedes volver a cambiarlo si realmente quieres redireccionamientos en tu lista!- En la pestaña «Wikidata», selecciona «Solo páginas sin item» para la opción «Páginas con elementos».
- Ejecuta la consulta
- Tus resultados tendrán elementos adicionales al lado del encabezado «resultados» (a menos que no hayas iniciado sesión en WiDaR, en cuyo caso verás un enlace apropiado en su lugar)
- Todas las páginas para las que no hay una coincidencia exacta en ninguna etiqueta o alias en Wikidata están marcadas de forma predeterminada.
- Puedes marcar/desmarcar casillas manualmente ahora, si es necesario.
- Puedes agregar declaraciones predeterminadas en el cuadro de declaraciones, que se agregarán a todos tus elementos nuevos. Entonces, si solo creas elementos para personas, agrega
P31:Q5
. Puedes agregar varias declaraciones de esta manera (una por línea). Ten en cuenta que el caso de P/Q debe estar en mayúsculas; de lo contrario, fallará silenciosamente. - Puedes agregar descripciones predeterminadas a los artículos nuevos, como
Dde:"some description"
para una descripción en alemán. - Haz clic en el botón verde «Iniciar QS». Esto abrirá una nueva página.
- Puedes hacer clic en «Ejecutar» para ejecutar un lote en tu navegador, o «Ejecutar en segundo plano» para ejecutarlos desde un servidor Wikimedia. Consulta Ayuda: QuickStatements para obtener más información.
A fecha de julio de 2020, «Ejecutar en segundo plano» tiene varios errores (por ejemplo, se pueden crear elementos duplicados). ¡Utiliza el modo frontend si es posible! |
Añadir o quitar declaraciones para elementos de Wikidata
Es posible añadir o quitar declaraciones de elementos de Wikidata con PetScan. Para ello es fundamental elegir «Wikidata» en «Otras fuentes -> Usar wiki». Después de esto aparecerá la caja de comandos al lado del número y permitirá continuar como se describió en la sección anterior.
Referrer
(V2 solamente) Si abres PetScan desde otra herramienta que permite al usuario crear una consulta, puedes pasar los parámetros referrer_url
y referrer_name
(el valor predeterminado es referrer_url
). referrer_url
debe tener una cadena {PSID}
que se reemplazará con el PSID que ve el usuario. Una vez que se ejecuta una consulta, un cuadro en la parte superior de la página le solicitará al usuario que regrese a la herramienta original, utilizando el referrer_url
modificado con PSID.
Ejemplos
Artículos en un Wikiproyecto
PetScan puede ser utilizado para consultar los artículos y anexos pertenecientes a un Wikiproyecto para su posterior análisis o para exportar esta lista (por ejemplo, para crear una lista de seguimiento del Wikiproyecto). En este ejemplo, encontraremos todos los artículos pertenecientes al «Wikiproyecto Videojuegos». Nota: Las instrucciones a continuación difieren de las instrucciones de la página original de PetScan en inglés, debido a la forma en cómo funcionan los Wikiproyectos en Wikipedia en español, mediante el uso de la plantilla PR.
Para realizar esta consulta, desde la página de inicio de PetScan, ve a la pestaña «Categorías» y en la sección «Categoría», añade la categoría principal del Wikiproyecto donde se categorizan los artículos (en este caso, sería «Categoría:Wikiproyecto:Videojuegos/Artículos»). En la misma pestaña, no te olvides de indicar el idioma de Wikipedia (en este caso, «es» para Wikipedia en español). En la pestaña «Propiedades de la página», en la sección «Espacio de nombres», selecciona «Discusión» y «Anexo discusión», que es donde se localiza la plantilla de Wikiproyectos (en este caso, {{PR|Videojuegos}}
). En la pestaña «Otras fuentes», en la sección «Espacio de nombres», selecciona «Cambiar a página principal», para que la lista sea de los artículos y anexos y no sus páginas de discusión. Por último, has clic en el botón «¡Adelante!» para ejecutar la consulta.
Aquí está la consulta completa. Cuando se ejecutó el 2 de junio de 2024, la consulta tardó 1,9 segundos en ejecutarse y arrojó 10 080 resultados. La lista aparece debajo del formulario de envío (que permanece en tu pantalla), por lo que debes desplazarte hacia abajo para ver los resultados. Sólo se muestran los primeros 10 000 resultados en HTML, para no bloquear tu navegador; otros formatos tendrán resultados completos (los cuales puedes configurar en la pestaña «Salida», sección «Formato»).
Artículos destacados que necesitan referencias
Los artículos destacados son lo mejor de lo mejor de Wikipedia, pero con el tiempo, los usuarios añaden información que no necesariamente está referenciada, con el riesgo de que pueda peligrar la distinción del artículo. En Wikipedia en español, las afirmaciones o secciones que requieran referencias se marcan con la plantilla Cita requerida. Usando PetScan, es posible saber qué artículos destacados poseen dicha plantilla.
Para realizar esta consulta, desde la página de inicio de PetScan, ve a la pestaña «Plantillas y enlaces» y en la sección «Plantillas», en el cuadro Tiene todas estas plantillas, escribe las plantillas «Artículo destacado» (que es la plantilla utilizada para indicar que un artículo es destacado) y «Cita requerida», separadas por un salto de línea. Por último, has clic en el botón «¡Adelante!» para ejecutar la consulta.
Aquí está la consulta completa. Cuando se ejecutó el 2 de junio de 2024, la consulta tardó 0,5 segundos en ejecutarse y arrojó 172 resultados. La lista aparece debajo del formulario de envío (que permanece en tu pantalla), por lo que debes desplazarte hacia abajo para ver los resultados.
Detección de páginas que tienen una combinación anómala de espacio de nombre y categoría(s)
PetScan se puede utilizar para encontrar páginas que se encuentran en una categoría (o combinación de categorías) que no es apropiada para páginas en un espacio de nombre en particular, por ejemplo, páginas de administración de Wikipedia que se encuentran en una categoría que solo debería contener artículos enciclopédicos. Esto se puede solucionar (por ejemplo, moviendo un artículo al espacio de nombre correcto o editando una discusión para insertar un ":" faltante donde se hace referencia a una categoría). El primer paso en este proceso es identificar (usando PetScan) las categorías que causan una categorización incorrecta (por ejemplo, categorías de administración de Wikipedia que se encuentran en categorías de artículos).
Encontrar fotos subidas a Commons no categorizadas en un idioma determinado
(Basado en Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons (en inglés). ¡Ve la motivación y la explicación completa allí! ¡Gracias al usuario de Wikimedia User:Spiritia y a otros colaboradores/comentaristas por contribuir con esto! )
Ejecuta una consulta utilizando PetScan con la siguiente configuración:
Language = commons
Project = wikimedia
Depth = 1
Categories = Uncategorized files
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <código de tu idioma>
Format: ☑ Extended data for files ☑ File usage data
El código del idioma español es «es»; el código del idioma rumano es «ro». Para encontrar fotos no categorizadas subidas por usuarios que usan el idioma rumano, una versión de la consulta (con salida HTML y sin ejecución automática) es:
Cuando la consulta se ejecutó el 2 de junio de 2024, tardó 9 segundos en ejecutarse y arrojó 972 fotos no categorizadas.
Notas:
- El campo «Idioma» no se utiliza para seleccionar el idioma deseado; el código del idioma deseado se establece en la pestaña «Plantilla», en el cuadro «Tiene todas estas plantillas».
- El código de idioma distingue entre mayúsculas y minúsculas en la consulta. Por ejemplo, utiliza «ro» en lugar de «RO».
- Para generar los resultados, se eligió «Formato: ☑ Wiki», en lugar de la salida predeterminada HTML.
¡Que lo disfrutes! ¡Gracias de nuevo a User:Spiritia especialmente!
Elementos sin declaraciones
La opción «No tiene declaraciones» (de la pestaña «Wikidata», sección «Usa elementos/propiedades») se puede utilizar para encontrar, por ejemplo, elementos sin declaraciones para una categoría en Wikipedia (muestra: es:Categoría:España)
Pasos para importar datos de la plantilla Bio de la Wikipedia en italiano a Wikidata, algunos con PetScan.
Obtener los enlaces de sitio para un determinado proyecto a partir de una consulta SPARQL
- Indica el proyecto en la pestaña «Categorías». Por ejemplo,
de
para «Idioma» ywikipedia
en «Proyecto» para utilizar la edición en alemán de Wikipedia. - En «Otras fuentes» introduce tu consulta SPARQL.
- Asegúrate de seleccionar «Desde categorías» en las opciones «Usar wiki»
- Has clic en «Adelante»
Esto podría ser útil para obtener la cantidad de visitas de un conjunto específico de páginas, en función de una consulta SPARQL. Puedes guardar esto en un Pagepile (consulta la pestaña «Salida»), luego ingresa esa ID de Pagepile en Massviews Analysis (selecciona 'Page Pile' en el menú desplegable «Fuente»).
Obtener una lista de elementos de Wikidata con exclusiones basada en una consulta SPARQL
Supongamos que tienes una lista de personas con ID de Wikidata (QIDs) a las que deseas agregar una ocupación (P106) de «diseñador de joyas» (Q2519376), tal vez con una herramienta como QuickStatements. Sin embargo, no deseas agregar esta ocupación a elementos que ya tienen esa ocupación. A continuación se explica cómo hacerlo con PetScan:
- Ten tu lista de QIDs en un archivo de texto, con cada QID en una nueva línea
- En la pestaña «Otras fuentes», pega este texto en el campo llamado «Lista manual»
- En el campo «Usar wiki» ingresa la cadena
wikidatawiki
- En el campo «SPARQL» ingresa tu consulta SPARQL. En este ejemplo, esta consulta devolverá como resultado todos los humanos que tienen una ocupación de «diseñador de joyas»:
select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
- Finalmente, debes hacer una exclusión, por lo que en el campo «Combinación» añade el texto
manual NOT sparql
para obtener todos los QID de la «lista manual», pero sin los elementos de la consulta SPARQL. - Has clic en «Adelante»
Añade tu ejemplo aquí...
Informes de errores, solicitudes de funciones, código fuente
Véase también
Enlaces externos
- Video de capacitación de EduWiki 2023
- Grupo de usuarios del Patrimonio Mundial Wiki: Capacidad de construcción de PetScan Training 2021