Wikimedia Enterprise/PMF
Es recullen algunes respostes deliberadament curtes a preguntes habituals. Per a més detalls i context en qualsevol d'aquests aspectes, si-us-plau llegiu l'assaig, els principis o la documentació tècnica.
Wikimedia Enterprise | |
---|---|
enterprise.wikimedia.com | |
Projecte |
|
Tècnic | |
General
Què és?
Wikimedia Enterprise és un servei de lliurament de dades que ofereix serveis per a la reutilització de contingut de tercers, lliurats mitjançant els serveis API. Proporciona un gran volum i un accés d'alta fiabilitat al contingut de Wikimedia, dissenyat per a les necessitats d'organitzacions comercials, com ara motors de cerca, assistents de veu i empreses emergents tecnològiques. Aquest servei inclourà una garantia contractual (Acords de nivell de servei) per als clients de pagament. A efectes contractuals, està gestionat per una LLC propietat total de la Fundació Wikimedia.
Al llançament, el servei inclourà el contingut de totes les edicions lingüístiques de tots els projectes germans de Wikimedia excepte Wikimedia Commons i Wikidata. Poder incloure també informació de Wikidata és una prioritat en el full de ruta de desenvolupament. Podeu obtenir més informació sobre el progrés del desenvolupament a través de les actualitzacions tècniques mensuals a pàgina principal del projecte a MediaWiki.org.
Specifically, the API service is provided in three products:
- Snapshot: Retrieve an entire Wikimedia project, updated daily
- On-Demand: Retrieve any article from any Wikimedia project at anytime
- Realtime: Stream real-time updates from any Wikimedia project
M'afectarà com a editor o propietari d'un bot?
No, no canviarà l'experiència d'edició com a editor (humà o bot). Totes les API preexistents seguiran estant disponibles.
Afectarà l'API empresarial als bolcats i a les API actuals?
El sistema d'abocaments de bases de dades i l'API de lliure disposició continua en el seu lloc i continua sent compatible. No s'estan eliminant ni restringint i continuaran rebent suport i desenvolupament. Part de la raó per la qual l'API Enterprise s'està creant per separat és per "no" interrompre els ecosistemes existents.
De fet, l'ecosistema existent de l'API actualment s'està renovant sota la iniciativa "API Gateway". Fins ara, les API i els serveis proporcionats per a la reutilització del contingut de Wikimedia havien de ser capaços de donar suport a les necessitats dels individus i també d'empreses extremadament grans com els motors de cerca.
Això va donar com a resultat un exemple pràctic de tragèdia dels comuns, on posar un servei únic a l'abast de tots per igual, permetia dominar el més gran, la qual cosa reduïa la qualitat del servei per a tots els altres. L'existència de l'API Enterprise, dissenyada per a les necessitats dels usuaris més grans, permetrà crear la nova API Gateway per a individus i amb restriccions contra els usuaris comercials més grans (per exemple, límits de tarifes).
Per què s'anomena "Enterprise"?
El projecte, equip i API es coneixien com a “Okapi”; es tractava d'un nom comodí temporal utilitzat fins que es va determinar un nom oficial definitiu. Un ocapi és un bonic mamífer de l'Àfrica que convenientment inclou les lletres a-p-i en el seu nom. El nom "Wikimedia Enterprise" (i "API empresarial") està destinat a deixar clar qui són els usuaris previstos del servei: les organitzacions amb ànim de lucre. Els criteris importants per seleccionar aquest nom van ser que no implica que el contingut de l'API sigui comercial o exclusiu, o que les API existents estiguessin canviant. El concepte "API empresarial" també apareix en l'estratègia del moviment i, per tant, és coherent amb el seu ús anterior en el moviment. Finalment, era important trobar un nom que no interferís amb els noms existents dels llocs web, afiliats, projectes i equips.
El projecte i l'API no s'han de confondre amb el grup MediaWiki Stakeholders o l'Enterprise MediaWiki Conference, que són respectivament una organització independent afiliada a Wikimedia que defensa les necessitats dels usuaris de MediaWiki fora de la Fundació Wikimedia, incloent-hi les empreses comercials; i un seguit de conferències per a aquesta comunitat.
Afectarà directament al contingut de Wikimedia?
No, l'API permet l'accés a gran volum i a alta velocitat, i la reutilització del contingut d'altres projectes. No té control tècnic o editorial sobre el contingut dels projectes de Wikimedia. Per descomptat, d'acord amb els drets atorgats en el marc de llicències de cultura lliure de Wikimedia, els reusuaris de Wikimedia poden crear treballs derivats del contingut.
A l'accedir al contingut de Wikimedia a través d'aquest nou mètode de consum únic i al signar un contracte de SLA, podrem assegurar-nos que els reutilitzadors a gran escala siguin més consistents i precisos a l'hora de mostrar els drets d'autor i les llicències per al contingut d'altres projectes. Qualsevol reducció en la redifusió inadvertida de contingut vandalizat per part de reutilitzadors a gran escala beneficia la comunitat: enforteix la reputació de la nostra comunitat de seleccionar contingut fiable i redueix la pressió per als membres de la comunitat dedicats a lluitar contra el vandalisme. Amb el temps, l'equip de Wikimedia Enterprise espera crear mecanismes per ajudar els reutilitzadors a reduir la probabilitat que obtinguin contingut vandalizat en els seus productes. Si aquest treball dona com a resultat una millor detecció del vandalisme, les lliçons apreses i/o el codi desenvolupat es compartiran amb la comunitat per millorar les eines i els fluxos de treball i, en conseqüència, per millorar la integritat del coneixement.
A llarg termini, l'equip de Wikimedia Enterprise també espera explorar mètodes (per exemple, "microcontribucions") perquè la nova informació pugui integrar-se en els projectes de Wikimedia per part del públic general que utilitza productes fabricats pels clients de Wikimedia Enterprise. Això està en la línia amb la recomanació de l'estratègia del moviment Millorar l'experiència de l'usuari, que parla de l'ús d'APIs pel "potencial per al retorn de dades". En aquest moment, es realitzarà la consulta adequada a la comunitat per garantir que aquestes contribucions puguin respondre a les necessitats reals de la comunitat, i d'una manera que compleixi amb la cultura editorial de Wikimedia, la política de privacitat, els termes d'ús, etc.
Evitarà que apareguin errors/vandalismes als resultats del motor de cerca?
Ajudarà.
En fer un procés d'ingestió de contingut de Wikimedia més consistent per a organitzacions de tercers que operen a gran escala i a gran velocitat, reduirà la probabilitat que mostrin vandalisme i/o que es redueixi la durada durant la qual es mostra. Els canals de l'API no inclouran funcions exclusives de detecció de vandalisme que no estan disponibles per al públic, però es permetrà que els senyals existents siguin més accessibles per als usuaris reutilitzadors (com ara les puntuacions ORES i la freqüència amb què un article rep modificacions actualment). Això permetrà als clients d'Enterprise disposar de més eines per prendre decisions sobre què mostrar i quan.
De conformitat amb el principi d'obres culturals lliures, la Fundació Wikimedia no controla com els reutilitzadors mostren el contingut dels projectes de Wikimedia, en quin context es mostra o amb quins altres conjunts de dades es combina. Si trobeu una instància de contingut de Wikimedia en un context inadequat en un resultat del motor de cerca, el seu operador tindrà un procediment per proporcionar informació sobre aquest tema. A tall d'exemple, Google té una política per a "com informar d'un fragment destacat".
Quina relació té amb l'estratègia del moviment?
En les recomanacions de l'estratègia del moviment Augmentar la sostenibilitat del nostre moviment i Millorar l'experiència de l'usuari, hi ha indicacions per, respectivament: "Explorar noves oportunitats tant per a la generació d'ingressos com per a la difusió de coneixement lliure a través de col·laboracions i ingressos obtinguts, per exemple [...] Crear API empresarial"; i "Fer que el conjunt d'API de Wikimedia sigui més complt, fiable, segur i ràpid, en col·laboració amb usuaris a gran escala [...] i millorar el coneixement i la facilitat d'atribució i verificabilitat per als usuaris de reutilització de contingut".
Al mateix temps, millorar la nostra API contribueix significativament al nostre progrés en la Direcció Estratègica i en la nostra visió amb contribucions significatives al Coneixement com a Servei i a l'Equitat del Coneixement. En paraules de la recomanació, fer que "el conjunt d'API de Wikimedia sigui més complet, fiable, segur i ràpida, en col·laboració amb usuaris a gran escala quan estigui alineats amb la nostra missió i principis", millorar "l'experiència d'usuari tant dels nostres usuaris directes com indirectes, tot augmentant l'abast i la visibilitat del nostre contingut i el potencial de retorn de dades, i millorar el coneixement i la facilitat d'atribució i verificabilitat per als usuaris de reutilització de contingut".
A més de les dues recomanacions esmentades anteriorment a les quals està connectada explícitament Enterprise, també té un paper a jugar en diverses de les Iniciatives estratègiques. Aquestes inclouen: "3. Augment de la conscienciació sobre el moviment Wikimedia", "36. Identificar l'impacte dels projectes i contingut de Wikimedia" i "desinformació" i "45. Polítiques adaptatives". Moltes de les recomanacions estratègiques impliquen un augment dels ingressos al llarg de tot el moviment: és una estratègia ambiciosa i, en última instància, costosa d'implementar. Per tant, la creació de l'API empresarial durant els anys vinents ens permet desenvolupar aquesta nova font d'ingressos que ajudarà a donar suport de manera sostenible la resta de recomanacions. En conseqüència: també inclou la iniciativa "7. Generació d'ingressos per al moviment".
Reconeixem que en la votació de la comunitat per prioritzar l'ordre en què les recomanacions han de rebre atenció en el moviment, aquestes recomanacions específiques sobre les API eren a la part baixa de la llista. Reconeixem i esperàvem totalment que les recomanacions no fossin d'interès popular. És una activitat que no afecta directament a la comunitat d'editors. No obstant això, és una de les poques recomanacions la resposta de la qual és responsabilitat exclusiva de la WMF. Això vol dir que la WMF pot iniciar aquest projecte de manera immediata i independent de qualsevol altra activitat de l'estratègia sense interrompre, desviar l'atenció, o desprioritzar la resta.
On s'ha discutit anteriorment?
La Fundació Wikimedia ha ofert serveis de dades de pagament des de poc després de la seva creació, i ha proporcionat canals per permetre que tercers allotgin seves pròpies bases de dades locals. La creació d'aquest servei va ser el que va portar a la contractació inicial de Brion Vibber, i es va utilitzar per impulsar la Fundació Wikimedia en els seus primers anys. El servei es va tancar a nous clients el 2010 i va ser finalment donat de baixa el 2014 principalment per falta de manteniment.
La revisió dels serveis de dades a gran escala per ajudar a garantir l'èxit del moviment, independentment de canviar els mètodes de descobriment del contingut de Wikimedia, es va discutir com una possible via d'exploració el 2015 i novament a Wikimedia-l el 2016. La idea es va presentar per dos grups de treball durant la fase 2 del procés d'estratègia del moviment, i el treball per millorar l'ús d'API de tercers es va identificar dues vegades en les recomanacions estratègiques finals (1, 2). L'inici de la feina en el projecte d'API empresarial es va plantejar específicament a a Wikimedia-l a mitjans de 2020.
Nota: Aquestes preguntes freqüents es van publicar el març de 2021. En aquell moment es va publicar un article al blog de Wikimedia, es van col·locar avisos a diverses llistes de correu i a la wiki, i moltes notícies dels mitjans de comunicació generals ho van cobrir, sobretot WIRED. Això va donar lloc a una discussió significativa de la comunitat en aquesta pàgina de discussió, als centres de discussió centrals de moltes wikis i a les xarxes socials. S'ha publicat una llista completa dels mitjans independents que han escrit notícies sobre aquest tema a Wikimedia_Enterprise#Press. A l'octubre de 2021, es va publicar una nota de premsa de la WMF que anunciava que el producte estaria disponible comercialment i es va publicar un informe de l'institut Open Future. Això va ser seguit el juny de 2022 amb una altra nota de premsa anunciant els primers clients del projecte i el sistema d'autoinscripció. S'ha creat una nova pàgina de "notícies" per al projecte a https://enterprise.wikimedia.com/news/ i s'hi publicaran tots els anuncis futurs del projecte.
Finançament
Es tracta de "vendre" o "obligar les grans empreses tecnològiques a pagar" per la Viquipèdia?
No, tot el contingut de Wikimedia està disponible sota llicències obertes i pot ser utilitzat per qualsevol persona per a qualsevol propòsit. Això no canviarà ni es pot canviar. El servei d'API empresarial és un nou mètode per lliurar aquest contingut a un volum i velocitat dissenyats específicament per a les necessitats de les principals organitzacions comercials que ja estan utilitzant el contingut de Wikimedia comercialment. L'API empresarial està venent el servei d'aquest nou mètode d'accés, però no impedeix que ningú (inclosos els clients potencials) utilitzi els mètodes d'accés gratuïts existents.
Molts governs i sectors professionals (com el periodisme) de tot el món estan debatent actualment com construir un model econòmicament sostenible mentre es treballa amb les "grans tecnològiques". La construcció de l'API de Wikimedia Enterprise crea un mecanisme perquè aquelles organitzacions comercials que han construït models de negocis a partir de l'ús de contingut de Wikimedia disponible lliurement també inverteixin en el moviment de Wikimedia d'una manera fiable i contínua.
La comunitat podrà accedir a l'Enterprise API sense pagar?
Sí, per a l'accés massiu, es proporciona una còpia de la sortida de l'API a través del servei de bolcats de bases de dades públiques, actualitzat quinzenalment. Aquesta és la mateixa freqüència amb la qual ja s'estan proporcionant altres bolcats en XML.
Els abocaments diaris i les diferències de cada hora es proporcionen a través del portal de serveis de dades, disponible per a qualsevol persona amb un compte de serveis al núvol de Wikimedia.
També estarà disponible una versió "de prova" del servei en directe a través del lloc web del producte sense cap cost. Aquesta versió està dissenyada principalment per permetre als clients comercials potencials investigar el servei i, per tant, té una tarifa/ús màxim restringit. No obstant això, està permès (i de fet s'encoratja!) que els viquimedistes s'hi registrin i facin servir aquest servei també per a ells mateixos. Les persones amb un cas d'ús rellevant per a la missió de la versió de pagament del servei que no s'aborda anteriorment, o per altres serveis de Wikimedia, poden tenir accés gratuït continu.
Com es gastaran els diners?
La direcció estratègica que pretenem assolir el 2030 requereix, entre altres objectius, una expansió a gran escala en llengües marginades de tot el món i això requerirà un augment significatiu dels ingressos. Més enllà de cobrir el cost del projecte en si, tots els fons generats pels clients d'Enterprise s'utilitzaran per donar suport a la missió dels projectes. Això inclou la inversió en els projectes de Wikimedia, en la comunitat, en les nostres organitzacions del moviment, i a Wikimedia Endowment. Tots els ingressos rebuts a través dels clients Enterprise es tracten de la mateixa manera que altres ingressos sense restriccions rebuts per la Fundació Wikimedia. És a dir, els ingressos van al mateix "pot" que les donacions per correu electrònic o bàners de recaptació de fons, i s'assignen segons el Pla anual de la Fundació Wikimedia.
In these early days, it is difficult to predict when Wikimedia Enterprise will reach profitability and even more difficult to accurately predict how much profit it will produce over the next few years. Once we have a more clear picture of timing and profitability, the Board of Trustees can plan for how they want to invest the profits to support the mission. That is likely to be at least a year away.
Quants diners recaptarà?
The annual financial reports are collated here, beginning in 2022 - the project's first year of operation. This information is also included within the scope of the overarching Wikimedia Foundation annual financial reports. Though not a legal requirement, the publishing of the LLC's financial information separately, and in greater granularity, from the overarching WMF report allows greater transparency of financial operations for this specific project.
No és sorprenent que aquesta sigui una de les preguntes més importants des del punt de vista del model de negoci i, a més, és impossible respondre-la per avançat. S'ha dut a terme una investigació important per conèixer què necessiten i volen els clients potencials de l'API empresarial, cosa que ha determinat el desenvolupament del producte i, en conseqüència, les estimacions d'ingressos potencials al llarg del temps. Una cosa és clara: això no substituirà la nostra necessitat de ser finançats per donacions de lectors. D'acord amb el principi operatiu d'independència financera de Wikimedia Enterprise i amb la declaració associada de la Junta de la Fundació Wikimedia sobre els principis d'ingressos de Wikimedia Enterprise, els ingressos empresarials no relacionats amb Wikimedia Enterprise i altres fonts no superaran el 30% dels ingressos totals de la Fundació Wikimedia. Això vol dir que almenys el 70% del finançament provindrà sempre de donacions i subvencions, etc.
D'acord amb el principi operatiu d'honestedat i transparència de Wikimedia Enterprise, publicarem els ingressos i les despeses globals, diferenciades de les de la Fundació Wikimedia en general, almenys un cop a l'any. A més, segons la declaració de la Junta de la Fundació Wikimedia, se li notificarà per endavant tots els acords previstos que generin ingressos superiors a 250.000 dòlars anuals, tot donant temps per a qualsevol dubte. Això és coherent amb com la Fundació Wikimedia tracta les grans donacions corporatives.
Segons els objectius financers del projecte que es van definir inicialment durant la fase de desenvolupament, el Pla anual 2021-22 preveu "10,2 milions de dòlars en ingressos contractuals i aproximadament 3,6 milions de dòlars en despeses per a Wikimedia Enterprise...".
Afectarà a les donacions per a la recaptació de fons?
No, la Fundació Wikimedia seguirà rebent la gran majoria del seu suport dels lectors. Creiem que això és important perquè la Viquipèdia segueixi sent independent. El finançament derivat de milions de donacions de lectors amb una mitjana de 15 dòlars ens s'alinea amb l'interès públic. Els ingressos de Wikimedia Enterprise complementaran el nostre suport als lectors, però no ho eclipsaran. L'API empresarial és un mecanisme perquè els usuaris corporatius que ja es beneficien de la reutilització del contingut de Wikimedia també contribueixin en els projectes.
Tècnic
Està en codi obert?
Sí. És [$URL publicat com a "versions estables"].
The specific purpose of this API's code, and this service, is to be useful to very large commercial organizations and their unique infrastructural, legal, and metadata requirements. Those organizations are unique not just in the sense of sheer scale but also unique relative to each other: with their own mutually-incompatible way of dealing with similar problems. Given that one of the stated principles of the project is "no exclusivity" of the API – either by contract, or by features – we need to ensure that no user (free or paid) should be unintentionally excluded from being able to use it. Therefore, it was considered preferable to publish stable versions. This ensures that no one builds upon, or has expectations for, code that is not yet fit for everyone's purposes.
Meanwhile, all of the development work itself is tracked as per Wikimedia standard practice publicly and “live” on phabricator.
Per què utilitza infraestructura al núvol operada externament/AWS?
Una de les principals necessitats de Wikimedia Enterprise és tenir la capacitat de crear ràpidament prototips i solucions que puguin adaptar-se a les necessitats dels clients previstos de l'API empresarial. Per fer això, hem optimitzat la iteració ràpida, hem separat la infraestructura dels projectes crítics de Wikimedia i utilitzem acords de nivell de servei (SLA) proporcionats. Al principi, els serveis externs en el núvol ens brinden aquestes capacitats. Si bé hi ha molts avantatges d'utilitzar un núvol extern per al nostre cas, reconeixem que també existeixen tensions fonamentals, donada la cultura i els principis de com es construeixen les aplicacions a la Fundació. Les necessitats dels clients potencials de l'API Enterprise són importants per aconseguir la nostra missió de fer que el coneixement estigui disponible per a tothom. No obstant això, fer servir els recursos existents de la Fundació Wikimedia per desenvolupar productes que responguin a aquestes necessitats subsidiaria els requisits de maquinari d'algunes de les organitzacions comercials més grans de el món.
L'API de Wikimedia Enterprise està allotjada a l'Amazon Web Services (AWS), un sistema molt utilitzat per a aquest tipus de propòsit. No obstant això, no hi ha obligació contractual, tècnica o financera d'utilitzar la infraestructura d'AWS. Estem emmagatzemant contingut de Wikimedia disponible públicament, dades de registre generals i dades d'ús lleugers en AWS. Volem proporcionar acords de nivell de servei (SLA) als clients amb garanties similars a les d'Amazon. La infraestructura existent de la Fundació Wikimedia no proporciona informació equivalent sobre el temps d'activitat. No obstant això, és un aspecte que estem explorant amb Wikimedia Site Reliability Engineering.
Mentrestant, estem investigant alternatives a AWS (i seguim oberts a idees que es puguin ajustar al nostre cas d'ús) per al moment en què aquest projecte estigui més establert i tinguem la confiança de saber quines són les necessitats reals d'infraestructura. Mentrestant, la infraestructura d'allotjament de la WMF segueix sent completament en propietat, independent i no es veu afectada per l'API d'Enterprise.
Per què és un lloc web .com?
La pàgina de portada del servei és enterprise.wikimedia.com, en lloc de .org com altres llocs web operats per la Fundació Wikimedia, per les següents raons:
- Límits de seguretat i privacitat de les dades. Els dominis DNS actuen com a límits tècnics per a les polítiques de privacitat i seguretat de les dades. Atès que Wikimedia Enterprise opera en una infraestructura separada, amb polítiques i controls separats, és més segur no diluir cap d'aquests límits tècnics allotjant Wikimedia Enterprise en un domini com "wikimedia.org" on la Fundació Wikimedia opera els llocs actuals. La Fundació Wikimedia no opera cap altre lloc dins de "wikimedia.com", de manera que això proporciona un límit net.
- Autenticitat. Està permès que un projecte amb ànim de lucre que alhora és propietat d'una organització sense ànim de lucre utilitzi un domini .org. No obstant això, l'equip de Wikimedia Enterprise va considerar que és més precís i honest que el domini sigui .com, ja que és un projecte amb finalitat de lucre.
Com afectarà a Wikidata o al servei de consultes de Wikidata?
L'API de Wikimedia Enterprise no afectarà directament a Wikidata ni al Servei de Consultes de Wikidata (WDQS). Si bé el WDQS és un servei important per als reutilitzadors massius de Wikidata per establir la base de la seva xarxa de coneixement, actualment els objectius de l'API empresarial se centren en la transmissió de contingut proper al temps real, que és un servei diferent al WDQS. Eventualment, part de la informació que els clients de l'API Enterprise obtenen actualment a través del WDQS podria obtenir-se a través de l'API, cosa que pot disminuir el volum d'ús del servei WDQS.
Per què no ho construeixen ells mateixos?
Tots els potencials clients inicials de l'API d'Enterprise ja estan utilitzant contingut de Wikimedia en els seus productes en diversos graus. De forma independent als altres, inverteixen diners en extreure, reestructurar i estandarditzar el nostre contingut per les seves necessitats. No obstant això, el que no poden fer internament és garantir la velocitat, la consistència i la fiabilitat de com els serveis de Wikimedia brinden aquest contingut. És un aspecte que només la Fundació Wikimedia pot oferir. A més, al proporcionar un producte disponible per a qualsevol client, l'API empresarial crea igualtat de condicions per a les empreses més petites que volen utilitzar el contingut de Wikimedia en els seus serveis, però que no tenen els recursos interns dels seus competidors més grans per realitzar les conversions de dades necessàries.
Què són els senyals de credibilitat
És el nom d'una característica del conjunt de dades de l'API. Ajuda a fer que la informació contextual que utilitzen els editors de Wikimedia per fer que les seves decisions editorials siguin més comprensibles dins d'un canal d'API. Per a l'assaig complet que documenta la naturalesa i el seu propòsit, vegeu la seva pàgina de documentació dedicada.
Quan revisen els historials d'edició d'articles, els editors solen tenir en compte molts factors. Aquests inclouen si un article: de sobte ha rebut moltes edicions noves; ha estat editat recentment per diversos comptes de nova creació o per diferents editors "anònims"; s'han revertit edicions freqüents; ha canviat el seu estat de protecció o qualificació de qualitat; o de sobte ha rebut més vistes del normal. Senyals de credibilitat és la transformació d'aquesta informació contextual i en punts de dades de l'API que els reutilitzadors de tercers poden aplicar per prendre les seves pròpies decisions sobre com tractar les noves revisions, en temps real. Per exemple: si un article s'identifica com a relacionat amb "notícies d'última hora", alguns reutilitzadors poden voler respondre a aquest "senyal" actualitzant la seva còpia com més ràpidament millor, mentre que altres poden voler aturar temporalment les seves actualitzacions.
Aquesta funció no són puntuacions, filtres, rànquings o judicis de valor de "modificacions bones o dolentes". Tampoc és una IA que pren decisions sobre la precisió, la veritat o la qualitat del contingut. Es pot extreure una llista completa de camps en la creació de qualsevol "senyal" donat a https://www.mediawiki.org/w/api.php En avançar en l'objectiu estratègic de "Coneixement com a servei", esperem que els senyals de credibilitat ampliïn el nombre de tercers que incorporen informació en temps real de Wikimedia, redueixin la barrera d'entrada de fer-ho i disminueixin els casos de vandalisme, etc. Al seu torn, que generin confiança en el contingut de Wikimedia i en el treball del moviment.
What is Breaking News
Just like "Credibility signals", this is the name for a a feature of the API. It identifies new and likely "newsworthy" events as they are being written about across Wikipedia language editions at any given moment. These events are then marked with a boolean field, allowing API users to easily identify this kind of content within their copy of the dataset. For a full essay documenting the nature and purpose of this, and how you can access it yourself, see its dedicated documentation page.
Consistent with the Wikimedia Enterprise principles (in particular that of "no exclusive content") the information this API feature is built upon is already public information that Wikimedia editors are already commonly using in their content moderation workflows – for example "does this article have a sudden increase in the number of pageviews, or of unique editors?", "was this article recently created/moved and have a 'current event' template?". The feature turns that kind of information into a feed of articles which API users can treat differently, if they wish. For example to re-index these articles more rapidly, or to pause re-indexing entirely until the content becomes more stable. This feature does not imply a change of Wikipedia editorial policy: most particularly regarding notability, reliable sources – summarised in the English Wikipedia policy "NOTNEWS".
What is Structured Contents
Within the Enterprise API suite, Structured Contents refers to the features making Wikimedia data more machine readable: these efforts are both focussed on pre-parsing Wikipedia snippets as well as connecting the different projects closer together. The Structured Contents endpoint (beta) has been released in September 2023 to the On-demand API, as a means to both facilitate more frequent updates as well as improve transparency in the development process. This endpoint includes pre-parsed Wikipedia abstracts, main images, descriptions, infoboxes and sections. To access this structured information in bulk the Structured Contents Snapshot endpoint (beta) in some languages was released to testing partners, and a public version made available on Hugging Face. Features will be continued to be added to this endpoint, see the Mediawiki Updates page.
Legal
Per què ho administra una empresa subsidiària?
La Fundació Wikimedia ha creat una societat de responsabilitat limitada (LLC) d'un sol membre, i és aquesta LLC la que signarà els contractes amb els clients de l'API Enterprise. L'estructura de l'LLC aïllarà la Fundació de les responsabilitats generades pel servei. És un enfocament estàndard quan una organització sense ànim de lucre du a terme una activitat amb finalitat de lucre, i ens ajudarà tant a administrar el risc com a promoure la transparència. Dit això, la Fundació encara està obligada segons la llei dels EUA a difondre públicament els ingressos i despeses de l'LLC en les nostres declaracions d'impostos anuals (vegeu els informes financers auditats aquí). L'LLC opera sota els auspicis de la Fundació Wikimedia, el seu personal són treballadors de la Fundació Wikimedia i, en última instància, està subjecte al govern de la junta directiva de la Fundació Wikimedia (WMF). La junta de l'LLC que supervisa el projecte prové de la direcció de la Fundació Wikimedia, en representació de les funcions del personal de la WMF, i el "president" de l'LLC és el director de desenvolupament de negoci de la WMF.
Podeu veure els contractes que formen la relació jurídica entre la Fundació Wikimedia i aquesta LLC a la Wiki de Governança. Respectivament, són:
- Acord d'operació d'LLC que estableix formalment l'LLC i la WMF com a únic membre
- Acord de llicència entre empreses que tracta el dret de l'LLC a utilitzar les marques comercials de Wikimedia, etc.
- Acord de repartiment de costos que parla de com es comptabilitzen els ingressos i les despeses de l'LLC amb la WMF
El registre legal de l'LLC es pot trobar a la Divisió de Corporacions de l'Estat de Delaware, amb el nom de l'entitat: Wikimedia, LLC, Número de fitxer: 7828447. Als Estats Units, la creació d'una entitat legal a l'estat de Delaware és habitual perquè el cos de dret corporatiu de Delaware està ben desenvolupat i fàcil d'entendre. L'ús de l'LLC per operar Wikimedia Enterprise ajudarà a aïllar la Fundació Wikimedia de l'exposició. La claredat de la llei corporativa de Delaware afavoreix aquest objectiu i també redueix els costos legals tant a curt com a llarg termini. Com a organització sense ànim de lucre, l'LLC que es registra a l'estat de Delaware no crea cap diferència en la nostra obligació fiscal federal dels Estats Units ni en la transparència financera en els requisits d'informació fiscal que estar registrada a qualsevol altre estat.
L'avaluació del tractament fiscal adequat de les activitats de l'LLC s'ha coordinat amb els auditors de la Fundació Wikimedia KPMG.
Qui són els clients?
L'API empresarial es va dissenyar inicialment per a les necessitats d'un nombre molt reduït d'organitzacions tecnològiques que són algunes de les empreses més grans i riques del món, conegudes comunament com a GAFAM. Com que no hi haurà contractes ni contingut exclusius, el desenvolupament d'aquest producte també ajudarà a oferir la possibilitat que les organitzacions comercials més petites puguin beneficiar-se de l'ús del contingut de Wikimedia en els seus productes. Aquest fet també es descriu al projecte Open Futures com a "rebaixant el terreny de joc", i és coherent amb la discussió de la Direcció Estratègica sobre "el coneixement com a servei".
En entrevistar moltes organitzacions de molts sectors comercials, va quedar clar que hi ha molts més clients potencials que només la "gran tecnologia". Les seves necessitats són diferents i, per tant, el full de ruta del producte s'ajustarà al llarg del temps per satisfer aquesta demanda, centrant-se a facilitar la integració i la comprensió del complex ecosistema d'informació de Wikimedia (a través de coses com senyals de credibilitat i subconjunts d'informació; vegeu el full de ruta).
As stated in the original press release, Google and the Internet Archive are the first to receive paid and free access (respectively) but we have not publicized the subsequent customers (paid or free) who have signed up to the service. Maintaining a public and comprehensive list of paying and free/trial customers would look like advertising or promotion of those customers. It would also introduce a new privacy (and potentially security) problem: In the same way that it would be inappropriate to make a public list of "all individuals who have used the Wikidata Query Service this month" (for example), making a public list of all organizations who have used this service goes against our privacy culture. Nonetheless, we do intend to be making "use case" blog posts, which will describe how some users (either general categories or individual cases with their permission) are benefiting from the service in the real world. No one is required to publish whether, or how, they read or reuse Wikimedia content. This is consistent with that practice.
Segons la declaració de la Junta de la Fundació Wikimedia, es notificarà per avançat tots els clients potencials que s'espera que generin ingressos superiors a 250.000 dòlars anuals, cosa que permetrà temps per resoldre qualsevol dubte. Això és coherent amb com la Fundació Wikimedia tracta les grans donacions corporatives. Com a organització amb seu als EUA, no està legalment permès fer negocis amb organitzacions amb seu a certs països, segons ho determina l'Oficina de Control d'Actius Estrangers.
Què estableixen els contractes?
Els contractes amb els clients generalment inclouran termes que regeixen la durada del compromís, el tipus d'atenció al client i el temps esperat, el cost, els mecanismes per resoldre disputes, garanties sobre l'atribució apropiada al context i la informació de llicències, i les restriccions sobre la reutilització de l'API per crear una negoci que sigui competència (alhora que reafirma la llicència de cultura lliure subjacent del contingut). Com es descriu en el document de principis, el contracte no atorgarà contingut ni accés exclusius, dades privades o dels usuaris o influència editorial; i no inclourà restriccions sobre com es pot usar el contingut que siguin contràries a les llicències de copyleft del contingut.