Abstrakní Wikipedie/Diskuse o licencování
(Aktualizace: 2021-12-23) Diskuse o licencích byla ukončena. Máme rozhodnutí na základě diskuse. |
Abstraktní Wikipedie je dlouhodobý projekt, jehož cílem je kombinovat obsah z nových a stávajících projektů Wikimedia a umožnit přispěvatelům vytvářet a udržovat články Wikipedie nezávisle na jazyce. Abstraktní Wikipedie bude vytvořena s využitím softwarových funkcí vytvořených přispěvateli a obsahu z jiných projektů Wikimedia, především Wikidat, za účelem generování textu ve více jazycích.
Stejně jako ostatní projekty Wikimedia budou Wikifunkce do značné míry spoléhat na obsah poskytovaný přispěvateli. Wikifunkce budou také do značné míry spoléhat na rozhodování přispěvatelů o vývoji všech politik projektů. Proto bychom měli společně rozhodnout, které licence budeme používat pro součásti Abstraktní Wikipedie.
Více informací o Abstraktní Wikipedii a Wikifunkcích najdete na stránce Abstraktní Wikipedie.
Tým Abstraktní Wikipedie požádal právní oddělení nadace Wikimedia Foundation o stanovisko k tomu, jaké licence by byly přijatelnou volbou pro jednotlivé vrstvy v rámci Wikifunkcí a jaká další právní rizika je třeba při výběru licence zvážit. Tento dokument vychází z jejich doporučení a pokynů.
Na této stránce je nejprve popsáno, co jsou tyto jednotlivé komponenty zač. Poté popisuje, které licence mají smysl pro kterou komponentu. Poté následuje diskuse o různých možnostech a jejich vzájemných interakcích. Stránku uzavírají vyjádření jednotlivých názorů.
Přehled a žádost
- (Aktualizováno: 2021-12-03)
Všechny příspěvky do Wikifunkcí a dalších projektů Abstraktní Wikipedie budou zveřejňovány pod svobodnými licencemi. Textový obsah na Wikifunkcích bude zveřejňován pod licencí CC BY-SA, signatury funkcí a další strukturovaný obsah pod CC-0. Musíme se rozhodnout, zda abstraktní obsah pro Abstraktní Wikipedii zveřejníme pod CC BY-SA nebo pod CC 0 a zda implementaci kódu zveřejníme pod Apache nebo GPL.
Rádi bychom věděli, které licence byste preferovali, a také zda máte další návrhy, připomínky, obavy atd. Prosím, ozvěte se na diskusní stránce.
Plánujeme shrnout diskusi a názory někdy kolem 16. prosince, návrh shrnutí a návrh rozhodnutí ponechat do 20. prosince a rozhodnutí dokončit těsně po nebo během úředních hodin, pokud bude zpětná vazba pozitivní.
Komponenty
Důležitým krokem na cestě k Abstraktní Wikipedii jsou Wikifunkce, wiki se softwarovými funkcemi, které lze kombinovat s položkami z Wikidat. Wikifunkce budou softwarovou hostovanou platformou, která uživatelům umožní psát a spouštět kód z webového prohlížeče. Wikifunkce umožní uživatelům odesílat a spouštět funkce, které mohou zahrnovat obsah z jiných projektů Wikimedia.
Pro účely licencí se zabýváme obsahem na čtyřech úrovních:
- Signatury funkcí: Definice funkce, tj. její název, počet a typy vstupních argumentů a typ výstupu;
- Implementace funkce: Kód, který je volán a prováděn v rámci Wikifunkcí, který může zahrnovat kód zaslaný přispěvateli a knihovny dostupné na platformě;
- Abstraktní obsah: abstraktní reprezentace textu nebo textových fragmentů, která je v podstatě souborem specializovaných volání funkcí pro vytvoření výstupu; a
- Výstupní obsah: text vytvořený voláním implementací funkcí na abstraktní obsah, který často obsahuje obsah Wikidat.
Příklad každého z nich je uveden v následující části.
Na následujícím obrázku jsou načrtnuty jednotlivé komponenty Abstraktní Wikipedie, které jsou důležité pro tuto diskusi. Jednotlivé komponenty popisujeme v následujícím textu.
Wikifunkce se budou skládat ze signatur funkcí, implementací funkcí a dalších objektů. Tyto další objekty mohou být různých typů a množina typů je rozšiřitelná. Objekty budou mít dokumentaci.
Signatury funkcí jsou jako API, udávají název funkce a parametry a také typy parametrů a výsledku. Implementace jsou zdrojové kódy funkcí - říkají počítači, jak má z argumentů vytvořit odpověď. Dokumentaci lze vytvořit pro jakoukoli signaturu, implementaci a jakýkoli jiný objekt ve Wikifunkcích. Dalšími objekty ve Wikifunkcích mohou být testery, jednotlivé řetězce, seznamy, typy, abstraktní obsah atd.
Některé z funkcí budou funkce, které přijímají abstraktní obsah a generují z něj výstupní obsah (často text v přirozeném jazyce). Některé funkce budou přistupovat k datům ve Wikidatech nebo na jiných místech a generovat z nich text v přirozeném jazyce. Funkce mohou pro generování textu používat lexikografická data z Wikidat.
Vygenerovaný text může být začleněn do každé Wikipedie, aby se zaplnily mezery ve znalostech.
Příklady komponent
Poznámka: Tyto příklady jsou velmi zjednodušené a ukazují příkladové hodnoty v angličtině, které by technicky byly QID Wikidat pro internacionalizaci (příklady).
Při daném konstruktoru Superlative s klíči subject, quality, class a location constraint můžeme mít následující abstraktní obsah:
Superlative( subject: Jupiter, quality: large, class: planet, location constraint: Solar System)
Ve Wikifunkcích bychom měli následující signaturu funkce:
generate text(superlative, language) : text
Tj. funkce, která přijme nadřazený objekt (jak je uvedeno v abstraktním obsahu výše) a jazyk (např. angličtinu) a vrátí text.
Tohle by pak mohla být možná implementace funkce v jazyce Python:
def generate_text(superlative, language): if language == English: subject = get_label(superlative.subject, language) adjective = superlative_form(superlative.quality, language) class = singular_form(superlative.class, language) location_clause = make_location_clause(superlative.location_constraint, language) text = ‘ ‘.join(subject, ‘is the’, adjective, class, location_clause) return text.capitalize_first(text) if language == Hausa: ... ...
Aplikace funkce na abstraktní obsah by vedla k následujícímu výstupu:
(anglicky) Jupiter is the largest planet in the Solar System.
(chorvatsky) Jupiter je najveći planet u Sunčevom sustavu.
Tento text pak může být zobrazen v jazykové verzi Wikipedie, aby poskytl společný základ znalostí o Jupiteru.
Právní analýza a autorskoprávní normy podle typu obsahu
Hnutí Wikimedia přijalo obecnou licenční politiku, která upřednostňuje licence svobodné kultury a licence softwaru s otevřeným zdrojovým kódem. Listina Creative Commons Zero (CC0) poskytuje výjimku, jejímž cílem je zajistit, aby byl obsah na celém světě ve veřejném vlastnictví (nebo v místním ekvivalentu veřejného vlastnictví). Licence Creative Commons Attribution-ShareAlike (CC BY-SA) umožňuje lidem používat obsah při dodržení minimálních požadavků na uvedení autora a zajištění, že následné úpravy budou zveřejněny za podmínek kompatibilní licence. V případě softwaru se Wikimedia řídí seznamem schválených licencí od Open Source Initiative (OSI).
Fakta
Samotná fakta obecně nejsou chráněna autorským právem. Ve Spojených státech amerických popsal Nejvyšší soud tuto zásadu v rozsudku Feist Publications Inc. v. Rural Telephone Service Co.: "Nejzákladnějším axiomem autorského práva je, že "není možné, aby autor chránil autorským právem své myšlenky nebo skutečnosti, o nichž vypráví".". Jedná se o základní prvek autorského práva, který platí bez ohledu na to, zda je obsah výslovně uvolněn na základě licence.
Projekty Wikimedia přijaly CC0 pro projekty, které jsou určeny ke shromažďování základních faktů. Jedná se například o položky nebo vlastnosti na Wikidatech nebo strukturovaná data na Wikimedia Commons. CC0 poskytuje základní, mezinárodní zřeknutí se autorských práv, aby bylo zajištěno, že faktografický obsah lze volně a bez omezení používat. To usnadňuje objevování, opakované používání a citování obsahu jinde. Tato licence může zahrnovat i nechráněná fakta, která jsou zkopírována ze zdrojů pod jinými licencemi, například text z Wikipedie, který je jinak dostupný pod licencí CC BY-SA.
Software
Software je obecně chráněn autorským právem, ačkoli ne všechny komponenty softwaru by měly být posuzovány stejně. Wikimedia zastává stanovisko, že architektura a základní funkce rozhraní API nejsou podle amerického práva chráněny autorským právem.
V případě softwaru, na který se vztahují autorská práva, nadace používá licenci otevřeného softwaru, která umožňuje jeho volné opakované použití za minimálních podmínek. Hlavní zásady svobody a otevřeného zdrojového kódu Wikimedia stanoví, že Nadace by měla uvolnit veškerý kód, který vytvoří, pod platnou open source licencí. V oblastech, kde Wikimedia podporuje software vytvořený uživateli, jako jsou například služby Wikimedia Cloud, rovněž vyžaduje, aby byl tento software uvolněn pod licencí open source. Existuje široká škála licencí, které lze považovat za open source, takže pro objasnění tohoto požadavku se Wikimedia obvykle obrací na seznam licencí schválených OSI pro software.
Základní licencí softwaru MediaWiki je copyleft licence GNU General Public License (verze 2.0 nebo novější) a pod touto licencí je k dispozici většina rozšíření, designů a knihoven PHP. Pro některé další projekty Wikimedia používá liberálnější licence, například licenci MIT nebo Apache (verze 2.0).
Textový nebo multimediální obsah
Podle licenční politiky Wikimedia licenční pravidla pro obsah mohou projekty Wikimedia hostovat obsah, který je k dispozici pod svobodnou licencí k obsahu, ve veřejném vlastnictví (například obsah, jehož autorská práva vypršela, nebo obsah, na který se nevztahují autorská práva), nebo který lze za určitých omezených okolností spravedlivě použít. Pro většinu projektů Wikimedia, včetně Wikipedie, to znamená, že text a média jsou k dispozici pod licencí CC BY-SA (verze 3.0).
Doporučení právního oddělení WMF
Wikimedia by měla stanovit licenci pro každý typ obsahu prostřednictvím jasných a jednoduchých zásad pro Wikifunkce. Wikimedia by měla vytvořit dokumentaci, která vysvětluje licence pro každý typ obsahu, včetně důvodu výběru této licence. Zejména pro software by měly existovat pokyny o tom, že kód třetích stran lze importovat pouze pod přijatelnou licencí. Uživatelské rozhraní by mělo obsahovat udělení licence vhodné pro každou formu obsahu.
Signatury funkcí
Doporučení: Signatury funkcí by měly být CC0.
Signatury funkcí by se měly skládat ze základních komponent (např. seznamu parametrů), které jsou založeny na základní funkčnosti. Vlastní obsah signatur funkcí pravděpodobně nebude chráněn autorským právem, nebo pokud chráněn je, může být v USA použit v rámci fair use. CC0 je vhodnou licencí pro informace, které nemusí být vůbec způsobilé k ochraně autorských práv. Použití CC0 zabraňuje vyvolávání nejasností nebo klamání opakovaných uživatelů, kteří se domnívají, že existují omezení autorských práv tam, kde žádná neexistují. Kromě toho CC0 zajistí maximální interoperabilitu s ostatními licencemi pro otevřený zdrojový kód nebo svobodnou kulturu.
Implementace funkce
Doporučení: Implementace funkce by měla být pod licencí Apache.
Implementace funkce by měla být pod licencí schválenou organizací OSI. Pokud si tým Wikifunkcí a komunita přeje omezit tuto funkci na jednu licenci, pak by licence Apache poskytovala ideální úroveň permisivní flexibility.
Kromě toho mohou Wikifunkce povolit i jiné přípustné licence, které jsou kompatibilní s licencí Apache, například licenci MIT nebo (třídílnou) licenci BSD. Povolení další sady licenčních možností může uživatelům umožnit importovat více obsahu z jiných zdrojů třetích stran. Vyžadovalo by to však také vytvoření dalších požadavků na software, například uživatelského rozhraní pro výběr licence a zobrazení příslušných licenčních upozornění. Wikifunkce mohou při počátečním spuštění zvolit pro jednoduchost jedinou licenci a později podle potřeby zvážit přidání podpory více licencí.
Abstraktní obsah
Doporučení: Abstraktní obsah by měl být licencován pod CC BY-SA nebo CC0.
Abstraktní obsah může být zveřejněn pod licencí CC BY-SA nebo jinou stejně povolenou licencí, která vyhovuje cílům projektu a splňuje licenční politiku Wikimedia. Wikimedia má značnou volnost při výběru nejlepší licence pro abstraktní obsah.
Volba CC BY-SA by byla standardní volbou a měla by výhodu konzistence s Wikipedií a většinou ostatních projektů Wikimedia. Umožnila by uživatelům určitým způsobem kopírovat a začleňovat obsah Wikipedie do abstraktního obsahu. Vyžadovalo by to však také zachování historie úprav nebo nějakého rovnocenného mechanismu historie příspěvků pro abstraktní obsah, který by umožnil lidem uvádět údaje o autorech obsahu.
Případně by mohl být Abstraktní obsah zveřejněn za přípustnějších podmínek CC0. To by softwaru umožnilo obejít požadavky na uvádění autorství, ale omezilo by to možnost uživatelů kopírovat nebo začleňovat jakékoli chráněné části článků Wikipedie nebo jiných zdrojů.
Výsledný obsah
Doporučení: Výstupní obsah by měl být licencován pod CC BY-SA nebo CC0.
Vzhledem k tomu, že výsledný výstupní obsah je generován pomocí softwaru, který kombinuje více zdrojů dat, mohou se vyskytnout otázky, zda je výsledný produkt vůbec chráněn autorským právem. V roce 2019 požádal americký úřad pro autorská práva o připomínky k tomu, jak by se mělo s obsahem vytvořeným algoritmy nebo procesy umělé inteligence zacházet podle autorského práva. V odpovědi na podání nadace Wikimedia Foundation v reakci jsme vysvětlili, že s algoritmy umělé inteligence by se mělo zacházet jako s jakýmkoli jiným softwarovým nástrojem a že uživatel nástroje by měl být považován za držitele autorských práv. Podle stejné zásady může Wikimedia považovat výstupní obsah za tvůrčí dílo autorů abstraktního obsahu. Bylo by proto pravděpodobně nejefektivnější, kdyby byl výstupní obsah licencován konzistentně se stávajícími projekty Wikimedia, a komunity by mohly diskutovat o tom, která z aktuálně používaných licencí by byla preferována.
Doporučení vývojového týmu
Vývojový tým doporučuje řídit se doporučeními právního oddělení, která jsou (zkráceně): zvolit CC0 jako licenci pro signatury funkcí; Apache pro implementace funkcí (a začít s jedinou licencí, a teprve když rozpoznáme potřebu více licencí, rozšířit Wikifunkce tak, aby podporovaly více licencí); zvolit buď CC0 nebo CC BY-SA pro abstraktní obsah a výsledný výstupní obsah.
Pro dokumentaci a další textový obsah Wikifunkcí zvolíme CC BY-SA, abychom zachovali kompatibilitu s většinou ostatních projektů Wikimedia, pokud jde o textový obsah. Pro ostatní objekty ve Wikifunkcích kromě implementací zachováme konzistenci s volbou pro signatury funkcí.
Vývojový tým dále doporučuje zvolit CC BY-SA pro Abstraktní obsah a výsledný výstupní obsah. Ačkoli by se dalo namítnout, že Abstraktní obsah se více podobá strukturovaným datům Wikidat než textu v přirozeném jazyce Wikipedie, domníváme se, že existuje řada faktorů, díky nimž je Abstraktní obsah dostatečně podobný textu:
- Editoři mohou velmi jemně vybírat, které skutečnosti se zobrazí a které ne. Ve Wikidatech se snažíme o úplnost před pečlivým výběrem.
- Editoři mají velmi jemnou kontrolu nad pořadím, v jakém se fakta zobrazují, a tvoří tak narativní prvky, které ve Wikidatech nejsou k dispozici.
- Očekáváme, že generování přirozeného jazyka umožní editorům vyjádřit do určité míry důraz a výběr formulací.
Všechny tyto skutečnosti ukazují na to, že Abstraktní obsah se více podobá textu než souboru faktů, a proto navrhujeme, abychom se řídili stejnou licencí, jakou používáme pro text ve Wikipedii, tedy CC BY-SA. Na druhou stranu lze namítnout, že zařazením Abstraktního obsahu pod CC0 otevíráme prostor pro větší množství možných opakovaných použití v aplikacích, které si zatím ani neumíme představit, natož pro ně správně rozhodnout právní rámec. CC0 zcela jistě umožňuje největší volnost při opětovném použití abstraktního obsahu.
Žádost o komentář
Rádi bychom vyzvali komunitu k diskusi o těchto doporučeních a doufáme, že se nám podaří najít shodu ohledně rozhodnutí o licencování. Cílem je udržet diskusi otevřenou po dobu přibližně čtyř týdnů a v případě potřeby ji prodloužit a restrukturalizovat. Pokud by se ukázalo, že to k dosažení konsensu nestačí, mohli bychom diskusi o licencích restrukturalizovat tak, aby se prozatím soustředila pouze na Wikifunkce, a pak na ni navázat diskusí o Abstraktní Wikipedii.
Pro výběr licence může být užitečné zvážit a prodiskutovat následující otázky:
- Jaké jsou dlouhodobé cíle projektů a jak může licence tyto cíle podpořit?
- Měli by lidé podílející se na tvorbě Abstraktního obsahu získat kredit?
- Jak cenné je zachovat konzistenci a kompatibilitu s licencemi ve Wikipedii?
(Aktualizováno: 2021-12-03)
Konkrétní otázky pro komunitu jsou dvě: zda máme pro Abstraktní obsah Abstraktní Wikipedie používat CC BY-SA nebo CC 0 a zda máme pro implementaci kódu používat Apache nebo GPL.
I když si myslíte, že obě možnosti jsou v pořádku, bylo by skvělé, kdybyste se vyjádřili explicitně, abychom lépe pochopili, k čemu se komunita přiklání.
Komentáře jsou vítány v jakémkoli jazyce.