ItWikiCon/2024/Programma/Proposte/Sessioni/AI e Wikimedia/Report

La sessione AI e Wikimedia è iniziata con una presentazione frontale di Alessio Melandri sull'Intelligenza Artificiale in cui ha trattato temi come l'IA debole, il funzionamento di esse, la produzione di differenti tipi di testo (dalle barzellette alle query SPARQL, seppur malfunzionanti per i noti problemi dell'IA sui numeri, AI wiki-like, ) e il come la nostra licenza libera le abbia favorite (siamo forse tra i pochi casi di contenuti non a rischio copyviol) e infine l'IA forte, che oggi non esiste né si sa se potrà esistere veramente.

E infine una grande domanda: che IA serve per replicare i 20 anni che abbiamo speso sui progetti? Wikipedia e Wikisource è facile, OSM anche...

La presentazione di Ilario

edit

Ilario ha poi aperto una presentazione su temi più "morali" come la neutralità, l'hype circle e la possibilità che l'IA faccia scomparire Wikipedia: per ora pare che, invece, ci stia portando più visualizzazioni (forse chi vuole verificare le info di ChatGPT? L'inizio comunque ha causato un calo), l'effetto sui progetti minori e il calo degli utenti registrati.

Secondo Ilario, l'IA potrebbe portare alcuni utenti a lasciarci, così come potrebbe essere utilizzata per manipolare massivamente articoli oggetto di propaganda e mette in crisi il modello collaborativo di Wikimedia, fondato sull'umano, ma vi sono anche lati positivi: aiuto al patrolling, miglioramento dei contenuti, assistenza ai progetti minori e ridurre il divario tra le varie edizioni linguistiche.

Gli scenari che propone Ilario sono uno continui, dove Wikimedia continua come oggi, o uno rivoluzionario, che integri l'IA: per WMF va usata in modo etico e collaborativo e non può sostituire la comunità e l'umano.

I rischi? Il copyright, i contenuti dell'IA potrebbero essere addestrati su contenuti in copyviol e non tutti i Paesi considerano i loro prodotti come nel pubblico dominio. I contenuti possono portare a bias fondati sulla cultura dominante (esempi: guerre coloniali) e sono spesso non trasparenti.

E c'è anche il rischio di un circolo: l'IA si addestra su Wikipedia, Wikipedia viene scritta da chi usa l'AI e l'AI torna su Wikipedia. Ma può essere sia vizioso che virtuoso.

STORM: la generazione automatica di articoli stile Wiki: l'esperienza di Ilario non è delle migliori (mischia autori e calciatori...)

Cosa sta facendo WMF?

edit

WMF non è stata un'early adopter, soprattutto per ragioni tecniche: abbiamo più spazio dati che potenza di calcolo, utile per distribuire contenuti, non per addestrare algoritmi!

Esiste comunque un impegno per l'IA nella Fondazione e in vari capitoli nazionali: c'è chi vuole modificare l'infrastruttura per costruire un'IA al servizio della comunità (ORES), chi ricerca e finanzia (Research Team) e anche Abstract Wikipedia, una sorta di Wikipedia centralizzata indipendente dalla lingua.

WMDE lavora con società private per collegare Wikidata all'IA.

Domande del pubblico alla presentazione

edit
  • Tool per identificare IA: esistono ma non sono perfetti, semplice statistica con falsi positivi (Ferdinando, Alessio)
  • Neutralità: per Wikimedia è mostrare la pluralità, si può chiedere all'IA, è difficile ma fattibile, oggi poco diffuso (per Ilario c'è possibilità di tool interlingue che confrontano per vedere la neutralità comparata)
  • Come ORES ci dà fiducia: tema importante, tecnologia e server non adeguati
  • Wikidata: importante, perché contiene dati puntuali e non semplici testi, oggi Alessio non si fida né a occhi aperti né chiusi, però è aperto a evoluzioni (aggiunge Hjfocs che l'allenamento avviene non tanto per conoscenza quanto per analisi del testo grezzo, legge caratteri arbitrari, noi abbiamo dati strutturati)
  • Wikimedia è indipendente, dunque usare altre AI potrebbe essere problematico e renderci più dipendenti, ma al momento nessuno nel movimento Wiki è in grado di farlo, sia per ragioni tecniche e legali. (Alessio) Ilario dice che WMFR vuole lavorare ad una propria IA e menziona anche SwissAI, intelligenza artificiale nazionale svizzera su supercomputer che sarà aperta, ma è difficile trovare una IA matura, i paletti legislativi sono un possibile rischio per la crescita e fare un'IA aperta è difficile, aperto diverso rispetto a WMF

Gruppi di lavoro

edit

I partecipanti sono poi stati divisi in 4 gruppi a rotazione, guidati da un host, e fondati su quattro domande:

  1. Quali sono le opportunità nell'IA?
  2. Quali sono i rischi e minacce ci sono oggi nell'IA?
  3. Uso dell'IA nei progetti Wiki: cosa renderebbe obsoleto e cosa cambierebbe?
  4. Quale sarà il ruolo dei progetti Wiki nel mondo con l'IA sempre più sviluppata?

Vi è stata poi una restituzione in plenaria.

Rischi e minacce

edit

Presenta Hjfocs, il gruppo ha trovato questi rischi e minacce:

  • Difficoltà nel capire i contenuti generati da IA
  • Rischio di vandalismi di massa
  • Controllo delle fonti, output opaco
  • Identità dell'autore
  • Bias, dato da corpora molto localizzati (cinese, inglese), ma con output multilingue
  • Che scelta per i progetti? Si potrebbe uscire dalla partita con licenze che vietano di usare i contenuti ma è un rischi
  • Il mito della crescita infinita: l'IA potrebbe non crescere sempre com'è cresciuta sino ad ora

Scenari futuristici

edit

Presenta Marta, il gruppo ha concluso con queste ipotesi:

  1. Wikipedia potrebbe scomparire, ma potrebbero continuare i repository come Data, Commos e Source per alimentare una AI affidabile, con progetti molto più grandi e universali e output multimodali
  2. Abbattimento delle differenze linguistiche e delle altre barriere, forum mondiali, con consensi globali
  3. Mappe adeguate automaticamente tramite smartphone senza intervento umano
  4. Presidio di conoscenza bene comune e variabile umana che resti nel loop di creazione contenuti
  5. I progetti Wiki potrebbero diventare marginali nell'ecosistema del sapere

Cambiamenti

edit

Presenta Torque, il gruppo ha concluso con queste ipotesi:

  • IA ottimale per compiti semplici, ripetitivi e continui, in sostanza i nuovi Bot
  • Aggiornamento automatico di dati in import
  • Nuovi tipi di utenza (verificatori IA?)
  • Più tempo libero per gli utenti per contribuzione creativa e divulgazione esterna
  • Commons: suggerire, creare e migliorare categorie
  • Superare il blocco dello scrittore
  • Migliorare messaggi e comunicazione tra utenti e tra Wiki e utenti
  • Tutoraggio automatico, esterno e interno
  • Nuove policy e automod