Etytree, un database di relazioni etimologiche
Etytree, un database di relazioni etimologiche Ester Pantaleo | |
Tipologia | presentazione e discussione |
Sala | 3 |
Giorno | sabato 18 |
Orario | 10:30-11:30 |
Appunti condivisi | Appunti su etherpad |
Foto su Commons | Link |
Slides | Link |
Torna al programma |
In questa presentazione Ester descriverà etytree, un tool che sta sviluppando. Etytree è un dizionario etimologico multilingue in forma grafica ed è basato su dati estratti dal Wiktionary inglese. Etytree si distingue da un classico dizionario etimologico in quanto non si presenta in forma testuale ma in forma grafica e permette di visualizzare in un'unica pagina come diverse parole (anche in diverse lingue) sono etimologicamente legate fra di loro e come esse siano derivate da uno stesso progenitore[1]. Il database lessicografico su cui si basa etytree contiene ~1.6 milioni di relazioni etimologiche in ~3mila lingue e viene rigenerato ad ogni nuova pubblicazione del dump XML del Wiktionary inglese.
Ester descriverà come ha creato il database, spiegherà perché ha scelto il Wiktionary inglese, e mostrerà una prima versione del tool che permette di esplorare il database attraverso un'interfaccia grafica. Parlerà anche di come questo database potrà eventualmente diventare parte di Wikidata. Dopo la presentazione, ci sarà spazio per una conversazione sul Wikizionario e su come il suo contenuto possa eventualmente aiutare a migliorare etytree.
Questo lavoro si basa sul lavoro del prof. Sérasset[2], ed è stato seguito dal prof. Di Noia del Politecnico di Bari. Il progetto inoltre si è avvalso della collaborazione di V.W. Anelli e A. Ferguson. Il progetto è finanziato da un IEG grant della Wikimedia Foundation.
Prerequisiti
editLa presentazione è aperta a tutti. Non richiede particolari conoscenze tecniche. La discussione è anch'essa aperta a tutti. Sarebbe interessante poter discutere anche con editori del Wikizionario, di Wiktionary o di Wikidata.
Temi trattati
editIn questa presentazione si parlerà degli argomenti elencati di seguito:
- etytree e il suo SPARQL endpoint
- Wiktionary, versione inglese, i suoi template e il wikitext
- etimologia
- Wikidata e l'integrazione https://www.mediawiki.org/wiki/Extension:WikibaseLexeme/Data_Model
- alcuni argomenti tecnici (in maniera informale): regex, grammar, database RDF, d3.js
Obiettivi
editCoinvolgere la comunità italiana nel progetto, e introdurla al tool per ricevere feedback. Coinvolgere editor o sviluppatori interessati al progetto.
Materiale necessario
editUn proiettore, un cavo per connettere un Mac, una connessione internet.
Partecipanti
editRichieste e suggerimenti dei partecipanti
edit- ... (per favore firmare)
- ↑ http://wikiworkshop.org/2017/papers/p1635-pantaleo.pdf
- ↑ Gilles Sérasset "DBnary: Wiktionary as a Lemon-Based Multilingual Lexical Resource in RDF", Special issue on Multilingual Linked Open Data, Semantic Web 0 (2014)