IRC office hours/Office hours 2012-07-23
[18:30:14] <Lydia_WMDE> alright...
[18:30:46] <Lydia_WMDE> everyone not speaking german: we'll occupy this channel for the german office hour for the next hour - back to english after that
[18:31:03] <Lydia_WMDE> sooooo wer ist denn alles für die sprechstunde da?
[18:31:09] -*- eptalon
[18:31:20] -*- Mathias_WMDE hört nur zu
[18:31:27] <TMg> ebenso.
[18:31:29] <Lydia_WMDE> Mathias_WMDE: spion! :P
[18:31:47] <Lydia_WMDE> alles klar
[18:31:53] <Lydia_WMDE> dann fangen wir mal an mit fragen
[18:32:05] <Lydia_WMDE> eptalon: hast du eine?
[18:32:13] -*- Necrophorus macht ebenfalls nur das Mäuschen
[18:32:26] -*- Lydia_WMDE fühlt sich beobachtet
[18:32:30] <Lydia_WMDE> ;-9
[18:32:41] -*- joancreus wisst nur ein bisschen deutsch :(
[18:33:21] <TMg> kleine meta-frage: bei den freiwilligen haben sich schon ein paar für DE-übersetzung eingetragen, aber ich denke, da braucht ihr keinen, oder?
[18:34:02] <Lydia_WMDE> TMg: wir haben morgen ein meeting um das ganze mal etwas in gang zu bringen - läuft grad nicht so optimal... - nach dem meeting wollte ich dann alle auf der seite anschreiben
[18:34:16] <eptalon> Also: Angenoomen ich hab den fall: geburts-, sterbedaten für eine perosn öffenltichen interesses, so müsste man folgende fälle für jedes der daten behandeln können: 1) Datum komplett bekannt, abgesichert mit referenzen 2) Datum eines von mehreren möglichen, mit refs 3) Datum teilweise bekannt (z.b. Monat-Jahr) 4) Statt Geburtsdatum ist Taufdatum bekannt.
[18:34:32] <Lydia_WMDE> TMg: ich muss gestehen ich weiß nicht wie es gerade mit der deutschen übersetzung aussieht
[18:34:54] <Lydia_WMDE> eptalon: jep
[18:35:07] <eptalon> Und sobald wir das haben fangebn die spielrerien julianischer-kalender, gregorianischer-kalender an.
[18:35:12] <Lydia_WMDE> jep
[18:36:10] <eptalon> die auch nach projekt, und pesönlichkeit variieren können (Patriarchen der Ostkirche...)
[18:36:50] <Lydia_WMDE> nach projekt? meinst du unterschied zw. englisch und deutschsprachiger wikipedia zum beispiel?
[18:36:57] <eptalon> gibt es das db-design-team schon?
[18:37:20] <Lydia_WMDE> es gibt sogar schon ein datenmodel ;-) moment ich such dir eben nen link
[18:37:25] <eptalon> Lydia_WMDE: Arabisssprachige WP benutzt vielleicht isalmische zeitrechnung...
[18:37:40] <Lydia_WMDE> http://meta.wikimedia.org/wiki/Wikidata/Notes/Data_model_primer
[18:37:55] <Lydia_WMDE> ja damit sollten wir umgehen können
[18:39:09] <Lydia_WMDE> ich hoffe der link ist verständlich und beantwortet die meisten fragen zu dem thema
[18:39:16] <Lydia_WMDE> falls nicht bitte weiter fragen :)
[18:39:48] <eptalon> überflogen bringt uns das aber nicht die möglichkeit: eine von mehreren varianzten, zb.
[18:40:00] <TMg> besserer link: http://meta.wikimedia.org/wiki/Wikidata/Data_model#Dates_and_times
[18:40:10] <Lydia_WMDE> TMg: danke!
[18:40:16] -*- Daniel_WMDE_ winkt
[18:40:23] <Lydia_WMDE> das ist die version des daten models die etwas krasser ist
[18:40:28] <Lydia_WMDE> aha! ein Daniel_WMDE_ ;-)
[18:41:23] <eptalon> TMg: und jetzt modellier damit mal, dass wir kein Geburtsdatum, aber ein Taufdatum von Beethoven haben?
[18:41:42] <Lydia_WMDE> das geht
[18:41:44] <Daniel_WMDE> eptalon: das ist dann einfach 'ne andere property
[18:41:49] <TMg> das würde ich als "Taufdatum" ablegen und als Geburtsdatum "unbekannt". Rest ist dann Vorlagenprogrammierung.
[18:41:51] <Daniel_WMDE> eptalon: theoretisch könnte man ja auch beides haben
[18:42:09] <eptalon> Oder dass eius 3 warscheinliche kandidaten fürs gebutsdatum gibt?
[18:42:15] <Daniel_WMDE> eptalon: mehrere werte mit referenzen gehen eh immer. unterschiedliche genauigkeiten auch
[18:42:18] <Lydia_WMDE> auch das geht ;-)
[18:42:23] <TMg> das geht, die 3 daten haben dann 3 quellen.
[18:42:28] <Daniel_WMDE> eptalon: ja. ließ die seite nochmal genauer.
[18:43:16] <Daniel_WMDE> eptalon: du könntest sogar sagen, dass es 3 mögliche daten gibt, und zwei, die früher mal als richtig angesehen wurden aber nun widerlegt sind.
[18:43:18] <Daniel_WMDE> geht alles
[18:43:39] <Daniel_WMDE> heya jorm
[18:43:51] <Daniel_WMDE> german time, i'm afraid :)
[18:43:58] <Lydia_WMDE> weitere fragen?
[18:44:14] <Lydia_WMDE> oder irgendwas das jemandem auf dem herzen liegt?
[18:45:07] -*- Daniel_WMDE will wissen wann wir die videos von der wikimania bekommen
[18:45:17] <Lydia_WMDE> hehe
[18:45:19] -*- Lydia_WMDE auch
[18:45:22] <eptalon> Daniel_WMDE: und die arabier sagen dann einfach, sie hätten gerne das datum is islamischer zeitrechnung?
[18:45:49] <Lydia_WMDE> eptalon: genau
[18:45:49] <Daniel_WMDE> eptalon: ja. das ist dann nur eine sache das ausgabeformats. intern gibt es nur eine darstellung für das datum.
[18:46:09] <eptalon> und datenvalidierung machen wir gar nicht?
[18:46:20] <Daniel_WMDE> eptalon: machen wir genau so wie jetzt auch.
[18:46:34] <Daniel_WMDE> oder was meinst du mit validierung?
[18:46:55] <Daniel_WMDE> validierung des formats? das passiert natürlich bei der eingabe. du wirst keinen 31. februar eingeben können.
[18:47:11] <eptalon> ein automatisiertes verfahren dass festellt das ein bestimmter eintrag vollständig ist.
[18:47:26] <Daniel_WMDE> nicht serverseitig, nein
[18:47:40] <Daniel_WMDE> "vollständig" ist auch scher zu definieren. kommt ja schon sehr darauf an...
[18:47:55] <Daniel_WMDE> ist ein eintrag ohne sterbedatum vollständig? nur wenn die betreffende person noch am leben ist...
[18:48:30] <Daniel_WMDE> eptalon: man kann aber leicht 'nen bot bauen, der anhand der daten irgendwelche wartungskategorien vergibt oder entfernt.
[18:48:46] <Daniel_WMDE> (naja, kategorien sind als thema noch offen, aber irgendwie wird das gehen...)
[18:48:53] <eptalon> Daniel_WMDE: d.h. zb. ich hab bei einer person entweder geburtsdatum, oder taufdatum, und mind. 1 geburtsort, und optional mind. 1 sterbedatum und ort.
[18:49:03] <JeroenDeDauw> o_O
[18:49:37] <Daniel_WMDE> eptalon: wenn das für historische personen so definiert ist, findet sich sicher jemand, der das per bot markiert.
[18:50:22] <Daniel_WMDE> Hallo BirgitteSB und siglar
[18:50:26] <eptalon> sind xml-artige tags in diskussion?
[18:50:32] <TMg> eptalon: in deiner wikipedia kannst du zusätzlich per vorlage bestimmen, dass bestimmte unvollständige daten nicht anzuzeigen sind.
[18:50:50] <Daniel_WMDE> eptalon: öh... für was denn?
[18:51:04] <Daniel_WMDE> eptalon: die daten wirden nicht als text verwaltet. es gibt kein markup.
[18:51:08] <siglar> Hello, Daniel_WMDE.
[18:51:42] <eptalon> Daniel_WMDE: also datenbanmktechnisch ist das (warsch. UNICODE) ohne markup
[18:52:05] <Daniel_WMDE> eptalon: datenbanktechnisch ist das JSON. aber das ist für die benutzung völlig irrelevant.
[18:52:20] <BirgitteSB> Hello Daniel
[18:52:45] <eptalon> Also dann löcher ich euch den bauch nicht mehr..
[18:53:03] <eptalon> mach das schon wer, gibts nen prototyp zum rumspielen mit?
[18:53:03] <TMg> datennormalisierung regel 1: atomare werte. ist nicht überall zu halten, sollte aber immer das ziel sein.
[18:53:28] <Lydia_WMDE> eine demo gibts hier: http://wikidata-test.wikimedia.de/
[18:53:50] <Lydia_WMDE> ist aber noch nicht soweit, dass du schon mit dem infobox teil rumspielen kannst
[18:53:58] <Lydia_WMDE> aktuell verwaltet es interwikis
[18:53:59] <Daniel_WMDE> TMg: naja - sind geokoordinaten "atomar"?
[18:54:17] <Daniel_WMDE> oder hättest du länge und breite gerne als separate eigenschaften, mit separaten quellangaben?
[18:54:21] <eptalon> Lydia_WMDE: sind die schon produktiv?
[18:54:33] <eptalon> bei uns krabbeln immer solche updatebots rum.
[18:54:47] <Daniel_WMDE> nein, die sind noch nicht produkltiv
[18:54:51] <Lydia_WMDE> eptalon: nein das ist ein testsystem - wir arbeiten daran es in den nächsten wochen auf den ersten wikipedias zu haben
[18:54:52] <Daniel_WMDE> desshalb ist das ja ein testsystem :)
[18:55:08] <Daniel_WMDE> Lydia_WMDE: *hust*
[18:55:22] <Lydia_WMDE> Daniel_WMDE: heh warum der husten? :D
[18:55:29] <Lydia_WMDE> wochen zu früh?
[18:55:32] <eptalon> braucht ihr noch köche zum in suppen spucken?
[18:55:36] <TMg> Daniel_WMDE: ein koordinaten-paar ist atomar. ein polygonzug auch. pragmatismus, würd ich sagen ;)
[18:55:55] <Lydia_WMDE> eptalon: lol - ich hätte meine suppe gern unbespuckt :P
[18:56:01] <Lydia_WMDE> aber sonst kannst du gern auf meta schaun
[18:56:07] <Daniel_WMDE> Lydia_WMDE: die foundation muss unseren gesamten code reviewen. ich *hoffe* das geht fix. ich würde aber nichts versprechen wollen.
[18:56:09] <Lydia_WMDE> siehe erster link im topic
[18:56:20] <Lydia_WMDE> da stehen ein paar sachen bei denen man aktuell mitmachen kann
[18:56:20] <TMg> Daniel_WMDE: bzw. sind das atomare "datentypen".
[18:56:24] <Daniel_WMDE> TMg: ja, so haben wir uns das auch gedacht
[18:56:56] <Lydia_WMDE> Daniel_WMDE: joa klar
[18:57:30] <eptalon> TMg: atomar heisst einfach, ich muss das ergebnis der abfrage nicht mehr parsen.
[18:57:31] <TMg> um beim beispiel zu bleiben: geburtsort und datum sind aber immer 2 daten.
[18:57:53] <eptalon> ja, das ist klar.
[18:58:29] <TMg> einen polygonzug wirst du wahrscheinlich immer parsen müssen. aber ich weiß, was du meinst.
[18:58:50] <eptalon> TMg: die wie wir gesehen haben aber beide nicht atomr sind.
[18:59:08] <TMg> kommt auf diedefinition von "atomar" an. ;)
[18:59:23] <eptalon> TMg: "ein wert"
[18:59:28] <Daniel_WMDE> eptalon: jeder *wert* ist atomar. eine eigenschaft kann aber mehrere werte haben
[18:59:40] <Daniel_WMDE> bzw mehrere statements mit wert, quellen und zusatzinfos.
[19:00:19] <TMg> passende frage zu units/maßeinheiten: werden die aus einer extra datenstruktur kommen oder selbst editierbare items im wikidata-sinne sein? fieses stichwort währungsumrechnung.
[19:00:54] <Daniel_WMDE> TMg: maßeinheiten werden vermutlich fest vorgegeben sein. währungen werden wir vorerst nicht unterstützen.
[19:00:54] <eptalon> TMg: ich würde da auf separate lookup-table tippen.
[19:01:14] <Daniel_WMDE> bei währungen ist es völlig unklar, auf welcher basis die umrechnung geschehen soll - es gibt ja keine SI-Einheit für Geld.
[19:01:25] <eptalon> ein fuss ist nunmal ein fuss, egal ob schugrösse 38 oder 43
[19:01:29] <Daniel_WMDE> Und mann muss währungen immer zusätzlich über den Zeitpunkt fixieren
[19:01:59] <TMg> maßeinheiten teilweise auch, manche haben sich in der geschichte verändert.
[19:02:11] <Daniel_WMDE> TMg, eptalon: was datentypen angeht werden wir uns sehr wahrscheinlich stark an SemanticMediaWiki orientieren
[19:02:16] <eptalon> Daniel_WMDE: das heisst auch keine statements: im jahre schnee kostete das teil soviel ,das ist heute etwa soviel?
[19:02:25] <Daniel_WMDE> die haben da schon reichlich erfahrung. vielleicht können wir sogar code wiederverwenden
[19:02:27] <JeroenDeDauw> Daniel_WMDE: SiteLink change looks good now - some issues after rebase though, fixing these now
[19:02:41] <Daniel_WMDE> eptalon: doch, sicher. angeben kannst du das. aber nicht automatisch umrechnen
[19:02:51] <Daniel_WMDE> JeroenDeDauw: thanks
[19:02:54] -*- JeroenDeDauw kicks wm-bot
[19:03:09] <Daniel_WMDE> mw-bot is probably scared of all the german talk ;)
[19:03:13] <JeroenDeDauw> Lydia_WMDE: did you kill it?
[19:03:14] <eptalon> Daniel_WMDE: und somit nicht in die db eintragen.
[19:03:15] <JeroenDeDauw> Heh
[19:03:27] <Lydia_WMDE> JeroenDeDauw: no - let's solve that after the office hour
[19:03:43] <eptalon> sorry guys. I couldn't help but torrture the nice office fellows a little.
[19:03:44] <Daniel_WMDE> eptalon: doch, sicher kommt das in die DB. Aber halt nicht als konvertierbare meßgröße
[19:04:48] <TMg> könnten maßeinheiten nicht wikidata-items sein? mit einem "prefered", historischen werten und bezügen+umrechnung zu anderen maßeinheiten?
[19:04:52] <eptalon> Daniel_WMDE: habt ihr Orakel gefragt, ob sie unterstützen wollen?
[19:05:11] <TMg> (was hat oracle damit zu tun?)
[19:05:19] <Daniel_WMDE> frag ich mich auch gerade
[19:05:45] <eptalon> TMg: solange der umrechnungsfakor fix ist, warsch. unproblematisch. Wieviele DM krieg ich für einen Euro.
[19:05:53] <Daniel_WMDE> TMg: theoretisch ja, scheint mir aber relativ umständlich und nutzlos, und würde ggf viel rechenleistung kosten
[19:06:04] <TMg> Daniel_WMDE: caching.
[19:06:08] <eptalon> Daniel_WMDE: Die machen mysql.
[19:06:15] <eptalon> nich?
[19:06:30] <TMg> wikidata muss komplett unabhängig von dem darunter laufenden DBMS sein, IMHO.
[19:06:30] <Daniel_WMDE> TMg: ja, alles lösbar. aber unnötig komplex. wenn wir das *brauchen* können wir drüber reden. es gibt viele viele dinge dich wichtiger und dringender sind
[19:07:03] <eptalon> TMg: de fakto aber ein PHP/MYSQL-teil.
[19:07:09] <Lydia_WMDE> eptalon: ich glaub du hast noch ein etwas zu eng gefasstes bild von datenbank wenn es zu wikidata kommt
[19:07:24] <Daniel_WMDE> die primärkopie der daten wird als json blob abgelegt, genau so und genau dort, wo auch der wikitext landet
[19:08:06] <Daniel_WMDE> für abfragen über eigenschaften (phase 3) werden wir vermutlich zusätliche, spezialisierte datenbanksysteme benutzen. was und wie ist aber noch offen.
[19:08:10] <Lydia_WMDE> Daniel_WMDE: vielleicht sollten wir das noch etwas klarer machen
[19:08:34] <Lydia_WMDE> datenbank != datenbank
[19:08:42] <Daniel_WMDE> eptalon: de facto ein mediawiki teil. also php. mysql per default, mit unterstützung für alles, was mediawiki eben unterstützt: mysql, postgres, sqlite, etc
[19:09:18] <Daniel_WMDE> Lydia_WMDE: ja, könnte sein...
[19:09:53] <TMg> Daniel_WMDE: ich dachte im sinne einer vereinfachung daran. wenn units eine extra datenstruktur sind, wer darf die dann ergänzen? und wie? extra GUI nur dafür?
[19:09:58] <Daniel_WMDE> eptalon: wir werden keine werte von eigenschaften in datenbanktabellen schreiben. bzw vielleicht tun wir das auch in gewissen fällen, aber das ist nicht die "eigentliche" art der datenspeicherung.
[19:10:06] <eptalon> also so wie ich das machen würde, wären das extra datenbanktabellen/modelle, dire nicht dort landen, wo der wikitext ist. der hat bestenfalls referenzen.
[19:10:14] <Daniel_WMDE> TMg: ich dachte an 'ne Konfigurationsdatei :)
[19:11:00] <eptalon> ich löchre zuviel. Danke, für die antworten.
[19:11:13] <Daniel_WMDE> eptalon: so hat es das alte Wikidata von 2005 gemacht. Macht haufenweise probleme. Wie machste denn da die Versionieren? Ohne riesigen mehraufwand?
[19:11:14] <Lydia_WMDE> eptalon: dafür machen wir den ganzen spaß hier ;-)
[19:11:19] <TMg> dann müsst ihr eine klare abgrenzung machen zwischen sozusagen starren "basis-units" und alles darüber hinaus landet als items in der wikidata-datenstruktur.
[19:11:43] <Daniel_WMDE> TMg: sorry - wann und warum müssten wir das?
[19:11:59] <Daniel_WMDE> es landet *immer* alles in der wikidata-datenstruktur. Alle daten jedenfalls.
[19:12:14] <TMg> für alte maßeinheiten, die nicht normiert sind. und selbst die heute normierten einheiten haben sich verändert.
[19:12:18] <eptalon> Daniel_WMDE: jedes feld hat ne versionsnummer.
[19:12:41] <eptalon> zusätzlich zu feldnamen, wert, und etwaigen ids.
[19:12:50] <Daniel_WMDE> eptalon: das bedeutet großen mehraufwand, viele viele datenbankabfragen, große joins, extra programmierung für diffs, history page, etc.
[19:13:00] <Daniel_WMDE> eptalon: ist langsam, viel aufwand und bringt nichts.
[19:13:15] <Lydia_WMDE> wir haben noch etwa 15 min
[19:13:16] <Daniel_WMDE> eptalon: glaub mir, wir haben uns das sehr gut überlegt.
[19:13:28] <eptalon> Daniel_WMDE: Ich bin nur der typ der fragt.
[19:14:38] <Daniel_WMDE> TMg: das mag sein, aber ich glaube, das ist zu vernachlässigen. Es ist ja nicht unbedingt nötig, den Umfang des Mondes in Preußischen Postmeilen angeben zu können
[19:14:38] <eptalon> Daniel_WMDE: wie machst du das versionieren denn jetzt?
[19:14:39] <Lydia_WMDE> weitere fragen von irgendjemandem? jemand noch was auf dem herzen der noch nicht dran war?
[19:14:52] <Lydia_WMDE> Daniel_WMDE: but but but!!!
[19:14:53] <Daniel_WMDE> eptalon: genau so wie bei wikitext. die daten werden genau so abgelegt wie wikitext. nur eben als json struktur.
[19:14:54] <Lydia_WMDE> i want! :D
[19:15:02] <Daniel_WMDE> ;)
[19:15:31] <TMg> währungen sind der offensichtliche fall. es gibt z.b. auch flächenangaben von vor x-hundert jahren in maßeinheiten, für die es mehr als eine mögliche umrechnung gibt. => wäre perfekt als wikidata-item.
[19:16:29] <Daniel_WMDE> TMg: kann man natürlich als item anlegen, kein problem. nur eine automatische umrechnung werden wir auf dieser basis wohl eher nicht unterstützen
[19:17:39] <TMg> also liegt diese zahl mit "sonstige maßeinheit" in wikidata? das meinte ich mit der abgrenzung von standardisierten und nicht standardisierten einheiten.
[19:18:08] <Daniel_WMDE> TMg: du kannst items über alles anlegen, auch über einheiten
[19:18:45] <Daniel_WMDE> das hat nichts damit zu tun, dass wir für einigen einheiten umrechnungen anbieten.
[19:19:14] <TMg> denke doch.
[19:19:18] <Daniel_WMDE> ich glaube, das werden wir auf einer völlig anderen ebene modellieren. obwohl... naja. doch. ich denke schon.
[19:19:34] <Daniel_WMDE> TMg: könnte man so machen, ja. ich will aber nicht :)
[19:19:43] <Lydia_WMDE> lol
[19:20:17] <TMg> so wie du es erklärst: für viele zahlen kann ich in wikidata die einheit angeben, dann sind umrechnungen möglich. für manche (alte) einheiten, währungen etc. aber nicht. deshalb die frage, wo die grenze ist?
[19:20:38] <TMg> das müsst ihr dokumentieren/kommunizieren und begründen.
[19:22:10] <Daniel_WMDE> ja.
[19:23:46] <TMg> außerdem wird es die einheiten sozusagen "doppelt" geben, zusätzlich zu deiner config auch als items (wird sicher jemand anlegen, es gibt ja auch WP-artikel über die einheiten).
[19:24:46] <TMg> ich hätte den "sich selbst aus dem sumpf ziehen"-ansatz nett gefunden, aber ob das für die potentiell wenigen fälle lohnt, ist natürlich fraglich.
[19:25:45] <Daniel_WMDE> genau :)
[19:26:16] <Daniel_WMDE> ich bin da eher pragmatisch. natürlich ist es toll, wenn sich das system komplett selbst definiert.
[19:26:35] <Daniel_WMDE> aber so einen anspruch haben wir mit wikidata garnicht. das wäre eigentlich auch schon zu viel "semantik".
[19:26:37] -*- Lydia_WMDE flüstert was von skynet
[19:26:41] <Daniel_WMDE> semantik wollen wir jha garnicht. macht nur probleme.
[19:26:46] <Daniel_WMDE> genau
[19:27:22] <Lydia_WMDE> soooo - eine letzte frage geht noch
[19:27:23] <Lydia_WMDE> :D
[19:27:27] <Lydia_WMDE> wer hat noch ein?
[19:28:08] <Lydia_WMDE> keiner? *schnief*
[19:28:31] <Lydia_WMDE> na gut - dann mach ichs mir jetzt in der sonne gemütlich :P
[19:28:36] <Lydia_WMDE> danke alle fürs kommen