Grants talk:Project/Automated Portuguese grammar checking edits via LanguageTool
Project Grant proposal submissions due today!
editThanks for drafting your proposal for a Project Grant. Proposals are due today! In order for this submission to be reviewed, it must be formally proposed. When you have completed filling out the infobox and have fully responded to the questions on your draft, please change status=DRAFT to status=PROPOSED to formally submit your grant proposal. This can be found in the Probox template found on your grant proposal page. If you have already done this, thanks for your submission, and you should be receiving feedback from the Project Grants committee in the coming weeks. Thanks, I JethroBT (WMF) (talk) 18:16, 14 March 2017 (UTC)
Thank you Jethro!
editMany thanks for the heads up Jethro! I was waiting for a similar information via e-mail, since I had contacted the projectgrants@wikimedia.org regarding this. I am not used to looking into the discussion pages. I have changed this accordingly. Again, many thanks!
Eligibility confirmed, round 1 2017
editThis Project Grants proposal is under review!
We've confirmed your proposal is eligible for round 1 2017 review. Please feel free to ask questions and make changes to this proposal as discussions continue during the community comments period, through the end of 4 April 2017.
The committee's formal review for round 1 2017 begins on 5 April 2017, and grants will be announced 19 May. See the schedule for more details.
--Marti (WMF) (talk) 19:53, 27 March 2017 (UTC)
Dear Tiago Santos,
Thank you for submitting this proposal. Automatic grammar correction of all Portuguese articles in Wikipedia is an interesting idea. As you may know, however, there are varying opinions among our volunteers about automation, with some appreciating the speed and efficiency of automated processes and some preferring the slower but more nuanced review of a human. Because there are differing opinions about this, we especially like to get feedback from relevant volunteer communities when we receive proposals for automation efforts. In this case, we will want to know whether the Portuguese speaking communities want the service you are offering to provide them. Please try to solicit feedback from as many members of those communities as you can here on this talkpage, either endorsing your proposal because it meets needs they have (their endorsements will be stronger if they can make an effort to articulate those needs), or else describing any concerns they have about it.
If you like, you can reach out to I_JethroBT_(WMF), our community organizer, for ideas about how to solicit feedback.
Kind regards,
--Marti (WMF) (talk) 01:50, 3 April 2017 (UTC)
- Dear Marti (WMF),
- It is with great pleasure that I hear from you. I am glad to see that the idea makes sense, as I sincerely believe this is a significant project.
- I will contact the community again, as well as Jethro. I have used the mailing list to announce the project, and I received some encouraging feedback, although I am not sure that the majority of the members has seen this page. I heed your advice and I will also ask assistance to Jethro.
- Past efforts
- I do not understand, why similar efforts made in the past by my colleagues did not become a permanent part of the Wikipedia. The languages that I have analyzed are very well developed in their current state, although improvement is possible – a truism.
- With this in mind, as I have previously referred, I intend to work with the community, especially with more vocal members against this project, as long as everyone remains assertive and intellectually honest. Those persons may prove to be the checks and balances of this project, and provide very useful feedback.
- Personal Bias
- I prefer to design rules that assist in the final revision by persons with great command of the language. I am slightly dyslexic and overly hasty, so I may be slightly biased towards a grammar checker that is more permissive with false positives, even if at the current state, the majority of rules is perfectly accurate.
- Interaction ideas
- Having an enthusiastic and intelligent community that benefits directly from my work, allows me to have more constructive criticism, and creates a goal that demands that I start working against my personal preferences. This seems to be an ideal situation.
- I intend to select gradually the rules, and do limited tests that can be observed by the community. When the overall benefit of an automated replacement run is fairly consensual, it will be done.
- Worst case scenario
- The Wikipedia is gigantic. Let’s try to forecast.
- If a first run, running on 40.000 articles, actually corrects 70% of the detection but changes 30% of correct instances, the overall quality of the text has still improved.
- This is a very low accuracy estimation, because I will start with a subset of rules that contains the most solid rules, having almost 100% accuracy.
- Concerned editors will still save time, correcting errors. To avoid having editor having to fix the same “corrections” constantly, subsequent runs may only apply to other articles, or be done with different rule sets, that have been improved to meet the required standards.
- Accepting a revision of 40.000 articles per week, after the first run, it would take 6 months to return to the previous set of Wikipedia articles.
- That would only happen if secondary goals were met, but nonetheless, by that time, rules would have been improved significantly, as they have been so far. In this scenario, more “perfect rules” would have been added to the set, increasing the potential benefit of subsequent runs.
- Note that all numbers mention here are just rough estimations, without any background study done on them. I do not have yet anything solid in terms of number of articles to be analyzed per run, nor precise accuracy data for individual rules, since these fluctuate with the corpus that is used to make those estimations.
- Best regards,
- TiagoSantos81 (talk) 20:46, 4 April 2017 (UTC)
WikiPT MailingList discussion
editWith intervenients permission I leave here a log of the discussion happening on the mailist. It covers many douts that can exist about the project and it helps other Portuguese only readers to form a better idea about the project.
https://lists.wikimedia.org/pipermail/wikipt/2017-April/thread.html
--------------------------------------------------------------------- [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Tiago Santos tiagofsantos81 sapo.pt Quarta-Feira, 5 de Abril de 2017 - 21:01:23 UTC Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Estimados senhores, O projeto de correções automáticas para Português passou a primeira fase de seleção. Tenho recebido algum encorajamento via e-mail, mas é importante que todos os interessados manifestem o seu apoio (ou dúvidas) na página de diálogo do projeto, de forma a que este tenha mais possibilidades de se tornar realidade. https://meta.wikimedia.org/wiki/Grants_talk:Project/Automated_Portuguese_grammar_checking_edits_via_LanguageTool A página está em Inglês,que preferencialmente deve ser utilizado, mas caso desconheçam o idioma, eu responderei a questões também em Português. Espero também que se interessem pelo projeto e que ofereçam criticas construtivas e ideias para melhorias futuras. Grato mais uma vez pela vossa atenção. Os melhores cumprimentos, Tiago Santos ------------------------------------------------ [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Diego Queiroz queiroz.diego gmail.com Quinta-Feira, 6 de Abril de 2017 - 00:22:18 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Tiago. Fiquei analisando o caso e, apesar da ideia ser boa, acho que seria interessante se aproximar mais do projeto antes de solicitar um IEG. Isso vai permitir que, você conheça melhor a Wikipédia, suas regras e as ferramentas disponíveis. Ao mesmo tempo, a comunidade te conhecerá e se sentirá mais confiante em te ceder apoio. Sobre sua proposta, eu faço parte do Grupo de Aprovação de Bots e, honestamente, eu seria resistente a aprovar um bot que faz edições automáticas em artigos corrigindo ortografia ou gramática. Ao mesmo passo que edições automáticas são uma mão na roda, pequenos erros as tornam extremamente indesejadas. Existem tantos pontos a serem tratados a nível de programação antes de realizar uma correção textual, que ficaria surpreso se fossem tratados de forma eficiente sem causar uma bela bagunça nos artigos. Lembro que, mesmo se o IEG for aprovado, você ainda vai precisar pedir aprovação para a Wikipédia local (já poderia ter pedido, inclusive). Além disso, no IEG você apresenta custos com servidor. Você até deixa claro que os custos podem ser reduzidos se alternativas forem utilizadas, mas sua falta de envolvimento com o projeto mostra que você não conhece as alternativas. A Wikimedia já disponibiliza o WikimediaLabs onde os desenvolvedores podem hospedar os projetos relacionados à Wikimedia sem custo algum. Depois, você apresenta uma série de atividades, mas não deixa claro o motivo dela requerer um IEG. Em resumo, parece que sua ideia é: ativar o Wikicheck (que parece que é algo bastante simples), mas o foco é trabalhar no LanguageTool. Não que isso seja um problema, mas parece que o LanguageTool tem mais a ganhar do que a Wikipédia, mais ainda se considerar que você já é um desenvolvedor ativo dessa ferramenta. Tudo isso torna seu pedido questionável. Claro que é sempre louvável alguém se propor para realizar um projeto que possa melhorar a Wikipédia, no entanto, parece conflito de interesse um usuário afastado por 8 anos retornar pedindo IEG sem sequer consultar se há o interesse da comunidade. Talvez os colegas da lista discordem do que disse, mas creio que isso justifique a falta de apoio. Um abraço, --- Diego Queiroz ------------------------------------------------------------------------------ Tiago Santos tiagofsantos81 sapo.pt Quinta-Feira, 6 de Abril de 2017 - 17:31:39 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Diego, Antes de mais agradeço o tempo que despendeu na resposta e na colocação de algumas questões pertinentes que, espero que sejam serão resolvidas com esta correio eletrónico. Em relação ao envolvimento na comunidade, acho que foi isso que fiz quando anunciei o projeto na mailing list. Como pode ver na página do próprio projeto, há bastantes anos que me envolvo voluntariamente em projetos públicos Open Source, e tenho por norma apresentar-me com algo para oferecer, tal como o fiz nesta lista de discussão. Apresentei-me e mostrei que posso contribuir para a comunidade. Algumas pessoas mostraram interesse e contactaram em privado. Umas com informação, outras com dúvidas e outras apenas com um sinal de boas-vindas. No entanto, é a primeira vez que me insinuam que devia ter “pedida autorização” antes de apresentar uma proposta. Por enquanto, isso é um costume que não é aceite nos países e instituições por onde estive. Tanto quanto sei, também não é política expressa da Wikipédia. Expressa o projeto como algo fácil. Ativar o Wikicheck e pouco mais. Quase ofensivamente simplista. Se alguém tentar utilizar o LanguageTool neste momento para edições automatizadas, não vão ter bons resultados e o cenários de alterações destrutivas materializa-se. Criar bots é trabalho, e tanto quanto sei, até ao momento, não existe ninguém a fazê-lo. Se formos a ver, criar um novo servidor para o WikiCheck também é simples, mas não há ninguém a querer mantê-lo. Além de que, só referi WikiCheck expressamente, porque estará disponível para todos os idiomas o que aumenta a relevância do projeto. Na página do projeto está expresso que as edições são testadas primeiro num extrato da Wikipédia, onde as regras são revistas e aprimoradas. Também é explícito que só quando satisfizerem critérios, a combinar com os interessados, serão utilizadas pelo bot. Note que a decisão será estatística, ou pelo menos decidida a partir de indicadores numéricos. Isto também é explicado com algum detalhe na página de discussão do projeto, e até é feita uma previsão de funcionamento. Dedico bastante do meu tempo livre ao voluntariado a projetos que julgo de interesse global. Além do LanguageTool, tenho sido um dos tradutores mais prolíficos de programas Open Source nos últimos anos, como pode constatar na página da candidatura, mas não tenciono dividir o meu tempo dedicado a voluntariados a mais instituições. Não que eu não ache que a Wikipédia não o merece, mas simplesmente porque o tempo é limitado e todas as pessoas tem prioridades. O que eu ofereço aqui é um serviço. Pago. Ofereço aqui porque é uma entidade que estimo, que julgo beneficiar desse serviço, e por concordar com os seus princípios, mas não estou a oferecer tempo pro bono. Sou voluntarioso e esse serviço permite-me continuar a realizar os meus trabalhos pro bono, seja nas traduções ou no corretor gramatical. Também melhora a motivação de continuar a fazê-lo, sabendo que existe uma comunidade considerada e respeitosa por trás destes projetos. Os pormenores de desenvolvimento do bot fazem parte do tempo de desenvolvimento. O tempo de desenvolvimento também está explicado em pormenor, e o que consigo fazer a tempo parcial pode ser visto na minha página do GitHub. É pública. A estimação de custos de servidor é mínima, e é parte de uma das componentes que pode compensar outros gastos inesperados. Como disse é uma estimação, mas apesar de já ter os componentes alinhavados, ainda não estou a desenvolver a solução. A proposta, tal como deixa expresso, é investir o tempo na criação dum mecanismo permanente, que liberta os editores duma série de atividades aborrecidas mas necessárias. Isso incluí a criação dum portal para verificação de artigos (o WikiCheck), criação de um bot que faça as edições automaticamente, e o mais importante, seleção e melhoria de regras para que isso possa ser feito. Essa é a parte mais complexa e com maior dispêndio de tempo. Espero que isto esclareça a situação. Os restantes esclarecimentos sobre metodologias e precisão já se encontram na página do projeto e na discussão associada, que pode e deve ser utilizada para esse fim. Além disso é bom negócio para todos. https://wikimediafoundation.org/wiki/2015-2016_Fundraising_Report Se houver um aumento de 0,1% de doações pela melhoria de qualidade da Wikipedia, o projeto já se rentabilizou mais de 10×. Isto cria abertura para mais bolsas na comunidade Portuguesa e quem sabe bónus anuais superiores para todos os membros da instituição. Cumprimentos, Tiago Santos ------------------------------------------------------------------------------ Tiago Santos tiagofsantos81 sapo.pt Quinta-Feira, 6 de Abril de 2017 - 17:34:13 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] > Claro que é sempre louvável alguém se propor para realizar um projeto que > possa melhorar a Wikipédia, no entanto, parece conflito de interesse um > usuário afastado por 8 anos retornar pedindo IEG sem sequer consultar se há > o interesse da comunidade. E em relação a isto não compreendo. Tanto quanto me recordo, nunca contribuí diretamente para a Wikipedia, e este e-mail não tem mais de 1 ano. ------------------------------------------------------------------------------ Diego Queiroz queiroz.diego gmail.com Quinta-Feira, 6 de Abril de 2017 - 18:30:42 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Tiago. As IEG servem para incentivar o desenvolvimento de pesquisas relacionadas à Wikipédia, não para contratar serviços, como você deixou explícito que está oferecendo. A grande maioria dos editores que acompanham essa lista e editam na Wikipédia fazem tudo voluntariamente. Eu sou desenvolvedor e crio bots quando tenho tempo, também voluntariamente. A Wikimedia Foundation é uma instituição sem fins lucrativos. As doações são solicitadas para manter o projeto, permitir novas iniciativas e garantir o desenvolvimento da fundação. É descabida a ideia de justificar o seu projeto com o argumento de que ele possa, mesmo que indiretamente, aumentar o número de doações e "rentabilizar". Esse claramente não é o objetivo das IEG ou da Wikimedia Foundation. Para saber mais, sugiro que leia: - https://meta.wikimedia.org/wiki/Grants:Start/About Sobre eu ter achado que estava 8 anos afastado, peço desculpas. Na página do projeto, a Marti (WMF) citou seu nome de usuário na página de discussão do projeto como sendo "Tiago Santos" e eu segui essa citação para ver as suas contribuições. Mas só agora vi que seu nome de usuário é "TiagoSantos81", que sequer está registrado na Wikipédia em Português. Apesar do equívoco, diria que isso só endossa as coisas que eu disse. Atenciosamente, --- Diego Queiroz ----------------------------------------------------------------------------- Tiago Santos tiagofsantos81 sapo.pt Quinta-Feira, 6 de Abril de 2017 - 21:21:47 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Diego, Gostaria, antes de mais, de pedir a sua autorização para colocar esta troca de correio eletrónico pública na página de discussão do projeto, dado que pode esclarecer alguns pontos a outros leitores. Vou responder em linha para ser mais simples. > As IEG servem para incentivar o desenvolvimento de pesquisas > relacionadas à Wikipédia, não para contratar serviços, como você deixou > explícito que está oferecendo. Exatamente. O IEG apresentado é para a conciliação do LanguageTool **com** a Wikipedia, beneficiando ambos. É essa relação, quase simbiótica, que estou a propor. > A grande maioria dos editores que acompanham essa lista... Exatamente. Existem alguns que são pagos para o fazer. Por isso mesmo têm obrigações distintas, e têm de oferecer um serviço relevante o suficiente para justificar o financiamento. > As doações são solicitadas para manter o projeto, permitir novas > iniciativas e garantir o desenvolvimento da fundação. Exatamente. Esta é uma nova iniciativa, que, se bem sucedida, pode abrir portas para muitos outros projetos relacionados, que, tal como referi, podem-se tornar viáveis com o dinheiro extra recolhido. > A Wikimedia Foundation é uma instituição sem fins lucrativos. Se o dinheiro for reinvestido, a Fundação cumpre essa função, e não vejo que forma o meu projeto ou a minha postura vai contra esse principio. > É descabida a ideia de justificar o seu projeto com o argumento de > que ele possa, mesmo que indiretamente, aumentar o número de doações e > "rentabilizar". Esse claramente não é o objetivo das IEG ou da > Wikimedia Foundation. Julgo que é assim que todos os projetos viáveis funcionam. Se não funcionam assim, cedo ou tarde tem problemas de contabilidade. Acho que ninguém discorda que a Wikipédia é um projeto viável. > Para saber mais, sugiro que leia: > - https://meta.wikimedia.org/ <https://meta.wikimedia.org/wiki/Grants:Start/About> Para usar tanta condescendência, acho deve começar por ler atentamente o projeto e a discussão já tida, porque os argumentos apresentados mostram que não leu ou compreendeu o projeto. Também deve ter em conta que isto não é um jogo de soma zero. Se a Wikipedia Foundation obtém mais dinheiro, gasta mais dinheiro. Todos beneficiam: utilizadores, bolseiros, contratados e empreendedores. Não sei se está a candidatar-se a alguma IEG, ou se tem pretensões de o fazer. Se tem, está a fazer exatamente o oposto do que deveria. Está a enfraquecer a Wikipedia e aumentar ainda mais o nível de com que espera que o seu projeto seja avaliado. Para mim o mais ofensivo é que aparenta defender que as IEGs existem para premiar contribuidores por familiaridade em detrimento do mérito, algo que também acho que não é alinhado com os princípios anunciados pela Wikipedia. Eu não tenho problemas com dúvidas ou algum criticismo, mas não é isso que está a fazer. Debate afirmando o projeto como descabido, o que não dá muita abertura para algo construtivo, e parece querer-se fazer representar como a voz de toda a comunidade Portuguese, portanto talvez seja importante dar importância aos pormenores: > Diego Queiroz Qual a razão de contestar tão acerrimamente um projeto de óbvia utilidade? Cumprimentos, Tiago Santos ---------------------------------------------------------------------------- Diego Queiroz queiroz.diego gmail.com Quinta-Feira, 6 de Abril de 2017 - 23:22:53 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Tiago. Não quero me prolongar demais nessa discussão, mas vamos lá... 1. Você não precisa da minha autorização para publicar a discussão nessa lista. Na verdade, os registros já são públicos e podem ser acessados por qualquer um em https://lists.wikimedia.org/pipermail/wikipt/2017-April/ thread.html . Sugiro que faça o link para a discussão ao invés de transcrever o texto no site projeto, para não poluir a página. 2. Essa lista contém 221 membros inscritos e todos podem se posicionar. Eu não falo pela comunidade, falo por mim. Mas falo como membro ativo da comunidade e com pleno conhecimento das políticas e ideais do projeto. Podem haver colegas que discordam do meu ponto de vista, isso é normal. Porém seu projeto já está em fase de ser avaliado e não teve apoio de membros ativos da comunidade e essa falta de apoio foi o principal ponto questionado pelos avaliadores. Eu posso estar errado, mas os fatos me sinalizam que eu tenho alguma razão no que digo. 3. O ponto que você não entendeu é que você sequer questionou a comunidade se ela tem interesse no seu projeto. Já considerou a possibilidade da comunidade achar que seu projeto, por melhor que sejam os resultados, não deva operar na Wikipédia? Não são apenas questões técnicas que definem o que será ativo. Existem questões políticas que determinam isso também (alguns editores acham que as edições não devem ser robotizadas, por exemplo). Estar em contato com a comunidade e consultar as opiniões dela é fundamental. Eu posso ir em um instituto de tratamento de câncer e sugerir perucas para todos pacientes. Posso até procurar financiamento para desenvolver essa minha nobre causa. Mas acho que convém eu perguntar antes se os pacientes querem perucas, não acha? Foi exatamente isso que você não fez. 4. Você tem utilizado a lista para divulgar seu projeto, e insiste nesse ponto. De fato, muitos usuários experientes acompanham essa lista, mas já lhe ocorreu que uma lista com 221 inscritos não represente uma comunidade com quase 2 milhões de usuários? (isso só para citar a Wikipédia em Português, vide https://pt.wikipedia.org/wiki/Wikipédia:Estatísticas ) Sem mais. --- Diego Queiroz ---------------------------------------------------------------------------------- Alchimista alchimistawp gmail.com Sexta-Feira, 7 de Abril de 2017 - 00:17:44 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Digest WikiPT, volume 54, assunto 4 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Tiago, o que o Diego tem tentado dizer é que convém perceberes como funciona a wikipédia internamente, convém haver algum envolvimento na comunidade para perceberes minimamente como funcionam as coisas, o que podes fazer, o que não podes fazer e como fazer. Por exemplo, esta mailling list é muito pouco usada, as discussões da wikipédia lusófona decorrem dentro da Wikipédia, as gerais nas esplanadas [0], conversas mais técnicas sobre robôs na coordenação robótica [1], e por ai adiante. (antes de criar uma consulta lá convém prestar atenção às informações que têm recebido, para poderes fazer o pedido mais percetível à própria comunidade, até porque este tema tem tópicos que podem ser discutidos em locais específicos). Neste caso, uma vez que se propõe a fazer as correções de forma automática, convém ter em atenção que a Wikipédia lusófona tem uma política de robôs [2], e como pode verificar nas Restrições em tarefas específicas, a correção de ortografia não é permitida recorrendo a bots. O mesmo acontece na versão Anglófona e em praticamente todos os projetos. Aliás, como o Diego falou, para um bot poder operar precisa de autorização, e tem de tomar muita atenção a este pormenor, porque um bot a editar sem permissão resulta em bloqueio. Cordialmente, Alchimista 0 - https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Esplanada 1 - https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Coordena%C3%A7%C3%A3o_rob%C3%B3tica 2 - https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Pol%C3%ADtica_de_rob%C3%B4s ----------------------------------------------------------------------------- Tiago Santos tiagofsantos81 sapo.pt Sexta-Feira, 7 de Abril de 2017 - 17:08:00 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Alchimista, Obrigado pela atenção e o tom construtivo com que se dirige, e por ser alguém "da comunidade", que finalmente, aponta-me para soluções. No entanto tenho que discordar de alguns pontos pela sua imprecisão. Vou começar pelos mais relevantes. > Restrições em tarefas específicas, a > correção de ortografia não é permitida recorrendo a bots. " Corretores automáticos são fortemente desencorajados, e usados somente em casos especiais. Deve-se ter em conta que é praticamente impossível prever todas as situações, e que mesmo nos casos aparentemente mais simples, existe a possibilidade de falsos positivos, como no caso de livros com títulos que o robô não reconhece como título de livro, sites ou nomes próprios, ou mesmo alterações de variantes linguísticas. Assim, de forma geral, a correção assistida é permitida, tal como em casos específicos com elevada taxa de acerto, contudo a utilização sistemática de corretores ortográficos generalistas não são bem vistos pela comunidade." https://pt.wikipedia.org/wiki/Wikipédia:Política_de_robôs#Restri.C3.A7.C3.B5es_em_tarefas_espec.C3.ADficas Isto não é um texto legal, portanto: "Corretores automáticos são fortemente desencorajados" deve querer significar: "Corretores automáticos são fortemente desencorajados", algo diferente de "correção de ortografia não é permitida recorrendo a bots." > O mesmo acontece > na versão Anglófona e em praticamente todos os projetos Não propriamente… - https://www.youtube.com/watch?v=2xmPwefktXI [FOSDEM 2014] How we found a million style and grammar errors in the English Wikipedia Quanto à atribuição de estatutos, existe já um protocolo, que caso o projeto se concretize, se irá realizar como parte do tempo de desenvolvimento. " Atribuição de estatuto O sistema de atribuição de estatuto de robô na Wikipédia lusófona é similar ao da Wikipédia anglófona, ou seja, nenhum bot poderá operar sem estar registado (ou em fase de teste). O operador terá de fazer o pedido, seguindo as instruções indicadas em Wikipédia:Robôs/Pedidos de aprovação. Um avaliador, que pode ser um burocrata, um membro do grupo de aprovação de robôs ou um operador de robôs experiente[1], verificará as informações colocadas pelo operador no pedido e as edições feitas pelo editor e pelo robô nos projetos e nas respetivas páginas de discussão do robô, para verificar se têm ocorrido erros. Se tudo estiver correto com o operador/robô, o avaliador[1] avisará o operador de que o bot poderá editar na Wikipédia durante cerca de uma semana, em fase de testes. Nesse ínterim, terá de efetuar, no máximo, duas a três edições por minuto (em caso de incumprimento deverá ser bloqueado temporariamente) até atingir cerca de 50 edições. Concluída a semana de testes, o autorizador, que pode ser um burocrata ou um membro do grupo de aprovação de robôs[1], verificará as edições do robô, assim como o seu comportamento, e, se não houver problema, emitirá a autorização para o robô operar, atribuindo-lhe o estatuto (caso seja um burocrata), ou comunicando aos burocratas (caso o membro do grupo de aprovação não seja um deles) ou aos stewards (na ausência de burocratas) a aprovação do pedido. Se existir algum erro, o operador terá de se justificar e, mediante a resposta, será atribuído (ou não) o estatuto, podendo ser solicitadas mais edições de teste, ou prolongado o período de testes. Nota: A utilização das expressões bot e robô nos nomes de usuários (que não sejam bots) será considerada como imprópria, e o usuário deverá ser avisado caso use tal nome impróprio e bloqueado (por período indeterminado). Se for um robô, terá de fazer o pedido para aprovação do estatuto. " Como vê não é bem como o Sr. Diego referiu. Existem regras bastante explícitas e relativamente fáceis de interpretar. Por último: > o que o Diego tem tentado dizer é que convém perceberes como > funciona a wikipédia internamente, convém haver algum envolvimento na > comunidade para perceberes minimamente como funcionam as coisas, o que > podes fazer, o que não podes fazer e como fazer. O que o Diego tem tentado dizer, foi o que disse. Começou com falácias e argumentos quebrados, porque talvez tenha o hábito de não ser contestado. Aliás só no arremate final, mostrou o propósito da sua intervenção: > 3. O ponto que você não entendeu é que você sequer questionou a > comunidade se ela tem interesse no seu projeto. Já considerou a > possibilidade da comunidade achar que seu projeto, por melhor que sejam os > resultados, não deva operar na Wikipédia? Não são apenas questões técnicas > que definem o que será ativo. Existem questões políticas que determinam > isso também (alguns editores acham que as edições não devem ser > robotizadas, por exemplo). Estar em contato com a comunidade e consultar as > opiniões dela é fundamental. > Eu posso ir em um instituto de tratamento de câncer e sugerir perucas > para todos pacientes. Posso até procurar financiamento para desenvolver > essa minha nobre causa. Mas acho que convém eu perguntar antes se os > pacientes querem perucas, não acha? Foi exatamente isso que você não fez. Se o objetivo fosse o de elucidar, teria oferecido os outro 3 pontos no primeiro e-mail que dirigiu. Também teria feito perguntas, em vez das afirmações erradas que fez, como se pode confirmar com uma simples consulta à página do projeto. Sempre disposto, para esclarecer dúvidas, ou a preparar protocolos para mitigar possíveis problemas, desde que a conversa mantenha este nível. Os melhores cumprimentos, Tiago Santos ----------------------------------------------------------------------------
Alchimista alchimistawp gmail.com Sexta-Feira, 7 de Abril de 2017 - 18:54:10 UTC Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia Mensagem seguinte: [WikiPT] Digest WikiPT, volume 54, assunto 4 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Caro Tiago, grande parte do tempo que despendo para a wikipédia anda em redor de bots. Tenho vários a realizar inúmeras tarefas, maioritariamente na wikipédia Lusófona mas por vezes sou solicitado noutros projetos, tal como o Diego sou membro do Grupo de Aprovação de Bots, e a própria política de bots fui eu que a elaborei e propus à comunidade. Não digo isto com o intuito de o menosprezar, mas simplesmente que entenda que é a àrea onde provavelmente estou mais à vontade, portanto o que pretendo é passar-lhe algumas informações de que precisa para começar a compreender o funcionamento da comunidade e dos procedimentos nesta área. << Isto não é um texto legal, portanto: "Corretores automáticos são fortemente desencorajados" deve querer significar: "Corretores automáticos são fortemente desencorajados", algo diferente de "correção de ortografia não é permitida recorrendo a bots." >> A política de bots é o conjunto das regras fundamentais pelas quais os bots se devem reger, cada projeto tem as suas regras específicas, embora todas andem em redor dos mesmos parâmetros. Este é um ponto essencial que precisa perceber e ter em conta. Salvo casos especiais em tarefas específicas e em projetos específicos, os bots precisam de aprovação por parte da comunidade local, caso contrário são bloqueados, e em casos de insistência tratados como vandalismo. Em termos wikipédicos, a Política de Bots é o "texto legal" pelos quais os bots devem reger-se, de uma forma muito suscita. Sobre a parte específica dos corretores ortográficos, o texto não proíbe taxativamente qualquer correção de ortografia automática para permitir que casos específicos possam ser corrigidos, coisas simples, com uma taxa de erro residual e com o apoio da comunidade. No caso inglês, o caso é idêntico ao Lusófono, para um bot poder operar tem de cumprir a política e ser aprovado por um processo similar, aliás, foi a baseado no anglófono que se instituiu a política e a aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder verificar a solução apresentada? < Quanto à atribuição de estatutos, existe já um protocolo, que caso o projeto se concretize, se irá realizar como parte do tempo de desenvolvimento. > Aqui parece haver confusão, a que protocolo se refere? Estes são os pontos mais importantes que penso que convém analisar para já, mas reafirmo o conselho de consultar as documentações, envolver-se com a comunidade e tentar perceber o seu funcionamento. Repare que o próprio Diego lhe indicou o Wikimedia labs [0], ou seja, não é preciso investir no alojamento / servidor, e sinceramente, penso que em vez de bot, o mais apropriado seria uma ferramenta lá. Cordialmente, Alchimista PS Desculpem o texto truncado no outro mail, o touchpad ganhou vida PS.2 Tiago, tenta responder nesta thread, senão fica uma coisa complicada de seguir. ---------------------------------------------------------------------------- Tiago Santos tiagofsantos81 sapo.pt Sábado, 8 de Abril de 2017 - 20:08:42 UTC Mensagem anterior: [WikiPT] Fwd: Re: Fwd: Possível registo malicioso Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ] Caro Alquimista, Não tento presumir que sei mais sobre a Wikipédia, que qualquer um dos aqui presentes. Aliás, tanto o Alquimista como o Sr. Diego estão a ser humildes, dado que além de pertencerem ao grupo de aprovação de bots pertencem ao grupo restrito de 8 burocratas que regem atualmente a Wikipédia Portuguesa. A questão é que, assim que aqui entrei, foi-me recordado que isto é uma instituição politizada. Como tal, devo reger-me pelos seus termos públicos objetivos, tal como os que mencionei, utilizando referências das próprias ligações que me ofereceu. > Em termos wikipédicos, a Política de Bots é o "texto legal" pelos quais os bots devem reger-se, de uma forma muito suscita. A referência a legal, foi com intuito de aligeirar a conversa. Mas eu explico. As palavras em texto jurídicos são sempre mais do que a sua interpretação superficial (p.ex. memorando de entendimento). O mesmo não se costuma passar com regulamentos. Foi exatamente por considerar a página apresenta como "a lei da terra" que me regi por ela. Exatamente por querer fazer as coisas de forma aprovada é que me interessei pelo regulamento. Se existir algo relevante mais objetivo e concreto, por favor, indique-me de forma a que eu o analise e possa continuar com uma conversa informada, assim como a procurar soluções que se enquadrem nos parâmetros já estabelecidos. Se são regras, devo sabe-las em pormenor. > Sobre a parte específica dos corretores ortográficos, o texto não proíbe taxativamente qualquer correção de ortografia automática para permitir que casos específicos possam ser corrigidos, coisas simples, com uma taxa de erro residual e com o apoio da comunidade. Esta foi a parte que eu li. Taxativamente não existe nada de objetivo. Para mim, regras objetivas e números são importantes. Quais são os parâmetros de análise? Percentagem de falsos positivos e corpus de amostragem necessário (n)? O que é considerado uma utilização de recursos computacionais razoável por cada ciclo? Foi isso que referi que iria ajustar com o começo do projeto, apesar de o ter feito com termos de merceeiro de forma a que seja fácil para qualquer um entender a lógica subjacente. Dependendo dos critérios definidos, os meus critérios de seleção e aperfeiçoamento de regras será ajustados. Aliás, eu não quero envolver-me em ortografia, ou em questões de gramática dúbias e polémicas que tendem a entreter académicos. A secção portuguesa do LanguageTool separa as várias variantes, mas tem uma componente que é comum a todas variantes. É exatamente esse sub-conjunto de regras que é comum que será trabalhado. O meu objetivo não é tornar a Wikipédia mais próxima do MEU Português, mas torná-la mais próxima de um Português correto. Para isso só serão utilizadas as regras comuns a todas as variantes. > No caso inglês, o caso é idêntico ao Lusófono, para um bot poder operar tem de cumprir a política e ser aprovado por um processo similar, aliás, foi a baseado no anglófono que se instituiu a política e a aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder verificar a solução apresentada? Esse é o LanguageTool geral. Outras sub-ferramentas dão um extrato das correções. Para um excelente exemplo de ação de um bot semelhante: https://ca.wikipedia.org/wiki/Especial:Contribucions/Langtoolbot > mas reafirmo o conselho de consultar as documentações, envolver-se com a comunidade e tentar perceber o seu funcionamento. Já deve ter percebido, que eu até vejo documentação e de uma forma séria. Mas reafirmo que não comecei a desenvolver. > Repare que o próprio Diego lhe indicou o Wikimedia labs [0], ou seja, não é preciso investir no alojamento / servidor, Eu já tinha sido previamente informado desse recurso (que eu já conhecia). Até analisar toda a informação necessária sobre ele, não me posso comprometer a utilizá-lo. Dependendo de muitas questões distintas, pode ser mais viável pagar pelo alojamento, apesar de qualquer poupança ser bem-vinda. Muitas questão podem tornar essa alojamento inviável ou indesejável. Nem tudo o que não rebato, indica que concordo. De todos os modos, os custos máximos de alojamento que estimei são menos de 8% do valor pedido para a proposta base, sem compromisso de manutenção. Os custos máximos de alojamento seriam, também, para a proposta máxima. > penso que em vez de bot, o mais apropriado seria uma ferramenta lá. Existem imensos projetos possíveis, incluso para outros idiomas distintos. Mas a proposta é a que coloquei. Só são moldáveis os critérios finais de aprovação e a forma como serão realizados. > envolver-se com a comunidade e tentar perceber o seu funcionamento. Quem é a comunidade? Não é o que estou a fazer? Estou a falar consigo, e já falei com mais algumas pessoas, algumas de forma pública como pode constatar. Mas... A comunidade são: os administradores; os burocratas; os utilizadores com contribuições; ou é o total de utilizadores? Qual o modo mais fácil de contactar diretamente os 2 milhões de utilizadores registados e fazer uma votação? Seria interessante aferir a opinião da comunidade no seu todo desta forma. É possível? Espero que seja possível contar com o apoio dos membros mais experientes para resolver estas questões, dado que não consegui encontrar Wikipédia com este tipo de respostas. Os melhores cumprimentos, Tiago Santos
Round 1 2017 decision
editThis project has not been selected for a Project Grant at this time.
We love that you took the chance to creatively improve the Wikimedia movement. The committee has reviewed this proposal and not recommended it for funding. This was a very competitive round with many good ideas, not all of which could be funded in spite of many merits. We appreciate your participation, and we hope you'll continue to stay engaged in the Wikimedia context.
Next steps: Applicants whose proposals are declined are welcome to consider resubmitting your application again in the future. You are welcome to request a consultation with staff to review any concerns with your proposal that contributed to a decline decision, and help you determine whether resubmission makes sense for your proposal.
Over the last year, the Wikimedia Foundation has been undergoing a community consultation process to launch a new grants strategy. Our proposed programs are posted on Meta here: Grants Strategy Relaunch 2020-2021. If you have suggestions about how we can improve our programs in the future, you can find information about how to give feedback here: Get involved. We are also currently seeking candidates to serve on regional grants committees and we'd appreciate it if you could help us spread the word to strong candidates--you can find out more here. We will launch our new programs in July 2021. If you are interested in submitting future proposals for funding, stay tuned to learn more about our future programs.Aggregated feedback from the committee for Automated Portuguese grammar checking edits via LanguageTool
editScoring rubric | Score | |
(A) Impact potential
|
5.4 | |
(B) Community engagement
|
5.1 | |
(C) Ability to execute
|
5.4 | |
(D) Measures of success
|
3.3 | |
Additional comments from the Committee:
|