Durante a vigência do FO1943, as seguintes conversões seriam adequadas para o dicionário pt-pt. Por enquanto não me ocorrem excepções, pelo que não deve haver muitas.
()/g, 'qu$1' ]
()/g, 'gu$1' ]
, 'eia$1' ]
, 'oo$1' ]
Deixo à discussão.JF (discussão) 19h40min de 11 de março de 2011 (UTC)Responder
- Fiz pequenos ajustes na sintaxe das expressões regulares que sugeriu acima:
)ü()/g, '$1u$2' ],
)/, 'eia$1' ],
)/, 'oo$1' ],
- Conforme esta lista de palavras com trema depois de G e Q, parece que a regra para remoção de trema terá alguns falsos positivos, principalmente em nomes próprios (ex.: Agüero, Camagüey, Sigüenza, Argüello).
- Tinha-me esquecido dos nomes espanhóis. É melhor não introduzir a regra para "güe", ficando só para güi, qüi, qüe.
)ü()/g, '$1u$2' ],
- JF (discussão) 22h26min de 12 de março de 2011 (UTC)Responder
- Removi o "
$1
" e o "$2
" da segunda linha pois não há grupos de captura (parênteses) na regex /qüe/g
. Helder 13h26min de 13 de março de 2011 (UTC)Responder
- Era só uma sugestão, porque não entendo muito bem a sintaxe. De qualquer modo obrigado pela correcção.JF (discussão) 13h44min de 13 de março de 2011 (UTC)Responder
- As duas últimas regras se referem apenas às terminações?
- É melhor aplicar só à terminações. JF (discussão) 02h34min de 12 de março de 2011 (UTC)Responder
- A palavra "pléiade" também deve mudar para "pleiade", ou será colocada no dicionário como um falso positivo da expressão regular?
- Deve mudar para "plêiade"JF (discussão) 02h34min de 12 de março de 2011 (UTC)Responder
- PS: A última regra acabou me levando a estes typos frequêntes: voô, voôs, dôou. Sugeri que coloquem no AWB... ;-)
- Pode achar útil o site Regex Tester - RegexPal para testar se certas expressões regulares (sem as /barras/ em volta) detectam determinado texto. Neste outro site (ou neste) também dá para testar as substituições que vão ocorrer. Helder 23h45min de 11 de março de 2011 (UTC)Responder
Fiz o pedido para que um administrador altere as configurações. Helder 13h26min de 13 de março de 2011 (UTC)Responder
Para pt-BR também?
Acho que já passou da hora de colocar regras análogas para a conversão para pt-BR. Sugiro incluir as seguintes (e posteriormente remover do dicionário as regras que se tornarem obsoletas):
)/g, 'ê$1' ],
)/g, 'ô$1' ],
)ü()/g, '$1u$2' ],
,
)/g, 'eia$1' ],
)/g, 'oo$1' ],
O que acham?
(PS: quando um admin for incluir as regras, cuidado com as vírgulas, pois todas as linhas da lista, exceto a última, devem terminar com uma vírgula). Na dúvida, confira com o JSHint antes de salvar (desmarque a opção "When variable is undefined"). Helder 16h43min de 16 de dezembro de 2011 (UTC)Responder
- Visto que não sou brasileiro, acho que a minha opinião não deve contar para esta discussão. Contudo, devo acrescentar que o dicionário Pt-pt está muito mais simples graças à aplicação destas regras. No caso do pt-BR, e como ainda estamos no período de transição para a adopção do AO-1990, sugiro que só as primeiras duas regras (as do é e ó) sejam adoptadas. Quando o período de transição terminar no Brasil as regras restantes serão aplicadas como correcção de erros ortográficos.JF (discussão) 22h27min de 2 de janeiro de 2012 (UTC)Responder
- Bom, como ninguém mais se manifestou, fiz o pedido para que incluam as duas primeiras regras.Helder 20h41min de 6 de julho de 2012 (UTC)Responder
- O Opraco já atendeu o pedido, então foi possível reduzir significativamente o tamanho do dicionário pt-BR (foram economizados pelo menos 7kb) removendo as regras que já não são necessárias. Helder 14h29min de 8 de julho de 2012 (UTC)Responder
Cheguei a tempo para discordar, espero. É muito conflitante editar na wikipédia. Eduardo Pazos (discussão) 22h09min de 8 de julho de 2012 (UTC)Responder
Mas que wikipédia mais injusta. Não vou mais editar nessa porcaria de wikipédia. E podem me bloquear à vontade. Eduardo Pazos (discussão) 22h11min de 8 de julho de 2012 (UTC)Responder
Esta wikipédia está fadado ao fracasso. Esperei melhorias. Mas melhoria é relativo. Estou decepcionado com esse projeto. Esse acordo ortográfico está me causando muita confusão. Eduardo Pazos (discussão) 22h12min de 8 de julho de 2012 (UTC)Responder
- Não entendi a relação do seu comentário com a simplificação que foi feita. Encontrou algum erro? Helder 22h18min de 8 de julho de 2012 (UTC)Responder
Encontrei um erro. Com a adoção do AO-1990, vão continuar existindo grafias duplas: Ex: académica e acadêmica. Homónimo e homônimo. O trema, os ditongos abertos, alguns hífens foram eliminados. Eduardo Pazos (discussão) 22h20min de 8 de julho de 2012 (UTC)Responder
- Tá, mas a simplificação que fizemos não mudou nada em relação a isso. Ou mudou e não percebi? Helder 22h30min de 8 de julho de 2012 (UTC)Responder
Só para o conversor ficar "perfeito" ele ficou muito grande. Pode-se criar uma sub-página, incluindo as regras: académica e acadêmica. Sem problemas. Eduardo Pazos (discussão) 22h27min de 8 de julho de 2012 (UTC)Responder
- O que ficou grande? O dicionário diminuiu, não aumentou. Helder 22h30min de 8 de julho de 2012 (UTC)Responder
Infelizmente, as simplificações que vocês fizeram mudou a grafia dos artigos. A grafia continua escrita nos artigos. Mas o conversor perdeu algumas grafias.
O conversor estava grande e um pouco pesado. É bom o script ficar leve. Helder, você fez uma grande invenção - inventou o conversor das variantes do português. Mudou a história da wikipédia em português para melhor. Eduardo Pazos (discussão) 22h35min de 8 de julho de 2012 (UTC)Responder
Helder, com gentileza, você poderia incluir as regras análogas de é e ó na sub-página do dicionário? Acredito que isso é melhor para a wikipédia. Eduardo Pazos (discussão) 22h37min de 8 de julho de 2012 (UTC)Responder
Será que eu não estou a entender a proposta? Eduardo Pazos (discussão) 22h42min de 8 de julho de 2012 (UTC)Responder
- Já limpou o cache do seu navegador desde que foram feitas as mudanças? Porque o script continua trocando académica por académica normalmente (testei no artigo Semana Académica). Helder 22h50min de 8 de julho de 2012 (UTC)Responder
Helder, a conversão de ém, én, ón e óm está dando errado. Está desconfigurando a gramática do português brasileiro. Académica não converte para Acadêmica. Eduardo Pazos (discussão) 22h45min de 8 de julho de 2012 (UTC)Responder
Que problema de conversão. Pensava que o conversor ia fazer milagres. Eduardo Pazos (discussão) 22h56min de 8 de julho de 2012 (UTC)Responder
Helder, você pode fazer alguma coisa para voltar a converter milénio para milênio, abdómen para abdômen, etc? Eduardo Pazos (discussão) 22h59min de 8 de julho de 2012 (UTC)Responder
- Ele ESTÁ convertendo normalmente, pois a regra está aqui. Limpe o cache do seu navegador e se depois disso ainda encontrar alguma frase em que não está ocorrendo a conversão, coloque uma cópia aqui. Helder 23h11min de 8 de julho de 2012 (UTC)Responder
O Eduardo sugeriu que seria interessante converter as datas que forem escritas como em "a 1 de Março" para a forma "em 1 de março". Se concordarem, acho que será mais prático colocar uma só regra usando expressões regulares em vez de inserir uma regra para cada dia do ano no(s) dicionário(s). Se houver interesse, a regex ficaria assim:
?) de (janeiro|fevereiro|março|abril|maio|junho|julho|agosto|setembro|outubro|novembro|dezembro)/gi, 'em $1 de $2' ],
?) de (janeiro|fevereiro|março|abril|maio|junho|julho|agosto|setembro|outubro|novembro|dezembro)/gi, 'a $1 de $2' ],
Acham que isso deve ser adicionado às configurações? Helder 17h10min de 15 de junho de 2011 (UTC)Responder
Concordo !Silent (discussão) 17h20min de 15 de junho de 2011 (UTC)Responder
- Como não houve objeções até agora, encaminhei o pedido aos administradores. Helder 17h08min de 29 de junho de 2011 (UTC)Responder
A regra tal como está não implicaria que escrevêssemos "01 de julho" em vez de "1 de julho"? Não sei como é, mas deveríamos adicionar
"nada" ao . Desculpem só agora ter reparado nisto.JF (discussão) 15h29min de 1 de julho de 2011 (UTC)Responder
- Não entedi muito bem a pergunta, mas se for o que eu entendi, não, pode-se escrever tanto "01 de julho" como "1 de julho". !Silent (discussão) 15h43min de 1 de julho de 2011 (UTC)Responder
- Na verdade, o "nada" já está ali: a interrogação após o primeiro grupo de caracteres (que detecta números de 0 a 3) é um quantificador que indica que ele é opcional. Pode conferir quais expressões são detectadas pela expressão regular inteira colocando algumas frases de exemplo no site RegexPal. Helder 16h55min de 1 de julho de 2011 (UTC)Responder
- É.
?
quer dizer que caracteres de 0 a 3 podem aparecer ou não. !Silent (discussão) 17h09min de 1 de julho de 2011 (UTC)Responder
- Muito obrigado pela explicação. Afinal era só desconhecimento meu da síntaxe.JF (discussão) 22h40min de 15 de julho de 2011 (UTC)Responder
Precisaremos fazer uma correção para evitar o problema que foi descrito aqui. Acredito que é suficiente colocar um espaço antes de "a" e antes de "em", pois é nestes casos que as expressões deverão ser convertidas. Há algum outro caso em que é necessária a conversão? Helder 21h23min de 22 de julho de 2011 (UTC)Responder
- Feito . Helder 16h56min de 14 de agosto de 2011 (UTC)Responder
Eduardo Pazos (discussão) 21h20min de 14 de agosto de 2011 (UTC)Responder
- Pode dar um exemplo de um artigo em que " a 9 de Agosto" não esteja sendo convertido para " em 9 de Agosto"? Neste exemplo funciona perfeitamente. Helder 00h23min de 15 de agosto de 2011 (UTC)Responder
Agora que todas as wikis podem ser usadas em https e que os links relativos ao protocolo já funcionam, precisamos que alguém atualize a parte do gadget que importa o script do Wikisource. Coloquei a atualização sugerida na página de testes. Podem atualizar o script, por favor? Helder 21h29min de 4 de outubro de 2011 (UTC)Responder
- PS: vale lembrar que é bom colocar um sumário que descreva a alteração, em vez de algo pouco informativo como "ver discussão" ou "Pedido em ]", para facilitar a vida de futuros editores... Helder 21h29min de 4 de outubro de 2011 (UTC)Responder
- Feito nesta edição. Helder 19h41min de 2 de janeiro de 2012 (UTC)Responder
Conforme este tópico, por favor coloquem o seguinte
,
)e\(c\)ção/g, '$1ecção' ]
no final da configuração pt-pt
da lista typo_changes
(notem que é preciso uma vírgula entre o último item existente e o novo que será incluído). O código análogo para pt-br
é:
,
)e\(c\)ção/g, '$1eção' ]
Helder 12h01min de 23 de novembro de 2011 (UTC)Responder
- Feito nesta edição. Helder 19h41min de 2 de janeiro de 2012 (UTC)Responder
O texto seguinte foi movido de: s:Utilizador:Helder.wiki/Scripts/LanguageConverter
Olá Hélder
Tenho estado a adicionar novas palavras a este dicionário, e mesmo que esta funcionalidade esteja um pouco esquecida, continuo a achar que é uma muito boa ideia.
Tenho várias sugestões para o melhoramento do dicionário e uma delas diz respeito a variações das terminações das palavras. Nas discussões iniciais parecia-me que era possível que o dicionário funcionasse assim, mas depois acabou por não usar fracções de palavras.
Eis alguns exemplos daquilo que eu pretendia:
- súdit : súbdit //resultaria para as quatro variantes em género e número,
- aterriss* : aterr* // "aterrisagem" e as formas do verbo "aterrissar" são convertíveis directamente retirando as letras "iss".Japf (discussão) 23h39min de 29 de Junho de 2012 (UTC)
O texto acima foi movido de: s:Utilizador:Helder.wiki/Scripts/LanguageConverter
- Oi! Só agora notei sua mensagem.
- O conversor que é usado na wiki chinesa (feito em PHP) difere desse script que foi adaptado do Wikisource para um gadget. Neste último, o único jeito de fazer a conversão de váriações das palavars com uma única regra é colocando expressões regulares aqui nas configurações do gadget, como foi feito para os acentos. Helder 02h18min de 1 de novembro de 2012 (UTC)Responder
- Oi Helder
- Haverá um modo de eu fazer experiências com o script do conversor de modo que só eu veja as alterações. Tenho quase a certeza que não é preciso alterá-lo muito.JF (discussão) 21h51min de 15 de novembro de 2012 (UTC)Responder
- O que pretende experimentar? Novas regexes? Se for isso, pode fazer assim: copie o conteúdo da MediaWiki:Gadget-LanguageConverter.js para o seu common.js e desative a "versão oficial" nas preferências, para não carregá-lo dus vezes. Aí é só ir modificando as listas de "typo_changes" como quiser (mas se for continuar os testes por muito tempo será bom continuar vigiando esta página aqui, para ver quando há novas atualizações que deseje incorporar também na sua cópia). Helder 22h33min de 15 de novembro de 2012 (UTC)Responder
- Não. Não me parece que mexer nas regexes seja a solução para o meu problema. O que eu precisaria de alterar seria .JF (discussão) 23h26min de 15 de novembro de 2012 (UTC)Responder
- Sendo assim também precisará copiar a oldwikisource:User:Helder.wiki/Scripts/LanguageConverter.js para uma subpágina sua (e trocar o link na sua cópia da MediaWiki:Gadget-LanguageConverter.js também) para fazer mudanças nela. Que tipo de teste pretende fazer? Helder 11h29min de 16 de novembro de 2012 (UTC)Responder
- Eu pretendia ver se podia alterar o código de modo a permitir a minha proposta. Já criei uma cópia do Language converter. Também tenho de fazer uma cópia do Gadget?JF (discussão) 20h41min de 16 de novembro de 2012 (UTC)Responder
┌─────────────────┘
Sim, copie para User:Japf/common.js e troque o link do final por
mw.loader.load( '//pt.wikipedia.org/w/index.php?title=User:Japf/Scripts/LanguageConverter.js&action=raw&ctype=text/javascript&smaxage=21600&maxage=86400' );
(e desative o gadget). Helder 21h08min de 16 de novembro de 2012 (UTC)Responder
- Já está, mas o código é muito mais intricado do que eu pensava. Não devo conseguir fazer nada.JF (discussão) 23h40min de 16 de novembro de 2012 (UTC)Responder
- Hmm.. De qualquer modo, aqui faltou remover a vírgula de "'pt-pt':'Português de Portugal',". Helder 11h43min de 17 de novembro de 2012 (UTC)Responder
- Aquilo foi só um teste para verificar se realmente as minhas alterações faziam efeito. Não mudei isso para toda a gente, pois não?JF (discussão) 16h53min de 17 de novembro de 2012 (UTC)Responder
- Já vi que não há modo de resolver esse problema. O programa precisa de usar espaços como separadores entre as palavras.JF (discussão) 21h26min de 17 de novembro de 2012 (UTC)Responder
- Pois é... eu até coloquei na lista de sugestões, mas parece complicado... Helder 22h53min de 20 de novembro de 2012 (UTC)Responder
Calma Helder. O conversor converte Arménia => Armênia. Não converte Roménia, Estónia, Letónia, Polónia e género. É algum problema de programação. E se estivesse assim no conversor: én => ên, ón => ôn‽ Eduardo Pazos (discussão) 22h08min de 12 de novembro de 2012 (UTC)Responder
- Converte sim. Helder 22h12min de 12 de novembro de 2012 (UTC)Responder
Estive a estudar meios de melhorar as conversões entre as várias versões do português. Dado o actual lay-out dos sistemas de conversão cheguei à conclusão que só se pode recorrer a regexes no LanguageConverter. Por favor deem a vossa opinião na página de discussão de Usuário(a):Japf/common.js.JF (discussão) 21h47min de 22 de fevereiro de 2013 (UTC) Responder
- Para facilitar, estas são as mudanças em relação a versão atual. Helder 01h18min de 23 de fevereiro de 2013 (UTC)Responder
- Fiz duas edições relacionadas a isso: , . Helder 21h11min de 28 de fevereiro de 2013 (UTC)Responder
- O problema com as minúsculas é um problema que eu não consegui lidar. Se nós fizermos /ô/gi, o sistema vai detectar tanto "ô" como "Ô", mas depois susbtitui os dois por "ó". Outro problema relacionado é a conversão de "Tcheca" que dá "checa". Há maneiras de contornar isto?JF (discussão) 21h26min de 28 de fevereiro de 2013 (UTC)Responder
- Não basta criar duas regras em vez de uma só para lidar com maiúsculas e minúsculas? (como em alguns itens da lista de typos do AWB). Helder 22h03min de 28 de fevereiro de 2013 (UTC)Responder
- Mas isso iria duplicar número de entradas. Devia haver algum modo de evitar essa duplicação.JF (discussão) 10h59min de 1 de março de 2013 (UTC)Responder
- Não que eu saiba. Mas esse tipo de problema não acontece com todas as entradas, certo? Sua preocupação neste caso é com o tamanho da lista ou com a velocidade de execução? O impacto disso na velocidade não deve ser perceptível... Quanto ao tamanho do código, se aparecerem muitos casos, pode-se tentar modificar o código colocando as partes repetitivas "em evidência", no estilo do en:User:Ohconfucius/script/EngvarB.js (ver detalhes). Helder 11h41min de 1 de março de 2013 (UTC)Responder
- Se a velocidade de execução não é afectada, não há problema em adicionar as duas entradas. Mas parece que você está a tentar resolver esse problema, por isso, podemos esperar um pouco para ver se consegue.JF (discussão) 12h24min de 1 de março de 2013 (UTC)Responder
parece que você está a tentar resolver esse problema
A que se refere? Helder 12h39min de 1 de março de 2013 (UTC)Responder
- Pela discussão em en:User talk:Ohconfucius/archive16#Simplifying ENGVAR script parece-me que você está a tentar resolver a questão das letras maiúsculas, ou percebi mal?JF (discussão) 13h44min de 1 de março de 2013 (UTC)Responder
- Ahh... aquele comentário de 2010 se referia aos dicionários, nos quais isso já está implementado (mas nos quais não dá para usar expressões regulares). Helder 13h50min de 1 de março de 2013 (UTC)Responder
- OK!
┌─────────────────────────┘
Pensando bem, acho que eu me referia um trecho do seguinte tipo que há nas minhas configurações do TemplateScript:
$.each( tabela, function(find, rep){
list.push({
find: new RegExp(find, 'g'),
replace: rep
},{
// Converte também a palavra correspondente com a primeira letra maiúscula
find: new RegExp('\\b' + ucFirst(find), 'g'),
replace: ucFirst(rep)
});
});
E isso é exatamente o que eu falei acima: colocar duas regras na lista, em vez de uma só. Mas um loop como o indicado acima permite que seja economizado código se houver muitas regras em que a duplicação é necessária. Helder 13h57min de 1 de março de 2013 (UTC)Responder
- Se receia que haja algum problema, pode colocar essas linhas de código no meu commons e eu verificarei se funciona bem.JF (discussão) 15h11min de 1 de março de 2013 (UTC)Responder
- Confira se estraguei ou melhorei o funcionamento com estas três alterações. Helder 15h46min de 1 de março de 2013 (UTC)Responder
- Mas aquelas linhas de código algumas linhas acima, não fazem esse trabalho?JF (discussão) 18h41min de 1 de março de 2013 (UTC)Responder
- Há também um problema com "gerenciar" e "Úmido" não é substituído.Sugere-me alguma alternativa para evitar que se obtenha "O canadianO"?JF (discussão) 18h46min de 1 de março de 2013 (UTC)Responder
- As repetições são menores do que o código acima. Se houver muitas repetições aí sim vale a pena tentar simplificar com um código do tipo que citei.
- De certeza que haverá muitas mais repetições. Eu quero experimentar usar esse código, mas não sei onde o colocar, por isso peço que você o faça.
- Esta linha está confusa (além de não detectar nada por causa do "^", que representa o final da string). Quais palavras está querendo detectar exatamente? Se remover a parte "^(or)" detectará alguma coisa, mas ainda assim estará sobrando várias outras.
- Só as palavras verdadeiras contam. Acho que podemos retirar o ^(or), porque "gerenciador" mudava corretamente para "gestor". Vou experimentar e ver se funciona.
- No caso de "O canadianO", também deve ser só uma questão de separar os casos (falta fazer o mesmo com os "ADNadn"). Helder 20h07min de 1 de março de 2013 (UTC)Responder
- Não me parece haver problemas com os ADNadn.JF (discussão) 23h43min de 1 de março de 2013 (UTC)Responder
Olá, alguém poderia por favor adicionar também o código da língua mirandesa: mwl, para eu trabalhar no dicionário mirandês? Cumprimentos. Athena La vie est drôle! 05h06min de 3 de setembro de 2017 (UTC)Responder
- Olá, o mirandês é considerado uma língua diferente do português. Este gadget talvez fizesse melhor efeito em relação ao asturiano que é mais próximo.JF (discussão) 14h38min de 3 de setembro de 2017 (UTC)Responder
- Verdade, mirandês é outra língua. Tanto que tem até uma versão própria da Wikipédia só para essa língua. !Silent (discussão) 17h32min de 3 de setembro de 2017 (UTC)Responder
- Da versão mirandesa já conheço, pois também contribuo nela. De facto, havia me esquecido que o gadget é só para os dialectos da língua portuguesa, e o galego. Vou trabalhar brevemente nos dicionários do português de Cabo Verde, Guiné-Bissau, Macau, São Tomé e Príncipe e Timor-Leste. Athena La vie est drôle! 18h21min de 3 de setembro de 2017 (UTC)Responder
- Sua intenção é utilizar o script na pt.wikipedia.org (convertendo para mwl) ou na mwl.wikipedia.org (convertendo para pt ou pt-br)?
- Tem a opção de copiar a configuração do gadget para os seus scripts pessoais e modificá-la para que apareça a opção extra quando acessa as wikis, e criar um dicionário em uma subpágina sua (fiz isso para o Galego, em gl:Usuario:He7d3r/common.js por exemplo). Helder 18h54min de 3 de setembro de 2017 (UTC)Responder
- Inicialmente, pensava em utilizar o script na pt.wiki para converter os textos em mirandês, e posteriormente criar um dicionário em português na mwl.wiki. Tentarei criar uma subpágina com o código do script na versão mirandesa para criar o dicionário e outro dia foco na criação dos dicionários noutros dialectos da língua portuguesa que faltam aqui, muito obrigada pela vossa ajuda, cumprimentos. Athena La vie est drôle! 20h34min de 3 de setembro de 2017 (UTC)Responder