Date: prev next · Thread: first prev next last
2011 Archives by date, by thread · List index


Ah!, me lembrei ainda que o próprio Daniel Naber iniciou o LanguageTool como
uma ferramenta escrita em Py, o código pode ser encontrado na rede. Depois
ele ampliou o projeto e reescreveu em Java.

--
Noelson


Em 4 de abril de 2011 11:18, Noelson Duarte <noelsond@gmail.com> escreveu:

Olá,

Até onde acompanhei (OOo), a integração Python/OOo era "fraca", pelo menos
no Windows requeria recompilação do Py (por isto o BrOo tem o seu
interpretador Py). Parece que as distros Linux resolveram este problema,
i.é, o OOo Linux usa o interpretador Python da própria distro.

Devido a estas peculiaridades e também pela maior semelhança entre Java e
C++ (o que pode facilitar na migração), creio que, caso seja decidado pela
migração do código do CoGroo, o melhor seria reescrever em C++. O CoGroo
seria escrito na mesma linguagem do aplicativo, e de quebra, poderia ganhar
alguns centésimos de s na performance.

Abraços.

--
Noelson


Em 3 de abril de 2011 20:56, william.colen@gmail.com <
william.colen@gmail.com> escreveu:

Oi, David,


2011/4/2 David Emmerich Jourdain <jourdain@documentfoundation.org>

(...)

Talvez, Rogério. Mas, o maior volume de erros gramaticais que tanto o
CoGroo
como outras ferramentas vão corrigir são relativamente comuns a maioria
dos
idiomas ocidentais. Cito exemplos:

pelo pelo > Corrigir para "pelo";
ou ou > Corrigir para "ou";
e e > Corrigir para "e";
vírgula onde não deveria ter vírgula;


Na verdade o CoGrO não verifica nenhum desses erros. Esse são os ditos
mecânicos, que podem ser resolvidos mecanicamente. Deixamos isso para
desenvolvimento pela comunidade, já que não existe interesse acadêmico,
mas
ngm contribuiu com um patch ainda :-(

E assim por diante.

Não sou profundo estudioso desta problemática, mas o Marcin
(LanguageTool)
me garantiu que estudos feitos pela Universidade de Varsóvia comprovam
que
mais de 80% dos erros gramaticais são comuns aos idiomas ocidentais.
Parece
que todos herdaram os mesmos vícios de gramática dos romanos!! :-)


Em um cenário otimista, pode restar 20% de idiossincrasias da língua
portuguesa, que então poderiam ter regras particulares. Talvez o pt_BR
possa
ter mais particularidades, por conta de outras influências lingüísticas.


Experimentos realizados pela Universidade de São Paulo apontam o contrário
:-)
Tenho aqui referências, com gráficos bonitos inclusive, apontando que o
contrário! Em textos bem escritos, o mais desafiador é encontrar erros
gramaticais, e eles são mais frequentes.



Com isso, um plugin multi-lingual passa a atender a maioria das demandas
de
vários idiomas, a partir de regras comuns a todos e trata suas
particularidades, a partir de arquivos de configuração separados, como:
ext-pt_BR.xml, ext-pt_pt.xml, ext-de_DE.xml, ext-de_AT.xml,
ext-de_CH.xml,
etc...

Até porque disponibilizar na web um arquivo xml, para permitir que a
comunidade colabore com a inclusão de itens de correção gramatical
diminui
a
distância entre desenvolvedor e comunidade e tira das costas dos
desenvolvedores a parte "pesada" do trabalho, que é adicionar as regras
particulares de cada idioma.


Visite o http://ccsl.ime.usp.br/cogroo/comunidade
Durante anos tivemos um XML pronto para receber contribuições:

http://cogroo.svn.sourceforge.net/viewvc/cogroo/cogroo3/trunk/CoGrOOBase/src/main/rules/rules.xml?revision=1409



Acho que temos que ir devagar com o CoGroo ... primeiro a equipe interna
do projeto tem que decidir se vai se esforçar para fazer com que ele
funcione em Java 64bits (não sei nem o que precisa para isso
acontecer),
caso eles não consigam, a coisa complica muito e acho que a ideia de
portar
para Python seja a mais correta (mas isso atrasaria o desenvolvimento
do
projeto em até 1-2anos dependendo da quantidade de gente trabalhando
nele).



Eu também tenho o CoGroo instalado e sei que sentiria falta dele,
contudo,
eu tenho que ser realista e pragmático. Se o melhor caminho for
desenvolver
tudo do zero, para Python, realmente será muito chato. Eu já tive que
reescrever aplicativos, feito por mim e por terceiros, em outra
linguagem.

É uma M#@d%!! :-) Você se sente realmente fazendo "re-trabalho"! É
desgastante!

Por isso, até eu mesmo recomendaria a sugestão dita pelo William, caso o
melhor caminho seja a migração do CoGroo para Python. Ele faz a
consultoria
do trabalho, outros "escovam bits"!!


Vou abordar a questão de um corretor gramatical Python mais tarde.

Abraços !

--
Unsubscribe instructions: E-mail to usuarios+help@pt-br.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/pt-br/usuarios/
All messages sent to this list will be publicly archived and cannot be
deleted




-- 
Unsubscribe instructions: E-mail to usuarios+help@pt-br.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/pt-br/usuarios/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.