Quem já escreveu no Word, o processador de textos da Microsoft, com certeza usou o corretor ortográfico do programa - aquele que sublinha palavras erradas e sugere suas versões corretas. Diante da palavra "coreta", por exemplo, ele vai indicar, por meio de uma linha vermelha embaixo dela, que está errada, e quando o corretor for acionado para corrigir todo o texto, ele vai sugerir, para essa palavra, pela ordem: "correta", "corveta", "corta", "coreto", "corretas" e "careta".
O que poucos sabem é que esta tecnologia de correção de texto para o português tem sotaque caipira - no bom sentido, é claro. Ela foi desenvolvida no interior paulista, no Instituto de Ciências Matemáticas e de Computação (ICMC), da Universidade de São Paulo, em São Carlos, a 241 quilômetros da capital.
É uma história que começou em 1993, quando a Itautec, uma fábrica brasileira de computadores hoje extinta, procurou o ICMC, por causa de seus pesquisadores com formação em computação com alguma ligação com linguagem natural, para que desenvolvessem um sistema de correção ortográfica - que depois evoluiu para gramatical e estilística.
Na época, a internet ainda era novidade. "A ideia era vender o sistema na forma de um CD, principalmente para uso em escritórios, no auxílio à redação de cartas e memorandos, ou seja, para usuários com ensino fundamental ou médio", lembra a cientista da Maria das Graças Volpe Nunes, do ICMC, coordenadora do projeto.
"Aceitamos o desafio e, em pouco mais de um ano, já tínhamos a primeira versão do revisor, que, como projeto científico, ficou conhecido como ReGra."
Maria das Graças conta que, para desenvolver a tecnologia do corretor, foi formada uma grande equipe de pesquisadores, estudantes de computação e linguística. O projeto teve apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), durante um certo período, num programa de parceria com a Itautec. Essa empresa, por sua vez, financiou a equipe durante 15 anos seguidos.
Em 2000, a Microsoft adquiriu uma licença da Itautec para incluir o revisor desenvolvido no ICMC nos seus programas do pacote Office. Mas a equipe continuou a dar assessoria para a Microsoft: novas regras de correção eram implementadas, adaptações eram feitas, como à nova ortografia do português, entre outras coisas. "Em 2008, a Itautec vendeu definitivamente os direitos do produto à Microsoft, e portanto o projeto chegou ao final, com bastante sucesso, por sinal", diz Maria das Graças.
Seu colega no projeto, o físico Osvaldo Novais de Oliveira Junior, do Instituto de Física de São Carlos (IFSC) da Universidade de São Paulo (USP), diz que o ReGra foi o primeiro revisor gramatical desenvolvido para o português.
"No nosso caso, com o léxico da versão brasileira da nossa língua", explica. "Quase na mesma época, uma empresa em Portugal, ativa até hoje, desenvolveu um revisor para a versão do idioma como é falado lá. O lançamento do deles deve ter ocorrido pouco depois do nosso."