Quem já escreveu no Word, o processador de textos da Microsoft, com certeza usou o corretor ortográfico do programa — aquele que sublinha palavras erradas e sugere suas versões corretas. Diante da palavra “coreta”, por exemplo, ele vai indicar, por meio de uma linha vermelha embaixo dela, que está errada, e quando o corretor fracionado para corrigir todo o texto, ele vai sugerir, para essa palavra, pela ordem: “correta”, “corveta”, “corta”, “coreto”, “corretas” e “careta”.
O que poucos sabem é que esta tecnologia de correção de texto para o Português tem sotaque caipira — no bom sentido, é claro Ela foi desenvolvida no interior paulista, no Instituto de Ciências Matemáticas e de Computação (ICMC), da Universidade de São Paulo, em São Carlos. E uma longa história, que começou em 1993, quando a Itautec, uma fabrica brasileira de computadores hoje extinta, procurou o ICMC, por causa de seus pesquisadores com formação em computação com alguma ligação com linguagem natural, para que desenvolvessem um sistema de correção ortográfica — que evoluiu para gramatical e estilística.
Na época, a internet ainda era novidade. “A ideia era vender o sistema na forma de um CD, principalmente para uso em escritórios, no auxílio à redação de cartas e memorandos, ou seja, para usuários com ensino fundamental ou médio”, lembra a cientista Maria das Graças Volpe Nunes, do ICMC, coordenadora do projeto. “Aceitamos o desafio e, em pouco mais de um ano, já tínhamos a primeira versão do revisor, que, como projeto científico, ficou conhecido como Regra”. Maria das Graças conta que, para desenvolver a tecnologia do corretor, foi formada uma grande equipe de pesquisadores, estudantes de computação e linguística.
O projeto teve apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), durante um certo período. Em 2000, a Microsoft adquiriu uma licença da Itautec para incluir o revisor desenvolvido no ICMC nos seus programas do pacote Offlce. Mas a equipe continuou a dar assessoria para a Microsoft: novas regras de correção eram implementadas, adaptações eram feitas, como à nova ortografia do Português.