Notícia

JC e-mail

Programa de computador lê em português

Publicado em 26 junho 2003

Salvador Nogueira escreve para a 'Folha de SP': Após mais de 12 anos de trabalho árduo, Aiuruetê finalmente começou a ganhar fluência na língua portuguesa. Agora, ele já lê em voz alta com sucesso e está quase pronto para entrar no mercado de trabalho. Aiuruetê é um programa de computador. Desenvolvido a partir da união de esforços de engenheiros e linguistas da Unicamp, trata-se do terceiro protótipo de um software conversor texto-fala. Ou seja, ele é capaz de ler um texto qualquer em voz alta. Por razões óbvias, cada língua exige uma base de dados diferente para que um programa desse tipo funcione. A pronúncia das palavras muda completamente de um idioma para outro, exigindo que cada país desenvolva seus sistemas, voltados para sua língua e seu vocabulário específicos. Além disso, mesmo considerando só o português, as letras ganham pronúncias diferentes, dependendo das palavras nas quais estão inseridas. 'O 'x' é um dos casos mais complicados, que pode assumir um som de 'sc', 's', 'x' e 'z', diz Fábio Violaro, coordenador do projeto na Faculdade de Engenharia Elétrica e de Computação da Universidade. Para isso, o programa precisa trabalhar com unidades fonéticas, não com as letras do alfabeto. Foi aí que a participação do pessoal do Instituto de Estudos da Linguagem foi preciosa. Eles compilaram uma base de 2.500 polifones (as tais unidades de pronúncia), que foi aplicada ao sistema. Também foi o pessoal da lingüística que batizou o programa de Aiuruetê, que em tupi quer dizer 'papagaio verdadeiro'. O sistema já é capaz de sintetizar em som as palavras de praticamente qualquer texto, mas ainda é deficiente na expressão de emoções. É nisso que o grupo da Unicamp está concentrado agora, desenvolvendo um módulo de programação capaz de dar entonação mais natural à voz do computador. Embora não tenha por objetivo tornar o programa uma aplicação comercial, a equipe presta assessoria e forma pessoal para empresas nacionais que possam ter interesse em desenvolver sistemas para o mercado brasileiro. Segundo Violaro, a pesquisa não vai só na direção de apurar as 'cordas vocais' da máquina, mas também seus ouvidos. O grupo também trabalha no desenvolvimento de sistemas de reconhecimento de voz - ou seja, que permitem que o computador entenda o que o usuário está dizendo. 'Com comandos simples [uma palavra], a taxa de acerto é de 99%. Com fala contínua, o acerto gira em torno de 91%, 92%.' As aplicações são variadas. O físico britânico Stephen Hawking, vítima de esclerose lateral amiotrófica, há anos usa um conversor de texto em fala sofisticado para se comunicar. O sistema também pode ser adaptado para uso em ensino a distância via computador, pode ajudar deficientes visuais a interagir com a máquina e realizar diversas tarefas hoje exclusivas de seres humanos. 'Infelizmente você pode dispensar um monte de atendentes por causa dessas máquinas', diz Violaro. (Folha de SP, 25/6)