Salvador Nogueira escreve para a 'Folha de SP':
Após mais de 12 anos de trabalho árduo, Aiuruetê finalmente começou a ganhar fluência na língua portuguesa.
Agora, ele já lê em voz alta com sucesso e está quase pronto para entrar no mercado de trabalho. Aiuruetê é um programa de computador.
Desenvolvido a partir da união de esforços de engenheiros e linguistas da Unicamp, trata-se do terceiro protótipo de um software conversor texto-fala. Ou seja, ele é capaz de ler um texto qualquer em voz alta.
Por razões óbvias, cada língua exige uma base de dados diferente para que um programa desse tipo funcione.
A pronúncia das palavras muda completamente de um idioma para outro, exigindo que cada país desenvolva seus sistemas, voltados para sua língua e seu vocabulário específicos.
Além disso, mesmo considerando só o português, as letras ganham pronúncias diferentes, dependendo das palavras nas quais estão inseridas.
'O 'x' é um dos casos mais complicados, que pode assumir um som de 'sc', 's', 'x' e 'z', diz Fábio Violaro, coordenador do projeto na Faculdade de Engenharia Elétrica e de Computação da Universidade.
Para isso, o programa precisa trabalhar com unidades fonéticas, não com as letras do alfabeto. Foi aí que a participação do pessoal do Instituto de Estudos da Linguagem foi preciosa.
Eles compilaram uma base de 2.500 polifones (as tais unidades de pronúncia), que foi aplicada ao sistema.
Também foi o pessoal da lingüística que batizou o programa de Aiuruetê, que em tupi quer dizer 'papagaio verdadeiro'.
O sistema já é capaz de sintetizar em som as palavras de praticamente qualquer texto, mas ainda é deficiente na expressão de emoções.
É nisso que o grupo da Unicamp está concentrado agora, desenvolvendo um módulo de programação capaz de dar entonação mais natural à voz do computador.
Embora não tenha por objetivo tornar o programa uma aplicação comercial, a equipe presta assessoria e forma pessoal para empresas nacionais que possam ter interesse em desenvolver sistemas para o mercado brasileiro.
Segundo Violaro, a pesquisa não vai só na direção de apurar as 'cordas vocais' da máquina, mas também seus ouvidos.
O grupo também trabalha no desenvolvimento de sistemas de reconhecimento de voz - ou seja, que permitem que o computador entenda o que o usuário está dizendo.
'Com comandos simples [uma palavra], a taxa de acerto é de 99%. Com fala contínua, o acerto gira em torno de 91%, 92%.'
As aplicações são variadas. O físico britânico Stephen Hawking, vítima de esclerose lateral amiotrófica, há anos usa um conversor de texto em fala sofisticado para se comunicar.
O sistema também pode ser adaptado para uso em ensino a distância via computador, pode ajudar deficientes visuais a interagir com a máquina e realizar diversas tarefas hoje exclusivas de seres humanos.
'Infelizmente você pode dispensar um monte de atendentes por causa dessas máquinas', diz Violaro.
(Folha de SP, 25/6)
Notícia
JC e-mail