Notícia

Jornal da Cidade (Bauru, SP) online

Sistema quer ampliar detecção de doenças pela voz

Publicado em 22 março 2010

Um fonoaudiólogo pede ao paciente para falar a vogal "a" diante de um microfone. Após alguns minutos, em um monitor de computador, o médico recebe os dados analisados pelo programa com uma suspeita de diagnóstico, caso alguma alteração seja detectada. Tornar possível essa cena é o objetivo de pesquisadores da Escola de Engenharia de São Carlos da Universidade de São Paulo que trabalham com sistemas de análise de voz.

Durante o doutorado no Departamento de Engenharia Elétrica, Paulo Rogério Scalassara trabalhou em um sistema de processamento digital de sinais que pudesse discriminar certas doenças relacionadas ao aparelho fonador. O estudo envolveu duas patologias: nódulos nas pregas vocais e o edema de Reinke, uma espécie de inflamação das pregas vocais que provoca o seu inchaço.

Agora, Scalassara pretende englobar no sistema outras quatro patologias: pólipo, carcinoma da laringe, mal de Parkinson e tremor essencial, um distúrbio neurológico semelhante ao Parkinson. Assim como ocorreu no doutorado, ele tem apoio da FAPESP por meio de Bolsa de Pós-Doutorado.

Scalassara se utiliza de um banco de vozes pré-gravadas e digitalizadas. Esses arquivos são submetidos a análises feitas com softwares baseados em modelos específicos. A inovação da pesquisa está nesses modelos.

"Os modelos convencionais observam alterações em características lineares da voz e nós utilizamos medidas de informação do sinal, como a entropia", disse à Agência FAPESP.

A entropia, no caso, refere-se ao grau de desordem inerente ao sinal vocal. O que os modelos fazem é selecionar trechos e testar previsões de como ele se comportará em seguida. A previsão é então comparada ao trecho posterior e, desse modo, é testada. Com base nos modelos de previsão usados, vozes oriundas de tratos vocais saudáveis têm características mais "previsíveis", ou seja, menor entropia. Por outro lado, doenças que comprometem o aparelho fonador geram vozes com maior entropia. Têm maior grau de irregularidade e, portanto, são menos previsíveis.

Agência Fapesp