Notícia

O Tempo Semanário - Um Jornal de Classe

USP desenvolve ferramenta de correção automática de redações

Publicado em 10 março 2021

Corrigir redações de forma automática a fim de aprimorar as habilidades dos estudantes que farão o Exame Nacional do Ensino Médio (Enem). Esse é o principal objetivo de uma ferramenta criada por pesquisadores do Instituto de Física de São Carlos (IFSC) e do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.

Disponível por meio de um aplicativo para smartphones com sistema Android e de um site, a solução possibilita identificar erros gramaticais, de pontuação, de digitação e de concordância nas redações. Para criar a ferramenta, que recebeu o nome de Corretor Inteligente de Redações Automático (CIRA), o estudante Gabriel Nogueira, que cursa Bacharelado em Ciências de Computação no ICMC, empregou técnicas da área de inteligência artificial.

“A ferramenta foi criada a partir de uma base de 100 mil redações da empresa Letrus, que foram corrigidas e pontuadas por professores seguindo os moldes da avaliação do Enem. A partir dos critérios utilizados por esses professores, o sistema inteligente aprendeu quais aspectos precisam ser levados em conta em uma correção e como estabelecer uma nota”, relata Gabriel.

A CIRA é resultado de um projeto de iniciação científica, em que Gabriel é orientado pelo professor Osvaldo Novais de Oliveira Jr, do IFSC, com bolsa da FAPESP. É composta por dois elementos essenciais: um sistema inteligente que estabelece uma pontuação para a redação, e outro que apresenta sugestões de como o usuário pode melhorar seu texto. “A redação é um dos itens mais relevantes da avaliação do Enem e de vestibulares, e os alunos podem ser treinados para escrever melhor. Além disso, a habilidade de escrita é uma das mais relevantes para qualquer curso universitário e profissão”, explica o professor Osvaldo.

Segundo ele, esse aprendizado não é simples, e o ideal é que o estudante tenha bons professores de português, leia muito e pratique a escrita tanto quanto possível. “Diante de tantas exigências, acredito que os estudantes podem se beneficiar de uma ferramenta como a CIRA, pois podem treinar a escrita de redações e receber retroalimentação e sugestões instantaneamente”, acrescenta o professor. Ele também ressalta que a ferramenta poderá ser útil para professores que precisam corrigir muitas redações, pois a pontuação fornecida poderá servir de baliza nessa árdua tarefa.

Como funciona – Para ter sua redação corrigida, basta o usuário fazer o download do aplicativo na Google Play Store ou acessar o site da CIRA. Depois, é só o usuário digitalizar a redação e submetê-la à ferramenta. “No futuro, pretendemos ter um sistema de leitura óptica de caracteres, de forma que o usuário poderá digitalizar sua redação de forma automática, bastando apontar a câmera do celular para o texto escrito no papel”, revela Gabriel.

Após fazer a submissão, o sistema apresenta ao usuário uma tela de resultados, em que constam a nota atribuída à redação e estatísticas sobre o texto (número de palavras, por exemplo). Caso erros sejam encontrados, eles são marcados em vermelho. Ao clicar em cima deles, abre-se uma janela contendo informações sobre o erro e sugestões de como remediá-lo. Gabriel preparou um vídeo para demonstrar como funciona o aplicativo na prática: clique aqui para assistir.

Ele conta que a ideia de criar o aplicativo surgiu quando estava prestes a terminar o projeto de iniciação científica. “Eu estava cursando a disciplina Programação Orientada a Objetos, ministrada pelo professor Márcio Eduardo Delamaro, no ICMC. A disciplina propunha, como projeto final, a implementação de um software e fiz um aplicativo simples, que funcionava apenas em computadores de mesa (desktops)”.

Esse aplicativo simples se tornou o embrião da CIRA. “Apesar de, posteriormente, termos descartado essa versão inicial do aplicativo e feito um novo aplicativo e um novo sistema do zero, durante esse projeto final da disciplina coloquei em prática boa parte das ideias que, mais tarde, viriam a compor a CIRA”, conta o estudante.

Pronto para uso, o aplicativo e o site continuam sendo aperfeiçoados por Gabriel, que pretende fazer a CIRA fornecer uma pontuação cada vez mais precisa e melhores sugestões aos usuários.

Linguística computacional – O projeto de Gabriel é um dos frutos das pesquisas realizadas pelo Núcleo Interinstitucional de Linguística Computacional (NILC), um grupo multidisciplinar de pesquisa, sediado no ICMC. Criado em 1993, o Núcleo conta hoje com pesquisadores de várias instituições, como USP, UNESP, Universidade Federal de São Carlos e Universidade Estadual de Maringá.

A ideia de desenvolver um sistema com correção automática de redações é relativamente antiga no NILC, pois em 2007 foi publicado um artigo de pesquisadores do IFSC e do ICMC prevendo que métricas estatísticas de textos poderiam ser correlacionadas com a qualidade. O sistema começou a se tornar realidade em 2019, com um projeto patrocinado pela Pró-Reitoria de Pesquisa da USP em um programa sobre sistemas inteligentes. Uma equipe foi formada com professores dos dois institutos, além de bolsistas do ICMC, incluindo Gabriel Nogueira.

O NILC é uma referência para os grupos de pesquisa em processamento de linguagem natural do Brasil. Além de inovar em diversas frentes de pesquisa, o Núcleo já estabeleceu colaborações com várias empresas – como Itautec, Microsoft, Samsung e Embrapa, possibilitando a transferência de tecnologia – e com institutos de pesquisa, como o Instituto de Estudos Avançados da ONU, para projetos de grande porte.

Entre as áreas de atuação do NILC estão projetos para enfrentar desafios científicos relacionados a tradução, ferramentas de auxílio à escrita científica e sumarização – que já são tradicionalmente explorados por quem investiga linguística computacional. Com a expansão da internet e das redes sociais, novas frentes de atuação foram criadas, destinadas, por exemplo, a estudar desafios como a detecção de fake news, a mineração de opinião e o diagnóstico de doenças mentais através da fala, entre muitos outros.