Você internauta, já recebeu ou compartilhou alguma notícia de conteúdo duvidoso nas plataformas digitais? Esses materiais mais conhecidos como fake news, são considerados como uma ameaça para o senso crítico dos usuários, e isso se torna muito sério, pois influencia diretamente na tomada de decisões de diversos aspectos.
Na atual era de fake news tem sido cada vez mais desafiador distinguir notícias falsas ou falsificadas das reais. Pensando nisso, pesquisadores ligados ao Centro de Ciências Matemáticas Aplicadas à Industria (CeMEAI) , desenvolveu uma plataforma Web para facilitar essa tarefa.
Por meio de uma combinação de modelos estatísticos e técnicas de aprendizado de máquina, a plataforma é capaz de predizer a probabilidade de um texto ser fake ou não. Através dos resultados preliminares, foi possível ver que o sistema detectou notícias falsas com 96% de precisão.
“A ideia da plataforma é oferecer à sociedade uma ferramenta adicional para identificar de forma não somente subjetiva se uma notícia é ou não falsa”, diz Francisco Louzada Neto, diretor de transferência tecnológica do CeMEAI e coordenador do projeto.
Características das fake news
Ao receber um texto, que deve conter a notícia completa, o sistema aplica métodos estatísticos para avaliar características de escrita, como palavras usadas ou classes gramaticais mais frequentes.
Essas caraterísticas são utilizadas por um classificador baseado em um modelo de aprendizado de máquina que é capaz de distinguir padrões de linguagem, vocabulário e semântica de notícias falsas e de verdadeiras e, dessa forma, inferir automaticamente se um texto submetido à plataforma é ou não uma fake news.
“As fake news apresentam padrões na redação do texto, uso e frequência de palavras que podem ser identificáveis pelo classificador”, afirma Louzada.
Os pesquisadores da USP, usaram um banco de dados composto por notícias verdadeiras e falsas, todas escritas em português para treinar a eficácia dos modelos. Além disso, os modelos foram expostos ao vocabulário usado em mais de 100 mil notícias publicadas nos últimos cinco anos.
A base de notícias serviu de entrada para os modelos estatísticos computacionais empregados na plataforma buscarem automaticamente padrões na redação do texto, como o uso e a frequência das palavras.
“Precisamos sempre atualizar e dar mais subsídios para os modelos usados pela plataforma, de modo a melhorar a acurácia e aumentar a capacidade de predição de fake news”, avalia Louzada.
E para comprovar ainda mais a precisão certa dos modelos, os pesquisadores pretendem usar as fake news que circularão nas eleições brasileiras deste ano e as relacionadas à pandemia de Covid-19.
“O combate às fake news é uma corrida de gato e rato porque, ao mesmo tempo que tem surgido plataformas como a que desenvolvemos para detectá-las, os métodos para produzir essas notícias falsas também têm sido aprimorados”, avalia Louzada.
Uma das preocupações é que o sistema também possa ser usado por criadores de fake news para avaliar o potencial de uma notícia falsa passar por verdadeira antes de ser difundida.
“Esse é um risco com o qual teremos que lidar”, afirma.
Plataformas para outras aplicações
A plataforma para detecção de fake news começou a ser desenvolvida por participantes da última edição do Mestrado Profissional em Matemática, Estatística e Computação Aplicadas à Indústria (Mecai), oferecido pelo ICMC-USP e em um dos cursos da área de educação corporativa oferecidos pelo CeMEAI.
Outras soluções desenvolvidas por participantes do curso foram uma plataforma web para antecipação do valor de mercado de criptomoedas e um sistema para acompanhamento de óbitos por COVID-19 em nível municipal.
“Percebemos a dificuldade de acesso aos dados referentes à evolução dos casos e óbitos e de previsão dos números de infectados e mortos em nível municipal em diferentes períodos da pandemia. Com base nessa constatação, a ideia é criar um website que disponibilizará esses dados para cada município do Brasil”, diz Louzada.
As informações são da Agência Fapesp publicada nesta quarta-feira (23).