Notícia

W Rádio Brasil

Matemática é ferramenta para aumentar representatividade no uso de big data

Publicado em 08 agosto 2019

Matemática é ferramenta para aumentar representatividade no uso de big data

A chamada revolução dos dados possibilitou muitos avanços. Conceitos das ciências de dados, como big data, aprendizado de máquina e inteligência artificial, tornaram-se triviais e, na prática, permitiram o surgimento de inúmeras soluções tecnológicas capazes de amparar tomadas de decisão. A matemática tem despontado como ferramenta para driblar os pontos cegos desse processo, minimizando preconceitos e análises estatísticas enviesadas.

O tema foi debatido por especialistas durante a mesa-redonda de abertura da Escola São Paulo de Ciência Avançada sobre Aprendizado de Dados, realizada de 29 de julho a 9 de agosto no Centro de Difusão Internacional (CDI) da USP. O evento teve apoio da FAPESP e organização do Instituto de Matemática e Estatística (IME-USP).

“A matemática gera insumos rigorosos, deixando tudo mais claro. Hoje qualquer um pode gerar, hospedar e consumir dados. O mundo está mudando muito em termos de como os dados são gerados. No entanto, minorias tendem a ficar de fora desses dados gerados. Nos Estados Unidos, podemos notar isso em hospitais, por exemplo”, disse Ling Liu, professora no Georgia Institute of Technology (GeorgiaTech), dos Estados Unidos, à Agência FAPESP.

De acordo com Liu, como algumas populações não têm acesso aos serviços, elas deixam de ser representadas nos dados que servem de base para projetos de aprendizado de máquina para diagnósticos, por exemplo. “Não é proposital, mas há preconceito. Como o modelo diagnóstico não serve para essas pessoas, elas se tornam um tipo raro”, disse.

Para Liu, a combinação de matemática e ciência de dados é capaz de encorajar a sociedade, os jovens e os profissionais a mudar essa nova realidade. “Com a matemática e as ferramentas de ciências de dados é possível fazer com que dados se tornem produtos científicos. Podemos aprender com a ciência de dados a pensar de forma mais crítica e não buscar apenas fenômenos estatísticos”, disse.

Nesse contexto, cientistas de dados precisam estar conscientes que vieses na geração de dados produzem estatísticas e produtos equivocados. “É mais ou menos como no mundo físico, governos e empresas forçam a maior participação de mulheres e outras minorias para atingir maior diversidade em suas ações e assim evitar preconceitos. O mesmo ocorre digitalmente com os dados. É preciso, com ferramentas matemáticas, olhar que dados são esses, de onde eles vêm e se estão enviesados”, disse Liu.

André Carvalho, pesquisador do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, concorda. “A ciência de dados precisa muito mais de ciência do que de dados e o uso dessa ciência é feita por meio da matemática”, disse.

A Escola São Paulo de Ciência Avançada sobre Aprendizado de Dados reuniu um total de 150 pesquisadores de 19 países foram selecionados entre 642 inscritos para o treinamento. O programa tem 11 minicursos e cinco palestras que cobrem os principais aspectos de aprendizado baseado em dados.

“O principal objetivo é apresentar uma visão integrada das quatro áreas da ciência da computação – banco de dados, aprendizado computacional, computação de alto desempenho e processamento de imagens –, todas elas tendo a matemática como base”, disse o coordenador do comitê organizador da Escola, João Eduardo Ferreira. Ele também afirma que essa visão integrada das quatro áreas será fundamental para superar os desafios impostos pela nova era dos sistemas computacionais.

Dada a transversalidade da ciência de dados, a Escola envolve também outras áreas do conhecimento relacionadas a aplicações de técnicas de ciência de dados para problemas em astronomia, economia, genética e processamento de imagens e gerenciamento de dados.

Teoria e prática

Ainda sobre os impactos sociais que a revolução e a evolução dos dados podem gerar, Yaser Said Abu-Mostafa, professor no California Institute of Technology Caltech e autor do livro Learning from data – que inspirou o nome da escola –, afirmou que a ciência de dados vive um contexto diferente de outras áreas do conhecimento.

“Em muitos campos do conhecimento, a reclamação corrente é que há ampla teoria estabelecida, porém demora-se muito para pôr algo em prática. Nas ciências de dados ocorre o oposto. O que temos agora são grandes conquistas práticas em campos clássicos, como fusão computacional, processamento de linguagem natural e reconhecimento de fala. Esses campos têm uma tradição de anos de dedicação e de métodos aplicados a eles e, agora, viraram negócios”, disse.

Para Abu-Mostafa, o cenário gera muitos desafios. “Matemática não é um luxo. É nossa maneira de entender como as coisas são e assim ser capaz de progredir e alcançar ainda mais”, disse.

Para o cientista, um dos fatores principais relacionados ao impacto social das ciências de dados está na constante tempo. “O problema é que uma grande mudança não leva mais nem uma década para ocorrer. Portanto, a turbulência na arena social é muito mais significativa. Pense por exemplo nos carros autônomos e nos números de motoristas profissionais ao redor do mundo. Em cerca de cinco anos esses carros farão parte das nossas rotinas. E não estou falando só da grande questão de emprego, mas também de interação humana. Todos têm um melhor amigo, que é o próprio telefone celular”, disse.

Aplicações em diversas áreas do conhecimento

Desde 2010, a FAPESP apoiou 76 eventos internacionais na modalidade Escola São Paulo de Ciência Avançada, cujo objetivo é atrair jovens cientistas para São Paulo e contribuir na criação de um ambiente internacionalizado nas universidades.

Presente na abertura da Escola São Paulo de Ciência Avançada sobre Aprendizado de Dados, o presidente da FAPESP, Marco Antônio Zago, ressaltou a importância do tema abordado.

“A ciência de dados é uma forma racional de coletar, classificar e ordenar informações que são geradas em uma quantidade cada vez maior, graças ao avanço técnico. E, mais do que isso, é uma oportunidade para explorar a integração de diferentes áreas e criar meios para extrair conhecimento da informação”, disse.

O reitor da USP, Vahan Agopyan, afirmou na ocasião que a ciência de dados é um dos temas estratégicos de pesquisa. “É uma satisfação sediar uma escola que discuta e promova essas ideias”, disse.

Também presente na abertura da Escola, a secretária estadual de Desenvolvimento Econômico, Patricia Ellen da Silva, ressaltou o compromisso com a FAPESP e as universidades estaduais públicas no investimento de ciência e tecnologia para o desenvolvimento do Estado.

“Acreditamos que apenas a partir desse tipo de investimento podemos crescer econômica e socialmente e também nos tornar atores globais em inovação. Todas essas tecnologias, que permitem nova revolução em áreas tão distintas como saúde e cidades inteligentes, estão interconectadas e a ciência de dados se torna cada vez mais importante para a gente”, disse.

Roberto Marcondes Cesar Junior e Claudia Maria Bauzer Medeiros, membros da coordenação do Programa FAPESP de Pesquisa em eScience e Data Science, também estiveram presentes na abertura do evento. Mais informações em: sites.usp.br/datascience/spsas-learning-from-data.

Essa notícia também repercutiu nos veículos:
Casa de Notícias