Notícia

Carlos Trentini

Dados do Facebook serão usados em pesquisa sobre polarização política no Brasil

Publicado em 07 maio 2019

Por Wagner Wakka

Em julho do ano passado, o Facebook anunciou um projeto chamado Social Science One. A ideia era uma parceria entre a empresa e áreas acadêmicas e da indústria para analisar os problemas relacionados à quantidade de dados que se têm com o uso de redes sociais. Basicamente, o grupo seria responsável por selecionar um número limitado de trabalhos e pesquisadores que pudessem ter acesso a dados de usuários da plataforma para pesquisa.

O Facebook passou a olhar melhor para os dados que está oferecendo a pesquisadores por conta do caso Cambridge Analytica, o escândalo que resultou no uso indevido de informações de mais de 87 milhões de usuários da plataforma. A empresa conseguiu ter acesso a tais dados sob o pretexto de pesquisa acadêmica exatamente para a Universidade de Cambridge.

“Este foi um escândalo, claro, para a empresa, mas também um escândalo para o universo acadêmico”, aponta o professor Pablo Ortellado, que fundou o Monitor do Debate Político no Meio Digital da Universidade de São Paulo (USP). A plataforma busca mapear, contar e analisar dados do debate político no meio digital, principalmente no Facebook.

Fundado em 2016, o projeto usava dados do Facebook em suas análises, o que foi cortado no final de 2017 por conta do caso Cambridge Analytica. “O Facebook restringiu muito os dados que são fornecidos pela API, sendo que vários grupos que faziam pesquisas com dados do Facebook ficaram paralisados. Inclusive o nosso. Houve um esforço, no decorrer do ano de 2018, para se reconectar, restabelecer o fornecimento de dados de pesquisa da plataforma do Facebook para comunidade acadêmica”, aponta o professor.

Esse esforço foi exatamente o Social Science One. O grupo, no ano passado, realizou uma chamada de trabalhos para quem está estudando os impactos das redes sociais na democracia.

Entre os 12 trabalhos anunciado em todo o mundo, o Monitor do Debate Político no Meio Digital da USP foi um dos selecionados. O grupo terá acesso a dados do Facebook por, pelo menos, um ano para levar as pesquisas adiante.

Com muita alegria comunicamos que o Monitor do debate político no meio digital? é um dos 12 grupos selecionados em todo o mundo pelo Social Science Research Council para conduzir pesquisa sobre todo o banco de dados de links do Facebook. (segue) https://t.co/40KOjdWzHE

Projeto

O Monitor do Debate Político no Meio Digital levantava matérias relacionadas a política brasileira em veículos de comunicação e páginas do Facebook. A ideia é pegar cada matéria produzida, com seus números de compartilhamento e comentários, e organizar por veículos e categoria. Assim, os pesquisadores conseguem oferecer um relatório e análise do comportamento político de usuários da rede social.

“A nossa pesquisa está muito baseada no padrão de consumo de notícias. Quando a gente tinha acesso às informações, a gente viu que havia três circuitos do consumo de notícias: você tinha sites hiperpartidários de esquerda e direita e a gente tinha outro circuito do meio, na comunicação da grande imprensa. Esta era lida tanto pelo pessoal que tava no circuito de esquerda quanto no de direita, mas os polos não liam seus opostos, ou seja os de esquerda não liam os de direita e os de direita não liam os de esquerda”, aponta Ortellado.

Este é um padrão muito típico brasileiro. Contudo, após o fechamento de acesso a dados pelo Facebook em 2017, não foi possível mais acompanhar os movimentos. O grupo teve de focar em outras áreas.

Assim, o professor aponta que o objetivo do trabalho agora é exatamente acompanhar este processo e investigar se esta tendência ainda se mantém. “Agora a gente vai poder olhar para o conjunto de uma forma muito mais precisa, se fenômeno se manteve, que a gente detectou lá em 2016/2017. A gente quer saber também os padrões demográficos. Uma coisa que a gente descobriu é que existe uma relação etária na polarização política. Em suma, significa dizer que a tendência é que, quanto mais velho, mais polarizadas as pessoas estão. A gente observou isso no consumo de notícias aqui no Brasil com dados que ainda são pequenos. Tem um pessoal em Stanford que viu também isso, outro pessoal em Oxford também. Então, estamos seguindo um pouco essa hipótese”, explica.

Quais dados?

Por conta do caso Cambridge Analytica, o Facebook tem se mostrado mais cuidadoso com a forma como deve apresentar as informações aos pesquisadores. O primeiro passo foi restringir o acesso a eles para apenas 12 entidades.

Junto disso, também estabeleceu que o Social Science One vai ser uma instituição independente, sob a qual não tem poder de influência. Assim, caso uma pesquisa chegue a uma conclusão negativa sobre a rede social, o Facebook não pode evitar que as informações sejam publicadas.

“Essa é a grande inovação do negócio. A gente vai ter acesso aos dados, mas esses investidores não podem ter acesso ao que a gente vai publicar, é um grupo altamente independente. A gente não tem amarras para isso. Por isso que a seleção não passou por eles, foi um comitê científico”, ressalta o professor.

O comitê buscou práticas que não permitem identificação pessoal, além de sistemas de segurança para acesso dos dados, inclusive por autenticação em dois fatores e uso de VPN. Ou seja, não é uma plataforma de acesso de qualquer usuário. O desafio era fazer o tratamento destas informações sem que isso pudesse inferir nos resultados das pesquisas.

Assim, os pesquisadores podem ter acesso a apenas três ferramentas. A primeira dela CrowdTangle, um conjunto de informações que permitem acompanhar popularidade de notícias e posts públicos.

A segundo é Ad Library API, associada a publicidade. A ferramenta vai contar com dados de publicidade relacionados a políticos no Facebook em vários países, incluindo o Brasil.

Por fim, o Facebook URLs Data Set será o conjunto mais robusto, que efetivamente vai passar os dados aos pesquisadores. Aqui, eles terão acesso a um pacote de todas as postagens compartilhadas ao menos 100 vezes por usuários únicos, contendo o próprio link além de estatísticas sobre ele. O pacote também vai trazer informações de agências de checagem de fatos sobre cada um dos links apresentados nesse pacote.

“Isso é praticamente tudo do que é mais relevante para a gente. Que eles estão tentando tirar é o que é muito pequeno, porque se for muito pequeno, você consegue identificar o usuário. Se você pega o link compartilhado por apenas duas pessoas, eu consigo inferir quem são essas duas pessoas por engenharia reversa. Esse é um dos cuidados para proteger o usuário, ao mesmo tempo tentando criar um ambiente com qual a gente possa criar a pesquisa”, lembra Ortellado.

Apesar de ainda não saber ao certo como essas informações serão apresentadas às instituições de pesquisa, o professor acredita que serão dados com possibilidades muito mais precisas que antes. O escopo do Facebook será de todos seus 2 bilhões de dados, sem que isso permita identificação do usuários.

Embora isso seja “um sonho”, como aponta o pesquisador, também é um entrave. “É um volume de dados inclusive muito grande, a gente nem tem computador para processar tanta coisa. O nosso problema agora é como que a gente vai fazer o processamento de uma montanha de dados sendo que a gente não tem infraestrutura para manejar tudo isso”, confessa.

Investimentos

Além de acesso aos dados, o Social Science One também ficou responsável por direcionar recursos para cada uma das pesquisas apresentadas. Aqui, a organização funciona como uma instituição de fomento à pesquisa. Aqui no Brasil, a melhor analogia seria a Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).

Assim, interessados em investir em pesquisas direcionam montante para o Social Science One, que repassa a verba para cada um dos projetos. Isso garante a independência e faz com que o controle seja meramente acadêmico sobre para onde esse dinheiro está indo.

No caso da USP, houve aporte de US$ 50 mil (cerca de R$ 198 mil) para o projeto a ser gasto em um ano. Segundo o professor, o investimento será direcionado para compra de computadores mais potentes para análise dos dados, além de pagamentos de estatísticos e viagens para congressos onde devem ser apresentados os resultados. “Basicamente, o que a gente vai fazer aqui é contratar um estatístico, que é o que a gente mais vai precisar. Claro que também há investimentos de outros meios aqui no Brasil”, apresenta o professor.

O próximo passo, segundo Ortellado, é aprender a lidar com a plataforma. O Facebook deve apresentar com maior profundidade quais são os dados e como os pesquisadores podem acessá-los. Não será algo tão simples e aberto, já que há alto nível de segurança (por exemplo, com autenticação de dois fatores para uma conta). A estimativa é de que os pesquisadores passem pelo menos um mês somente entendendo como o sistema funciona.

“Eles estão desenvolvendo e mostrando para gente como que vai ser estruturado esse banco de dados. A gente acha que vai gastar pelo menos um mês aprendendo. Depois é correr atrás disso, porque a gente só vai ter um ano de acesso a essas informações. Montamos uma equipe grande e vamos basicamente parar tudo que a gente tava fazendo para ficar um ano só trabalhando nisso”, relata Ortellado.

O trabalho completo do grupo se chama The Demographics of the Sharing of Hyperpartisan News in Brazil (A demografia do compartilhamento de notícias hiper partidárias no Brasil, em tradução livre) e vai englobar todo estudo anterior do grupo. Participa do trabalho também Márcio Ribeiro, professor de Ciência da Informação também da USP.

O conjunto de todas as pesquisas selecionadas bem como as instituições que financiam os projetos estão abertas na página do Social Science One.

Essa notícia também repercutiu nos veículos:
Tesão News Canaltech Yahoo! Finanças Tech Na Net