Notícia

Inteligência & Inovação

Centro de Estudos da Metrópole lança plataforma que disponibiliza microdados dos censos demográficos

Publicado em 01 agosto 2019

O CEM (Centro de Estudos da Metrópole), um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs) financiados pela FAPESP, lançou a plataforma DataCEM, que disponibiliza microdados dos Censos Demográficos realizados pelo IBGE (Instituto Brasileiro de Geografia e Estatística) entre 1960 e 2010. Segundo o Centro, a plataforma reduz custos de pesquisadores no tratamento de dados censitários. Ao disponibilizar os microdados do Censo, o DataCEM permite ao pesquisador produzir suas próprias tabelas.

Banco de dados

Microdados são bancos de dados que contêm o maior detalhamento possível das informações coletadas. No caso do Censo, são os registros dos domicílios e pessoas entrevistadas. Os microdados podem ser agregados para obter informações sobre unidades maiores, conforme desejado pelo usuário: distritos, municípios, microrregiões, mesorregiões, unidades da Federação e outros.

DataCEM

O desenvolvimento do DataCEM foi coordenado pelo pesquisador Rogério Barbosa. “São bancos de dados com as informações individuais, porém com anonimato e sigilo garantidos, sem nenhum tipo de identificação das pessoas”, disse Barbosa.

Enquanto o portal do IBGE só disponibiliza microdados dos dois censos mais recentes, o DataCEM divulga as edições mais antigas dos censos, de 1960 a 1991. A amostra do Censo Demográfico de 1960, a mais rara, passou por processo de revisão e consistência. Ela contém informações para todas as unidades da Federação, o que a difere das divulgações públicas até então existentes.

Além disso, segundo Barbosa, o IBGE distribui as informações em um formato técnico, que pode ser de difícil compreensão e acesso para pesquisadores, especialmente os que não são muito experientes com dados quantitativos. “No DataCEM, já fizemos um pré-processamento dos dados do Censo e podemos disponibilizar apenas as variáveis que os pesquisadores precisam”, disse.

Funcionalidade

O DataCEM também ajuda o usuário no uso de recurso computacional, já que o arquivo contendo um Censo pode ter 20 gigabytes de tamanho. Softwares estatísticos geralmente abrem um arquivo inteiro do Censo Demográfico, que será armazenado na memória do computador do usuário. A plataforma conta também com o WikiDados, um repositório de informações para consulta e textos explicativos. O WikiDados é desdobramento de alguns dos relatórios técnicos feitos pela equipe de pesquisadores do Centro de Estudos da Metrópole. Nele se explica o processo de harmonização das variáveis, se oferece um panorama do que existe em cada Censo, além de apresentar um guia sobre a utilização dos dados.

Transferência de conhecimento

O DataCEM nasceu do esforço de uma equipe de seis pessoas, coordenada por Barbosa, que tinha como responsabilidade levantar e tratar dados que seriam utilizados pelos pesquisadores que estavam trabalhando nos capítulos do livro Trajetórias das Desigualdades: Como o Brasil Mudou nos Últimos 50 Anos, publicação organizada pela professora Marta Arretche, coordenadora do CEM. Nessa etapa de produção do livro, o trabalho desse grupo foi chamado de Projeto Censo.

Para esse levantamento de dados, foram produzidos modelos estatísticos e tabelas, que precisavam ter os mesmos recortes e definições e que fossem sempre comparáveis. Depois da publicação do livro, o CEM passou a contar com uma ampla base de dados que era usada, até então, apenas pelos próprios pesquisadores. “Então veio a ideia de disponibilizar para o público externo esse trabalho, de forma que pesquisadores externos ao CEM não precisassem fazer esse trabalho de novo. Foi uma forma de transferir o conhecimento produzido pelo CEM para a sociedade”, disse Barbosa.

Fonte: Agência Fapesp com informações da assessoria de comunicação do CEM