Notícia

Jornal da Ciência online

Plataforma permite acesso a microdados dos censos demográficos

Publicado em 29 julho 2019

Por Agência Fapesp

Ferramenta criada no Centro de Estudos da Metrópole (CEPID Fapesp) disponibiliza dados das pesquisas realizadas pelo IBGE entre 1960 e 2010

O Centro de Estudos da Metrópole (CEM), um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs) financiados pela Fapesp, lançou a plataforma DataCEM, que disponibiliza microdados dos Censos Demográficos realizados pelo Instituto Brasileiro de Geografia e Estatística (IBGE) entre 1960 e 2010.

Segundo o CEM, a plataforma reduz custos de pesquisadores no tratamento de dados censitários. Ao disponibilizar os microdados do Censo, o DataCEM permite ao pesquisador produzir suas próprias tabelas.

Microdados são bancos de dados que contêm o maior detalhamento possível das informações coletadas. No caso do Censo, são os registros dos domicílios e pessoas entrevistadas. Os microdados podem ser agregados para obter informações sobre unidades maiores, conforme desejado pelo usuário: distritos, municípios, microrregiões, mesorregiões, unidades da Federação e outros.

O desenvolvimento do DataCEM foi coordenado pelo pesquisador Rogério Barbosa. “São bancos de dados com as informações individuais, porém com anonimato e sigilo garantidos, sem nenhum tipo de identificação das pessoas”, disse Barbosa.

Enquanto o portal do IBGE só disponibiliza microdados dos dois censos mais recentes, o DataCEM divulga as edições mais antigas dos censos, de 1960 a 1991. A amostra do Censo Demográfico de 1960, a mais rara, passou por processo de revisão e consistência. Ela contém informações para todas as unidades da Federação, o que a difere das divulgações públicas até então existentes.

Além disso, segundo Barbosa, o IBGE distribui as informações em um formato técnico, que pode ser de difícil compreensão e acesso para pesquisadores, especialmente os que não são muito experientes com dados quantitativos. “No DataCEM, já fizemos um pré-processamento dos dados do Censo e podemos disponibilizar apenas as variáveis que os pesquisadores precisam”, disse.

O DataCEM também ajuda o usuário no uso de recurso computacional, já que o arquivo contendo um Censo pode ter 20 gigabytes de tamanho. Softwares estatísticos geralmente abrem um arquivo inteiro do Censo Demográfico, que será armazenado na memória do computador do usuário.

A plataforma conta também com o WikiDados, um repositório de informações para consulta e textos explicativos. O WikiDados é desdobramento de alguns dos relatórios técnicos feitos pela equipe de pesquisadores do Centro de Estudos da Metrópole. Nele se explica o processo de harmonização das variáveis, se oferece um panorama do que existe em cada Censo, além de apresentar um guia sobre a utilização dos dados.

Transferência de conhecimento

O DataCEM nasceu do esforço de uma equipe de seis pessoas, coordenada por Barbosa, que tinha como responsabilidade levantar e tratar dados que seriam utilizados pelos pesquisadores que estavam trabalhando nos capítulos do livro Trajetórias das Desigualdades: Como o Brasil Mudou nos Últimos 50 Anos, publicação organizada pela professora Marta Arretche, coordenadora do CEM. Nessa etapa de produção do livro, o trabalho desse grupo foi chamado de Projeto Censo.

Para esse levantamento de dados, foram produzidos modelos estatísticos e tabelas, que precisavam ter os mesmos recortes e definições e que fossem sempre comparáveis.

Depois da publicação do livro, o CEM passou a contar com uma ampla base de dados que era usada, até então, apenas pelos próprios pesquisadores. “Então veio a ideia de disponibilizar para o público externo esse trabalho, de forma que pesquisadores externos ao CEM não precisassem fazer esse trabalho de novo. Foi uma forma de transferir o conhecimento produzido pelo CEM para a sociedade”, disse Barbosa.

* Com informações da assessoria de comunicação do CEM.

 

Essa notícia também repercutiu nos veículos:
Plantão News (MT) Radar do Futuro