Notícia

Agência Fiocruz de Notícias

Aula inaugural aborda uso de big data na pesquisa em saúde

Publicado em 01 abril 2019

Por Solange Argenta (Fiocruz Pernambuco)

Desenvolver um estudo utilizando uma coorte de 100 milhões de pessoas parece inviável para um pesquisador brasileiro? O coordenador do Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs) da Fiocruz Bahia, Maurício Lima Barreto, afirma que esse tipo de pesquisa já é uma realidade no país. A declaração foi feita na aula inaugural da Fiocruz Pernambuco, realizada (29/3) no auditório da instituição. A palestra foi acompanhada por uma plateia atenta, formada por alunos das pós-graduações em Biociências e Biotecnologia em Saúde (BBS) e em Saúde Pública (SP). Aberta pelo diretor da unidade, Sinval Brandão Filho, a aula magna contou com a presença da vice-presidente de Educação, Informação e Comunicação da Fiocruz, Cristiani Machado, além de pesquisadores, servidores e convidados.

Com o tema Integrando grandes bases de dados (‘big data’) para a pesquisa em saúde: potenciais avanços e limitações, Barreto iniciou abordando a mudança na forma como os cientistas trabalham com os seus dados de pesquisa. Para ele, se antes o dado era uma propriedade do pesquisador, hoje não é mais. “O dado hoje é um bem que está aí fluindo nos sistemas (de informação) e que se quer cada vez mais maximizar seu uso para aumentar a capacidade de produção científica”, explicou.

Em sua fala, separou os dados obtidos no contexto de uma pesquisa, daqueles que são coletados rotineiramente, cujo propósito não é fazer um estudo, também chamados dados administrativos. Oriundos de uma série de sistemas, onde ficam armazenados, carregam o potencial de eventualmente serem utilizados em pesquisas. Barreto considera que o grande desafio para o pesquisador é utilizar essa imensa massa de dados (big data) para gerar conhecimento. “Transformar aquela matéria às vezes inerte, amorfa ou complicada em algum tipo de conhecimento útil para resolver algum problema, seja ele do campo do conhecimento ou do mundo real”, detalhou.

Outro aspecto destacado foi a preocupação com o manejo desses dados, para que atendam ao padrão Fair, um acrônimo em inglês formado com as características Findability, Accessibility, Interoperability and Reusability, ou seja, informações que sejam encontráveis, acessíveis, interoperáveis e reusáveis. Ele deu exemplos de grandes financiadores de pesquisa que já solicitam ao pesquisador a inclusão de um plano de gestão de dados no seu projeto: a Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), National Institutes of Health (NIH), Wellcome Trust, entre outras. Essa exigência visa dar oportunidade para que os dados gerados nos projetos com financiamento dessas instituições possam ser reutilizados posteriormente.

Barreto declarou que a criação do Cidacs foi uma tentativa de trabalhar com grandes bases de dados de uma forma mais organizada, com uma estrutura para armazenar, proteger e aprimorar as informações geradas, “tornando-as um patrimônio para que outros possam usá-las, nesse espírito Fair, em vez de simplesmente jogar fora todo o esforço ao fim de cada pesquisa”. O primeiro projeto do Cidacs, a “Coorte de 100 milhões de brasileiros”, foi criado para avaliar os determinantes sociais e os efeitos de políticas e programas sociais sobre os diferentes aspectos da saúde na sociedade brasileira. Para isso, o estudo vincula informações dos programas sociais e de outras bases de dados de sistemas de informação em saúde, como mortalidade, nascimento, doenças infecciosas transmissíveis e não transmissíveis, entre outros. O pesquisador citou também os trabalhos desenvolvidos em torno da dengue e da hanseníase, que permitiram responder às perguntas de pesquisa utilizando dados de 20 milhões e 13 milhões de pessoas, respectivamente.