Notícia

Novo Cantu Notícias

Repositórios científicos buscam certificação

Publicado em 04 março 2021

Por Elton Alisson , da Agência FAPESP

O aumento incessante dos dados gerados por estudos em diversas áreas do conhecimento tem despertado a atenção da comunidade científica em relação à confiança nos repositórios em que serão depositados. Uma das preocupações dos cientistas, das agências de fomento à pesquisa e dos usuários dos dados científicos é que eles sejam geridos de maneira adequada, de modo a assegurar sua preservação e disponibilidade em longo prazo.

A fim de fornecer essas garantias têm surgido iniciativas voltadas à certificação de repositórios científicos. Algumas delas foram apresentadas no segundo dia do Second Latin American and Caribbean Scientific Data Management Workshop, que aconteceu de forma on-line no dia 24 de fevereiro.

“A certificação promove a confiança, que está no cerne do armazenamento e compartilhamento dos dados”, disse Rorie Edmunds, diretor executivo do World Data System (WDS).

“De um lado, as agências de fomento querem ter a certeza de que os dados gerados nas pesquisas que financiam não serão desperdiçados e poderão ser reutilizados no futuro. Por outro lado, os pesquisadores desejam ter certeza de que seus dados estarão seguros, acessíveis e utilizáveis ao longo do tempo. Já os usuários, que têm interesse em reutilizar os dados, desejam saber se eles serão preservados de maneira adequada e se são de alta qualidade”, afirmou Edmunds.

A fim de avaliar a confiabilidade dos repositórios de dados foram criados nos últimos anos serviços de certificação. Um dos mais populares é o CoreTrustSeal, desenvolvido por um grupo de trabalho no âmbito de uma parceria do WDS com o Data Seal of Aproval e a Research Data Alliance (RDA).

Para ser certificado pelo CoreTrustSeal, o repositório científico precisa cumprir 16 requisitos. O primeiro deles é explicitar claramente que tem como missão fornecer acesso e preservar os dados armazenados.

“Essa missão deve ser um componente central para os repositórios e as organizações responsáveis pelo gerenciamento deles porque sabemos que governos e modelos de financiamento mudam. A missão é uma garantia de que continuarão fornecendo acesso a longo prazo e realizando ações para preservação desses dados mesmo em um cenário de mudanças”, disse John Crabtree, membro do conselho do CoreTrustSeal e um dos diretores do Odum Institute for Research in Social Science da Universidade da Carolina do Norte, dos Estados Unidos.

Além do CoreTrustSeal há uma série de outros processos de certificação, como o Nestor Seal e a ISO 16363, também abordados durante o evento.

Uma das vantagens para os cientistas depositarem seus dados de pesquisa em repositórios certificados é a garantia de preservação e manutenção a longo prazo, de forma profissional e reconhecida mundialmente. Já os usuários têm os benefícios de poder reutilizar dados com as garantias que a certificação confere, apontou Edmunds.

O especialista indicou uma série de sites onde é possível localizar repositórios de dados confiáveis, como o do próprio CoreTrustSeal, além da homepage do WDS, do re3data, do Repositoy Finder e do Fair Sharing.

Princípios de confiança

De acordo com dados apresentados por Dawei Lin, membro do conselho do CoreTrustSeal e diretor associado de bioinformática do National Institute of Allergy and Infectious Diseases (NIAID) dos Estados Unidos, apenas 12% dos dados descritos em artigos publicados em 2011 em periódicos científicos financiados pelo National Institutes of Health (NIH) foram depositados em repositórios reconhecidos. Só 20% dos 328 repositórios de dados biomédicos estavam ativos após 18 anos de operação.

“Isso levanta as preocupações de perda de investimentos na geração desses dados e de oportunidades para maximizar seu valor”, avaliou Lin.

A fim de desenvolver abordagens concisas e mensuráveis e fornecer um ponto de partida para defender, apoiar e implementar certificações e avaliações de repositórios digitais, de modo a aumentar o nível de confiança neles, um grupo de pesquisadores na área de gestão de dados elaborou um conjunto de cinco princípios, chamados de TRUST – iniciais das palavras transparency (transparência), responsibility (responsabilidade), user focus (foco no usuário), sustainability (sustentabilidade) e technology (tecnologia), em inglês.

“Os princípios TRUST não são um fim em si mesmo, mas um meio de facilitar a comunicação com todas as partes interessadas na confiabilidade dos repositórios digitais”, ressaltou Lin.

Enquanto os princípios TRUST são associados a repositórios, um conceito mais amplo, chamado FAIR – sigla das iniciais das palavras findable (localizável), acessible (acessível), interoperable (interoperável) e reusable (reusável), em inglês, foi lançado em 2016 e se aplica a dados de todos os tipos, mas principalmente de pesquisa.

“Há uma confusão sobre dados abertos e dados FAIR, que têm diferenças. Um conjunto de dados pode estar totalmente disponível, mas não significa que são FAIR”, disse Ingrid Dillo, membro do conselho da RDA e vice-diretora do Dutch National Centre of Expertise and Repository for Research Data (DANS), um dos centros nacionais holandeses para depósito e apoio a pesquisadores na gestão de dados científicos.

Segundo ela, as agências de financiamento à pesquisa já têm procurado instrumentos para avaliar se os dados produzidos por meio dos estudos que financiam são FAIR e estão surgindo ferramentas com esse propósito.

Um projeto iniciado na Europa em 2019, chamado FAIRsFAIR, pode contribuir para criação dessas ferramentas. Com orçamento de 10 milhões de euros e previsto para terminar em março de 2022, o projeto visa fornecer soluções práticas para avaliar se conjuntos de dados científicos são FAIR ao longo de todo o seu ciclo de vida.

“A ideia é criar ferramentas que possam ajudar os cientistas a pensar sobre como podem tornar seus dados FAIR no momento em que começam a planejar suas pesquisas e a escrever o plano de gerenciamento de dados”, disse Mustapha Mokrane, membro do conselho do CoreTrustSeal e pesquisador do DANS.

Os participantes do projeto já desenvolveram uma ferramenta, disponível ainda em versão de demonstração no site www.f-uji.net, que ajuda pesquisadores a avaliarem a qualidade dos dados que produzem em suas pesquisas.

“Há ainda pouco conhecimento na América Latina sobre o que significa disponibilizar dados de pesquisa em repositórios para compartilhamento com o mundo”, disse Claudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (IC-Unicamp) e membro da coordenação do Programa FAPESP de Pesquisa em eScience e Data Science.

“O evento foi muito importante para disseminar os conceitos, particularmente no contexto das políticas de dados abertos da FAPESP”, avaliou Medeiros, que foi mediadora do encontro.

A íntegra do evento pode ser acessada em: https://fapesp.br/eventos/wds.

Este texto foi originalmente publicado por Agência FAPESP de acordo com a licença Creative Commons CC-BY-NC-ND. Leia o original aqui.