A busca de informação na internet por meio de palavras-chave é uma atividade trivial, integrada ao cotidiano de usuários do mundo todo. Mas selecionar em meio a milhares de referências aquelas que realmente possuem relevância científica é algo bem mais complicado.
Quem precisa fazer um levantamento da literatura especializada em qualquer domínio da ciência deve ainda saber como as informações relevantes estão organizadas, como se monta a estrutura a grande área daquele campo de estudos, quais são suas subáreas, quais são as comunidades que nelas atuam ou que conexões as diferentes comunidades mantêm entre elas.
Uma metodologia para fazer esse tipo de levantamento por meios computacionais acaba de ser estabelecida por um grupo de pesquisadores. O sistema criado é tema de artigo publicado no Journal of Informetrics. “Esse tipo de recurso computacional é cada vez mais necessário não só devido ao volume da literatura especializada como também por causa do aumento da interdisciplinaridade em ciência”, disse o autor principal do artigo, Filipi Nascimento Silva.
De acordo com Nascimento, pesquisador do Instituto de Física de São Carlos da Universidade de São Paulo (USP) a interdisciplinaridade faz com que o pesquisador recorra a artigos de outras áreas do conhecimento com as quais talvez não esteja familiarizado. “Por exemplo, um pesquisador em oncologia talvez necessite saber mais sobre a área de redes complexas. A partir de dados de revistas indexadas, que incluem os títulos das publicações científicas, seus resumos e suas citações, criamos um método para mapear as diferentes áreas”, disse.
A metodologia faz parte da pesquisa de pós-doutorado “Abordagem de redes complexas em e-Science e dados dinâmicos”, financiada com bolsa da Fundação de Ampara à Pesquisa (Fapesp). “Ela permite visualizar a área, inteirar-se das palavras-chave mais importantes de cada subárea, conhecer as conexões entre as subáreas, e, finalmente, ter acesso aos artigos que realmente interessam”, disse Nascimento Silva.
Considerando que as publicações em revistas indexadas constituem bases de dados de alta relevância e que já existem sistemas de busca por meio de palavras-chave muito eficientes, o desafio que os autores do estudo se propuseram foi o de organizar todo o material que pode ser levantado.
Comunidades pouco conectadas
Para testar o modelo, os pesquisadores do estudo escolheram duas áreas para as quais haviam especialistas na equipe, de modo que estes pudessem avaliar subjetivamente se o resultado obtido fazia sentido. Foram escolhidas as áreas de redes complexas e cristais fotônicos.
“Ao testar nossa metodologia nessas áreas, descobrimos fortuitamente coisas bastante interessantes. Por exemplo, na área de cristais fotônicos, identificamos duas comunidades muito bem constituídas: uma comunidade de engenheiros, voltados para telecomunicações, e outra comunidade maior, de físicos e químicos, que desenvolvem os conceitos e fabricam os materiais”, explicou o coordenador do estudo, Osvaldo Novais de Oliveira Júnior, professor do Instituto de Física de São Carlos.
Foi constatado que esses grupos são pouco conectados entre si. “Isso significa que o conhecimento existente e disponível na área pode não estar sendo utilizado por pesquisadores da própria área, pelo fato de uma comunidade quase não saber o que se passa na outra. Foi uma descoberta acidental, mas que evidenciou a importância de se dispor de um método computacional para levantar a literatura especializada”, disse Novais.
O professor conta que os scripts dos programas empregados pelos pesquisadores já estão disponíveis para quem os solicitar, mas, para poder utilizá-los, o usuário precisa ter conhecimento das linguagens da computação. O próximo passo é transformar esses scripts em um software com interface acessível para não especialistas em computação. “Queremos, no futuro, torná-los mais acessíveis e disponibilizá-los para a comunidade. Esperamos que pesquisadores de quaisquer áreas possam fazer levantamentos da literatura utilizando nossa metodologia”, disse Novais.
Uma animação computacional que possibilita visualizar a rede pode ser vista neste link.
(Agência Gestão CT&I, com informações da Fapesp)