Notícia

Jornal da Unesp

Supercomputação a serviço da ciência

Publicado em 01 novembro 2014

Por Cínthia Leone

Lançado há cinco anos, o Núcleo de Computação Científica da Unesp (NCC) vem facilitando a vida de pesquisadores de diversas áreas, por meio de uma significativa rede de supercomputadores. Trabalhos que demandam um extraordinário volume de processamento de dados encontram uma ferramenta adequada e certificada internacionalmente – o GridUNESP, que representa um dos principais eixos de atuação do Núcleo, ao lado do SPRACE (São Paulo Research and Analysis Center) (veja quadro). Atualmente, o Grid presta serviço para pesquisas nas áreas de astronomia, biologia, biofísica, ciência da computação, ciência dos materiais, engenharia, física, geociências, meteorologia, química e relações internacionais.

Grid ou computação em grade é uma rede de supercomputadores distribuídos geograficamente para realizar cálculos de uma mesma tarefa. Sem uma formação como essa, certas análises poderiam demorar tanto que seriam inviáveis. “Alguns dos usuários que atendemos hoje tinham estudos guardados à espera de uma ferramenta de processamento como essa”, lembra o físico Sérgio Novaes, diretor-científico do NCC e professor do Instituto de Física Teórica (IFT) da Unesp.

O pesquisador Sérgio Lietti, que gerencia os procedimentos técnicos do Núcleo, explica que no começo foi necessário um esforço de treinamento para a comunidade unespiana. “Os professores assimilaram rapidamente a maneira de trabalhar em grid e nosso volume de cooperação hoje é bastante intenso”, afirma. Com a implantação de uma nova plataforma totalmente desenvolvida pelo NCC – o GridUNESP Web Portal –, ficou muito mais fácil a submissão de tarefas à equipe, o que agora pode ser feito on-line.

O GridUNESP foi criado com recursos da Financiadora de Estudos e Projetos (Finep), pouco mais de R$ 4,4 milhões. Ele é composto de 8 clusters (conjunto de computadores interligados), sendo 1 central, na sede do NCC na capital paulista, e 7 secundários, um deles mantido em São Paulo junto ao principal para controle e os outros 6 operados remotamente nos polos computacionais das unidades da Unesp em Araraquara, Bauru, Botucatu, Ilha Solteira, Rio Claro e São José do Rio Preto. O cluster central corresponde a 70% da capacidade total de processamento e 73% da capacidade de armazenamento de dados.

Fazendo as contas

O volume e a variedade de projetos realizados no GridUNESP é alta, mas foi apenas este ano que o primeiro projeto de Ciências Humanas usou o NCC. Liderado por Gabriel Cepaluni, professor da Unesp em Franca, o estudo usa a computação de alto desempenho para compreender melhor as características dos países que formam coalizões na Organização Mundial de Comércio. O Grid permite cruzar variáveis econômicas, políticas e geográficas das nações de 1982 a 2008 para criar indicadores para responder a essa questão. Os primeiros resultados surpreendem, ao apontar que fatores econômicos como Produto Interno Bruto (PIB) e fluxo e abertura comerciais têm menos influência para a promoção da cooperação comercial do que as semelhanças de regimes políticos.

O químico Élson Longo, professor da Unesp em Araraquara, coordena um dos primeiros grupos a utilizar o NCC. Ele investiga o comportamento de semicondutores em aplicações como placas de energia solar e ação bactericida. A equipe, que tem várias parcerias internacionais, produziu pesquisas que motivaram publicações em revistas do exterior, geraram patentes e outras aplicações industriais, além de duas empresas spin off (companhias que nascem a partir de grupos de pesquisa). “No Grid, podemos fazer em oito horas cálculos computacionais que levariam duas semanas ou mais”, afirma Longo.

Já Alexandre Suman de Araújo, da Unesp em São José do Rio Preto, utiliza há dois anos o GridUNESP para fazer simulações computacionais que prevejam o comportamento de certas moléculas em meio aquoso. Entre os alvos, está uma proteína do vírus da dengue e peptídeos antimicrobianos. “Os trabalhos que já estamos publicando podem dar mais entendimento sobre a interação dessas moléculas com hormônios e fármacos no corpo humano, por exemplo”, explica Araújo.

O mesmo grupo usa a supercomputação para investigar ainda os calixarenos, moléculas que, em algumas situações, capturam metais presentes na água. A equipe almeja o desenvolvimento de calixarenos mais eficientes, que possam dar origem a filtros para tratar água contaminada por cádmio, mercúrio e chumbo, ou até mesmo criar métodos de extração intensiva de metais de valor econômico, como a prata.

Garantia para a pesquisa

Enquanto isso, a expectativa de Francisco Carlos Lavarda, professor da Unesp em Bauru, é de que os cálculos de física quântica que ele realiza no GridUNESP possam prever as propriedades de células de plástico que produzem energia solar ou de moléculas capazes de combater a malária. “A estrutura do Núcleo é fundamental para o meu tipo de pesquisa, que precisa experimentar diversas hipóteses, o que envolve alto volume de processamento”, declara.
“Antes do NCC eu realizava meus cálculos em outros centros computacionais de alto desempenho como o Cenapad, da Unicamp, mas tínhamos que esperar alguns dias na fila de processamento, uma restrição que não temos hoje”, diz Aguinaldo Robinson de Souza, da Unesp em Bauru. Seu trabalho tenta entender as características tridimensionais de moléculas dentro de uma proteína, como, por exemplo, do fármaco diapocinina dentro da albumina (uma proteína presente no sangue humano e que é responsável pela interação inicial com os medicamentos que ingerimos).

O projeto de Leandro Cristante de Oliveira, da Unesp em São José do Rio Preto, usa simulações computacionais para a caracterização estrutural de macromoléculas a fim de entender, por exemplo, mecanismos de sistemas biológicos relacionados ao crescimento de cânceres ou à produção de combustíveis de segunda geração. “Minha pesquisa só é possível devido à existência do NCC”, afirma.

Os exemplos mencionados mostram a grande demanda computacional do GridUNESP. Hoje ele atende a 60 projetos científicos, envolvendo mais de 300 pesquisadores de toda a Universidade. Antes que a ocupação da estrutura computacional venha a atingir 100% de sua capacidade, comprometendo a velocidade de realização dos serviços, foi fundamental prever a atualização dos recursos existentes. Por isso, o NCC prepara-se para ampliar sua estrutura com a aquisição de um novo cluster nos próximos meses com recursos já concedidos pela Finep.

Outras atividades

O NCC também gerencia o EduGrid e presta serviço para a Autoridade Certificadora de Grid do Estado de São Paulo, a ANSPGrid CA, criada pela própria Unesp em parceria com a Academic Network at São Paulo (ANSP), da Fapesp. Vinculada ao órgão internacional que regula o tema, a International Grid Trust Federation (IGTF), a unidade emite certificados válidos no mundo todo para outros grids e para pesquisadores que desejam trabalhar com esse tipo de recurso, garantindo aos usuários que essas redes são à prova de ataques de hackers e outras ações indevidas.

O NCC mantém, ainda, a Biblioteca Virtual da Unesp e dados do Grupo de Redes de Computadores da Universidade. A infraestrutura do Núcleo garante cooperação permanente com a Intel em áreas como computação em nuvem – que utiliza a memória e as capacidades de armazenamento e cálculo de computadores compartilhados por meio da Internet –, além de ter conexão com centros de pesquisa e desenvolvimento dos EUA e parcerias com diferentes empresas no Brasil.

Futuro mais rápido

O NCC acabou de ser incluído pela Intel no programa Intel Parallel Computing Centers (IPCC), um grupo de pesquisa que conta com a participação de algumas das principais universidades do mundo – no Brasil, além da Unesp, apenas a UFRJ está presente nessa iniciativa.

“O paralelismo é uma área de fronteira que vai melhorar drasticamente a capacidade de processamento dos supercomputadores”, explica Lietti. Atualmente, os processadores operam de modo serial, ou seja, cada operação utiliza uma quantidade de “contas” sequenciais, e cada conta depende do resultado da anterior para começar a processar. Por exemplo: se um cálculo tiver 6 contas com 10 minutos cada, será necessária uma hora para executar a tarefa. Na computação paralela, esse mesmo resultado seria obtido em 10 minutos, porque as contas acionadas pelo processador podem ser executadas simultaneamente. “O fato de a Unesp estar no grupo de pesquisa que soma esforços para a criação de hardwares que tornem isso possível é algo superimportante.”

Física teórica

O SPRACE foi implementado em 2003, com financiamento da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) e foi a experiência adquirida que permitiu a criação do NCC. É por meio desse projeto que a Unesp colabora com o LHC (Large Hadron Collider, ou Grande Colisor de Hádrons, em português), que é o maior acelerador de partículas do mundo, no qual foi feita a descoberta do bóson de Higgs, responsável por dar massa às partículas elementares. O acelelador pertence ao Cern (acrônimo antigo para Conseil Européen pour la Recherche Nucléaire, em francês, e que atualmente é chamado de Organização Europeia para a Pesquisa Nuclear). O Núcleo também coopera com o Fermilab (Fermi National Accelerator Laboratory), nos EUA. Os dois laboratórios estrangeiros são os principais do mundo na investigação de física de altas energias, um tipo de pesquisa que depende do uso de supercomputação. “Nossa equipe ganhou uma experiência que percebemos que seria importante compartilhar com toda a Universidade”, afirma Novaes. Tanto o Fermilab como o LHC usam a formação em grid para distribuir geograficamente os cálculos de seus experimentos.

Parceria para a educação

A multinacional Intel, que é a líder no fornecimento de processadores no mundo e é a fabricante dos processadores do NCC, mantém com a Universidade uma parceria permanente de pesquisa, que tem permitido desde a elaboração de soluções industriais, passando pela pesquisa básica e até pelo treinamento de profissionais da própria unidade.

Entre os projetos originados por essa interação está o EduGrid, que visava fazer o treinamento de pesquisadores simulando um cluster computacional através de um par de servidores. A Secretaria de Educação do Estado de São Paulo precisava oferecer um programa permanente de atualização para professores da rede pública, mas o volume de acessos e de informações disponíveis exigia recursos diferenciados de informática. O NCC criou uma rede de servidores virtuais localizados em diferentes instituições geograficamente distantes entre si. A Intel financiou pesquisadores para desenvolver os projetos e estabeleceu uma parceria na área de cloud computing para viabilizá-los.

“Acreditamos que essa seja a maneira adequada de se fazer pesquisa e adquirir expertise em áreas de ponta na computação de alto desempenho, com financiamento do setor privado e gerando como produto algo que tenha um importante impacto social”, afirma Novaes. O gerente de Pesquisa e Desenvolvimento da Intel, Fábio Tagnin, avalia como positiva a cooperação com o Núcleo nesse e em outros projetos. “A equipe da Unesp é flexível, dedicada e apresenta soluções criativas.”