Notícia

Jornal da Unicamp online

Cenapad-SP: 15 anos apoiando a pesquisa nacional

Publicado em 11 maio 2009

Por Edison Zacarias da Silva

A computação de alto desempenho - a missão do Centro Nacional de Processamento de Alto Desempenho em São Paulo (Cenapad-SP) - tem uma história interessante, que teve início na metade do século passado com o advento dos primeiros computadores. Métodos usados em física computacional surgiram junto com os primeiros computadores e foram usados no Projeto Manhattan, primeiro grande programa que precisou de computação de alto desempenho para seu desenvolvimento.

Nas décadas de 50 e 60 surgiram então os primeiros computadores que foram usados para estudos que antes eram impossíveis de serem feitos com papel e lápis. Tinha início uma nova área de investigação - a simulação computacional. Problemas difíceis e que precisam de uma grande capacidade computacional - a previsão do tempo, as pesquisas espaciais e as pesquisas de artefatos nucleares, entre outros exemplos -, que hoje só podem ser estudados usando simulações, sempre usaram centros de computação dedicados para estes fins.

Aos poucos, os computadores começaram a entrar em todas as áreas de atividades, da simulação de novos aviões ao uso pelo sistema financeiro e pelas bolsas de valores. Todo este serviço era feito usando computadores de memória central, os chamados main frames.

Quando Seymour Cray projetou o primeiro supercomputador, na década de 1970, o objetivo era ter várias instruções de um programa sendo executadas praticamente ao mesmo tempo e, com isso, mais velocidade de processamento. Os programas mais adequados para este tipo de computador eram aqueles cujas instruções eram independentes umas das outras - processamento paralelo - ou poderiam ser executadas em várias unidades de processamento ao mesmo tempo - processamento vetorial. Os computadores evoluíram e os problemas possíveis de serem tratados, cresceram.

Na década de 80, uma mudança de paradigma aconteceu: os microprocessadores iniciaram uma nova fase em ciência computacional, permitindo, com a miniaturização, o advento das estações de trabalho, computadores de porte médio que eram unidades independentes e cabiam em cima de uma mesa. Um pesquisador podia agora ter seu próprio sistema computacional e ficar independente dos centros de computação, onde anteriormente levava seus trabalhos para serem processados. Surgiram também os computadores pessoais, os PCs e a internet.

Parecia que para muitas das aplicações os centros de computação haviam se tornado obsoletos. Isto era, de fato, uma visão equivocada. É verdade que hoje alguns pesquisadores e algumas empresas têm seus sistemas computacionais autônomos e, às vezes, é possível um grupo montar um sistema a partir de vários computadores pessoais em rede, fazendo um cluster ou até com o uso de processadores de videogames. Porém, muitos problemas ainda demandam mais capacidade computacional que estas soluções caseiras.

De fato, no mundo hoje a computação de alto desempenho está mais forte do que nunca. Ela permeia quase todas as áreas de atuação do homem. Além das áreas de previsão de tempo, uma das primeiras a usar um supercomputador Cray, e as outras já mencionadas, dois exemplos são a tecnologia dos carros de Fórmula 1, que evolui semanalmente, entre uma corrida e outra, devido ao projeto virtual no qual novos modelos e aperfeiçoamentos aos projetos são simulados em supercomputadores e posteriormente feitos e testados nos carros ao longo de um campeonato; o outro exemplo é a indústria farmacêutica, que utiliza o projeto virtual de fármacos, que ajuda a melhorar os produtos encurtando o tempo de desenvolvimento de um novo fármaco a partir de simulações feitas em supercomputadores.

Apesar de todo esse desenvolvimento nos últimos 50 anos, a demanda por Processamento de Alto Desempenho (PAD ou, em inglês, High Performance Computing - HPC) cresce proporcionalmente à inovação na construção dos computadores. Em outras palavras, mesmo com tanta evolução, os programas continuam precisando de mais memória e mais poder de processamento para tentar realizar cálculos cada vez mais complexos.

Por isso, uma das estratégias para atender tais demandas é o agrupamento de computadores em clusters. Neles, os vários computadores que os compõem são ligados por uma rede local de alta velocidade e trabalham juntos como se fossem um único computador com capacidade bem superior. Visto que cada componente tem sua própria memória e seu processador, o cluster pode atender programas com maiores demandas por memória e poder de processamento.

Conhecendo a importância da tecnologia de processamento de alto desempenho para a competitividade do país e para o seu desenvolvimento econômico, o Ministério da Ciência e Tecnologia (MCT), por meio da Financiadora de Estudos e Projetos (Finep), implementou o Sistema Nacional de Processamento de Alto Desempenho (Sinapad), para tornar mais fácil o aproveitamento pelo país das oportunidades oferecidas por esta tecnologia.

O Sinapad foi concebido como um sistema cooperativo e geograficamente distribuído com cobertura nacional, hoje composto de oito centros, sendo o Cenapad-SP um deles.

Nestes 15 anos, o Cenapad-SP vem cumprindo sua missão de apoiar as atividades de P&D nas áreas de Ciência e Tecnologia do país, disponibilizando um ambiente de alto desempenho.

No período de 1994 a 2002, o parque computacional foi crescendo por meio da instalação de equipamentos IBM e, a partir de 2005, com os equipamentos da SGI.

O Cenapad-SP iniciou suas atividades com um IBM 9076 SP1 com 8 nós interligados pelo High Performance Switch - cada nó com 256 MB de RAM e disco de 2 GB e um cluster de 8 IBM RISC6000/560, sendo cada estação com 128 MB de RAM e 1,7 GB de disco.

Em julho de 2002, instalamos uma máquina IBM 7040-671 conhecida como Regatta, com 4 processadores Risc/power4 e 4 GBytes de memória, que impulsionou a pesquisa por oferecer 22GFlops teóricos de desempenho.

Em dezembro de 2005, instalamos os primeiros equipamentos SGI/Altix 1350 adquiridos com recursos da Fapesp, e quintuplicamos o poder computacional teórico do parque computacional do Cenapad-SP, acrescentando 420GFlops aos 105GFlops dos equipamentos já existentes. Nesta mesma data, a capacidade de armazenamento em disco foi acrescida de 7.56 TB. Foram instalados 4 nós, cada um deles com 16 processadores Itanium2, 64GB de memória e desempenho teórico de 96Gflops, além de dois outros nós que, juntos, totalizam 36GFlops.

Em fevereiro de 2008, instalamos o equipamento SGI/Altix 450, adquirido com recursos do Sinapad através da RNP (Rede Nacional de Pesquisa), com processadores Itanium2, composto de 104 processadores (208 cores) e 592 GB de memória RAM, totalizando uma capacidade de processamento teórica em torno de 1.1 TFLOPs, além de 36 TB de disco externo.

É importante realçar que servidores mais robustos e com uma melhor relação memória/processador podem resolver de maneira mais eficiente os grandes problemas e desafios computacionais, típicos em um ambiente de alto desempenho. Isso é um diferencial imprescindível para um centro como o Cenapad-SP, que se firmou no cenário brasileiro como referência em processamento científico de alto desempenho nos últimos anos.

O Cenapad-SP é responsável por uma produção científica de alta qualidade. Os serviços oferecidos pelo centro se convertem em resultados que podem ser medidos pela produção científica de seus usuários, representada por 689 artigos em revistas internacionais indexadas, 244 participações em conferências internacionais, entre outros indicadores. Hoje são 122 projetos de pesquisa e 306 usuários utilizando o Cenapad-SP. São projetos de várias áreas de conhecimento e de diversas instituições do país.

Além destes indicadores, devemos enfatizar que alguns dos trabalhos mais importantes feitos neste início de milênio em nanociência foram desenvolvidos usando recursos do Cenapad-SP. Nos últimos anos foram publicados 14 artigos na prestigiosa Physical Review Letters, dos quais dois têm um destaque adicional.

O artigo How do Au-nanowires break?, autores E. Z. da Silva, A.J.R. da Silva and A. Fazzio, Physical Review Letters, 87, 256102 (2001) foi matéria da capa do fascículo 18. Esta foi a primeira vez que um artigo de autores brasileiros foi capa desta importante revista. Isto deu ao artigo uma grande visibilidade internacional e, no cenário nacional, foi matéria de artigo de meia página na Folha Ciência, e matéria de capa da revista Pesquisa Fapesp em fevereiro de 2002.

O segundo trabalho brasileiro que foi matéria de capa no Physical Review Letters também usou o parque do Cenapad-SP: Molecular-Dynamics Simulations of Carbon Nanotubes as Gigahertz Oscillators, Physical Review Letters, 90, 55504-1 (2003).S. B. Legoas, V. R. Coluci, S. F. Braga, P. Z. Coura, S. O. Dantas, e D. S. Galvão.

Sendo um centro nacional, o Cenapad-SP atende a usuários de diversas instituições do país, como podemos ver no mapa abaixo, que apresenta a distribuição de uso por estado.

Ao longo dos anos, o uso do parque computacional foi sempre crescente como mostra o gráfico abaixo, o que evidencia a demanda nacional existente. Neste gráfico, o uso de CPU apresentado corresponde ao uso total da capacidade instalada evoluindo juntamente com ela.

Ao longo destes 15 anos, o uso por instituição variou, tendo sempre a Unicamp e a USP como nossas maiores usuárias.

Quando olhamos o uso do sistema computacional do Cenapad-SP por área do conhecimento, vemos que a física e a química são nossos maiores usuários. Porém o Centro atende várias outras áreas, como por exemplo a biologia, que está usando cada vez mais o sistema.

Concluímos que o Cenapad-SP está contribuindo de modo significativo para o avanço do uso da tecnologia de processamento de alto desempenho no país. O Centro é um grande responsável pelo apoio às principais publicações brasileiras que usam PAD.

Edison Zacarias da Silva é coordenador do Cenapad-SP e professor do Instituto de Física "Gleb Wataghin" (IFGW)