Notícia

Correio Popular (Campinas, SP)

Rede de hardwares

Publicado em 29 setembro 2008

As experiências do Large Hadron Collider (LHC), o Grande Colisor de Hádrons, que promete respostas a alguns enigmas do universo, irão gerar 700 Megabytes de dados a serem armazenados por segundo. Em um ano de operação, a expectativa é de que o sistema produza 15 milhões de Gigabytes, segundo o físico da Universidade Estadual de Campinas (Unicamp) e um dos integrantes do projeto no Brasil, Jun Takahashi. Armazenar, diz ele, é parte simples. “Precisaremos de máquinas para processar esses dados e gente para interpretá-los”, comenta. A missão não cabe em uma sala. Um grid equaciona a questão utilizando uma rede de computadores espalhada em diferentes regiões do mundo.

O grid é um conceito que surgiu há pelo menos dez anos na Organização Européia para Pesquisa Nuclear, o European Organization for Nuclear Research (Cern), o mesmo berço da world wide web, a www, ou internet. A internet compartilha informações, permite que dados circulem por uma rede mundial, que pode ser conectada em qualquer lugar do planeta. O grid possibilita o compartilhamento do hardware, a capacidade física da máquina, por meio de um programa que administra os recursos dos computadores instalados no sistema. As informações obtidas no LHC serão armazenadas em cerca de quatro mil computadores instalados no projeto e processadas em ao menos 100 mil máquinas ao redor do mundo.

O Brasil participa do desenvolvimento do Grid com o Centro Brasileiro de Pesquisas Físicas (CBPF) e contribui hoje com 630 computadores para a pesquisa, 250 na Universidade Estadual Paulista (Unesp), 200 na Universidade Federal do Rio de Janeiro (Uerj) e 180 no CBPF. Essas máquinas são exclusivas para processar dados do LHC. Nos próximos meses, entram em operação outras 300 na Uerj, já compradas; mais 180 na CBPF, em aquisição; e 150 na Universidade de São Paulo (USP), explica o pesquisador do CBPF, o físico Ignácio Bediaga. “A internet distribui informação para todo mundo. O grid vai ser bem semelhante, mas vai distribuir também potência computacional, capacidade de armazenamento e processamento”, explica.

Segundo Bediaga, a participação dos pesquisadores do Centro de Pesquisas Físicas no desenvolvimento do grid ainda está na fase do aprendizado. “No momento, estamos aprendendo. Não existe um livro-texto para seguirmos. É complicado desenvolver, colocar para funcionar. O objetivo é formarmos pessoal no futuro”, alega. De acordo com ele, no CBPF grids estão sendo desenvolvidos para os setores de meteorologia e biomédica. “A área de biomédica é nosso maior usuário no momento. Futuramente, os grids devem se expandir”, diz. Cada sistema tem um software próprio de gerenciamento, de acordo com sua destinação.

Takahashi lembra que a Petrobras está trabalhando para desenvolver um grid para a empresa. Segundo Bediaga, hoje a tecnologia é interessante para cientistas e grandes corporações, que precisam utilizar redes de alto desempenho. Mas ele não descarta que o grid possa chegar ao usuário comum num futuro próximo. “Imagine um HD mundial que possa ser compartilhado pelos usuários comuns ou um Google que utiliza computadores espalhados por diferentes países”, diz.

Experimentos são divididos nas redes LCG e OSG

O grid do LHC é dividido em dois sistemas, um norte-americano, o Open Science Grid (OSG), e outro europeu, o LHC Computer Grid (LCG), explica o físico Ignácio Bediaga. A Unesp e a Uerj estão atuando com o sistema norte-americano. A CBPF e a USP, com o europeu. Segundo Bediaga, técnicos estão desenvolvendo projetos para permitir a interoperabilidade dos dois sistemas. “O software é comum, mas cada experiência tem acesso aos seus dados”, diz.

O projeto tem quatro diferentes experimentos: Alice (A Large Ion Collider Experiment), LHCb (LHC Beauty), Atlas (A Toroidal LHC Apparatus), e CMS (Compact Muon Solenoid). Cada uma estuda resultados específicos. O LHCd e o Alice pertencem ao sistema europeu do grid. Os dois outros, ao norte-americano.

Uma falha mecânica interrompeu o funcionamento do LHC há 10 dias. O conserto deve levar três meses, conforme Bediaga, e estar concluído em dezembro. Mas o projeto tem um acordo com os países europeus onde está instalado de que não irá operar no inverno, devido ao alto consumo de energia. Portanto, a experiência somente deve ser retomada em março de 2009, explica o físico. “Esse atraso não interfere em nada”, alega.

Bediaga diz que o projeto pode responder a questões importantes, que ele divide em três pilares. “Para começar, vamos entender melhor o que já entendemos em boa parte. Também vamos entrar, o que acho fascinante, onde a teoria ainda não chegou. É possível que os experimentos mostrem como é feita a matéria escura. Há uma intuição de que o LHC possa produzi-la. E poderemos descobrir porque o universo é feito de matéria e não anti-matéria, descobrir porque a anti-matéria desapareceu há 14 bilhões de anos. Em nossos experimentos de laboratório, ela sempre aparece”. (SG/AAN)

Middleware administra e disponibiliza as máquinas

Programa intermediário organiza os espaços de acordo com a demanda de processamento

Promover o compartilhamento físico dos computadores exige um middleware, programa intermediário que administra e disponibiliza espaço nas máquinas, diz o físico Jun Takahashi. Os computadores que integram o grid podem ser diferentes, mas há padrões mínimos. No caso do LHC, a conexão tem de ser por fibra ótica. O cluster de 250 máquinas da Unesp tem capacidade de 12 Terabytes e velocidade de conexão de 2,5 Gigabits por segundo. O cluster da USP terá 8 Terabytes e a mesma velocidade de conexão.

“Hoje há um projeto em andamento para instalar conexão por fibra ótica em institutos de pesquisa de São Paulo”, explica Takahashi, referindo-se ao projeto Kya Tera, da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp). Ele comenta que os programas utilizados nos grids precisam ser constantemente atualizados. Um bom middleware, acrescenta, consegue interagir com as diferentes linguagens de cada máquina e identificar aplicativos mal-feitos. Nesses casos, ele exclui o computador e avisa o administrador.

De acordo com o físico, o sistema tem diversos controles de seguranças e falhas são provocadas, na grande maioria, por erro humano. Para ingressar no grid do LHC são necessárias senhas. O usuário, cadastrado, passa primeiro por uma porta de entrada, o gateway, que filtra os acessos. “O gateway tem múltiplos recursos de controle”, comenta. Ele explica que ainda não há informações oficiais sobre o que provocou a invasão ocorrida após o lançamento do projeto.

“Sabemos que a invasão ocorreu via Estados Unidos e um grupo, que se disse escocês, colocou uma página dentro de uma área segura, em um dos computadores de controle do detector”, conta Takahashi. Garante, porém, que não houve ameaça ao sistema. De acordo com ele, além dos softwares, os detectores são controlados mecanicamente. (SG/AAN)

Saiba mais

O LHC tem 27 quilômetros. Os feixes de prótons percorrem 11 mil vezes esse percurso a cada segundo, explica o físico Jun Takahashi. Quando colidirem, irão promover 600 milhões de explosões por segundo, sendo que cerca de três mil eventos mais importantes serão selecionados por aproximadamente quatro mil computadores para serem analisados pelos pesquisadores.

A previsão é de que as seqüências de colisões durem entre 8 e 10 horas. Os especialistas irão se reunir quatro vezes por ano para debater os resultados. Nas primeiras experiências, a energia gerada nas colisões será de 10 teravolts, mas pode alcançar 14 teravolts, explica Takahashi. A expectativa é de que o LHC opere por entre 10 e 15 anos.

O projeto é um anel situado a mais de 100 metros de profundidade ao longo da fronteira entre a Suíça e a França. A construção durou 14 anos e tem custo estimado de US$ 8 bilhões. Atualmente, 9 mil cientistas de quase 200 instituições de diversos países estão envolvidos no LHC.