Últimas notícias
Table of contentsNessa Twiki você encontrará:
|
Links importantes |
Mostrar instruções
Esconder
Reporte a quantidade de nós "down" que você vê em URL-1
Mostrar instruções
Esconder
Verifique em um terminal da osg-ce os e-mails enviados pelo logwatch dos nodes su - pineVerifique principalmente o espaço em disco dos servidores principais e tentativas de acesso às máquinas. Somente necessário no início do seu plantão.
Mostrar instruções
Esconder
Use URL-1
Mostrar instruções
Esconder
Observe a sequência de comandos abaixo e tente reproduzi-la:. /OSG/setup.sh /OSG/verify/site_verify.plQualquer erro neste script reporte a lista.
Mostrar instruções
Esconder
Você deverá verificar três coisas: a primeira é se algum node não está com o condor funcionando:condor_statusVerifique se todos estão listados e confira o estado ("busy" ou "idle"). A segunda é verificar se a farm não está saturada
condor_qpreste atenção a última linha deste comando. Se houver algum job em estado "held" reporte a lista. Se a quantidade de jobs "idle" form maior do que 700, também reporte. O terceiro check é feito com
condor_q -run|grep 2+, verificando os jobs que estão rodando com mais de dois dias na farm. Coloque o output no seu e-mail
Mostrar instruções
Esconder
Verifique na URL1
Mostrar instruções
Esconder
Teste uma transferência usando o protocolo srm, da osg-ce . /OSG/setup.sh grid-proxy-init srmcp -2 --debug=true file:////tmp/teste.sh srm://osg-se.sprace.org.br:8443/pnfs/sprace.org.br/data/mdias/teste srmrm srm://osg-se.sprace.org.br:8443/pnfs/sprace.org.br/data/mdias/teste. Qualquer erro relate
Mostrar instruções
Esconder
Em um terminal verifique o status dos jobs condor_cron_qVerifique se algum job está "held" , ou se pelo menos três estão em estado "R"
Mostrar instruções
Esconder
Observe nossa própria monitoração URL-1
Mostrar instruções
Esconder
Acompanhe o estado dos probes utilizados pelo CMS SAM utilizando esse link URL1
Mostrar instruções
Esconder
Verifique a página do JobRobot URL1
Mostrar instruções
Esconder
Em um node tente reproduzir os comandos abaixo . /OSG/setup.sh ldapsearch -x -LLL -p 2170 -h is.grid.iu.edu -b mds-vo-name=SPRACE,mds-vo-name=local,o=grid condor_status -pool osg-ress-1.fnal.gov -l -constraint "GlueCEInfoHostName == \"osg-ce.sprace.org.br\""(prepare-se para um output gigante!)
Mostrar instruções
Esconder
Esses agentes devem ficar verdes (tolerância de 30 min, pois eles podem estar "busy" com alguma transferência). Check URL1
Mostrar instruções
Esconder
Verifique a qualidade das transferências na instância Debug URL-1| Nome | Quantidade |
|---|---|
| Marco Dias | 1 dia |
| Allan Szu | 1 dia |
| Data | Autor | Página Modificada? | Comentários |
|---|---|---|---|
| 19 Outubro 2008 | Marco Dias | sim | Criação da página |