 
| Últimas notícias
 Table of contentsNessa Twiki você encontrará:  
 | Links importantes | 
 
  Mostrar instruções
    Mostrar instruções  Esconder
  Esconder  Reporte a quantidade de nós "down" que você vê em URL-1
     Reporte a quantidade de nós "down" que você vê em URL-1 . Verifique se algum node possui load> número de cores +1, para dar alguma folga de processamento. Veja ainda se na tabela "OSG-CE Cluster Network Last Hour" um valor maior que (86 nós x 100 Mbytes/S)= 8,6 GB/S se mantém por mais de 20 minutos, indicando que a rede está saturada.
. Verifique se algum node possui load> número de cores +1, para dar alguma folga de processamento. Veja ainda se na tabela "OSG-CE Cluster Network Last Hour" um valor maior que (86 nós x 100 Mbytes/S)= 8,6 GB/S se mantém por mais de 20 minutos, indicando que a rede está saturada. 
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Verifique em um terminal da osg-ce os e-mails enviados pelo logwatch dos nodes
      Verifique em um terminal da osg-ce os e-mails enviados pelo logwatch dos nodes su - pineVerifique principalmente o espaço em disco dos servidores principais e tentativas de acesso às máquinas. Somente necessário no início do seu plantão.
 
  Mostrar instruções
  Mostrar instruções  Esconder
  Esconder  Use URL-1
     Use URL-1 para verificar um load maior do que 15, para osgce, osgse, storage01 e storage02. Caso positivo reporte.
 para verificar um load maior do que 15, para osgce, osgse, storage01 e storage02. Caso positivo reporte.  
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Observe a sequência de comandos abaixo e tente reproduzi-la:
     Observe a sequência de comandos abaixo e tente reproduzi-la:. /OSG/setup.sh /OSG/verify/site_verify.plQualquer erro neste script reporte a lista.
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Você deverá verificar três coisas: a primeira é se algum node não está com o condor funcionando:
     Você deverá verificar três coisas: a primeira é se algum node não está com o condor funcionando:condor_statusVerifique se todos estão listados e confira o estado ("busy" ou "idle"). A segunda é verificar se a farm não está saturada
condor_qpreste atenção a última linha deste comando. Se houver algum job em estado "held" reporte a lista. Se a quantidade de jobs "idle" form maior do que 700, também reporte. O terceiro check é feito com
condor_q -run|grep 2+, verificando os jobs que estão rodando com mais de dois dias na farm. Coloque o output no seu e-mail
 Mostrar instruções
    Mostrar instruções  Esconder
  Esconder  Verifique na URL1
     Verifique na URL1 se existe algum serviço não disponível. Na URL2
 se existe algum serviço não disponível. Na URL2 verifique a quantidade de espaço disponível. Alerte caso o espaço disponível seja inferior à 10 GB
 verifique a quantidade de espaço disponível. Alerte caso o espaço disponível seja inferior à 10 GB   Mostrar instruções
    Mostrar instruções  Esconder
  Esconder  Teste uma transferência usando o protocolo srm, da osg-ce
     Teste uma transferência usando o protocolo srm, da osg-ce . /OSG/setup.sh grid-proxy-init srmcp -2 --debug=true file:////tmp/teste.sh srm://osg-se.sprace.org.br:8443/pnfs/sprace.org.br/data/mdias/teste srmrm srm://osg-se.sprace.org.br:8443/pnfs/sprace.org.br/data/mdias/teste. Qualquer erro relate
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Em um terminal verifique o status dos jobs
     Em um terminal verifique o status dos jobs condor_cron_qVerifique se algum job está "held" , ou se pelo menos três estão em estado "R"
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Observe nossa própria monitoração URL-1
      Observe nossa própria monitoração URL-1 (valores em amarelo para cacert-crl-expiry são ok). Verifique se as datas de alguns probes estão conferindo com o que você vê em URL-2
 (valores em amarelo para cacert-crl-expiry são ok). Verifique se as datas de alguns probes estão conferindo com o que você vê em URL-2 . Qualquer probe em vermelho, ou as datas entre os sites não correspondem reporte para a lista.
. Qualquer probe em vermelho, ou as datas entre os sites não correspondem reporte para a lista.  
 Mostrar instruções
    Mostrar instruções  Esconder
  Esconder  Acompanhe o estado dos probes utilizados pelo CMS SAM utilizando esse link URL1
      Acompanhe o estado dos probes utilizados pelo CMS SAM utilizando esse link URL1 . Qualquer cor diferente do verde por mais de 2 horas deve ser reportada. Verifique o tempo do último teste (pela cor, quanto mais claro, mais velho e passando o mouse por ele). Se for maior que 12 horas, reporte.  A situação geral do site, monitorada pelo CMS center é mostrada aqui URL2
. Qualquer cor diferente do verde por mais de 2 horas deve ser reportada. Verifique o tempo do último teste (pela cor, quanto mais claro, mais velho e passando o mouse por ele). Se for maior que 12 horas, reporte.  A situação geral do site, monitorada pelo CMS center é mostrada aqui URL2 
 
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Verifique a página do JobRobot URL1
     Verifique a página do JobRobot URL1 . Verifique a porcentagem "EFFICIENCY" estiver abaixo de 60 % reporte
. Verifique a porcentagem "EFFICIENCY" estiver abaixo de 60 % reporte 
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Em um node tente reproduzir os comandos abaixo
     Em um node tente reproduzir os comandos abaixo . /OSG/setup.sh ldapsearch -x -LLL -p 2170 -h is.grid.iu.edu -b mds-vo-name=SPRACE,mds-vo-name=local,o=grid condor_status -pool osg-ress-1.fnal.gov -l -constraint "GlueCEInfoHostName == \"osg-ce.sprace.org.br\""(prepare-se para um output gigante!)
 Mostrar instruções
   Mostrar instruções  Esconder
  Esconder  Esses agentes devem ficar verdes (tolerância de 30 min, pois eles podem estar "busy" com alguma transferência). Check URL1
     Esses agentes devem ficar verdes (tolerância de 30 min, pois eles podem estar "busy" com alguma transferência). Check URL1 e URL2
 e URL2 
  
 Mostrar instruções
  Mostrar instruções  Esconder
  Esconder  Verifique a qualidade das transferências na instância Debug URL-1
     Verifique a qualidade das transferências na instância Debug URL-1 e na instância Production URL-2
 e na instância Production URL-2 . Caso apareça um "No data Returned by DB Query" neste último significa que não temos transferências programada. Reporte nos dois casos quando a qualidade das transferências ficar abaixo de 50% por mais de 3 horas.
. Caso apareça um "No data Returned by DB Query" neste último significa que não temos transferências programada. Reporte nos dois casos quando a qualidade das transferências ficar abaixo de 50% por mais de 3 horas. 
| Nome | Quantidade | 
|---|---|
| Marco Dias | 1 dia | 
| Allan Szu | 1 dia | 
| Data | Autor | Página Modificada? | Comentários | 
|---|---|---|---|
| 19 Outubro 2008 | Marco Dias | sim | Criação da página | 
 
  Copyright © 2008-2025 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Copyright © 2008-2025 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.