Olá pessoal!

Hoje veremos como realizar corretamente a análise para o troubleshooting do ambiente clusterizado.

Na verdade, não passarei aqui como se fazer um troubleshooting, mas, sim, como conhecer a ordem de inicialização do Clusterware, e, com isso, identificar o lugar onde o problema ocorre.

O Clusterware, é iniciado no boot do sistema operacional, pois é chamado através do /etc/inittab;

Entradas no /etc/inittab referentes ao startup do Clusterware:

h1:35:respawn:/etc/init.d/init.evmd run >/dev/null 2>&1 </dev/null
h2:35:respawn:/etc/init.d/init.cssd fatal >/dev/null 2>&1 </dev/null
h3:35:respawn:/etc/init.d/init.crsd run >/dev/null 2>&1 </dev/null

Assim que o servidor é iniciado, o primeiro processo que tentará ficar online é o CSS, para isso, verificará se tem acesso de leitura/gravação nos Voting Disks;

Para acompanhar a subida do CSS, verificar dois logs:

  • Arquivo: /var/log/messages

As mensagens esperadas são:

    • Cluster Ready Services completed waiting on dependencies;
    • Running CRSD with TZ=;
    • Oracle CSS Family monitor starting.
  • Arquivo: $ORA_CRS_HOME/log/<hostname>/alert.log

A mensagem esperada é:

    • CSSD voting file is online: /dev/voting1

O arquivo /etc/oracle/ocr.loc define a localização do OCR. Necessário para que o processo CRSD seja iniciado. O CSS faz a leitura desse arquivo;

O CSS solicita o início do CRSD e EVMD ($ORA_CRS_HOME/log/hostname/alert.log.

As mensagens esperadas para esta ação são:

  • The OCR service started on node mvrac1;
  • EVMD started on node mvrac1;
  • CRSD started on node mvrac1;

O CRSD inicializará os recursos do cluster ($ORA_CRS_HOME/log/<hostname>/crsd/crsd.log).

As mensagens esperadas são:

  • “Attempting to start ‘ora.mvrac1.vip’ on member ‘mvrac1′”;
  • “Start of ‘ora.mvrac1.vip’ on member ‘mvrac1’ succeeded.”

Diretórios onde são gerados os logs do Clusterware:

  • $ORA_CRS_HOME/log/<hostname>

Para o restante dos recursos, o caminho de log permanece o mesmo:

Listener:

  • $ORACLE_HOME/network/log/listener.log

ASM:

  • Definido pelo parâmetro BACKGROUND_DUMP_DEST da instância ASM;

Banco de Dados:

  • Definido pelo parâmetro BACKGROUND_DUMP_DEST da instância de banco de dados.

Conhecendo todo o ciclo de inicialização do Clusterware, e onde procurar erros, fica fácil encontrar o problema, ou, ao menos, direcionar o problema para o Suporte Oracle.

Finalizamos hoje a série de artigos das rotinas administrativas do Clusterware.

O próximo artigo iniciará a série que tratará sobre a conversão de um banco de dados single instance para RAC.

Um abraço!

Vinicius