Olá pessoal!
Hoje veremos como realizar corretamente a análise para o troubleshooting do ambiente clusterizado.
Na verdade, não passarei aqui como se fazer um troubleshooting, mas, sim, como conhecer a ordem de inicialização do Clusterware, e, com isso, identificar o lugar onde o problema ocorre.
O Clusterware, é iniciado no boot do sistema operacional, pois é chamado através do /etc/inittab;
Entradas no /etc/inittab referentes ao startup do Clusterware:
h1:35:respawn:/etc/init.d/init.evmd run >/dev/null 2>&1 </dev/null h2:35:respawn:/etc/init.d/init.cssd fatal >/dev/null 2>&1 </dev/null h3:35:respawn:/etc/init.d/init.crsd run >/dev/null 2>&1 </dev/null
Assim que o servidor é iniciado, o primeiro processo que tentará ficar online é o CSS, para isso, verificará se tem acesso de leitura/gravação nos Voting Disks;
Para acompanhar a subida do CSS, verificar dois logs:
- Arquivo: /var/log/messages
As mensagens esperadas são:
- Cluster Ready Services completed waiting on dependencies;
- Running CRSD with TZ=;
- Oracle CSS Family monitor starting.
- Arquivo: $ORA_CRS_HOME/log/<hostname>/alert.log
A mensagem esperada é:
- CSSD voting file is online: /dev/voting1
O arquivo /etc/oracle/ocr.loc define a localização do OCR. Necessário para que o processo CRSD seja iniciado. O CSS faz a leitura desse arquivo;
O CSS solicita o início do CRSD e EVMD ($ORA_CRS_HOME/log/hostname/alert.log.
As mensagens esperadas para esta ação são:
- The OCR service started on node mvrac1;
- EVMD started on node mvrac1;
- CRSD started on node mvrac1;
O CRSD inicializará os recursos do cluster ($ORA_CRS_HOME/log/<hostname>/crsd/crsd.log).
As mensagens esperadas são:
- “Attempting to start ‘ora.mvrac1.vip’ on member ‘mvrac1′”;
- “Start of ‘ora.mvrac1.vip’ on member ‘mvrac1’ succeeded.”
Diretórios onde são gerados os logs do Clusterware:
- $ORA_CRS_HOME/log/<hostname>
Para o restante dos recursos, o caminho de log permanece o mesmo:
Listener:
- $ORACLE_HOME/network/log/listener.log
ASM:
- Definido pelo parâmetro BACKGROUND_DUMP_DEST da instância ASM;
Banco de Dados:
- Definido pelo parâmetro BACKGROUND_DUMP_DEST da instância de banco de dados.
Conhecendo todo o ciclo de inicialização do Clusterware, e onde procurar erros, fica fácil encontrar o problema, ou, ao menos, direcionar o problema para o Suporte Oracle.
Finalizamos hoje a série de artigos das rotinas administrativas do Clusterware.
O próximo artigo iniciará a série que tratará sobre a conversão de um banco de dados single instance para RAC.
Um abraço!
Vinicius
Related posts
Disclaimer
Minhas postagens refletem minhas próprias opiniões e não representam necessariamente as opiniões do meu empregador, a Accenture.