Nodes Lacking Space Due to Large Cluster Health Monitor File Crfclust.Bdb

Problema

Al llegar un alerta con el 88 % del /u01 catalogado como un critical, enviado por la herramienta de monitoreo #OracleCloudControl13 , comenzamos por revisar los indicadores de Logs, traces que ya tenemos rgistrados con logrotate y con adrci para su depuracion automatizada.

A continuacion mostramos el estado de volumenes ocupados ,siendo los mismos donde almacenamos los binarios de Oracle en cada uno de los nodos miembros del cluster.

[oracle@srvracpro01]$ df -h /u01
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/VolGroupSys-LogVolU01 100G 78G 22G 78% /u01

[oracle@srvracpro02]$ df -h /u01 
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/VolGroupSys-LogVolU01  100G 81G 19G 81% /u01

Analizemos el problema:

Luego de la revision de los paths en el ORACLE_HOME sin encontrar problemas,  procedemos sobre el GRID_HOME. Luego de la ejecucion del comando du * -sch encontramos directorios con mucho volumen.

Nos dirigimos al $GRID_HOME y verificamos los tamaños de los archivos y nos observamos uno en particular, el archivo Crfclust.Bdb que ocupa aproximadamente 48.5G:

[oragrid@srvracpro01]$ pwd
/u01/app/grid/11.2.0.4/crf/db/srvoracd12b

[oragrid@srvoracd12b srvoracd12b]$ ls -lh | grep bdb
-rw-r----- 1 root root 115M Jan 30 17:28 crfalert.bdb
-rw-r----- 1 root root 48.5G Jan 30 17:28 crfclust.bdb
-rw-r----- 1 root root 8.0K Jan 29 11:54 crfconn.bdb
-rw-r----- 1 root root 126M Jan 30 17:28 crfcpu.bdb
-rw-r----- 1 root root 114M Jan 30 17:28 crfhosts.bdb
-rw-r----- 1 root root 135M Jan 30 17:28 crfloclts.bdb
-rw-r----- 1 root root  88M Jan 30 17:28 crfts.bdb
-rw-r----- 1 root root 8.0K Jan  2 16:58 repdhosts.bdb
-rw-r--r-- 1 root root 115M Jan 30 16:51 srvoracd12b.ldb
[oragrid@srvoracd12b srvoracd12b]$

Entendiendo el problema

Este es un problema que viene derivado del proceso monitor Cluster Health Monitor (CHM) y la base de datos relacionada al proceso, que incrementa notoriamente el espacio.

Solucion

Debemos rezisear el tamaño del file. Sigue leyendo