Høj pladsforbrug Fra crfclust.bdb

Jeg har en 2-node testbed, der kører Oracle RAC 11.2.0.4 på OL6. Stort set alt er på systemdisken. Dette er trods alt bare et testbed. Rodpartitionen er ved at blive fyldt op. Jeg fik en advarsel fra EM om problemet med diskplads og gik ind og ryddede op i nogle logfiler. Mens jeg ryddede op i gamle logfiler, fortalte min hjerne mig, at udnyttelsen af logfilpladsen ikke var ude af kontrol, og at der måtte være et andet underliggende problem. Sikkert nok, tre dage senere fik jeg besked om, at disken var ved at blive fyldt op igen. Jeg vidste, at jeg var nødt til at grave videre i det her. Der skal være endnu en fil eller to, der samler pladsen. Efter lidt gravning kom jeg til denne mappe i min Grid Infrastructure-installation:

[oracle@host01 host01]$ pwd
/u01/app/crs11.2.0.4/crf/db/host01
[oracle@host01 host01]$ ls -l
total 10945448
-rw-r--r-- 1 root root 1773999 Jul 2 13:54 02-JUL-2014-13:54:50.txt
-rw-r--r-- 1 root root 1120665 Jul 2 14:00 02-JUL-2014-14:00:06.txt
-rw-r--r-- 1 root root 16953 Mar 25 2014 25-MAR-2014-19:51:58.txt
-rw-r----- 1 root root 280764416 Nov 13 16:15 crfalert.bdb
-rw-r----- 1 root root 9850126336 Nov 13 16:14 crfclust.bdb
-rw-r----- 1 root root 8192 Jul 2 13:59 crfconn.bdb
-rw-r----- 1 root root 352174080 Nov 13 16:15 crfcpu.bdb
-rw-r----- 1 root root 249356288 Nov 13 16:15 crfhosts.bdb
-rw-r----- 1 root root 265261056 Nov 13 16:14 crfloclts.bdb
-rw-r----- 1 root root 172232704 Nov 13 16:14 crfts.bdb
-rw-r----- 1 root root 24576 Jul 2 13:54 __db.001
-rw-r----- 1 root root 401408 Nov 13 16:15 __db.002
-rw-r----- 1 root root 2629632 Nov 13 16:15 __db.003
-rw-r----- 1 root root 2162688 Nov 13 16:15 __db.004
-rw-r----- 1 root root 1187840 Nov 13 16:15 __db.005
-rw-r----- 1 root root 57344 Nov 13 16:15 __db.006
-rw-r----- 1 root root 16777216 Nov 13 16:06 log.0000008765
-rw-r----- 1 root root 16777216 Nov 13 16:15 log.0000008766
-rw-r--r-- 1 root root 120000000 Jul 2 13:55 host01.ldb
-rw-r----- 1 root root 8192 Jul 2 13:54 repdhosts.bdb

Filen crfclust.bdb er omkring 9,8 GB. Min systemdisk er kun 30 GB, så denne ene fil fylder 33 % af hele pladsen. Og det bliver ved med at vokse. For at løse problemet udførte jeg disse trin:

[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl stop ressource ora.crf -init
CRS-2673:Forsøg på at stoppe 'ora.crf' på 'host01'
CRS-2677:Stop af 'ora.crf' på 'host01' lykkedes
[oracle@host01 host01] $ su
Adgangskode:
[root@host01 host01]# rm -rf *
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl start ressource ora.crf -init
CRS-2672:Forsøg på at starte 'ora.crf' på 'host01'
CRS-2676:Start af 'ora.crf' på 'host01' lykkedes

Hvorfor virkede dette? Disse filer er Berkeley-databasen, der bruges til Cluster Health Monitor (CHM). En af filerne formodes kun at være omkring 1 GB i størrelse og regelmæssigt rense ældre data. Men udrensningstrinnet virker ikke. Ved at fjerne filerne manuelt, vil jeg miste historiske ydeevnedata, men det er acceptabelt for mig på dette tidspunkt. Ved opstart vil CHM oprette filerne på ny, hvis de mangler.

Efter at have løst problemet, fandt jeg Metalink Note 1343105.1, som beskriver problemet. Jeg har endnu ikke været i stand til at finde et specifikt fejlnummer, men det er tydeligt, at der findes en fejl.