這篇文章主要介紹“Oracle集群中OLR與套接字文件分析”,在日常操作中,相信很多人在Oracle集群中OLR與套接字文件分析問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”O(jiān)racle集群中OLR與套接字文件分析”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),衛(wèi)東企業(yè)網(wǎng)站建設(shè),衛(wèi)東品牌網(wǎng)站建設(shè),網(wǎng)站定制,衛(wèi)東網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,衛(wèi)東網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。| OLR
OLR文件中記錄的信息是ohasd守護(hù)進(jìn)程啟動集群初始化資源時(shí)所需要的資源定義信息,當(dāng)集群啟動時(shí)ohasd會從/etc/oracle/olr.loc文件中獲取olr文件的位置。
[root@node1 ~]# ls -ltr /etc/oracle total 2248 drwxr-xr-x. 3 root oinstall 4096 Nov 21 01:38 scls_scr drwxrwxr-x. 5 root oinstall 4096 Nov 21 01:38 oprocd -rws--x---. 1 root oinstall 2279833 Nov 21 01:38 setasmgid -rw-r--r--. 1 root root 0 Nov 21 01:38 olr.loc.orig -rw-r--r--. 1 root oinstall 81 Nov 21 01:38 olr.loc -rw-r--r--. 1 root root 0 Nov 21 01:38 ocr.loc.orig -rw-r--r--. 1 root oinstall 40 Nov 21 01:38 ocr.loc drwxrwx---. 2 root oinstall 4096 Nov 21 01:44 lastgasp [root@node1 ~]# cat /etc/oracle/olr.loc olrconfig_loc=/u01/app/11.2.0/grid/cdata/node1.olr crs_home=/u01/app/11.2.0/grid [root@node1 ~]# ls -ltr /u01/app/11.2.0/grid/cdata/node1.olr -rw-------. 1 root oinstall 272756736 Jan 8 21:40 /u01/app/11.2.0/grid/cdata/node1.olr [root@node1 ~]#
對于olr文件,每個(gè)節(jié)點(diǎn)都有自己的olr文件,默認(rèn)位置在$GRID_HOME/cdata/
[root@node1 ~]# ocrcheck -local Status of Oracle Local Registry is as follows : Version : 3 Total space (kbytes) : 262120 Used space (kbytes) : 2676 Available space (kbytes) : 259444 ID : 810831447 Device/File Name : /u01/app/11.2.0/grid/cdata/node1.olr Device/File integrity check succeeded Local registry integrity check succeeded Logical corruption check succeeded [root@node1 ~]# ocrcheck -local -config Oracle Local Registry configuration is : Device/File Name : /u01/app/11.2.0/grid/cdata/node1.olr [root@node1 ~]#
ocrcheck驗(yàn)證完整性是根據(jù)安裝時(shí)生成libocr11.so,根據(jù)libocr11.so內(nèi)容來檢查ocr/olr。
| 轉(zhuǎn)儲OLR文件
olr文件為二進(jìn)制方式保存,我們可以使用oracle提供的ocrdump工具對olr文件進(jìn)行轉(zhuǎn)儲,生成文本模式的文件,方便我們了解olr文件內(nèi)容。
[root@node1 ~]# ocrdump -local [root@node1 ~]# ls -ltr total 284 drwxr-xr-x. 2 root root 4096 Jan 10 2018 tmp drwxr-xr-x. 2 root root 4096 Jan 10 2018 scripts ... -rw-r--r--. 1 root root 10257 Nov 20 09:20 install.log.syslog -rw-r--r--. 1 root root 52196 Nov 20 09:23 install.log -rw-------. 1 root root 1717 Nov 20 09:23 anaconda-ks.cfg -rw-------. 1 root root 179399 Jan 8 22:05 OCRDUMPFILE [root@node1 ~]#
[grid@rac1 tmp]$ cat OCRDUMPFILE 05/31/2018 03:50:13 /u01/app/11.2.0/grid/bin/ocrdump.bin -local [SYSTEM] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : root, GROUP_NAME : root} ... [SYSTEM.ORA_CRS_HOME] ORATEXT : /u01/app/11.2.0/grid SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : root, GROUP_NAME : root} ##GI_HOME信息 [SYSTEM.WALLET] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_CREATE_SUB_KEY, OTHER_PERMISSION : PROCR_CREATE_SUB_KEY, USER_NAME : root, GROUP_NAME : root} ... [SYSTEM.version.activeversion] ORATEXT : 11.2.0.4.0 SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : root, GROUP_NAME : root} ##集群版本信息 [SYSTEM.GPnP] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_NONE, OTHER_PERMISSION : PROCR_NONE, USER_NAME : grid, GROUP_NAME : oinstall} ##集群初始化資源GPnP定義信息 [SYSTEM.GPnP.profiles] BYTESTREAM (16) : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_NONE, OTHER_PERMISSION : PROCR_NONE, USER_NAME : grid, GROUP_NAME : oinstall} [SYSTEM.GPnP.profiles.peer] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_NONE, OTHER_PERMISSION : PROCR_NONE, USER_NAME : grid, GROUP_NAME : oinstall} … [SYSTEM.network] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : grid, GROUP_NAME : oinstall} [SYSTEM.network.haip] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : grid, GROUP_NAME : oinstall} [SYSTEM.network.haip.group] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : grid, GROUP_NAME : oinstall} [SYSTEM.network.haip.group.cluster_interconnect] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : grid, GROUP_NAME : oinstall} [SYSTEM.network.haip.group.cluster_interconnect.interface] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : grid, GROUP_NAME : oinstall} ##集群初始化資源HAIP信息 [SYSTEM.OCR] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : root, GROUP_NAME : root} ##OCR信息 [SYSTEM.OCR.BACKUP] UNDEF : SECURITY : {USER_PERMISSION : PROCR_ALL_ACCESS, GROUP_PERMISSION : PROCR_READ, OTHER_PERMISSION : PROCR_READ, USER_NAME : root, GROUP_NAME : root} ...
OLR與OCR文件的數(shù)據(jù)存儲都是采用樹形結(jié)構(gòu),詳細(xì)信息查看dump后的文件即可,這里不再解讀。
| OLR文件丟失導(dǎo)致的初始化資源層無法啟動
olr文件丟失后,集群啟動時(shí)alert[hostname].log日志中會有明顯olr文件無法讀取的錯(cuò)誤信息,如下:
alertnode1.log:
2018-03-26 06:15:17.579: [ohasd(5219)]CRS-0704:Oracle High Availability Service aborted due to Oracle Local Registry error [PROCL-33: Oracle Local Registry is not configured Storage layer error [Error opening olr.loc file. No such file or directory] [2]]. Details at (:OHAS00106:) in /u01/app/11.2.0/grid/log/node1/ohasd/ohasd.log. 2018-03-26 06:15:17.733: [ohasd(5230)]CRS-0704:Oracle High Availability Service aborted due to Oracle Local Registry error [PROCL-33: Oracle Local Registry is not configured Storage layer error [Error opening olr.loc file. No such file or directory] [2]]. Details at (:OHAS00106:) in /u01/app/11.2.0/grid/log/node1/ohasd/ohasd.log. 2018-03-26 06:15:17.886: [ohasd(5241)]CRS-0704:Oracle High Availability Service aborted due to Oracle Local Registry error [PROCL-33: Oracle Local Registry is not configured Storage layer error [Error opening olr.loc file. No such file or directory] [2]]. Details at (:OHAS00106:) in /u01/app/11.2.0/grid/log/node1/ohasd/ohasd.log. [client(5256)]CRS-10001:CRS-10132: No msg for has:crs-10132 [10][60]
日志中直接報(bào)olr.loc文件無法打開。(opening olr.loc file. No such file or directory)
[root@node1 ~]# ps -ef | grep -E 'ohasd|agent|gpnp|gipc|mdns' | grep -v grep root 1332 1 0 20:53 ? 00:00:00 /bin/sh /etc/init.d/init.ohasd run [root@node1 ~]#
后臺進(jìn)程中,只有init.ohasd腳本運(yùn)行在后臺,初始化資源層中所有資源均為啟動,對于olr文件丟失,我只需要通過備份的olr文件還原即可。
| OLR文件的備份與恢復(fù)
OLR文件會在GI軟件安裝之后,或者GI升級之后自動進(jìn)行一次備份,OLR文件并不會像OCR一樣自動進(jìn)行備份,如果初始化資源層面的資源出現(xiàn)變動,建議手工備份OLR文件。
1.手動備份OLR
ocrconfig -local -manualbackup
2.查看OLR文件的備份
ocrconfig -local -showbackup
3.恢復(fù)OLR文件
ocrconfig -local -restore
恢復(fù)時(shí)確保ohasd.bin未啟動,如果ohasd.bin仍在運(yùn)行,請使用crsctlstop crs停止GI。
恢復(fù)OLR過程中如果出現(xiàn)PROTL-16:Internal Error錯(cuò)誤,導(dǎo)致恢復(fù)失敗,可能是由于olr.loc文件丟失導(dǎo)致,因?yàn)閛lr文件還原時(shí)會讀取olr.loc文件,將olr文件恢復(fù)到olr.loc指定的位置。
[root@rac1 oracle]# ocrconfig -local -restore /u01/app/11.2.0/grid/cdata/rac1/backup_20180221_045700.olr PROTL-16: Internal Error [root@rac1 oracle]#
如果仍然失敗,請嘗試創(chuàng)建虛擬OLR,設(shè)置正確的所有權(quán)和權(quán)限,然后重試還原命令:
#cd#touch .olr #chmod 600 .olr #chown : .olr
4.驗(yàn)證OLR文件的完整性
對于OLR文件的完整性驗(yàn)證,也可以使用Oracle提供的CVU進(jìn)行驗(yàn)證,但這里的驗(yàn)證并不檢查OLR文件內(nèi)容的邏輯完整性,如果需要同時(shí)驗(yàn)證邏輯完整性還需使用ocrcheck -local進(jìn)行驗(yàn)證。
[grid@node1 ~]$ cluvfy comp olr Verifying OLR integrity Checking OLR integrity... Checking OLR config file... OLR config file check successful Checking OLR file attributes... OLR file check successful WARNING: This check does not verify the integrity of the OLR contents. Execute 'ocrcheck -local' as a privileged user to verify the contents of OLR. OLR integrity check passed Verification of OLR integrity was successful. [grid@node1 ~]$
5.OLR文件的自動備份
在12.2.0.1以上版本中,Grid也開始支持OLR文件的自動備份,自動備份功能作為BUG的一部分而進(jìn)行提供,BUG 24799186(現(xiàn)由BUG 26493466取代),但在18.1以及GI RU 12.2.0.1.180116中以包含OLR自動備份功能。
套接字文件是進(jìn)程與進(jìn)程之間雙向通信的端點(diǎn),是進(jìn)程間通信的一種約定,Oracle集群在啟動時(shí),首先讀取OLR文件進(jìn)行初始化資源層的啟動,并逐步實(shí)現(xiàn)集群的啟動,在此過程中會在/var/tmp/.oracle目錄中創(chuàng)建相關(guān)集群進(jìn)程需要的套接字文件。
套接字文件是集群運(yùn)行過程中必不可少的文件,在集群運(yùn)行過程中請不要刪除相關(guān)套接字文件,如果套接字文件丟失會導(dǎo)致一些不可預(yù)知的問題。
如下測試是在集群運(yùn)行過程,手工刪除/var/tmp/.oracle中的所有文件后,通過crsctl檢查集群狀態(tài),輸出CRS-4535與CRS-4000以及CRS-4639,第一感覺是集群未啟動,但實(shí)際情況是集群與數(shù)據(jù)庫均運(yùn)行正常。
[root@node1 ~]# crsctl stat res -t CRS-4535: Cannot communicate with Cluster Ready Services CRS-4000: Command Status failed, or completed with errors. [root@node1 ~]# crsctl check crs CRS-4639: Could not contact Oracle High Availability Services [root@node1 ~]# ps -ef | grep -E 'ohasd|agent|mdns|gpnp|gipc|pmon' | grep -v grep root 1332 1 0 Jan20 ? 00:00:00 /bin/sh /etc/init.d/init.ohasd run root 3829 1 0 Jan20 ? 00:01:19 /u01/app/11.2.0/grid/bin/ohasd.bin reboot grid 3951 1 0 Jan20 ? 00:01:10 /u01/app/11.2.0/grid/bin/oraagent.bin grid 3962 1 0 Jan20 ? 00:00:00 /u01/app/11.2.0/grid/bin/mdnsd.bin grid 3973 1 0 Jan20 ? 00:00:11 /u01/app/11.2.0/grid/bin/gpnpd.bin grid 3984 1 0 Jan20 ? 00:01:43 /u01/app/11.2.0/grid/bin/gipcd.bin root 3986 1 0 Jan20 ? 00:02:18 /u01/app/11.2.0/grid/bin/orarootagent.bin root 4030 1 0 Jan20 ? 00:00:16 /u01/app/11.2.0/grid/bin/cssdagent grid 4390 1 0 Jan20 ? 00:00:05 asm_pmon_+ASM1 grid 4559 1 0 Jan20 ? 00:02:03 /u01/app/11.2.0/grid/bin/oraagent.bin root 4567 1 0 Jan20 ? 00:02:17 /u01/app/11.2.0/grid/bin/orarootagent.bin oracle 4769 1 0 Jan20 ? 00:01:44 /u01/app/11.2.0/grid/bin/oraagent.bin oracle 4832 1 0 Jan20 ? 00:00:07 ora_pmon_oraapp1 [root@node1 ~]#
對于套接字文件丟失導(dǎo)致集群運(yùn)行不正常以及其他問題,最簡單的辦法就是重新啟動集群,集群在啟動時(shí)會重新創(chuàng)建需要的套接字文件。
到此,關(guān)于“Oracle集群中OLR與套接字文件分析”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!