이 문제를 어떻게 분석할 것인가? 먼저 시스템 로그를 살펴보십시오. HP-UX인 경우 시스템 로그는 /var/log/syslog/syslog.log이고 AIX는 errpt입니다.
시스템 로그에 다음이 표시됩니다. /p >
11월 11일 18:43:57 rx8640c syslog: Oracle CSS 제품군 모니터 종료 3
11월 11일 18:43:59 rx8640c su: + tty root-oracle
Nov 11 18:43:59 rx8640c syslog: Cluster Ready Services가 종속성을 기다리는 동안 완료되었습니다.
ALERT 로그를 비교한 결과 시스템이 기본적으로 이때 다시 시작되었음을 확인했습니다.
Wed Nov 11 18:43:28 2009
추적 덤프가 id=[cdmp_20091111184328]
Wed Nov 11 18:57:17 2009
시작 중입니다. ORACLE 인스턴스(일반)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
AIX 시스템인 경우 마지막 종료를 사용하여 HP인지 확인할 수 있습니다. .
여기서 syslog.log에서 CSS 프로세스가 종료되고(이는 내 생각에) CSS가 닫히거나 비정상적이며 호스트가 자동으로 다시 시작되는 것을 볼 수 있습니다. 이는 현재와 일치합니다. 상황
다음 ORA_CRS_HOME에서 ocssd 로그를 분석하세요.
[CSSD]2009-11-11 18:39:18.460 [13] >WARNING: clssgmAssignMemberNo(): grock(#CSS_CLSSOMON ) memberNo(1)이 이미 할당됨
[ CSSD]2009-11-11 18:39:34.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) 50% 하트비트에서 치명적, 14.807 se에서 제거
조건
[ CSSD]2009-11-11 18:39:35.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) 하트비트 50%에서 치명적, 13.807에서 제거 se
조건
[ CSSD]2009-11-11 18:39:42.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) 75% 하트비트에서 치명적, 퇴거 6.807초
onds
[ CSSD]2009-11-11 18:39:45.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) 재구성이 임박함
> [ CSSD]2009-11-11 18:39:45.314 [14] >TRACE: clssnmPollingThread: diskTimeout이 (27000)ms로 설정됨 임박한 재구성 상태(1)
[ CSSD]2009-11-11 18:39:46.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) 재구성이 임박함
[ CSSD]2009-11-11 18:39:46.314 [14] >WARNING: clssnmPollingThread: node rx8640c (1) 90% 하트비트에서 치명적, 2.807초 만에 제거
onds
[ CSSD]2009-11-11 18:39:47.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) 재구성이 임박함
[ CSSD]2009-11-11 18:39:47.314 [14] >WARNING: clssnmPollingThread: node rx8640c (1) 90% 하트비트에서 치명적, 1.807에서 제거 초
onds
[ CSSD]2009-11-11 18:39:48.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) 재구성이 임박함
[ CSSD]2009-11-11 18:39:48.314 [14] >WARNING: clssnmPollingThread: 노드 rx8640c (1) 90% 하트비트에서 치명적, 0.807초 내에 제거
이후
[ CSSD]2009-11-11 18:39:49.133 [14] >TRACE: clssnmPollingThread: node rx8640c (1) 재구성이 임박함
[ CSSD]2009-11-11 18:39 :49.134 [14] >TRACE: clssnmPollingThread: 노드 rx8640c(1)에 대한 제거 시작, 플래그 0x000f, 상태 3,
이 로그 정보는 분명하며 개인 네트워크 하트비트가 손실되고 노드가 제거됩니다.
사설망에 문제가 생기고 하트비트가 끊기는 이유는 DBA가 감당할 수 있는 부분이 아닌 것 같아서 보고서를 작성해서 네트워크 관리자에게 전달하는 것 같아요
또한 노드가 다시 시작될 수 있습니다. OCSSD, OPROCD, OCLSOMON의 세 가지 프로세스가 있습니다.
일반적으로 OCSSD의 원인은 하트비트 손실(네트워크 하트비트 또는 투표 디스크 문제)과 CSS 프로세스가 CPU 리소스를 요청할 수 없고 OPROCD, OCLSOMON 이유는 프로세스가 CPU 리소스를 요청할 수 없고 BUG이기 때문입니다.
노드를 다시 시작하기 전에 600 오류도 보고했습니다.
Wed Nov 11 18:43:27
2009
/oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_24884.trc 파일의 오류:
ORA-00600: 내부 오류 코드, 인수: [keltnfy-ldmInit] , [46], [1], [], [], [], [], []
버그 5486074로 확인됨
ORA-600 [keltnfy-ldminit ]는 호스트 이름이나
네트워크 주소를 확인할 수 없는 경우 서버 생성 경고
하위 시스템에서 발생할 수 있습니다. 이는 DNS 서버를 사용할 수 없기 때문에 발생할 수 있습니다.
확인 이 오류로 인해 CSS가 종료되고 호스트가 다시 시작된다는 점은 언급하지 않았지만 이 오류는 클라이언트에서 보고되어야 합니다. . .
적어도 네트워크에 문제가 있다는 것은 확인할 수 있습니다
시작할 때 오류가 보고되었습니다
Wed Nov 11 18:58: 06 2009
/oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_7203.trc 파일의 오류:
ORA-00600: 내부 오류 코드, 인수: [ksprlspeeq3], [65536], [], [] , [], [], [], []
Wed Nov 11 18:58:07 2009
/oracle/ 파일에 오류가 있습니다. app/oracle/admin/ora10g/udump /ora10g1_ora_7203.trc:
ORA-07445: 예외 발생: 코어 덤프 [kgscDump()+801] [SIGSEGV] [객체에 매핑되지 않은 주소] [0x000001004] [] []
ORA-00600: 내부 오류 코드, 인수: [ksprlspeeq3], [65536], [], [], [], [], [], []
2009년 11월 11일 수요일 18:58 :08
/oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_7203.trc 파일의 오류:
ORA-07445: 예외 발생: 코어 덤프 [kgscDump() +801] [SIGSEGV] [객체에 매핑되지 않은 주소] [0x000001004] [] []
ORA-07445: 예외 발생: 코어 덤프 [kgscDump()+ 801] [SIGSEGV] [객체에 매핑되지 않은 주소] [0x000001004] [] []
ORA-00600: 내부 오류 코드, 인수: [ksprlspeeq3], [65536], [], [], [], [], [], []
ORA-07445[kgscDump]는 Bug 5508574 - OERI[504] / OERI[99999] / Dump [kgscdump] with > 31 CPU에 해당하지만 시스템에는 15C와 30개의 코어만 있습니다.
ORA-00600[ksprlspeeq3] 이 10203 관련 BUG는 발견되지 않아서 지금은 크게 신경쓰지 않았습니다.
METALINK 참고 사항: 4.1을 권장합니다. 이전 버전입니다. 많은 분류된 기사와 일부 도구 목록이 포함된 지식