오랜만에 Linux 환경 실제 사이트에 RAC 설치를 진행했는데

 

grid 설치 도중 문제가 발생해 원인을 잡는다고 2시간 반을 소모했다.

 

grid 과정 중 노드 add하고 ssh 설정과 test 할 수 있는 단계의 다음 단계가 진행이 안된다.

 

확인해보니 exectask를 remote node에서 retrieve할 수 없다고 한다.

(version of exectask could not be retrieved from node node02)

 

runcluvfy도 시도해보았지만 3번째 확인 과정에서 역시 hang되어버렸다.

 

한참 있다가 ctrl+c로 취소하면 비슷한 에러메시지가 나타난다.

 

음.. 왜그럴까 처음엔 OS 보안 설정을 의심했었다.

 

그런데 좀 자세히 조사해보니 node1의  /tmp/CVU_11.2.0.4.0_grid 밑에 약 30개의 sh 파일이 있고 그 중에 exectask.sh가 있다.

하지만 node2는 디렉토리는 있는데 스크립트가 하나밖에 없는 상태였다.

 

1. 음 혹시? 하고 scp로 /tmp/CVU_11.2.0.4.0_grid 아래의 모든 파일을 node2의 같은 위치로 넘겨보았다.(public hostname으로)

파일이 하나 전송되다가 더 진행이 되지 않네?

 

2. reboot을 해보았다. 동일 증상이다.

 

원래대로라면 설치했던 OS 엔지니어에게 확인해달라고 하겠지만, OS 설치 엔지니어는 새벽까지 설치해서 연락하기 힘든 상황이다. 원인을 찾기 위해 계속 다른 시도를 해보았다.

 

3. node2에서 node1로 파일을 아무거나 넘겨보았다. 안된다.

 

4. 여태 grid 유저로 시도했었는데, root도 안되나? 안된다

 

5. root 유저와 grid 유저의 ~/.ssh 아래 내용을 전부 삭제하고 시도. 안된다..

 

6. private 링크(인터커넥트)를 통해서는 될까? 된!다!된!다!!

 

그럼 설마?? 서버 설치 요구사항에 Jumboframe을 위해 MTU 9000 설정해달라고 했는데, 인터커넥트는 9000이 맞는데 왠걸 ifconfig -a로 확인해보니 양쪽 노드 모두 public 링크까지 MTU를 9000 설정되어있는걸 확인했다.

 

public 인터페이스의 MTU size를 1500으로 변경하고 scp 전송 정상 확인하고 grid 막혔던 부분도 진행되어 무사히 설치 완료.

 

중간중간 메타링크와 구글을 확인해보았지만 이 문제는 둘 다 도움을 줄 수 없었다.

 

나름 재미있었던 케이스였다.

'TroubleShoot' 카테고리의 다른 글

SQL*Net break/reset to client  (0) 2017.02.02
flashback on 시도시 ora-38788 에러  (0) 2016.02.23
cacti troubleshoot  (0) 2015.03.02
yum update시 package duplicate error 해결  (0) 2015.01.30
MAX_DUMP_FILE_SIZE 변경 적용 이상 해결  (0) 2014.05.12
Posted by neo-orcl
,

■ 개요


접속이 안된다는 이상이 있다고 연락을 받고 확인을 하려 할 때 maximum processes 값을 초과하여 접속을 할 수 없을 경우가 있을 수 있다.

아니면 shared pool의 부족 등의 이유도 있을 수 있다.

 

이때 선택하는 방법은 pmon을 kill하고 startup 하는 비상 조치를 취할 수 있는데 문제는 이 경우 추후 원인을 찾지 못할 수도 있고 이 조치를 취하면 안되는 즉, DB를 내리면 안되는 경우도 있을 수 있다.

 

그래서 -prelim 옵션이 존재한다. preliminary connect 이다.

(오라클 매뉴얼에서 검색으로도 찾을 수 없다)

 

일반적으로 정상 상태에서 sysdba 접속시 새 프로세스를 시작하고, 새 프로세스가 SGA에 접속하고, SGA내에 프로세스와 세션 상태 정보를 넣기 위한 메모리를 할당받아 남긴다.

 

하지만 prelim 옵션은 마지막 과정이 없다.

그래서 Lock이나 latch나 mutext를 사용하는 작업을 할 수는 없다.

(prelim 접속시 shutdown 명령도 abort만 가능하다.) 

 

■ 테스트


$ sqlplus -prelim / as sysdba

SQL*Plus: Release 11.2.0.3.0 Production on Fri May 27 13:17:51 2016

Copyright (c) 1982, 2011, Oracle.  All rights reserved.

SQL> select 1 from dual;                       
select 1 from dual
*
ERROR at line 1:
ORA-01012: not logged on
Process ID: 0
Session ID: 0 Serial number: 0

SQL> oradebug setmypid
Statement processed.

SQL> oradebug unlimit

Statement processed.

SQL> oradebug hanganalyze 12
Statement processed.

 

RAC일 경우에는 옵션이 다르게 있다.

 

SQL> oradebug setmypid
SQL> oradebug unlimit
SQL> oradebug -g all hanganalyze 3
SQL> oradebug -g all dump systemstate 266

 

 

※해당 기능을 사용한 케이스의 링크

 

 

http://arup.blogspot.kr/2008/08/diagnosing-library-cache-latch.html

'Knowledge > Oracle' 카테고리의 다른 글

Oracle DBA와 개발자의 필독서  (2) 2016.09.23
Data guard와 Active data guard license  (0) 2016.08.12
impdp, imp 주의사항  (0) 2016.03.20
Oracle Create Table 내부 절차  (0) 2015.10.21
SQL Loader Direct Load  (0) 2015.10.05
Posted by neo-orcl
,

DHL로 왔다.

 

 

3월 11일에 신청하고 3월 24일 도착 13일 소요.

 

card가 색상이 너무 밋밋하다

자격증도 옛날 형태가 더 멋있었는데

 

옷은 참 크기를 Large로 선택해서 신청했는데 오고 보니 완전 미국 사이즈 L이었다.. 내가 키 180에 팔이 긴 편인데 소매는 손목을 다 덮고 배둘레도 배가 많이 나온 사람 기준으로 만든게 아닌가 싶을 정도의 크기이다.

너무 커서 입을 순 없을듯. 다른 분들은 S나 M을 신청하는걸 추천.

'잡담' 카테고리의 다른 글

OCM11g-DBA 합격 메일  (0) 2016.03.08
오라클 메타링크의 한글 문서 주의점  (0) 2013.12.02
드디어 티스토리 블로그 탄생!  (0) 2012.12.20
Posted by neo-orcl
,