기술 정보
home
채널 소개
home

socket error 발생 여부에 따른 Interconnect down시 동작

문서 유형
장애 해결
분야
관리/환경설정
키워드
CM
interconnect
SocketError
적용 제품 버전
7FS02PS
1 more property

개요

socket error 발생 여부에 따른 Interconnect down 시 동작을 안내합니다.

방법

양 노드 클러스터 모두 up 상태인 경우 Master Interconnect가 down 시 동작입니다.

Case 1. socket error 미발생

1. Monitor Thread에서 Interconnect 감지하여 cfile에 씀
2. Master node가 schedule out 할 노드 선정
3. 이때 Master node의 Interconnect가 down 상태이므로 스케줄링 우선순위에 의해 Master node의 cluster down

Case 2. socket error 발생

1. (Monitor Thread가 Interconnect 감지 전) socket error 발생 감지 – cm 로그에 connection reset by peer. fd:11 로그 발생
2. CM이 Slave를 group에서 제외 ( FAST_NET_ERROR_DETECTION에 의해)
3. Slave cluster down
Slave에서 ifconfig down 발생 시, socket error 여부에 상관없이 Slave node의 cluster가 down 됩니다.
Slave가 socket error 감지 시 Master node의 실제 down 여부를 cfile을 통해 확인하고 Slave down 연결종료 신호를 수신하지 않더라도 Slave Interconnect가 down 상태이므로 스케줄링 우선순위에 의해 Slave node 를 down 합니다. (테스트 진행 시 Master node로 vip 절체되며 Slave node cluster 가 down 됩니다.)
참고
ifconfig down으로 수행 시, socket error 발생 여부는 OS, VM 종류에 따라 차이가 존재합니다. (OS에서 처리하는 부분으로 정확한 동작 방식은 확인이 어렵습니다.)
ifconfig 관련 package (net-tools) 대신 ip addr, nmcli 등 다른 명령어로 수행 후 테스트가 필요합니다.