개요
socket error 발생 여부에 따른 Interconnect down 시 동작을 안내합니다.
방법
양 노드 클러스터 모두 up 상태인 경우 Master Interconnect가 down 시 동작입니다.
Case 1. socket error 미발생
1. Monitor Thread에서 Interconnect 감지하여 cfile에 씀
2. Master node가 schedule out 할 노드 선정
3. 이때 Master node의 Interconnect가 down 상태이므로 스케줄링 우선순위에 의해 Master node의 cluster down
Case 2. socket error 발생
1. (Monitor Thread가 Interconnect 감지 전) socket error 발생 감지 – cm 로그에 connection reset by peer. fd:11 로그 발생
2. CM이 Slave를 group에서 제외 ( FAST_NET_ERROR_DETECTION에 의해)
3. Slave cluster down
•
Slave에서 ifconfig down 발생 시, socket error 여부에 상관없이 Slave node의 cluster가 down 됩니다.
•
Slave가 socket error 감지 시 Master node의 실제 down 여부를 cfile을 통해 확인하고
Slave down 연결종료 신호를 수신하지 않더라도 Slave Interconnect가 down 상태이므로
스케줄링 우선순위에 의해 Slave node 를 down 합니다. (테스트 진행 시 Master node로 vip 절체되며 Slave node cluster 가 down 됩니다.)
참고
ifconfig down으로 수행 시, socket error 발생 여부는 OS, VM 종류에 따라 차이가 존재합니다. (OS에서 처리하는 부분으로 정확한 동작 방식은 확인이 어렵습니다.)
ifconfig 관련 package (net-tools) 대신 ip addr, nmcli 등 다른 명령어로 수행 후 테스트가 필요합니다.