vMotion 란?
여러 대의 ESXi 서버가 시스템에 악영향을 끼치는 상황 발생 시 온라인(DRS)/오프라인(HA) 상태에서 안정적인 서비스 제공을 위해 가상머신을 다른 서비로 옮길 수 있는 것
HA ?
여러 대의 서버가 클러스터 내에서 작동할 때 서버에 장애가 발생한다면 안정적인 서비스를 제공하기 위해 가상머신이 다른 서버로 옮겨가는 것을 의미
- HA 조건
cpu, memory, network, 공유 storage 필요
HA 설정
1. HA 작동을 위해 EDIT 선택

2. HA 선택 정보 확인

HA를 실행하면 fdm이 작동하며 /scratch/log/fdm.log에 기록이 저장

◇ Enable Host Monitoring : HA 서비스를 잠시 중지할 수 있는 것(Poweroff의 개념 x)
〉 Host Failure Response : 장애 발생 시 응답 방법
- Failure Response
· Disables : 장애 발생 시 Host Monitoring 종료로 아무 대처하지 않는다.
· Restart VMs : 장애 발생 시 가상머신을 다시 시작한다.
- Default VM restart Priority : 재가동되어야 하는 vm을 찾아 highest인 경우에는 VM 중 우선순위가 가장 높은 가상 머신을 우선적으로 재가동 진행하며 Low인 경우 가장 우선순위가 낮은 가상머신을 우선적으로 재가동 진행
- VM dependency restsart condition : VM과 서버 간의 연결 상태에 따라
+) Default VM restart Priority 은 VM dependency restsart condition과 연관 있음
〉 Response for Host Isolation : 장비는 정상적이지만 네트워크의 문제가 생겨 장비가 고립된 경우
Disabled : 아무것도 설정 x
Power off and restart VMs : 전력을 끊어 비정상적인 종료 진행
Shut down and restart VMs : os에서 정상적인 절차에 의한 종료
저장 장치와 통신 오류 용어
- PDL : 블록 스토리지 장치가 사라진 것
- APD : 블록 스토리지에 접근할 수 있는 경로가 사라짐

〉 Datastore with PDL : 스토리지 장치를 찾을 수 없는 경우
Disabled : 아무것도 설정 x
Issue evnets : 문제가 발생했다는 알람을 출력한다.
Power off and restart VMs : 스토리지가 없어 정상적인 shut down은 하지 못하고 전력 중단
〉 Datastore with APD : 스토리지로 가는 경로를 찾을 수 없는 경우
Disabled : 아무것도 설정 x
Issue evnets : 문제가 발생했다는 알람을 출력한다.
〉 VM Monitoring : 가상머신 간의 통신 모니터링(시간 간격으로 장애 체크(신호가 없다면 장애라고 판단))
Disabled : 아무것도 설정 x
VM Monitoring Only : host와 guest 간의 통신 문제
VM and Application Monitoring : host와 guest, guest 내 통신 문제
· VM Monitoring sensetive : 최대, 최소 시간 등 민감성 지정 가능
+) 통신 시간에 대한 장애 판단을 하기에는 어려움이 있음
◇ Admission Control : 여러 서버 중 몇 대의 서버 오류 시 나머지 서버가 그 역할을 대신할 수 있는지 확인 작업
Host failure cluster tolerates : 감당할 수 있는 서버 장애 대수(default 1)
> Define host failover capacity by :
Slot Policy(Powerd-on VMs) : 사용량이 아닌 슬롯의 사용에 따라 결정(잘 사용 안 함)
Dedicated failover hosts : 평상시에 일을 안 시키고 장애 시만 시킬 서버 host
Performance degradation VMs tolerate : 자원이 충분하지 않는 경우가 %일 때 경고를 출력할 것인가 결정
◇ Heart beat Datastores : 네트워크와 스토리지 모두 연결이 안 될 때 결정
Automatically : 자동으로 저장소 설정
Use datastores only : 특정 목록 결정해서 사용
Use datastores from : 자동과 특정 목록 모두 결정
3. HA 작동

Primary가 선출되며 나머지 2개가 primary로 선출될 수 있는 후보
+) 확인해야 할 사항
⑴ Heart Beat에 연결했었던 stroage가 나오는가?

⑵ 저장소가 1개의 primary와 나머지의 secondary로 이루어져 있는가?

▶오류 발생 : heart beat에 저장소가 보이지 않는 경우(저장소와 통신상 오류 발생)

저장소와 통신이 되고 있지 x
해결 방법 1) ESXi 에이전트 재시작

해결 방법 2) 아래의 명령어 입력 : fdm.log 파일에서 명령어를 이용하여 저장 장치가 연결되어 있는지 확인
The following command shows what the ESXi host has marked as its heartbeat datastore:
for uuid in $(lsof |awk '$2=="fdm" ' |grep FILE |grep -v /var/log |awk 'BEGIN { FS = "/" }; {print $4}'); do localcli storage filesystem list |grep $uuid| awk '{print $1, $2}';done;
The following command will show what the ESXi host has logged in the fdm.log as the heartbeat datastore. This command will also show you some previous datastores used, if any:
for uuid in $(cat /var/log/fdm.log |grep "Creating heartbeat file" |tail -n 10 |awk 'BEGIN { FS = "/" }; {print $4}' |awk '{print $1}' |sort |uniq); do localcli storage filesystem list |grep $uuid| awk '{print $1, $2}';done;
- 명령어 입력 시 출력되는 저장소 확인

▶오류 발생 2 아래와 같이 응답할 수 없다는 그림이 뜰 경우
해결 방법) vSphere 재시작


Adapter


표준 스위치에서 GUI 환경으로 vmnic를 선택해 주면 Active, Standby 구성이 기본적으로 설정이 된다(Active-Active로 설정 불가)
+) 실습에서는 각 스위치의 어댑터 2개를 이중화하여 장애 대응이 가능하게 설정해 놓은 상태
Active - Standby : Active 어댑터 장비 시 Standby가 잠시 Active로 활동하면서 네트워크와 연결되고 Active 장치가 다시 정상 작동 시 Standby로 돌아간다.
Active - Active : Active 어댑터로 각각 활동을 하고 있다가 하나의 어댑터에서 오류 발생 시 대신 네트워크와 연결되고 Active 장치가 다시 정상 작동이 되어도 원래의 Adapter로는 연결이 돌아가지 않는다.
- 연결된 장비 확인
esxtop // cpu 보기
n // network 관점에서 보기
h // 다양한 도움말 보기
'가상화 > VMware' 카테고리의 다른 글
[vsphere] vMotion - DRS 실습1 (0) | 2023.03.24 |
---|---|
[vsphere] vMotion - HA 실습 (0) | 2023.03.24 |
[vsphere] VM Clone 방법 (0) | 2023.03.23 |
[vphere] ESXi - VM (0) | 2023.03.23 |
[vsphere] Storage - 관리 (0) | 2023.03.23 |