KBSTER0041-everRun開機過程中VM自動啟動異常問題

適用產品:Stratus everRun 8.x 版本

問題

當everRun系統關機(含硬體設備關機、斷電等),意即everRun環境無運作。

當兩台硬體設備開機或通電開機後,虛擬機器自動啟動出現啟動失敗,需要強制啟動狀況。

情境

當發生問題時,為其中一台Node節點尚未準備運作完成,因另一台節點可能未開機、開機中、還沒運行everRun系統、無仲裁伺服器判斷等狀況。

下列為發生問題情境:

1

一台節點開機完成,故作為主要節點,另一台處於關機狀態,或是還在開機中而未顯示”正在執行”。

2

因虛擬機器有在”啟動”按鈕,設定”自動啟動”功能,當everRun環境開機運作、HA模式發生切換等狀態,自動啟動按鈕會依據時間與群組順序配置,逐一進行啟動。

“自動啟動”配置預設為”上次”,意即比照上次為開機或關機狀態。

3

因第二台Node節點沒有運作everRun系統完成,對Node節點來說處於單節點狀態,虛擬機器為雙工模式,需要兩台節點皆運作時正常啟動虛擬機器,故顯示錯誤訊息。

4.

倘若未等另一台Node節點everRun系統運作完成,而對虛擬機器執行強制啟動,虛擬機器將以單工模式進行運作。

5.

承第4點,雖可將VM運作起來,但因第二台節點未與everRun同步運作,將以單機模式運作。

6.

承第5點,單工模式影響A-Link網路之同步複寫。

原因

  • everRun系統做為雙主機容錯備援保護機制運作,當一台節點everRun開機完成後,eAC管理平台將運作,第二台節點應一同開機並等待everRun開機完成,才可進行後續操作。
  • 虛擬機器做為雙主機備援容錯機制下之雙工模式,在保護虛擬機器情況避免第二台節點尚未運作時,運作虛擬機器,故第二台節點運作前,不會讓虛擬機器啟動。
  • 倘若對虛擬機器強制啟動,使虛擬機器變為單工模式,第二台節點未運作時,A-Link網路將報錯誤,亦可理解為無第二台節點存在,A-Link亦無作用。
  • 若要使用自動啟動虛擬機器功能,強烈建議搭配Quorum仲裁伺服器使用。

解決方案

因未等待完成everRun系統完整運作同步,而產生之錯誤訊息,此為正常現象,下列為三種解決方案提供進行調整:

A

因第一台節點先行運作完成並運行eAC管理平台,而虛擬機器因配置自動啟動而主動運行開啟,但因雙工模式而未進行OS啟動,此時只需等待第二台Node節點啟動運行完畢即可,無須對虛擬機器執行任何操作,如下:

A-1. 第二台Node節點正在啟動中,但虛擬機器已經轉圈圈自動啟動中。

A-2. 第二台節點已開機完畢,並準備自動與第一台節點同步資訊,虛擬機器頁面此時已無轉圈圈,因陸續啟動中。

A-3. 待節點皆同步完成後,同時虛擬機器也正在正常啟動中。

A-4. everRun確認第二台存在後,虛擬機器皆會自動重新啟動運行,故無需人為介入操作。

而網路部分因無對虛擬機器手動強制啟動,故網路無錯誤訊息。

B

因虛擬機器配置自動啟動功能,在未確保硬體設備可快速開機運作情況下,建議關閉自動啟動功能(恢復為預設”上次”選項),以確認everRun節點運行完畢後,手動啟動虛擬機器運作。

C

如虛擬機器需使用自動啟動功能,強烈建議搭配SplitSite Quorum仲裁伺服器進行判決管理,透過SplitSite Quorum代理第二台Node節點確認無問題後,通知第一台Node主要節點可以先行運行虛擬機器,待第二台Node節點上線運行後恢復為正常運行環境。

2920 (14) 4920 (14) 6920 (14) Backup (8) everRun (25) ftServer (17) Neverfail (11) Stratus (17) Stratus ftServer (12) VATES (31) Windows (10) Windows Server (8) XCP-ng (29) XOA (24) XOProxy (10) XOSTOR (7) 容錯保護 (6) 故障排除 (8) 災難復原 (9) 營運持續 (7) 管理維護 (6) 系統管理 (10) 網路設定 (7) 虛擬化平台 (8) 虛擬化管理 (10) 虛擬機器 (6) 資料同步 (6) 高可用性 (28)

文章索引