高可用性叢集
高可用性叢集(英語:High-availability clusters,也稱為HA叢集、故障轉移叢集)是以最短的中斷時間為目標而可靠地運作的,支撐伺服器應用的一組電腦。它們通過使用高可用性軟體來管理叢集中的冗餘電腦,當系統組件出現故障時,這些電腦可以繼續提供服務。在沒有叢集的情況下,如果執行特定應用的伺服器崩潰,那麼在崩潰的伺服器得到修復之前,應用將不可用。HA叢集通過檢測硬體/軟體故障,並立即在另一個系統上重新啟動應用程式來補救這種情況,而不需要進行人工干預,這個過程稱為故障轉移。作為這個過程的一部分,叢集軟體可能會在啟動節點上的應用之前對節點進行組態。例如,可能需要匯入和掛載適當的檔案系統,可能需要組態網路硬體,還可能需要執行一些支撐應用。[1]
HA叢集通常用於關鍵資料庫、網路上的檔案分享、業務應用和客戶服務(如電子商務網站)。
HA叢集實現試圖在叢集中建立冗餘以消除單點故障,包括連接多個網路,以及通過儲存區域網路冗餘連接一些資料儲存。
HA叢集通常使用心跳專用網路連接,用於監視叢集中每個節點的健康狀況和狀態。所有叢集軟體必須能夠處理的一個不明顯但嚴重的情況是腦裂問題,這種情況發生在所有專用鏈路同時中斷,但叢集節點仍在執行時。如果發生這種情況,叢集中的每個節點都可能會錯誤地判斷其他節點已經停機,並嘗試啟動其他節點仍在執行的服務。重複服務實例可能會導致共享儲存上的資料損壞。
HA叢集通常也使用仲裁見證儲存(本地或雲)來避免這種情況。見證裝置無法在裂開後的叢集的兩半之間共享,因此,在所有叢集成員都無法相互通訊(如心跳失敗)的情況下,如果某個成員無法訪問見證,該裝置將無法啟用。
- ^ van Vugt, Sander (2014), Pro Linux High Availability Clustering, p.3, Apress, ISBN 978-1484200803