中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 新聞 > 國內 >
 首頁 > 新聞 > 國內 >

零宕機方案 vSphere Fault Tolerance

2016-12-14 11:33:31   作者:   來源:CTI論壇   評論:0  點擊:


  Google 的工程師大牛 Jeff Dean 說過:“如果你有一萬臺計算機在運行,那么每天一定會有電腦死機發(fā)生。”事實上的確如此,無論服務器設計得有多可靠,總是有宕機的可能性存在,哪怕是 IBM 號稱永不宕機的大型機 (z 系列主機,z 代表 zero down time)。所以數(shù)據(jù)中心的管理員們一直在尋找提高系統(tǒng)可靠性的解決方案,最常見的就是雙機熱備方案。
  VMware vCenter 就能夠提供高可靠的集群 (Cluster) 方案,在 vSphere 集群中,任何一臺服務器發(fā)生嚴重故障了(如系統(tǒng)宕機、網(wǎng)絡故障、存儲失聯(lián)等),上面運行的工作負載就會被 vCenter 轉移到其他正常運行的服務器繼續(xù)運行。這種高可靠架構可以滿足絕大多數(shù)業(yè)務的需求,在共享存儲或 vSAN 上都能實現(xiàn) RPO=0 的效果,但是需要一點時間在其他服務器上重啟相關應用和服務,所以 RTO>0。
  漲姿勢:RTO 和 RPO
  在設計高可靠系統(tǒng)時經(jīng)常涉及到 RTO 和 RPO 兩個指標:
  • RTO (Recovery Time Objective) 就是企業(yè)能容忍的恢復時間。災難發(fā)生后,從 IT 系統(tǒng)宕機導致業(yè)務停頓,到 IT 系統(tǒng)恢復至可以恢復業(yè)務運營之間的時間。
  • RPO (Recovery Point Objective) 可簡單地描述為企業(yè)能容忍的最大數(shù)據(jù)丟失量。假設系統(tǒng)一天做一次備份,如果第二天出現(xiàn)錯誤,那從備份完成后到錯誤出現(xiàn)時所寫入的數(shù)據(jù)都無法挽回了,從上一次備份到發(fā)生錯誤之間的時間就是 RPO。
  但是還是有一部分關鍵應用不允許有任何中斷,要求達到 RTO=0 的高可靠性,這時候就可以采用 vSphere Fault Tolerance 容錯技術。
  FT 工作原理
  FT 技術的工作原理是把需要保護的虛機運行在主服務器上,指定集群中的另一臺服務器為備份,vSphere 在備份服務器上也創(chuàng)建一個跟受保護虛機一模一樣的虛機。主虛機和備份虛機的數(shù)據(jù)和狀態(tài)是完全一致的,通過 vLockStep (virtual Lockstep) 技術來保證兩臺虛機的同步運行。vSphere 通過網(wǎng)絡把主虛機的 FT 日志 (FT Logging) 傳遞給備份虛機,保證兩臺虛機在同一時間內處理相同的指令,并且處理相同的非確定性事件,如網(wǎng)絡數(shù)據(jù)包、用戶輸入、硬件時鐘等,這些非確定性事件在物理機上幾乎是無法同步的,但是虛機的所有硬件和 I/O 輸入都是由 vSphere 來控制的,所以就可以做到。
  漲姿勢:Lockstep 技術
  Lockstep 技術是容錯計算機 (Fault Tolerance Computer) 的關鍵實現(xiàn)技術之一,通過使用相同的、冗余的硬件組件來保持多個 CPU、內存精確的同步,在正確的相同時鐘周期內執(zhí)行相同的指令。該技術能夠保證發(fā)現(xiàn)任何錯誤,即使短暫的錯誤,系統(tǒng)也能在不間斷處理和不損失數(shù)據(jù)的情況下恢復正常運行。
  vSphere 把發(fā)送給主虛機的網(wǎng)絡數(shù)據(jù)包也完全復制給備份虛機,備份虛機執(zhí)行跟主虛機完全一致的指令流,按照相同的順序來對網(wǎng)絡服務請求做出響應,產(chǎn)生完全一致的運算結果。唯一的區(qū)別在于,主虛機對外的輸出是實際生效的,磁盤寫操作會提交給硬盤、網(wǎng)絡數(shù)據(jù)包會被發(fā)送出去;備份虛機的所有對外輸出都會被 vSphere 屏蔽,外界不會感知到備份虛機的存在。
\
  只有當主虛機失效時 (主服務發(fā)生故障),備份虛機才會真正生效。因為兩個虛機的 CPU 指令順列、內存狀態(tài)都是完全一致的,vSphere 馬上進行故障轉移 (failover),即刻讓備份虛機變成新的主虛機, 所有的 TCP 網(wǎng)絡連接都沒有中斷,虛機中的應用可以繼續(xù)運行。對外界用戶而言,受保護的虛機完全沒有中斷運行,實現(xiàn)了 RPO=0 和 RTO=0 的最高等級容錯。為了繼續(xù)保護新的主虛機,vSphere 會在集群中尋找一臺合適的服務器作為新的備份服務器,然后在上面復制一個新的備份虛機出來,從而形成新的容錯保護機制。
\
  換一個角度,我們也可以把 FT 技術看作是一種特殊的 vMotion。vMotion 的過程是把虛機的內存逐塊地復制到另一臺服務器上,在復制的過程中虛機還在正常運行,所以內存還在被不斷的改寫,最后一塊被復制的內存被稱之 vMotion checkpoint,這塊內存復制完成之后虛機就被完全切換到新的服務器上運行,從而完成 vMotion 的整個過程。FT 技術則是持續(xù)地復制 checkpoint 內存塊,正常情況下并不結束這一操作,只有當故障轉移時,才真正完成 vMotion 操作。
  FT 適用條件
  FT 技術不要求對應用進行改寫,或是對操作系統(tǒng)進行特殊的配置,所以一般的應用可以很方便地使用 FT 技術來進行保護。vSphere 6.0 可以保護的虛機最多可以有 4 個 vCPU、64 GB 內存,不超過這個資源限制的應用都可以采用 FT 技術來保護。而且這是 vSphere 標準版就內置的功能,不用采購額外的軟件許可證,凡是 vSphere 的用戶都可以隨時激活對于虛機的 FT 保護。
  FT 的工作機制要求主備虛機之間進行同步,只有等備份虛機上的同步操作完成之后,主虛機上的數(shù)據(jù)包傳輸才會真正完成。對于網(wǎng)絡上的用戶而言,發(fā)給主虛機的網(wǎng)絡請求就有一個額外的延遲,一般這個延遲從幾毫秒到幾百毫秒不等,一個低速的 FT 日志同步網(wǎng)絡(如1GB)可能加劇這種等待,搭建 vSphere FT 環(huán)境要求主備服務器之間是專用的 10GB 高速低延遲同步網(wǎng)絡,以保證主備服務器之間的 FT 日志同步速度,否則就會給受保護的應用帶來嚴重的性能影響。所以 FT 技術不適用于對于延遲敏感的應用或者是實時應用,也不適用于對于內存進行大量修改的應用(因為會產(chǎn)生大量的 FT 日志同步)。
  傳統(tǒng)的容錯計算是由昂貴的專用服務器實現(xiàn)的,現(xiàn)在 vSphere 在普通的 x86 服務器上就能實現(xiàn)同樣的功能,容錯計算終于成為一種大家都用得起的技術。

相關熱詞搜索: VMware vCenter 零宕機

上一篇:Asterisk課堂-IAX2 介紹

下一篇:最后一頁

專題

玉田县| 南江县| 剑川县| 江孜县| 福海县| 望都县| 象州县| 和平区| 广宁县| 沅江市| 五寨县| 抚州市| 芦山县| 浠水县| 湖口县| 揭阳市| 通河县| 海丰县| 治县。| 宿州市| 色达县| 辉南县| 象州县| 涟源市| 闻喜县| 昭苏县| 岚皋县| 阜新| 玉环县| 内乡县| 鄢陵县| 三门县| 武隆县| 太原市| 武冈市| 德江县| 宕昌县| 安国市| 永吉县| 桃源县| 鸡泽县|