更多細節!英特爾頂級專家答疑虛擬化
【CNETCOM 分析評論】上一篇文章破解了服務器虛擬化比較主要的挑戰(點擊),xiangxindajiakenenghaigandaobugouxiangxi,youyupianfusuoxian,womenkenengwufaquyiyilejiebutongyonghumianlindexunihuatiaozhanzaiquyiyigeichujiejuefangan,suoxingwomenyouyoujihuizhailufanyileyixieyouguowaimeitipengyoutichudeyufuwuqixunihuaxiangguandewenti,erqieqihuidazheshiyingteergongsicongshixunihuajishuyanjiudelingjunrenwu--現任英特爾實驗室首席虛擬化架構師的Richard A.Uhlig先生,他擁有英特爾公司內部最高技術職稱"英特爾院士",希望這些內容能夠為大家提供一些有用的參考:
問題1:虛擬化技術在高吞吐量的設備,如網絡和存儲設備中的應用效果如何?
回答:目前有一個值得關注的趨勢,就是使I/O設備能夠"對虛擬化更為友好"的新標準正在製訂中。例如, PCI-SIG(PCI和PCI-Express接口標準的製訂和推進組織)已經開發了一種新的規範,使PCI-Express設備能夠更加容易地在虛擬機上共享其資源。這種規範被稱為"單根I/O虛擬化"(縮寫為SR-IOV),它定義了一種方式,以提供多重"虛擬功能"(Virtual Function),這些功能可被獨立地、直接地分配給在虛擬機上運行的客戶操作係統,從而消除一些虛擬化過程中的開銷。英特爾在其最新的網絡適配器中就提供了對SR-IOV的支持。然而,對於這種I/O設備直接分配,還有一個很大的挑戰,那就是它使其他重要的虛擬化功能變得更加複雜,例如虛擬機的遷移。因為將一個物理I/O接口直接分配給客戶操作係統之後,當其虛擬機要遷移到另外一個平台時,會很難釋放這一資源。對此,我們一直在與虛擬機監視器(VMM)的提供商協商,以解決這些問題,以便我們能通過SR-IOV,從直接I/O分配中獲得優勢和好處,而同時又可以保護虛擬機的遷移能力。
問題2:英特爾的虛擬化技術是怎樣提供具有突破性的安全特性的,這些特性是如何運作的?
回答:回hui到dao早zao些xie年nian時shi我wo們men對dui英ying特te爾er虛xu擬ni化hua技ji術shu的de定ding義yi,實shi際ji上shang從cong這zhe項xiang技ji術shu處chu於yu起qi點dian時shi,我wo們men就jiu已yi經jing有you了le很hen強qiang的de安an全quan意yi識shi,而er今jin,安an全quan問wen題ti更geng已yi被bei納na入ru了le虛xu擬ni化hua技ji術shu的de發fa展zhan路lu線xian圖tu。虛xu擬ni機ji提ti供gong了le一yi個ge從cong基ji礎chu上shang來lai說shuo更geng強qiang的de、可使代碼分離的形式,因為它運行的層級比運行操作係統內核和設備驅動程序的Ring 0更低一層。我們的目標就是幫助虛擬機監視器軟件, 通tong過guo這zhe種zhong基ji於yu硬ying件jian層ceng的de支zhi持chi而er進jin一yi步bu增zeng強qiang安an全quan防fang護hu。例li如ru,英ying特te爾er虛xu擬ni化hua技ji術shu可ke通tong過guo硬ying件jian機ji製zhi來lai重zhong新xin映ying射she和he阻zu止zhi設she備bei對dui係xi統tong內nei存cun的de直zhi接jie存cun儲chu器qi存cun取qu,所suo以yi甚shen至zhi連lian擁yong有you特te權quan、運行在Ring 0級別的某個虛擬機中的設備驅動程序,也不能訪問屬於另一個虛擬機的內存空間,這(zhe)些(xie)都(dou)是(shi)需(xu)要(yao)硬(ying)件(jian)支(zhi)持(chi)才(cai)能(neng)實(shi)現(xian)的(de)。英(ying)特(te)爾(er)虛(xu)擬(ni)化(hua)技(ji)術(shu)還(hai)能(neng)通(tong)過(guo)減(jian)少(shao)與(yu)虛(xu)擬(ni)化(hua)工(gong)作(zuo)相(xiang)關(guan)的(de)代(dai)碼(ma)來(lai)簡(jian)化(hua)虛(xu)擬(ni)機(ji)的(de)執(zhi)行(xing),最(zui)終(zhong)減(jian)少(shao)可(ke)信(xin)計(ji)算(suan)的(de)總(zong)體(ti)規(gui)模(mo),從(cong)而(er)減(jian)少(shao)其(qi)相(xiang)對(dui)於(yu)惡(e)意(yi)軟(ruan)件(jian)的(de)"受攻擊麵"。
問題3:隨著處理器內核數量的不斷增加,fuwuqidezhenghebiliyezaizengda。ninengbunengtantan,womenyinggairuhezaiyitaiyunxingzheshuyibaijixunijidefuwuqichuxianguzhanghouzuidachengduxianzhiqichanshengdebuliyingxiang?
回答:總的來說,有兩個辦法可以用於解決這類難題:第一種是在服務器發生錯誤時糾正其故障並恢複它的運行,或者包容錯誤以限製錯誤產生的效果。
眾所周知的ECC內存,就采用了內存錯誤檢測與校正功能,它是第一種辦法的典型應用。相同的故障恢複原則也可以適用於其它的資源,比如在係統為一致性進行互連和I/O的情況下(例如,使用CRC來檢測連接級別的錯誤和觸發包重發)。
當錯誤不能被糾正時,包容它們也是有所幫助的,因為其可支持更高級別的恢複算法。這一過程可通過將無法修正的數據標注"Poison"位wei標biao簽qian,然ran後hou在zai係xi統tong中zhong跟gen蹤zong這zhe個ge數shu據ju來lai實shi現xian。如ru果guo有you這zhe個ge標biao簽qian的de數shu據ju在zai係xi統tong中zhong後hou來lai被bei再zai次ci利li用yong了le,硬ying件jian會hui在zai操cao作zuo係xi統tong或huo虛xu擬ni機ji監jian視shi器qi之zhi外wai再zai進jin行xing機ji器qi檢jian測ce,從cong而er提ti供gong有you關guan錯cuo誤wu本ben質zhi的de信xin息xi。理li想xiang的de情qing況kuang就jiu是shi,這種硬件在回應錯誤時,能夠支持虛擬機監視器執行一個更有目的的行為,例如僅僅關閉有故障的虛擬機,而不是整個平台及其他正在正常運行的虛擬機。
就英特爾來說,我們還增添了豐富的全新特性,使我們的多路服務器產品線能夠兼容更多種類的,可被糾正或被包容的錯誤,包括QPI鏈接恢複和標記有"Poison"數據的轉發,還能支持PCI-E先進錯誤報告和內存鏡像等等。這些特性都是我們追求的"RAS"能力中的一部分,我們的多路服務器平台會不斷擴展和改善來實現這一目標。
上述特性,都是致力於提高某一特定的服務器的可靠性,但是有時,你可能會失去整個平台(比如在斷電時)。在這種情況下,一種有趣的全新解決方法產生了,那就是利用虛擬化技術,在另一個平台上維持虛擬機狀態的副本。
如ru果guo出chu現xian平ping台tai性xing的de錯cuo誤wu,工gong作zuo負fu載zai的de執zhi行xing可ke以yi在zai其qi他ta平ping台tai上shang通tong過guo這zhe種zhong虛xu擬ni機ji複fu製zhi得de到dao恢hui複fu和he繼ji續xu。同tong時shi,虛xu擬ni化hua還hai可ke以yi和he其qi它ta已yi有you的de提ti高gao可ke用yong性xing的de方fang法fa很hen好hao地di配pei合he,如基於集群的故障解決方案。在這種情況下,出現故障的集群中,備用機器可以由虛擬機提供,而不需要動用物理設備。正如我們所見,服務器的整合比在不斷增加,我期待看到硬件故障恢複和容錯機製的更大發展,以實現單個物理平台之上的和跨平台的更高可用性和係統容錯能力。
問題4:你會如何怎樣服務器整合?特別是當很多節點被整合時會出現很多問題,比如處理器循環和莫名其妙的損耗,例如讓資源緊張的屏幕保護?
回答:處理器循環通常是由不同的情況引發的,包括空閑循環和自旋鎖。當客戶操作係統已進入一個空閑狀態,它通常也會發出一條指令,比如HLT(halt),或者發出命令到處理器,以進入到更具能效的狀態(稱為"C狀態")。xunijijianshiqikeyishezhigezhongxunihuajishuzhixingchengxu,laiyindaoxunijiconggaikehucaozuoxitongzhongtuichu,ranhouanpailingyigexunijitouruyunxing,congerbaozhengwulidechuliqiziyuanbubeilangfei。
通過這種方式檢測空閑狀態,是一種標準的通過虛擬機監視器進行的處理器資源管理,但是有一種更有趣的情況,就是一個處理器反複循環地檢查的鎖的可用性,而該鎖可能暫時是由另一個處理器所保持的。在一個沒有采用虛擬化技術的係統中,這種自旋鎖問題解決得非常快,因為持有鎖的處理器一般在很短時間內就釋放鎖, 而請求鎖的處理器就會獲得它和退出自旋鎖循環。
然而,在虛擬化後的係統中,名為"鎖保持者搶先占有"的不利情況可能會發生,即正在運行某虛擬機、持chi有you鎖suo的de處chu理li器qi,可ke能neng不bu會hui聽ting從cong虛xu擬ni機ji監jian視shi器qi的de安an排pai,而er搶qiang先xian占zhan有you鎖suo,而er其qi他ta虛xu擬ni處chu理li器qi則ze一yi直zhi在zai請qing求qiu等deng待dai一yi個ge不bu能neng被bei釋shi放fang的de鎖suo。最zui糟zao糕gao的de情qing況kuang是shi,要求獲得鎖的處理器不斷自旋,這將非常明顯地浪費CPU資源。這種情況下,虛擬機監視器也不知道這種浪費資源的情況正在發生。
weibangzhujiejuezhezhongqingkuang,yingteerzuijinzaixunihuajishuzhongzengtianleyizhongzhixingkongzhigongneng,takezaixunijishangyunxing,duiwulichuliqijinxingjiankong。dangyigeshuliangguoduodediedaizaiyigezixuansuozhongbeijiancedaoshi,chuliqijiuhuibaxunijituichukongzhiquanfanhaigeijianshiqi,這樣它就可以安排另一個虛擬處理器運行。我們發現這種新的控製功能--"暫停循環退出"在較高的操作係統整合比下是非常有效的。
再來談談令資源緊張的屏幕保護程序,這是從虛擬機監視器和硬件角度很難解決的問題,因為用戶怎麼使用都是合法的。最佳方案是不要在客戶操作係統上使用屏幕保護程序,如果這些程序的計算是無用的。
問題5:隨著Nehalem-EX在Westmere-EPzhihoufabu,kanqilaiwomenxianzaikeyigoujiangengdaguimodefuwuqixunihuapingtai,bingzaiqishangyunxinggengduodexunijile,kewentishi,womenyinggairuheweiqitigongzugoudeSAN I/O帶寬,以確保所有的虛擬機都正常運行?
回答:從千兆到萬兆以太網的過渡還有很長的路要走,後者可以實現為每個虛擬機提供更好更平衡的I/O,即在提供更高帶寬到平台的同時,減少連接到物理服務器的端口數。通過將存儲協議彙聚到以太網上,例如iSCSI和FCoE也能帶來更高的效率。
在這一過程中,關鍵的挑戰,是要為客戶提供優質的服務質量,要保證在不同的虛擬機上能夠實現共享同樣的實體網絡連接,以(yi)及(ji)減(jian)輕(qing)通(tong)過(guo)虛(xu)擬(ni)機(ji)監(jian)視(shi)器(qi)進(jin)行(xing)包(bao)處(chu)理(li)和(he)交(jiao)換(huan)的(de)功(gong)能(neng)的(de)負(fu)擔(dan)。英(ying)特(te)爾(er)已(yi)經(jing)開(kai)始(shi)為(wei)萬(wan)兆(zhao)以(yi)太(tai)網(wang)適(shi)配(pei)器(qi)增(zeng)添(tian)新(xin)的(de)特(te)性(xing),來(lai)解(jie)決(jue)這(zhe)些(xie)問(wen)題(ti),包(bao)括(kuo)VMDq,它提供了一個第二層包分類和發送/接收排序功能,可以與不同的客戶操作係統協作。這種支持減少了在虛擬機監視器中的數據複製,並提高了不同虛擬機的服務質量。
另一個可見的進步,就是由PCI-SIG開發的PCI-Express設備虛擬化的全新標準,特別是SR-IOV(單根I/O虛擬化)規範。SR-IOV定義了一種方法,即每個PCI-E端點設備對應一個"虛擬功能",可ke以yi直zhi接jie從cong虛xu擬ni機ji管guan理li程cheng序xu分fen配pei到dao客ke戶hu操cao作zuo係xi統tong,以yi此ci來lai進jin一yi步bu降jiang低di網wang絡luo處chu理li管guan理li程cheng序xu中zhong的de間jian接jie開kai銷xiao。正zheng如ru前qian文wen所suo講jiang,它ta讓rang我wo們men既ji能neng獲huo得de分fen配pei直zhi接jieI/O分配到虛擬機的好處,同時又要保留了虛擬機遷移的優勢,這是很難兼得的,支持SR-IOV的產品將很快在市場上出現。
問題6:你對虛擬化在HPC領域的未來發展方向,以及改進開發並行計算集群上的舉措,有什麼看法呢?
回答:目前對這一問題普遍的認識是,虛擬化在高性能計算機(HPC)上的使用還很少,這是因為HPC的側重點是要追求極致的性能。但我也聽到越來越多的高性能計算用戶對虛擬化技術表現出了一些興趣,其原因有很多:
首先,HPC的de工gong作zuo負fu載zai通tong常chang是shi長chang時shi間jian運yun行xing,所suo以yi如ru果guo能neng在zai出chu現xian故gu障zhang時shi獲huo取qu檢jian查zha點dian中zhong間jian結jie果guo會hui很hen有you幫bang助zhu。但dan檢jian查zha點dian往wang往wang需xu要yao特te殊shu的de操cao作zuo係xi統tong或huo應ying用yong程cheng序xu來lai支zhi持chi。通tong過guo在zai高gao性xing能neng的de虛xu擬ni機ji上shang運yun行xingHPC工作負載,就能在對操作係統和應用程序完全透明的情況下,實現對正在運行的負載的檢查。
在有多個用戶共享的HPC集(ji)群(qun)環(huan)境(jing)中(zhong),同(tong)時(shi),虛(xu)擬(ni)化(hua)技(ji)術(shu)也(ye)有(you)利(li)用(yong)於(yu)實(shi)現(xian)跨(kua)集(ji)群(qun)的(de)負(fu)載(zai)平(ping)衡(heng)。也(ye)許(xu)這(zhe)在(zai)沒(mei)有(you)虛(xu)擬(ni)化(hua)技(ji)術(shu)參(can)與(yu)的(de)情(qing)況(kuang)下(xia)也(ye)能(neng)實(shi)現(xian),但(dan)需(xu)要(yao)修(xiu)改(gai)應(ying)用(yong)程(cheng)序(xu)和(he)額(e)外(wai)的(de)管(guan)理(li)工(gong)具(ju)。透(tou)明(ming)虛(xu)擬(ni)機(ji)檢(jian)查(zha)點(dian)和(he)虛(xu)擬(ni)機(ji)遷(qian)移(yi)可(ke)以(yi)成(cheng)為(wei)強(qiang)有(you)力(li)的(de)工(gong)具(ju),用(yong)於(yu)供(gong)應(ying)和(he)管(guan)理(li)跨(kua)越(yue)不(bu)同(tong)用(yong)戶(hu)、不同優先級和不同時間敏感度工作負載的HPC集群硬件資源。
從另一個角度來看,HPC工作負載可以從OS特殊化中受益---通過提供一個擁有很小內核、並bing能neng榨zha取qu出chu硬ying件jian最zui佳jia性xing能neng的de虛xu擬ni機ji管guan理li程cheng序xu,例li如ru通tong過guo加jia強qiang調tiao度du和he降jiang低di內nei存cun管guan理li的de開kai銷xiao。乍zha一yi看kan,似si乎hu引yin進jin這zhe種zhong管guan理li程cheng序xu首shou先xian是shi增zeng加jia了le新xin一yi層ceng的de開kai銷xiao,違wei背bei了le降jiang低di開kai銷xiao這zhe一yi目mu標biao。但dan實shi際ji上shang,這zhe個ge管guan理li程cheng序xu可ke以yi依yi靠kao一yi個ge很hen小xiao的de操cao作zuo係xi統tong內nei核he或huo者zhe執zhi行xing庫ku,在zai同tong一yi個ge平ping台tai的de不bu同tong虛xu擬ni機ji上shang運yun行xing更geng多duo的de全quan功gong能neng的de操cao作zuo係xi統tong。這zhe可ke以yi實shi現xian在zai一yi個geHPC集群上,不同用戶根據他們的工作量而選擇不同的操作係統,而且同時他們又都能共享相同的群集硬件資源。
關於虛擬化的性能開銷問題可能會永遠存在於HPC上,但我在上麵列出的一些優勢和特點,或許會讓用戶們對在HPC上應用虛擬化技術的想法刮目相看。
Richard A.Uhlig先生對虛擬化相關問題的解答到此告一段落,而關於虛擬化具體問題的討論未來還將在產業界討論,也會在《IT號外》中zhong呈cheng現xian。在zai隨sui後hou的de內nei容rong裏li,我wo們men將jiang與yu大da家jia一yi同tong通tong過guo一yi係xi列lie的de案an例li故gu事shi,來lai更geng近jin距ju離li地di領ling略lve英ying特te爾er架jia構gou服fu務wu器qi虛xu擬ni化hua技ji術shu的de魅mei力li,敬jing請qing期qi待dai!





閩公網安備 35020302001891號