新起之秀FPGA能否挑起並行計算大梁?
【CNETCOM 資訊】現今,我們已經進入了百億億次的大計算時代,數據量的爆發式增長、數據獲取能力的大幅提升,對計算提出了更高的需求和挑戰,大數據、雲計算、高性能計算等不同計算方式正在交叉融合,通用計算和並行計算在各自擅長的領域發揮不可替代的作用。在人工智能領域,GPU並行計算已初見成效,而能效比更優的FPGA作為新起之秀,能否挑起並行計算的大梁?
“如果無數多的猴子在無數多的打字機上隨機的打字,並持續無限久的時間,那麼在某個時候,它們必然會打出莎士比亞的全部著作!”這是1909年nian法fa國guo數shu學xue家jia波bo萊lai爾er在zai談tan及ji概gai率lv時shi所suo舉ju出chu的de無wu限xian猴hou子zi定ding理li,而er這zhe個ge理li論lun應ying用yong今jin天tian時shi,使shi用yong一yi台tai超chao級ji計ji算suan機ji隨sui機ji打da字zi可ke能neng更geng快kuai命ming中zhong某mou本ben書shu。但dan是shi這zhe隻zhi是shi概gai率lv的de問wen題ti,計ji算suan機ji並bing不bu能neng分fen別bie他ta們men打da出chu來lai的de是shi莎sha士shi比bi亞ya的de文wen稿gao還hai是shi一yi推tui亂luan碼ma。讓rang計ji算suan機ji擁yong有you接jie近jin人ren類lei的de智zhi能neng水shui平ping是shiIT行業最偉大,也是最難實現的夢想,而深度學習則是通往人工智能的漫漫長路上一項重要的技術。
shenduxuexiyeshihenjuxianshiyiyideyixiangjishu,dangyongyouwuxianduodeshujuyangbenbingjingguofenxihou,jisuanjijiunengzaiyidingchengdushangmonirenleidexingwei,binganzhaojidingdemubiaokuaisuwanchengrenwu。yihoudejisuanjikenenghui“認識”世界上所有的人,知道這個人的姓名、住在哪裏、喜好如何,就像一個老朋友。這就是深度學習能夠實現的人物畫像,之後企業可以精準的投放廣告、可以更好的定製產品、可以控製機械臂自動生產商品、你甚至無法區分與你聊天的是機器還是人類!
但是,要讓機器能真正像人類一樣思考不僅依靠算法模型的精確,同時也需要媲美人腦計算效率的高性能計算技術。眾所周知,CPU 由you專zhuan為wei順shun序xu串chuan行xing處chu理li而er優you化hua的de幾ji個ge核he心xin組zu成cheng,需xu要yao很hen強qiang的de通tong用yong性xing來lai處chu理li各ge種zhong不bu同tong的de數shu據ju類lei型xing,同tong時shi又you要yao邏luo輯ji判pan斷duan,因yin此ci需xu要yao引yin入ru大da量liang的de分fen支zhi跳tiao轉zhuan和he中zhong斷duan的de處chu理li,它ta擅shan長chang的de是shi邏luo輯ji控kong製zhi和he通tong用yong類lei型xing數shu據ju運yun算suan,就jiu像xiang一yi個ge資zi深shen的de老lao教jiao授shou,360行(xing)樣(yang)樣(yang)精(jing)通(tong)。但(dan)是(shi)一(yi)個(ge)能(neng)力(li)再(zai)強(qiang)的(de)人(ren),其(qi)精(jing)力(li)也(ye)是(shi)有(you)限(xian)的(de),它(ta)需(xu)要(yao)一(yi)件(jian)事(shi)一(yi)件(jian)事(shi)的(de)處(chu)理(li),雖(sui)然(ran)處(chu)理(li)速(su)度(du)很(hen)快(kuai),但(dan)是(shi)任(ren)務(wu)量(liang)太(tai)大(da),總(zong)有(you)些(xie)任(ren)務(wu)在(zai)排(pai)隊(dui)等(deng)待(dai)處(chu)理(li)。要(yao)想(xiang)讓(rang)計(ji)算(suan)能(neng)夠(gou)像(xiang)人(ren)腦(nao)一(yi)樣(yang)快(kuai)速(su)的(de)實(shi)現(xian)響(xiang)應(ying),就(jiu)需(xu)要(yao)大(da)量(liang)的(de)計(ji)算(suan)核(he)心(xin)的(de)堆(dui)疊(die),也(ye)就(jiu)是(shi)需(xu)要(yao)將(jiang)順(shun)序(xu)計(ji)算(suan)轉(zhuan)變(bian)為(wei)並(bing)行(xing)計(ji)算(suan)。
並(bing)行(xing)計(ji)算(suan)讓(rang)計(ji)算(suan)機(ji)能(neng)夠(gou)同(tong)時(shi)響(xiang)應(ying)大(da)量(liang)的(de)計(ji)算(suan)請(qing)求(qiu),雖(sui)然(ran)無(wu)可(ke)避(bi)免(mian)的(de),每(mei)個(ge)計(ji)算(suan)核(he)心(xin)的(de)計(ji)算(suan)能(neng)力(li)相(xiang)對(dui)降(jiang)低(di),就(jiu)像(xiang)聘(pin)用(yong)了(le)一(yi)群(qun)小(xiao)學(xue)生(sheng),每(mei)個(ge)學(xue)生(sheng)隻(zhi)需(xu)要(yao)計(ji)算(suan)一(yi)個(ge)十(shi)分(fen)簡(jian)單(dan)的(de)問(wen)題(ti)。他(ta)們(men)無(wu)法(fa)像(xiang)老(lao)教(jiao)授(shou)一(yi)樣(yang)快(kuai)速(su)的(de)處(chu)理(li)複(fu)雜(za)的(de)問(wen)題(ti),但(dan)是(shi)每(mei)個(ge)複(fu)雜(za)的(de)問(wen)題(ti)都(dou)可(ke)以(yi)無(wu)限(xian)拆(chai)解(jie),最(zui)後(hou)都(dou)可(ke)以(yi)轉(zhuan)化(hua)成(cheng)一(yi)個(ge)簡(jian)單(dan)的(de)計(ji)算(suan)問(wen)題(ti)。舉(ju)個(ge)簡(jian)單(dan)的(de)例(li)子(zi),比(bi)如(ru)計(ji)算(suan)4×4這個問題,在沒有學會乘法口訣的小孩子來說,他不能計算出結果,但是這個複雜的問題可以拆借成4+4+4+4,進而還能分解成1+1+・・・+1+1,這樣每個小孩子都可以處理其中一塊力所能及的計算,最後進行讀數的彙總即可。
目前,處理並行計算的最主流形式當屬GPU,它由數以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計,因此能夠很好地處理高並行計算。目前高端的GPU已經做到4992個計算核心,單卡雙精度浮點運算峰值可達1.8萬億次每秒。
雖然,GPU並行計算能力強,並且高級語言的使用可使開發人員將精力集中在算法研究和實現上,但是GPU也有其應用的局限性:其成本和功耗都比較高,在工業應用或者大規模使用使會有瓶頸。因此一些企業將目標轉移到早期主要是作為數字邏輯器件使用的FPGA上。
什麼是FPGA?Field-ProgrammableGate Array的縮寫,即現場可編程門陣列,是一種半定製的IC芯片。原廠生產出的是空白的不含配置信息的FPGAxinpian,yonghukegenjuzijidexuyao,liyongpianshangsuotigongdegezhongziyuankaifazijideluoji,jiangshengchengdepeizhixinxixieru,congerjiangqibianchengzijisuoxugongnengdexinpian,FPGA可近乎不限次數反複重配。據浪潮為國內某大型互聯網公司定製的FPGA的實際測試數據顯示,一個FPGA加速卡的功耗約為20W~75W的功耗,對機房場地的適用性高,對機器散熱要求不高。而作為對比,1個GPU單元為235W~300W。因此相較於GPU,FPGA具有更高的性能功耗比,一塊中端GPU 的每瓦單精度20Gflops/W,而FPGA可以達到60Gflops/W~80Gflops/W。
雖然在實測中FPGA具有明顯的性能功耗比優勢,但是傳統FPGA開發采用Verilog、VHDL等硬件描述語言,對開發者的技術要求較為嚴苛,而浪潮希望能采用OpenCL這種高級語言和模型編程,將開發周期可大幅縮短,對於一些應用可以實現幾個人月完成,為FPGA的應用發展提供更為廣闊的平台。而浪潮擁有從萬億次到千萬億次的超級計算機產品研發、係統建設、運維服務能力,在GPU領域的技術積累將加速OpenCL實現從CPU到FPGA的遷移。
技術的實現首先源於客戶的需求,浪潮相關人員表示,目前浪潮為國內一家以搜索為主要業務之一的大型互聯網公司定製了一款FPGA卡,已經部署了近5000片,在前端用在其搜索業務,後端用於其深度學習的模型。近日SC15上,浪潮聯合全球可編程邏輯芯片巨頭Altera,以及中國最大的智能語音技術提供商科大訊飛,共同發布了一套麵向深度學習、基於AlteraArria 10 FPGA平台、采用OpenCL開發語言進行並行化設計和優化的深度學習DNN的語音識別方案,讓浪潮成為全球領先的具備GPU、MIC和FPGA三項HPC異構計算應用能力的廠商!
與FPGA生產原廠以及終端用戶的聯合研發,讓浪潮能夠實現最大限度的定製化開發,相比芯片設計,FPGA將開發周期從“年”計降低到“月”。對dui於yu互hu聯lian網wang客ke戶hu而er言yan,硬ying件jian產chan品pin的de快kuai速su響xiang應ying和he深shen度du定ding製zhi化hua將jiang為wei其qi帶dai來lai市shi場chang的de先xian機ji。麵mian向xiang未wei來lai,浪lang潮chao互hu聯lian網wang行xing業ye產chan品pin總zong監jian孫sun波bo表biao示shi,浪lang潮chao將jiang針zhen對dui互hu聯lian網wang客ke戶hu的de需xu求qiu特te點dian,加jia速suGPU、FPGA、ARM等異構計算服務器的研發進度,繼續發揮浪潮領先的定製化能力,滿足客戶快速變化的需求!





閩公網安備 35020302001891號