亚洲综合偷自成人网第页色,久久婷婷五月综合国产尤物app ,一本色道久久88综合日韩精品

異構(gòu)計算的前世今生

技術(shù)研究
電子發(fā)燒友網(wǎng)
周凱揚
2021-12-17
[ 導(dǎo)讀 ] 異構(gòu)計算已經(jīng)成了半導(dǎo)體業(yè)界不得不思考的一個話題,傳統(tǒng)通用計算的性能捉襟見肘,過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機中,各種除CPU以外的計算單元層出不窮,無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。異構(gòu)計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機SoC、汽車芯片,大到服務(wù)器芯片和超算處理器,異構(gòu)帶來了更大的算力。但與此同時,異構(gòu)計算…

  異構(gòu)計算已經(jīng)成了半導(dǎo)體業(yè)界不得不思考的一個話題,傳統(tǒng)通用計算的性能捉襟見肘,過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機中,各種除CPU以外的計算單元層出不窮,無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。

  異構(gòu)計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機SoC、汽車芯片,大到服務(wù)器芯片和超算處理器,異構(gòu)帶來了更大的算力。但與此同時,異構(gòu)計算也帶來了一些潛在的問題。

  異構(gòu)計算的崛起

  異構(gòu)計算其實早在計算機時代的早期就開始零星出現(xiàn)了,比如英特爾在80年代推出的浮點協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉(zhuǎn)眼進入了新世紀,異構(gòu)出現(xiàn)的頻率也越來越高,2010年蘋果推出了首個自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領(lǐng)域,加速器和協(xié)處理器也數(shù)量也在逐步增加。

微信圖片_20211217155157.jpg

全球超算系統(tǒng)加速器/協(xié)處理器的應(yīng)用趨勢 / TOP500

  2020年以后,各國的超級計算機計劃都定位在了Exascale的百億億級別,要想實現(xiàn)目標,要么靠堆核心規(guī)模來堆性能,要么就是選擇異構(gòu)計算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構(gòu)設(shè)計。

  明眼人都能看出,這種CPU+GPU的異構(gòu)設(shè)計也開始變得愈發(fā)緊密,比如英偉達今年宣布的Arm CPU Grace,該處理器靠著英偉達專利互聯(lián)技術(shù)NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實現(xiàn)了500GB/s的內(nèi)存帶寬。

  非傳統(tǒng)的架構(gòu)更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個字母了。促使大家選擇異構(gòu)的動力究竟是什么?答案很簡單,異構(gòu)給到了一個更高效的方案,能夠?qū)崿F(xiàn)的算力更高。既然你CPU在計算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術(shù)為我撐腰。

  異構(gòu)計算真就完美無缺?

  異構(gòu)計算就真的如此完美嗎?并非如此。異構(gòu)計算的存在其實也引出了不少隱患,比如極度差異化的編程模型,從過去的單向編程轉(zhuǎn)為了多向編程。因為異構(gòu)系統(tǒng)中存在多個計算設(shè)備,又有著不同的系統(tǒng)架構(gòu)、指令集和編程模型,因此異構(gòu)系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來說,異構(gòu)混合計算系統(tǒng)需要多套不同的代碼,這增大了應(yīng)用開發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開發(fā)者。

微信圖片_20211217155204.jpg

IPU / Graphcore

  其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構(gòu),還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構(gòu)下,將并行程序移植到異構(gòu)處理器上需要的可不只是重新編譯,還有代碼重寫。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠都不會被移植到其他加速器上,甚至這一部分工作量還分攤到了加速器廠商的軟件開發(fā)工作量上。

  所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開發(fā)者充分利用異構(gòu)處理器的計算資源,而不用在編程時考慮復(fù)雜的硬件細節(jié)。現(xiàn)在已經(jīng)有了不少跨平臺的編程標準,比如C++/Fortran、OpenMP、SYCL和Kokkos等。

  最后是復(fù)雜的數(shù)據(jù)存取過程,異構(gòu)帶來的不僅是不同層級的計算架構(gòu),還有不同層級的存儲架構(gòu),比如主存儲、主緩存、設(shè)備主存、設(shè)備緩存和寄存器等等。數(shù)據(jù)要在多種存儲類型之間移動,程序執(zhí)行要在同時對多種存儲進行存取,這些存儲方式的帶寬和延遲也不盡相同。

  異構(gòu)計算的未來

  在近期舉辦的CIUK 2021大會上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對異構(gòu)計算未來的看法。他認為異構(gòu)計算的趨勢還將繼續(xù)發(fā)展下去,差異化不會消失,但也不會出現(xiàn)極度差異化的情況。

  其次CPU與GPU的關(guān)系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說通用計算性能,GPU還是要略勝一籌。而且依目前的趨勢來看,CPU也在慢慢汲取GPU上的優(yōu)點,比如HBM、寬矢量處理器的核心、核心內(nèi)部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長路要走。


【聲明】物流產(chǎn)品網(wǎng)轉(zhuǎn)載本文目的在于傳遞信息,并不代表贊同其觀點或?qū)φ鎸嵭载撠煟锪鳟a(chǎn)品網(wǎng)倡導(dǎo)尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)文章存在版權(quán)問題,煩請聯(lián)系小編電話:010-82387008,我們將及時進行處理。

相關(guān)文章

劉強東點將女會計

好好算賬,降本增效。

RFID技術(shù)推動智能電網(wǎng)建設(shè)

隨著科技水平與生活水平的不斷提高,地球也付出了環(huán)境污染、氣候變化、能源枯竭等方面的代價,環(huán)保與能源問題成為不可回避的重要母題。而電網(wǎng)作為人類社會最大的能源輸送樞紐,對我們的日常生活和活動有著無比的重要性。因此,提高電網(wǎng)的利用率...

07月07日 17:32RFID世界網(wǎng)
主站蜘蛛池模板: 国产成人综合久久精品尤物| 国产亚洲综合一区柠檬导航| 丁香婷婷综合网| 国产精品欧美亚洲日本综合| 亚洲欧美成人综合久久久| 国产成人无码综合亚洲日韩| 青青青伊人色综合久久| 亚洲高清无码综合性爱视频| 天天综合久久久网| 中文字幕亚洲综合久久菠萝蜜| 久久本道久久综合伊人| 欧美色综合久久久久久| 欧美综合图区亚欧综合图区| 伊人yinren6综合网色狠狠| 亚洲 欧美 综合 高清 在线| 久久综合久久综合亚洲| 综合人妻久久一区二区精品| 亚洲综合成人网| 伊人亚洲综合网| 夜鲁鲁鲁夜夜综合视频欧美| 国产欧美日韩综合精品二区| 欧美激情综合五月色丁香| 亚洲国产综合精品一区在线播放| 国产成人亚洲综合| 大香网伊人久久综合网2020| 欧美日韩综合一区在线观看| 国产亚洲综合色就色| 欧美亚洲日本国产综合网| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 亚洲国产成人精品无码久久久久久综合| 人人狠狠综合久久亚洲婷婷| 久久婷婷五月综合色奶水99啪| 亚洲国产精品综合久久网络 | 亚洲AV综合色区无码一区| 久久综合久久综合久久| 精品久久久久久综合日本| 久久久久亚洲av综合波多野结衣| 亚洲综合最新无码专区| 国产成人综合精品一区| 色综合久久中文字幕综合网| 亚洲欧美日韩综合|