存算一體方案解析

發(fā)布時間:2023-05-27 11:19:45  |  來源:博客園  


(相關資料圖)

存算分離是將計算和存儲功能分開部署在不同的節(jié)點或設備上的概念。在存算分離架構中,計算任務通常在獨立的計算單元(如CPU或GPU)中執(zhí)行,而數(shù)據(jù)存儲在獨立的存儲設備中。這種架構可以提供更大的靈活性和可伸縮性,但可能需要進行大量的數(shù)據(jù)傳輸和通信?!抉T諾依曼架構的特點為存算分離】存算分離不可避免地存在以下問題:

內(nèi)存墻計算機系統(tǒng)中處理器速度遠遠快于內(nèi)存訪問速度而導致的性能瓶頸。解決內(nèi)存墻問題可以考慮高速緩存、內(nèi)存層次結構優(yōu)化、內(nèi)存訪問模式優(yōu)化以及使用更快速的內(nèi)存技術(快閃存、非易失性內(nèi)存等)。

功耗墻指的是處理器和其他組件的功耗增加速度超過了散熱和功耗管理技術的改進速度,從而導致系統(tǒng)性能增長受限的現(xiàn)象。為了應對功耗墻,處理器制造商和系統(tǒng)設計者采取了多種策略。其中包括優(yōu)化芯片設計和電源管理,改進散熱技術,采用節(jié)能的制造工藝,以及引入新的架構和技術,如低功耗處理器、異構計算和功耗管理技術等。

存算一體方案可以分為三類:近存計算(Processing Near Memory),存內(nèi)處理(Processing in Memory,PIM)和行內(nèi)計算(Computing in Memory,CIM)。

近存計算是將存儲單元和計算單元集成,增加訪存帶寬、減少數(shù)據(jù)搬移,提升整體計算效率。近存計算仍是存算分離架構,本質上計算操作由位于存儲外部、獨立的計算單元完成,其技術成熟度較高,主要包括存儲上移、計算下移兩種方式。(華為昇騰910系列芯片為馮諾依曼架構和達芬奇架構的組合,達芬奇架構的本質應為采用多級cache實現(xiàn)近存計算。)

存儲上移(Memory Uplift):存儲上移是指將計算操作或部分計算操作移到內(nèi)存子系統(tǒng)中執(zhí)行。傳統(tǒng)上,計算主要在中央處理器(CPU)中完成,而內(nèi)存主要用于數(shù)據(jù)存儲。但通過存儲上移,內(nèi)存子系統(tǒng)可以提供一些計算功能,使其具備在處理數(shù)據(jù)時進行一些簡單的計算能力。這樣做的好處是可以減少數(shù)據(jù)從內(nèi)存到CPU的數(shù)據(jù)傳輸量,從而降低數(shù)據(jù)傳輸延遲和功耗。計算下移(Compute Offloading):計算下移是指將計算任務從主處理器(如CPU)下移到內(nèi)存子系統(tǒng)中的專用計算單元或加速器中執(zhí)行。通過計算下移,計算密集型任務可以在專用硬件加速器或內(nèi)存中的計算單元中進行處理,從而釋放主處理器的負擔,提高計算效率和能效。計算下移可以采用定制的硬件加速器,如圖形處理器(GPU)、向量處理器、FPGA(可編程邏輯門陣列)等,這些加速器專為特定類型的計算任務進行優(yōu)化。

存內(nèi)處理的關鍵點是將計算操作和數(shù)據(jù)緊密結合,以在存儲器內(nèi)部進行計算,而不需要將數(shù)據(jù)從存儲器傳輸?shù)接嬎銌卧_@種架構可以減少數(shù)據(jù)傳輸?shù)男枨?,降低延遲,并提高計算效率和能效。存內(nèi)處理的本質是將計算操作直接嵌入到存儲器中,以在數(shù)據(jù)存儲位置附近進行計算。

存內(nèi)計算是真正的存算一體,在芯片設計過程不再區(qū)分存儲和計算單元,真正實現(xiàn)存算融合。存內(nèi)計算是計算新范式的研究熱點,本質是利用不同存儲介質的物理特性,對存儲電路重新設計使其同時具備計算和存儲能力,直接消除存算界限,在存儲原位上實現(xiàn)計算。(后摩時代在2023.5.12發(fā)布的H30車載芯片應滿足存算一體架構方案。)

關鍵詞:

 

網(wǎng)站介紹  |  版權說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com