華中科技大學馮丹:支持近數據處理的存儲技術
發表時間:2019-09-12 作者:211大學網

華中科技大學馮丹:支持近數據處理的存儲技術

2019-09-12 分類:技術

近日,在2019全球閃存峰會上,國內外閃存、存儲領域的重磅專家、學者從閃存技術、方案、實際應用等角度,圍繞“閃存加速數字經濟”這一命題探索閃存及存儲現狀與趨勢,為全球閃存蓬勃產業注入源源不斷的新動力。中國計算機學會信息存儲專委會主任委員、華中科技大學計算機學院院長馮丹,作為重磅嘉賓出席峰會并發表題為《支持近數據處理的存儲技術》的精彩演講。

馮丹表示,支持近數據處理的固態盤技術以及存算一體的憶阻器技術為解決“存儲墻”問題提供了全新的路徑,并從三個方面進行了闡述。

以下為演講實錄:

謝謝,我給大家分享一下我們做的一些工作,這是近數據處理存儲技術,主要從三個方面給大家分享。

應該說,大數據時代第一個對存儲有挑戰,第二個對數據處理也存在挑戰,存儲方面據統計增長率已經達到了36%,2018年全球的數據總量是33ZB,預計到2025年將達到175ZB。但是大量的數據實際上除了要存之外,更多的要做處理,比如說大數據的5V特征——Volume(體量)、Velocity(速度)、Variety(多樣性)、Veracity(準確性)、Value(價值), 要求在大量的數據中間能夠找到有價值的數據或者說發現有價值的數據做處理。

處理和存儲之間實際上發展的是不平衡的,處理器核每兩年翻一倍,內存容量每三年才翻一倍。也就是說,每個核的內存容量每兩年是減少30%,它分配到的內存帶寬也大為減少,從而導致處理和存儲之間的差距越來越大。

而存儲性能的提升非常有限,從1999年到2017年訪問延遲基本上沒有什么變化,盡管帶寬提升了20倍,容量提升了128倍,這樣就導致處理和存儲之間的發展非常不平衡。從性能的角度來看,據分析大約50%處理器流水線中的停頓是由數據訪問造成的,有的是數據的沖突,有的是因為內存沒有命中,所以導致存儲流水停頓問題。這就是我們所有說的內存強的問題。還有一個功耗強的問題,據統計移動設備中瀏覽網頁41%的能量花費在數據訪問上,LOAD操作能耗約為ADD指令的115倍。因此,內耗強的問題也非常突出。

從閃存內部講,16個通道的閃存構成的SSD,理論上來講內部的數據的速率可以達到8.5GB/S,但是把它封裝成為SSD盤之后,就是SATA接口或者PCIe接口就達不到這么高的速度,就是2G/S的速度。如果是64個SSD理論上是可以達到545個GB/S的速度,但是掛載在PCIe的總線上,被Host來訪問的話16個通道的SSD變成了16GB/S的速度。

也就是說,設備內部速度理論上是非常高的,但是通過層層衰減,性能非常低了,這樣就導致了CPU訪問的時候差距非常大,怎么樣解決這個問題呢?分析一下就是由傳統的馮諾依曼體系結構限制了它。

傳統的馮諾依曼體系結構導致數據一定是要存儲里搬到計算里,然后算完之后再回去。我們反過來想一下,能不能把處理推送到存儲中間去,充分發揮內部帶寬作用呢?

這個是傳統的馮諾依曼體系結構數據流向存在的問題,從而使得過分的以計算為中心導致性能差、能耗低,所以新的理念我們能不能實現以數據為中心的體系結構,也就是說在盡量靠近數據的地方來處理數據或者盡量減少數據的訪問來完成計算,也就是所說的將處理推送到數據中間去或者推送到存儲中間去。

現在的一些解決方案,為了提高訪存的帶寬也有CPU+GPU+FPGA+TPU,來使得能夠更多的并行訪存。我們也做了一點工作,在SSD控制器里做了支持近數據處理的可重構的存儲控制器。

主要的思路基于可重構的FPGA來實現硬件的加速,也就是說把一些頻繁操作的處理推送到SSD控制器里。第二個方面圍繞RRAM做了存算融合,也就是CIM方面做了探索,我們做了優化的工作今天跟大家分享一下。

第一個工作支持可重構的近數據處理的固態盤,我們開發了PCIe原形系統,用FPGA做,像內存條是flash的直卡或者PCM的直卡,我們用來做實驗的。在控制器中間我們除了做傳統的閃存FTL這些操作之外以及閃存的控制,我們還加了可重構的處理的模塊,很多可重構的單元,還加上重構配置模塊。

可重構的處理單元可以配置成為要加速處理的一些操作,比如說來做數據的過濾操作,要去查詢一個數據,或者操作的一些音節碼,以及加密的操作等等,可以用可重構的單元,通過FPGA的編程之后用硬件直接實現加速。將處理推送到存儲,離數據最近的地方來做,具體的來做基于近數據處理,我們實現AES加密的模塊,接收到的數據經過可重構的近數據處理模塊之后再通過flash的控制器到真正的Facebook中間去。