焦點(diǎn)滾動(dòng):Rambus提升GDDR6帶寬,以應(yīng)對(duì)邊緣計(jì)算挑戰(zhàn)

為了不斷滿足人工智能和機(jī)器學(xué)習(xí)需求的迅速增長(zhǎng),算力在快速增長(zhǎng),數(shù)據(jù)量也在快速增長(zhǎng)。

現(xiàn)在ChatGPT等人工智能相關(guān)的應(yīng)用程序,它的增長(zhǎng)速度以及對(duì)數(shù)據(jù)的需求更是非常龐大,而且ChatGPT-3是以1750 億個(gè)參數(shù)進(jìn)行訓(xùn)練的。這些人工智能應(yīng)用的快速發(fā)展,也對(duì)處理器及帶寬提出了更高的要求和標(biāo)準(zhǔn)。

“市面上越來(lái)越多的客戶和公司都開(kāi)始專注于開(kāi)發(fā)自己個(gè)性化、定制化的處理器產(chǎn)品,以更好地滿足神經(jīng)網(wǎng)絡(luò)以及專屬應(yīng)用的需求。”Rambus IP核產(chǎn)品營(yíng)銷高級(jí)總監(jiān)Frank Ferro說(shuō)道。


(資料圖片)

此時(shí),內(nèi)存墻問(wèn)題越來(lái)越成為制約算力的重要問(wèn)題。Frank表示:“盡管算力的增長(zhǎng)非常顯著,但是帶寬上的進(jìn)步卻無(wú)法改善,也就是造成兩者間的不匹配,很多計(jì)算資源并沒(méi)有被充分利用到?!?/p>

正是由于對(duì)帶寬需求更加進(jìn)一步的增加,以及對(duì)需求的上漲,驅(qū)動(dòng)了像Rambus公司一樣不斷打造新一代的產(chǎn)品,提高內(nèi)存帶寬以及接口帶寬。實(shí)際上,根據(jù)Rambus 5月初剛剛公布的2023年一季度業(yè)績(jī)公告,在內(nèi)存接口芯片的推動(dòng)下,季度產(chǎn)品收入達(dá)到 6380 萬(wàn)美元,同比增長(zhǎng) 33%,總營(yíng)收達(dá)到了1億1400萬(wàn),均創(chuàng)出新高。

HBM還是GDDR

人工智能的應(yīng)用場(chǎng)景可劃分為訓(xùn)練和推理兩部分,其中訓(xùn)練是指通過(guò)大數(shù)據(jù)訓(xùn)練出一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,通過(guò)大量標(biāo)記過(guò)的數(shù)據(jù)來(lái)訓(xùn)練相應(yīng)的系統(tǒng),使其能夠適應(yīng)特定的功能。而推理則是利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論。借助神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,利用輸入的新數(shù)據(jù)來(lái)一次性獲得正確結(jié)論的過(guò)程。

訓(xùn)練和推理在算力和存儲(chǔ)上的需求并不完全相同,訓(xùn)練需要更大的數(shù)據(jù)進(jìn)行分析,而推理則更注重成本。也正因此,產(chǎn)業(yè)界誕生了包括HBM與GDDR兩種存儲(chǔ)解決方案,以適應(yīng)不同的場(chǎng)景要求。

AI推理場(chǎng)景帶寬大概需要400-500Gb/s的帶寬,如果用HBM3,帶寬可以提高至800Gb/s,但卻是大材小用,同時(shí)成本會(huì)增加3-4倍之多。

HBM(高帶寬內(nèi)存)于 2013 年推出,是一種高性能 3D 堆疊 SDRAM架構(gòu)。如其名稱所述,HBM最重要的是帶寬更高,盡管HBM的內(nèi)存都以相對(duì)較低的數(shù)據(jù)速率運(yùn)行,但其通道數(shù)更多。例如,以3.6 Gbps運(yùn)行的HBM2E在存儲(chǔ)和處理器間的通道數(shù)達(dá)到了1024條,這無(wú)法在PCB上實(shí)現(xiàn),因此硅中階層(interposal)被用來(lái)連接內(nèi)存和處理器。

GDDR的歷史

隨著AI的推理越來(lái)越多地向邊緣設(shè)備上進(jìn)行集成和轉(zhuǎn)移,GDDR越來(lái)越成為邊緣AI處理所需。比起HBM,GDDR的歷史則更為悠久。GDDR可以追溯到PC和游戲機(jī)時(shí)代,早期的GPU使用SDRAM和DDR,這與CPU相同。隨著對(duì)GPU性能追求增強(qiáng),推動(dòng)了GDDR專用圖形顯示的需求增長(zhǎng)。

2003 年 10 月,英偉達(dá)推出了 GeForce FX 5700 Ultra,搭配了256 MB GDDR2 DRAM,當(dāng)時(shí)5000系列大部分仍使用DDR DRAM。直到 2018 年底 GeForce 16 和 20 系列,GDDR被用于整個(gè)產(chǎn)品線。如今,GDDR6 是最先進(jìn)的顯存解決方案。

相比于LPDDR和DDR,GDDR在帶寬關(guān)鍵參數(shù)上具有絕對(duì)優(yōu)勢(shì),在24Gb/s傳輸速率和32位總線的時(shí)候,GDDR6可以提供最多96GB/s的帶寬,在速度、帶寬和延遲方面顯著優(yōu)于其他產(chǎn)品。

Rambus GDDR6方案

Rambus提供業(yè)內(nèi)鮮有的全面內(nèi)存IP產(chǎn)品組合,包括DDR、LPDDR、GDDR以及HBM,此外還有連接類Serdes,諸如PCIe和CXL,均達(dá)到了業(yè)界領(lǐng)先水平。并且Rambus的解決方案大多是提供包括控制器和PHY在內(nèi)的全套方案。

為了應(yīng)對(duì)邊緣AI對(duì)于GDDR的需求,Rambus日前推出的GDDR6 PHY,提供市場(chǎng)領(lǐng)先的數(shù)據(jù)傳輸速率,最高可達(dá)24 Gb/s,能夠?yàn)槊總€(gè)GDDR6內(nèi)存設(shè)備帶來(lái)96 GB/s的帶寬,達(dá)到了行業(yè)標(biāo)桿水平。此前GDDR6的傳輸率為16Gb/s,總帶寬64GB/s,全新的GDDR6使帶寬增加了50%,從而為人工智能/機(jī)器學(xué)習(xí)(AI/ML)、圖形和網(wǎng)絡(luò)應(yīng)用提供更高成本效益、高帶寬的內(nèi)存。并憑借與Foundry的密切合作,支持先進(jìn)的工藝節(jié)點(diǎn)。

除了業(yè)界領(lǐng)先的24Gb/s性能外,Rambus GDDR6 PHY還經(jīng)過(guò)了全方位的優(yōu)化,可滿足AI/ML及其他需要高帶寬、低延遲內(nèi)存解決方案的先進(jìn)應(yīng)用的需求。Rambus能夠?qū)崿F(xiàn)24Gb/s的數(shù)據(jù)傳輸速率,依靠的是其在信號(hào)完整性和電源完整性(SI/PI)方面享譽(yù)世界的專業(yè)知識(shí),這些知識(shí)可用于設(shè)計(jì)PHY、芯片封裝和印刷電路板(PCB)。

此外,F(xiàn)rank還強(qiáng)調(diào)Rambus的工程師會(huì)和客戶在設(shè)計(jì)初期就緊密合作,并提供封裝參考設(shè)計(jì),以確保系統(tǒng)達(dá)到最優(yōu)性能。

總而言之,Rambus的GDDR6方案在性能、功耗管理、集成、完整性、以及支持等方面都具有明顯優(yōu)勢(shì),是提升邊緣計(jì)算能力的理想合作伙伴。

推薦DIY文章
使命召喚s10賽季什么時(shí)候結(jié)束 Ace Racing的s10賽季是什么時(shí)候
耗子為汁是什么意思怎么走紅的:是成語(yǔ)“好自為之”的諧音_熱資訊
全球要聞:大遼皇帝列表及簡(jiǎn)介 遼朝是游牧民族契丹建立的 強(qiáng)盛時(shí)勢(shì)力范圍覆蓋西域
世界快看點(diǎn)丨新西蘭講什么語(yǔ)言 為什么新西蘭這個(gè)國(guó)家有三種官方語(yǔ)言
老人節(jié)是哪天:中國(guó)的老人節(jié),玄月初九,也是中國(guó)的傳統(tǒng)節(jié)日-滾動(dòng)
熱點(diǎn)在線丨古人談讀書(shū)二則譯文:沒(méi)有毅力,就什么都是不可能的
精彩新聞

超前放送