近期,兩場(chǎng)RISC-V(開源指令集架構(gòu))會(huì)議在上海、杭州兩地接連召開,一場(chǎng)是滴水湖中國(guó)RISC-V產(chǎn)業(yè)論壇(以下簡(jiǎn)稱“滴水湖論壇”),另一場(chǎng)是2024 RISC-V中國(guó)峰會(huì)。
“這兩個(gè)會(huì)其實(shí)有點(diǎn)區(qū)別,滴水湖重在產(chǎn)業(yè)落地,RISC-V中國(guó)峰會(huì)則重在產(chǎn)業(yè)的未來,但談的都是高性能計(jì)算。”電子創(chuàng)新網(wǎng)創(chuàng)始人兼CEO張國(guó)斌告訴記者,AI需要大算力,當(dāng)然會(huì)成為RISC-V現(xiàn)在最重要的發(fā)展方向。
其中,中國(guó)工程院院士倪光南在“2024 RISC-V中國(guó)峰會(huì)開幕會(huì)”表示:“根據(jù)2023年年底的數(shù)據(jù),在芯片領(lǐng)域RISC-V IP核出貨量達(dá)到130億顆,完成了ARM經(jīng)過30年才走過的歷程?!痹撓⒆寴I(yè)界振奮。隨著RISC-V在物聯(lián)網(wǎng)、嵌入式系統(tǒng)等領(lǐng)域批量應(yīng)用,并在桌面計(jì)算、服務(wù)器、人工智能等領(lǐng)域迅速發(fā)展,未來RISC-V有望成為繼X86和ARM之后的第三大主流芯片架構(gòu)。
而RISC-V國(guó)際基金會(huì)人工智能與機(jī)器學(xué)習(xí)專委會(huì)主席、北京大學(xué)講席教授謝濤則期待AI能成就RISC-V生態(tài),就“像當(dāng)年P(guān)C成就X86生態(tài),手機(jī)成就ARM生態(tài)”一樣。
在半導(dǎo)體行業(yè)資深產(chǎn)業(yè)分析師黃燁鋒看來,在今年滴水湖論壇產(chǎn)品推介中就能看到包含AI SoC、AI CPU在內(nèi)的RISC-V芯片。“這在任何CPU指令集的發(fā)展歷程中都是相當(dāng)罕見的:短短四屆滴水湖論壇,人們見證了RISC-V的一路狂飆,現(xiàn)在AI又為RISC-V這輛跑車提供了一次‘氮?dú)饧铀佟ㄖ讣铀俣群芸欤┑臋C(jī)會(huì)。”他表示。
RISC-V優(yōu)勢(shì)在開放性、靈活性
“RISC-V是CPU指令集,談AI芯片,CPU指令集和它有什么關(guān)系?”謝濤表示,今年4月11日, RISC-V國(guó)際基金會(huì)理事會(huì)官宣,人工智能/機(jī)器學(xué)習(xí)是2024年RISC-V國(guó)際基金會(huì)頂級(jí)關(guān)鍵戰(zhàn)略最優(yōu)先的戰(zhàn)略。
在今年的世界人工智能大會(huì)上,RISC-V國(guó)際基金會(huì)理事長(zhǎng)戴路也表示,RISC-V是最適合AI的指令集架構(gòu)。此外,加拿大AI芯片獨(dú)角獸Tenstorrent首席CPU架構(gòu)師練維漢指出,RISC-V非常適合做AI計(jì)算,比如大語言模型的存取非常破碎、混亂,這是CPU最擅長(zhǎng)做的。
不僅如此,嵌入式處理器開發(fā)商MIPS CEO Sameer Wasson也在滴水湖論壇上表示,作為技術(shù)奇點(diǎn)的生成式AI,及數(shù)據(jù)驅(qū)動(dòng)的資本投入,推動(dòng)著RISC-V時(shí)代的到來。
謝濤認(rèn)為,基于RISC-V構(gòu)建AI算力的優(yōu)勢(shì)在于其開放性、靈活性,高度可擴(kuò)展性、功耗和效率優(yōu)勢(shì),以及生態(tài)系統(tǒng)和社區(qū)的強(qiáng)有力支持?!跋癞?dāng)年P(guān)C成就X86生態(tài),手機(jī)成就ARM生態(tài),我們期待AI成就 RISC-V這樣的生態(tài)?!敝x濤說。
“目前,RISC-V AI芯片有兩種主要模式:一種是緊耦合模式(integrated),適合低功耗領(lǐng)域(RISC-V+AI),一種是松耦合模式(attached),適合大算力領(lǐng)域(AI+RISC-V)?!敝x濤表示,前者以CPU主干為骨架,集成在CPU內(nèi)部,共享程序計(jì)數(shù)器、寄存器等流水線單元,只是在執(zhí)行單元部分增加矩陣或向量單元;后者則外掛在CPU上,會(huì)有獨(dú)立的流水線、寄存器堆、緩存等,是協(xié)處理器,可以接收來自及一個(gè)或多個(gè)CPU的指令,異步執(zhí)行不同CPU提交的任務(wù)。
黃燁鋒進(jìn)一步指出,RISC-V + AI的緊耦合模式就是通過指令集擴(kuò)展實(shí)現(xiàn)AI加速,理論上,ARM公司的Neon、Helium(前者是適用于ARM Cortex-A系列處理器的一種128位SIMD擴(kuò)展結(jié)構(gòu),后者是ARM Cortex-M系列產(chǎn)品的MVE一種新的矢量指令集擴(kuò)展)都屬于此類;AI + RISC-V的松耦合模式則在RISC-V CPU的基礎(chǔ)上,增加協(xié)處理器或加速器——ARM家族的代表是Ethos NPU(該系列是ARM推出的AI微加速器)。
以緊耦合模式的RISC-V AI芯片為例,本次滴水湖論壇展示了來自進(jìn)迭時(shí)空(杭州)科技有限公司的SpacemiT Key Stone K1,號(hào)稱是“全球首款8核RISC-V AI CPU”,這顆芯片采用了進(jìn)迭時(shí)空自研的RISC-V智算核X60,它擁有8個(gè)核心,頻率最高2.0GHz,核心單核算力比ARM Cortex-A55高30%。
不過,謝濤也指出,我國(guó)乃至全球RISC-V+AI生態(tài)仍存在生態(tài)碎片化、資源投入嚴(yán)重不足、缺少組織統(tǒng)籌以及產(chǎn)學(xué)研協(xié)同不夠的挑戰(zhàn)。
如何撼動(dòng)CUDA
在AI芯片領(lǐng)域,英偉達(dá)是絕對(duì)的市場(chǎng)霸主,其全球市場(chǎng)占有率高達(dá)90%。作為最有希望挑戰(zhàn)英偉達(dá)霸主地位的公司,AMD仍與英偉達(dá)有一個(gè)數(shù)量級(jí)的差距。
從近期的財(cái)務(wù)數(shù)據(jù)來看,數(shù)據(jù)中心業(yè)務(wù)是這兩大GPU巨頭增長(zhǎng)的主要驅(qū)動(dòng)力,并在2024年保持高速增長(zhǎng)。
財(cái)報(bào)顯示,英偉達(dá)在2025財(cái)年第一財(cái)季(自然年2024年2月至4月)創(chuàng)下了260億美元的季度收入紀(jì)錄,其中數(shù)據(jù)中心業(yè)務(wù)貢獻(xiàn)了226億美元,同比增長(zhǎng)427%。作為對(duì)比,AMD在2024年第一季度和第二季度的收入分別為55億美元和58億美元,數(shù)據(jù)中心銷售額分別達(dá)到23億美元和28億美元,分別同比增長(zhǎng)80%和115%。
一個(gè)越來越為人熟知的事實(shí)是,之所以英偉達(dá)能成為AI芯片市場(chǎng)霸主,除其硬件產(chǎn)品性能優(yōu)秀外,更在于它構(gòu)建起了以CUDA(英偉達(dá)推出的運(yùn)算平臺(tái))為基礎(chǔ)的軟件棧。
“相比于英偉達(dá),國(guó)產(chǎn)Al芯片除性能差距外,軟件生態(tài)差距更大。英偉達(dá)的成功不僅僅在于其芯片,更在于其軟件棧CUDA的成功?!敝x濤表示,CUDA是2006年英偉達(dá)推向市場(chǎng)的,經(jīng)過這么多年的發(fā)展,英偉達(dá)為CUDA生態(tài)投入120億美元,目前CUDA開發(fā)者已有450萬。
謝濤指出,如今國(guó)內(nèi)高端AI芯片企業(yè)達(dá)40多家,但軟件棧層面各自為戰(zhàn),整體市場(chǎng)份額不足10%。
“一些國(guó)產(chǎn)和國(guó)際AI芯片公司也會(huì)采用所謂的‘打不過就加入’的思路,兼容CUDA軟件生態(tài),特別是走GPGPU(通用圖形處理器)的路線。這樣的道路能解燃眉之急,但長(zhǎng)遠(yuǎn)來看還是受制于人?!敝x濤表示,當(dāng)然還有一些AI芯片公司走的是非CUDA路線,但整體上來說AI算力軟件生態(tài)呈現(xiàn)小、散、弱的局面。
他還指出,指令集不統(tǒng)一,硬件架構(gòu)分散;軟件棧不統(tǒng)一,用戶學(xué)習(xí)成本高;算子覆蓋度低,用戶遷移成本高,以及企業(yè)各自為戰(zhàn),沒有足夠的生態(tài)競(jìng)爭(zhēng)力,這些都導(dǎo)致國(guó)產(chǎn)AI芯片競(jìng)爭(zhēng)力的缺乏。
但英偉達(dá)的CUDA生態(tài)是相對(duì)封閉的。對(duì)此,謝濤指出歷史上能夠擊敗閉源霸主生態(tài)的往往是一個(gè)開源的生態(tài)。
“在IT歷史上,當(dāng)一個(gè)閉源生態(tài)占據(jù)主導(dǎo)地位的時(shí)候,基本上沒有看到一個(gè)成功的例子是說第二個(gè)后來居上的閉源生態(tài)撼動(dòng)(原先)霸主生態(tài)。但有兩大案例,是開源的生態(tài)去震撼閉源霸主的生態(tài),一個(gè)Linus VS Windows,一個(gè)是Android VS iOS?!敝x濤說,RISC-V指令集本身是開源的,且已有了相當(dāng)?shù)男酒鲐浟考伴_發(fā)生態(tài)基礎(chǔ)。
言下之意,選擇RISC-V做AI芯片的理由又多了一個(gè),即用開源的RISC-V生態(tài)來撼動(dòng)英偉達(dá)的CUDA生態(tài)。
針對(duì)以上當(dāng)前構(gòu)建我國(guó)RISC-V+AI生態(tài)存在的挑戰(zhàn),謝濤認(rèn)為,可以采用自下而上的思路,以RISC-V指令集擴(kuò)展+開源系統(tǒng)軟件棧(并推成標(biāo)準(zhǔn))為“公共開源根”,利用國(guó)際開放/開源社區(qū)“長(zhǎng)葉”(基于開源根的商業(yè)軟件/芯片),形成“根技術(shù)開源”與“葉技術(shù)競(jìng)爭(zhēng)”的技術(shù)生態(tài)優(yōu)勢(shì)。
謝濤提出,應(yīng)聚焦邊緣計(jì)算和智能終端等多樣化應(yīng)用場(chǎng)景,推動(dòng)軟件生態(tài)的發(fā)展,進(jìn)而帶動(dòng)云上軟件生態(tài),這種“農(nóng)村包圍城市”的策略來與現(xiàn)有巨擘抗衡,逐步建立RISC-V在AI領(lǐng)域的市場(chǎng)地位。再依托日益強(qiáng)大的RISC-V軟硬件生態(tài),聚焦全球開源工具創(chuàng)新,最終達(dá)成類似Android VS iOS或Linux VS Windows的競(jìng)爭(zhēng)格局。
關(guān)于具體破局思路,謝濤提出了國(guó)際標(biāo)準(zhǔn)+開源社區(qū)兩抓手?!耙皇且酝苿?dòng)RISC-V國(guó)際標(biāo)準(zhǔn)為抓手到國(guó)際借力,把握‘根技術(shù)’,快速布局新市場(chǎng)(如智能終端、AI PC等),以推動(dòng)國(guó)際基金會(huì)標(biāo)準(zhǔn)來依托上游國(guó)際開源社區(qū)貢獻(xiàn)系統(tǒng)軟件棧。二是以共建國(guó)際開源軟件生態(tài)為抓手到國(guó)際借力,到國(guó)際開源軟件生態(tài)(如Triton、SYCL)中發(fā)出中國(guó)強(qiáng)聲音?!敝x濤說。
在謝濤看來,Triton(開源的GPU編程語言)與SYCL(由英特爾主推,和CUDA同層級(jí)的跨平臺(tái)抽象層)是RISC-V AI生態(tài)發(fā)展的關(guān)鍵,SYCL被他類比為“編程模型中的RISC-V”,相對(duì)的CUDA是編程模型中的X86。
黃燁鋒指出,Triton實(shí)現(xiàn)了硬件無關(guān)的中間層表示,生態(tài)兼容負(fù)擔(dān)小,編程難度相較CUDA更低,但仍能實(shí)現(xiàn)接近于CUDA極限生態(tài)的性能。