經(jīng)歷近三個(gè)月的暫停發(fā)貨后,英偉達(dá)面向中國(guó)市場(chǎng)的AI加速芯片H20重新獲得出口許可。
7月15日,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在接受央視采訪時(shí)確認(rèn),美國(guó)政府已批準(zhǔn)H20的出口申請(qǐng),英偉達(dá)將啟動(dòng)對(duì)該產(chǎn)品的對(duì)華發(fā)貨流程?!拔覀兛梢蚤_始發(fā)貨了,我對(duì)此感到非常高興?!秉S仁勛表示。
H20是英偉達(dá)于2023年底發(fā)布的定制化產(chǎn)品,基于Hopper架構(gòu)設(shè)計(jì),擁有CoWoS先進(jìn)封裝技術(shù)。原本是在滿足監(jiān)管紅線下,為中國(guó)市場(chǎng)量身打造的AI加速卡,主要面向推理和中小規(guī)模模型訓(xùn)練場(chǎng)景。該產(chǎn)品是繼A100、H100、A800與H800等主力GPU產(chǎn)品相繼被限制出口后,英偉達(dá)試圖維持中國(guó)市場(chǎng)供給能力的技術(shù)調(diào)整方案。
今年4月,美國(guó)政府以“可能用于高風(fēng)險(xiǎn)超級(jí)計(jì)算場(chǎng)景”為由,通知英偉達(dá)H20芯片向中國(guó)出口需許可證,隨后發(fā)貨暫停。英偉達(dá)曾在向美國(guó)證監(jiān)會(huì)(SEC)提交的文件中披露,自4月9日起,H20等產(chǎn)品對(duì)包括中國(guó)內(nèi)地、中國(guó)香港及中國(guó)澳門在內(nèi)的D:5類地區(qū)出口需單獨(dú)申請(qǐng)?jiān)S可。
除H20外,黃仁勛還宣布將發(fā)布一款名為RTX Pro的新顯卡。他表示,這款顯卡非常重要,是專為計(jì)算機(jī)圖形、數(shù)字孿生和人工智能設(shè)計(jì)。
英偉達(dá)官網(wǎng)顯示,RTX PRO是面向?qū)I(yè)人士打造的高性能平臺(tái),覆蓋建筑與工業(yè)設(shè)計(jì)、高級(jí)視覺特效、復(fù)雜科學(xué)可視化、大型語言模型微調(diào)和本地AI助手運(yùn)行等多個(gè)應(yīng)用場(chǎng)景。
H20回歸:性能受限但契合需求
開源證券研報(bào)指出,合規(guī)芯片H20恢復(fù)銷售有望緩解國(guó)內(nèi)算力“缺芯”問題,核心利好國(guó)產(chǎn) AIDC (智算中心)全產(chǎn)業(yè)鏈。
根據(jù)公開信息,H20配備96GB HBM3顯存,顯存帶寬可達(dá)4TB/s,部分升級(jí)型號(hào)還提升至141GB顯存、900GB/s的卡間互聯(lián)帶寬。其FP8和FP16算力分別為296 TFLOPS與148 TFLOPS,盡管其峰值算力僅為H200的約15%,在AI推理及中小規(guī)模模型部署中仍具一定競(jìng)爭(zhēng)力,尤其適合大模型推理階段對(duì)帶寬、內(nèi)存容量要求較高的場(chǎng)景。
產(chǎn)業(yè)經(jīng)濟(jì)分析師、釘科技創(chuàng)始人丁少將向時(shí)代周報(bào)記者指出,H20主要面向中國(guó)頭部AI企業(yè)與云服務(wù)商,適用于推理任務(wù)與中小規(guī)模訓(xùn)練。此次解禁后,可緩解中國(guó)AI企業(yè)短期推理算力缺口。不過,丁少將也強(qiáng)調(diào),H20因性能受限無法滿足萬億參數(shù)大模型訓(xùn)練,難以替代國(guó)產(chǎn)芯片在超算與國(guó)家級(jí)大模型項(xiàng)目中的角色。
“H20在顯存容量和帶寬方面相較于H100有明顯提升,二級(jí)緩存更大、功耗更低,使其在當(dāng)前人工智能推理應(yīng)用中具備現(xiàn)實(shí)優(yōu)勢(shì)。隨著今年DeepSeek的開源,大模型推理需求激增,對(duì)H20的需求也因此大幅增加。”半導(dǎo)體資深專家、電子創(chuàng)新網(wǎng)創(chuàng)始人張國(guó)斌在接受時(shí)代周報(bào)記者采訪時(shí)表示。
具體到客戶結(jié)構(gòu)與應(yīng)用場(chǎng)景,頭豹研究院分析師曾涵宇向時(shí)代周報(bào)記者解釋稱,對(duì)于國(guó)內(nèi)那些對(duì)算力有海量需求的巨頭公司而言,H20顯然不會(huì)是他們的首選,畢竟 H100 /H200的性能更為強(qiáng)勁。而垂直行業(yè)客戶更看重在特定場(chǎng)景中實(shí)現(xiàn)的高精度與專業(yè)性。垂類大模型專為解決行業(yè)問題設(shè)計(jì),能很好地適配醫(yī)療診斷、金融風(fēng)控等行業(yè)需求,因此金融、醫(yī)療、法律、教育等行業(yè)會(huì)是H20的主要客戶。
在價(jià)格策略方面,H20同樣體現(xiàn)出務(wù)實(shí)取向。據(jù)張國(guó)斌介紹,該產(chǎn)品在國(guó)內(nèi)市場(chǎng)的報(bào)價(jià)區(qū)間大致在8.6萬元至11萬元人民幣之間,略低于國(guó)產(chǎn)昇騰910B。對(duì)于預(yù)算有限、但仍需保持英偉達(dá)CUDA生態(tài)兼容性的企業(yè)而言,H20提供了一個(gè)相對(duì)平衡的選項(xiàng)。
事實(shí)上,作為英偉達(dá)為規(guī)避出口限制而量身打造的芯片,H20不僅承載著對(duì)華業(yè)務(wù)延續(xù)的技術(shù)意義,也具有重要的商業(yè)權(quán)重。廣發(fā)證券研報(bào)指出,英偉達(dá)第一季度確認(rèn)46億美元H20收入(另外有25億美元未能交付),同時(shí)確認(rèn)了45億美元的減值支出。此外,第二季度原本有80億美元 H20訂單,預(yù)計(jì)也將產(chǎn)生損失。
在曾涵宇看來,今年發(fā)布的華為昇騰 910C性能強(qiáng)且性價(jià)比高,就已成為H20禁售期間國(guó)內(nèi)AI企業(yè)的另一個(gè)選項(xiàng)。
RTX Pro瞄準(zhǔn)工業(yè)數(shù)字化轉(zhuǎn)型紅利
“RTX Pro瞄準(zhǔn)工業(yè)數(shù)字化轉(zhuǎn)型紅利,以性價(jià)比切入邊緣計(jì)算藍(lán)海?!倍∩賹⒈硎荆啾菻20,RTX Pro更側(cè)重邊緣端低成本部署,契合中國(guó)制造業(yè)自動(dòng)化升級(jí)需求,對(duì)國(guó)產(chǎn)GPU在中小型企業(yè)市場(chǎng)的份額有分食作用。
據(jù)悉,英偉達(dá)RTX系列產(chǎn)品傳統(tǒng)上多定位于消費(fèi)級(jí)市場(chǎng)。而英偉達(dá)官網(wǎng)顯示,RTX PRO支持臺(tái)式機(jī)、移動(dòng)工作站、數(shù)據(jù)中心、虛擬工作站以及嵌入式GPU方案,體現(xiàn)出更強(qiáng)的專業(yè)適配性,適用于多種計(jì)算環(huán)境。
其中,數(shù)字孿生被視為RTX Pro切入智能制造的重要落點(diǎn)之一。得益于其采用GDDR7高帶寬顯存與多單元流處理器架構(gòu),RTX Pro 能夠支撐汽車、工業(yè)制造等行業(yè)的大規(guī)模三維模型的實(shí)時(shí)交互計(jì)算。
“RTX Pro 是為智能工廠和物流領(lǐng)域的數(shù)字孿生AI應(yīng)用量身打造的?!睆垏?guó)斌指出,隨著數(shù)字化深入千行百業(yè),大模型與各行業(yè)的深度融合對(duì)高性能GPU的需求日益增加。相較于H20,RTX Pro GPU更專注于圖形渲染,特別適用于數(shù)字孿生技術(shù)。
頭豹研究院分析師許諾進(jìn)一步指出,結(jié)合國(guó)內(nèi)車企對(duì)虛擬工廠、智能座艙的數(shù)字化需求,以及工業(yè)互聯(lián)網(wǎng)平臺(tái)的普及,RTX Pro可成為數(shù)字孿生系統(tǒng)的核心算力支撐,預(yù)計(jì)在頭部新能源車企、高端裝備制造企業(yè)中快速落地。
與此同時(shí),RTX Pro在AI融合場(chǎng)景中的表現(xiàn)同樣值得關(guān)注。RTX Pro平臺(tái)內(nèi)置第五代Tensor Core與DLSS 4等新一代技術(shù),使其能兼顧圖形處理與AI加速。
許諾稱,中國(guó)市場(chǎng)對(duì)3D圖像處理和AI深度學(xué)習(xí)計(jì)算等需求不斷增加,GPU市場(chǎng)廣闊。例如在智慧醫(yī)療領(lǐng)域輔助3D醫(yī)學(xué)影像分析,在教育科研領(lǐng)域支撐AI驅(qū)動(dòng)的分子模擬等場(chǎng)景,與國(guó)內(nèi)在生物醫(yī)藥、新材料等領(lǐng)域的研發(fā)需求形成協(xié)同,進(jìn)一步填補(bǔ)專業(yè)級(jí)AI算力的細(xì)分市場(chǎng)空白。
本文鏈接:http://jphkf.cn/news-2-2981-0.html英偉達(dá)H20重返中國(guó)!黃仁勛確認(rèn)解禁,瞄準(zhǔn)垂直行業(yè)推理缺口
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇:人形機(jī)器人租金腰斬,進(jìn)廠需跨三大門檻,宇樹王興興:3-5年內(nèi)應(yīng)用進(jìn)程加快
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕