久久国产精品一区二区三区四区,久色婷婷小香蕉久久,国产日韩欧美在线播放不卡,另类av一区二区

國產替代狂奔,中國版英偉達何時現身?
來源:維科網    時間:2023-07-11 15:04:56

在國產GPU突圍的道路上,部分廠商已經走出了自己的路。但鑒于硬件、生態等各方面的差距,這樣必定是一條充滿荊棘的長路。

最近,風頭正盛的英偉達在算力領域又下一城。


【資料圖】

在最新的最新MLPerf訓練基準測試中,英偉達的H100僅用11分鐘就訓練完了GPT-3。

并且還在所有的八項測試中都創下了新紀錄。

可以說,這是一款專為AI、HPC和數據分析而設計的“性能怪獸”。

憑借著4nm制程、800億個晶體管、18432個CUDA核心,以及專用的Transformer引擎,H100將大模型訓練速度提高了6倍。

同時,H100還支持NVLink Switch系統,可以實現單節點內和節點間的全方位GPU通信,從而支持百億億級(Exascale)的工作負載。

這也是其能在MLPerf 8項基準測試中橫掃其他競爭者的重要原因。

在算力愈發重要的AIGC時代,任何能提高模型訓練、機器學習的硬件技術,都成了各大AI企業垂涎欲滴的產物。

然而,目前在GPU領域,大部分國內企業,仍然只能仰賴英偉達一家的技術。

在國內算力愈發捉襟見肘,以及國際風云變幻的敏感時刻,國內的GPU廠商,能否奮力追趕,解決這一“卡脖子”難題,以至于成為下一個“英偉達”呢?

01 種子選手的秘密

在目前國內一票GPU的“種子選手”中,一家名叫壁仞科技的企業引起了人們的注意。

原因很簡單,那就是其產品BR100不僅創下了全球算力紀錄,并且宣稱其峰值算力達到了英偉達A100的3倍,甚至還能對標沒發售的H100。

然而,稍微了解過國內芯片行業的人都知道,在芯片領域,國內的炒作太多了,徒有其表的例子也太多了。

那么,做出這個“媲美英偉達”GPU的企業,究竟是什么來頭?其自主研發的BR100,是否真的像其宣傳的那樣出色?

要回答這個問題,我們不妨先看看壁仞科技的創始班底,技術背景究竟如何。

作為一家通用智能芯片設計研發商的壁仞科技,成立于2019年,團隊由國內外芯片和云計算領域的專家和研發人員組成。

其創始人張旭博士,不僅擁有清華大學和斯坦福大學的博士學位,還曾是英偉達的高級架構師,負責Volta架構的設計和開發。

除此之外, 團隊其他成員的技術身份,也頗為亮眼。

李新榮,聯席CEO,曾任AMD全球副總裁、中國研發中心總經理,負責AMD大中華區的研發建設和管理工作。

洪洲,CTO,曾在NVIDIA、S3、華為等工作操刀GPU工程項目,擁有超過30年的GPU領域經驗。

焦國方,軟件生態環境主要負責人,曾在高通領導和產品研發了5代Adreno移動GPU系統架構。

這樣的團隊背景,決定了壁仞科技的技術底色。

依據之前在英偉達、AMD、高通、商湯科技等知名企業的研發經驗和技術積累,壁仞科技研發了自主原創的芯片架構——壁立仞。

壁立仞架構基于SIMT(單指令多線程)模型,針對AI場景進行了專用的優化和定制。

其最大的特點,就是可以將多個小芯片拼成一個大芯片,每個小芯片只做一部分功能,然后通過高速互連組合成一個大芯片。

這樣可以提高芯片的良率和可靠性,同時降低成本和功耗,實現更強大的算力和擴展性。

這就是壁仞科技所謂的Chiplet的設計理念。

這種技術的難點在于如何保證芯片之間的高速通信和協作,同時避免信號干擾和功耗過高。

因此,如何設計合適的芯片分割和組合方案,使得每個芯片都能發揮最大的效能,同時減少電磁干擾和熱耗散,就成了Chiplet能否成功的關鍵。

對此,壁仞科技使用了兩種關鍵的技術2.5D CoWoS和BLink,來攻克這一難關。

簡單地說,2.5D CoWoS技術是一種把多個芯片堆疊在一起的技術,它利用了一個硅基板作為中介層,縮短了芯片之間的距離,從而提高了信號的傳輸速度和質量。

而BLink則在中介層上,建立了一個專用的接口,它可以讓多個芯片之間直接傳輸數據,而不需要經過其他的電路或芯片,從而減少了延遲和功耗。

然而,盡管2.5D CoWoS、BLink這些技術,讓壁仞科技打造出了算力更強的BR100,但這些技術,目前在國際上并不罕見,其他GPU廠商也有過類似的設計。

例如,Nvidia的A100和H100 GPU都采用了CoWoS技術,把GPU芯片和HBM內存堆疊在一起,提高了內存帶寬和計算性能。而Nvidia還開發了自己的NVLink接口,類似于BLink接口,可以讓多個GPU之間高速互聯。

此外,AMD也有自己的Infinity Fabric接口,可以實現類似的功能。

那既然這是一種“大家都能用”的技術,那壁仞科技怎么就做到讓BR100算力達到A100三倍的呢?而英偉達真就會坐視著自己被超越了?

其實,這樣的結果,是二者在不同數據格式下的表現所致。

具體來說,BR100的巨大算力,更多是在矩陣FP32數據格式下的表現。

一般來說,數據格式占用的位數越多,它的范圍和精度就越高,但是也會消耗更多的空間和電力。

而矩陣FP32其實就是一種特殊的FP32數據格式,它只用了19位來存儲一個浮點數,這樣做的目的是為了讓矩陣FP32能夠兼容Tensor Core這種專門用于加速矩陣乘法的硬件單元。

矩陣乘法是深度學習中最常見和最重要的計算操作之一,所以使用矩陣FP32可以大幅提升深度學習的性能。

但是,矩陣FP32也有一個缺點,就是它的精度比向量FP32低,也就是說它能表示的浮點數的范圍和細節程度比向量FP32小。

這樣就會導致一些誤差和損失,在某些情況下可能會影響模型的質量和效果。

因此,矩陣FP32和英偉達A100的向量FP32并不等價,因為矩陣FP32只適用于矩陣乘法這種特定的計算操作,并不能代表GPU的整體性能。

02 生態之痛

除了技術方面的較量外,軟件生態上的壁壘,也是國產GPU無法忽視的一道屏障。

從某種程度上說,這樣的壁壘比某些具體技術的難點,更難以攻克。

在GPU領域,業界流傳著一種說法:“CUDA是Nvidia最深的護城河”。

這是因為,早在十幾年前,在業內大部分人都認為GPU只能處理圖形相關的計算時,英偉達就已經意識到了GPU在AI領域的潛力和價值,并開始了相應的布局,在2006年推出了通用并行計算架構CUDA。

在CUDA問世前,人們在進行各種計算任務時,用的都是CPU,而非GPU。

然而,CPU雖然具有很強的“通用性”,可以處理各種計算,但是它的速度不夠快,而且核心數量有限。

而相較之下,只能處理圖形計算的GPU,不僅速度很快快,而且有很多很多的核心。

通過CUDA,在進行AI計算時,人們可以將神經元之間的計算分配到GPU的不同核心上,并行地進行運算。這樣就大大提高了神經網絡的訓練和推理的速度、效果。

英偉達看到了CUDA的巨大潛力,于是不斷地完善和優化CUDA的技術和生態。

例如讓CUDA支持C、C++、Fortran、Python等多種編程語言,或是提供了針對不同領域和應用優化的庫和工具,比如圖像處理庫、深度學習庫、自動駕駛庫等等。

這樣的優化,為開發者提供了極大的便利,使其不用再學習新的編程語言,或是從頭開始編寫代碼。

于是,越來越多的人用慣了,用舒服了,CUDA的生態就這么被搭建起來了。

誠然,在CUDA構建自身生態壁壘的過程中,也不是沒有遇到過競爭者,但最后這些對手都一一成為了“陪跑者”。

例如,蘋果公司和Khronos Group在2009年推出的OpenCL,也有過想成為行業標準的想法,讓人們可以用不同廠商的CPU、GPU、來做異構計算。

然而,OpenCL沒有CUDA那么高效和靈活,需要更多的編程技巧和優化工作,這就加大了開發者的負擔。

而英偉達的老對手AMD,也想要提供一個通用并行計算平臺,并推出了相應的產品ROCm,它跟CUDA的架構非常類似,甚至有一個工具叫hipify,可以把CUDA代碼轉換成ROCm代碼。

但是ROCm只能用在AMD的GPU上,而且只支持幾款顯卡。

于是,綜合對比下來,更多的開發者還是選擇了“通用性”、“易用性”都更勝一籌的CUDA。

如今,在軟件生態方面,壁仞科技也推出了自主研發的BIRENSUPA軟件平臺,試圖通過“無縫運行”的方式,讓開發者無需修改代碼,就可以在BR100系列產品上運行原本基于CUDA的應用。

這樣,習慣了使用CUDA的用戶,如果轉而使用BR100系列產品,可以獲得更高的計算性能和更低的功耗成本。

然而,這樣的思路,卻面臨著幾大挑戰,而其中之一,就是BR100系列產品在通用計算生態上的支持。

BIRENSUPA軟件平臺

因為,壁仞科技為了提高BR100系列產品在AI計算方面的性能和能效,也對流處理器進行了一些優化和定制,比如說使用BF16替代FP16作為主要的數據格式,以及增加了一些針對AI的硬件指令和功能。

這樣,BR100就可能犧牲了部分通用計算能力,導致其在一些非AI的應用場景和領域上表現不佳或者不兼容。

而這也是為什么,BR100的主要應用場景,大多是復旦大學、清華大學這類高校的人工智能計算和高性能計算項目。

除此之外,BR100系列產品,在算力利用率上也存在著風險。

雖然,BR100的架構是通用的,如果如果壁仞科技愿意,也同樣可以將其用于通用類的計算。

但因為BR100的內部算力帶寬已經明顯超過PCIe和HBM2e的帶寬,所以絕大部分數據可能都要在GPU內流轉。

這就意味著,雖然BR100的算力很強大,它的數據來源和輸出通道,都不夠快,不能及時地給它送來或者拿走數據。

而如果一個軟件生態主要支持通用處理, 它的GPU芯片往往就需要有足夠高的外部帶寬,來獲取各種類型的數據。

這是因為,不同類型的應用,往往對帶寬的需求和敏感度都不同。一些大型的應用,可能需要更高的帶寬,才能更好地計算。

最后,也是最具風險的一點,就是雖然壁仞科技宣稱,BR100要無縫地支持CUDA生態,但CUDA不是一個開源生態,英偉達在其中埋下了大量專利壁壘。

如果壁仞科技真的打算撬動這塊壁壘,則很可能受到英偉達的在專利上的反擊。

綜上所述,雖然目前在國產GPU突圍的道路上,部分廠商已經走出了自己的路,但鑒于硬件、生態等各方面的差距,這樣的道路,必定是一條充滿荊棘的長路。

原文標題:國產替代狂奔,中國版英偉達何時現身?

關鍵詞:

X 關閉

X 關閉

久久国产精品一区二区三区四区,久色婷婷小香蕉久久,国产日韩欧美在线播放不卡,另类av一区二区
久久久久久久久岛国免费| 久久久av毛片精品| 久久久久99精品国产片| 国产欧美日韩三级| 午夜激情综合网| 亚洲精品色婷婷福利天堂| 国产亚洲一区二区在线观看| 欧美片网站免费| 韩国女主播一区| 午夜精品999| 午夜国产精品视频免费体验区| 欧美xx视频| 欧美高清一区二区| 国产午夜精品久久久久久久| 欧美视频一区在线观看| 激情小说另类小说亚洲欧美| 久久精品一本久久99精品| 国产精品video| 久久久久久久尹人综合网亚洲| 亚洲欧美国产日韩天堂区| 欧美在线一二三区| 亚洲免费综合| 欧美黄网免费在线观看| 国色天香一区二区| 亚洲精品免费一二三区| 国产情侣久久| 欧美激情视频在线免费观看 欧美视频免费一| 欧美激情综合五月色丁香小说| 久久色在线观看| av成人免费在线观看| 亚洲午夜小视频| 欧美一级成年大片在线观看| 国产视频一区在线观看一区免费| 欧美日韩在线播放| 欧美一区二区三区在线观看| 国产欧美日韩综合一区在线播放| 亚洲人成毛片在线播放女女| 久久国产日本精品| 欧美精品1区2区| 欧美日韩亚洲系列| 欧美性猛片xxxx免费看久爱| 久久精品久久综合| 亚洲美女av网站| 国产视频一区二区三区在线观看| 亚洲欧美中文日韩在线| 在线看国产一区| 欧美亚洲系列| 久久精品99久久香蕉国产色戒| 欧美久久久久中文字幕| 夜夜狂射影院欧美极品| 久久亚洲综合色一区二区三区| 欧美三级午夜理伦三级中视频| 久久精品国产69国产精品亚洲| 亚洲专区国产精品| 亚洲影视综合| 欧美日韩一区视频| 亚洲美女视频在线免费观看| 亚洲先锋成人| 欧美日韩国产专区| 国产精品青草综合久久久久99| 欧美激情中文字幕在线| 欧美在线|欧美| 欧美日韩在线视频一区| 9人人澡人人爽人人精品| 国产婷婷色一区二区三区在线| 一区久久精品| 在线免费不卡视频| 亚洲午夜三级在线| 国产偷自视频区视频一区二区| 午夜精彩视频在线观看不卡| 国产在线一区二区三区四区| 欧美成人性网| 亚洲第一在线综合在线| 国产精品一区二区在线观看不卡| 一本久久a久久精品亚洲| 看片网站欧美日韩| 激情一区二区三区| 欧美亚男人的天堂| 亚洲国产精品久久久久| 欧美极品一区| 日韩亚洲成人av在线| 欧美一级淫片aaaaaaa视频| 国产精品www994| 亚洲欧洲一区| 亚洲一区二区三区久久| 欧美精选一区| 亚洲第一网站| 午夜精品一区二区三区四区| 国产精品美女久久久| 一区二区三区国产盗摄| 欧美成人a视频| 国产精品日韩欧美| 欧美一二三视频| 亚洲最新视频在线播放| 国产三区精品| 亚洲国产精品久久久久秋霞影院| 国色天香一区二区| 欧美日韩在线不卡| 免费不卡中文字幕视频| 欧美一区二区三区四区在线观看| 在线亚洲一区观看| 国产精品一卡| 国产日产欧美a一级在线| 欧美v国产在线一区二区三区| 狠狠色综合播放一区二区| 日韩网站免费观看| 亚洲一区欧美激情| 亚洲视频每日更新| 亚洲免费观看| 影音先锋日韩精品| 久久久久一区二区三区四区| 国产精品三区www17con| 国产精品国产精品国产专区不蜜| 中国亚洲黄色| 在线观看视频一区二区| 欧美区一区二区三区| 国产日韩专区在线| 韩国在线一区| 在线一区亚洲| 国产亚洲欧美日韩一区二区| 欧美岛国在线观看| 久久久久久尹人网香蕉| 中文在线不卡视频| 国产一区二区三区视频在线观看| 欧美日韩一区二区欧美激情| 久久久久久综合| 久久久.com| 国产伦精品一区二区三区高清| 国产一区二区三区不卡在线观看| 国产精品久久久免费| 一区福利视频| 欧美日韩成人综合在线一区二区| 亚洲色图自拍| 亚洲国产成人91精品| 国产曰批免费观看久久久| 欧美精品精品一区| 欧美在线观看你懂的| 欧美亚洲一区二区在线| 亚洲国产91| 国产亚洲精品aa午夜观看| 欧美专区中文字幕| 久久gogo国模裸体人体| 亚洲人成在线观看网站高清| 亚洲精品久久久久久久久久久| 国产精品久久二区| 一区二区三区日韩在线观看| 久久久精品网| 亚洲观看高清完整版在线观看| 极品尤物一区二区三区| 午夜欧美理论片| 99精品视频免费全部在线| 国产精品爽爽ⅴa在线观看| 狠狠色2019综合网| 欧美日韩一区二区三区高清| 欧美日韩在线综合| 在线观看视频日韩| 国产精品日韩一区二区三区| 亚洲自拍偷拍一区| 国语自产精品视频在线看| 一区二区三区在线视频免费观看| 夜夜嗨av一区二区三区四季av| 久久精品在线观看| 国产欧美精品在线观看| 在线一区亚洲| 影音先锋中文字幕一区| 在线视频你懂得一区二区三区| 亚洲一区日韩在线| 狠狠久久亚洲欧美专区| 久久人91精品久久久久久不卡| 免费亚洲一区二区| 久久国产精品网站| 午夜精品成人在线视频| 中文网丁香综合网| 欧美a级片网站| 一区二区日韩欧美| 亚洲免费观看高清完整版在线观看熊| 国产主播一区二区三区| 国产欧美日韩亚洲精品| 先锋影音久久| 国产一本一道久久香蕉| 国产午夜亚洲精品理论片色戒| 国产欧美一区二区三区国产幕精品| 欧美日韩1区2区3区| 一本色道久久综合精品竹菊| 亚洲精品视频一区二区三区| 国产欧美精品国产国产专区| 国产精品亚洲人在线观看| 亚洲欧洲日本专区| 亚洲精品国产欧美| 欧美成人一区在线| 久久九九99| 麻豆精品在线播放| 亚洲无线视频| 欧美日韩dvd在线观看| 欧美男人的天堂| 久久夜色精品国产噜噜av| 欧美极品一区二区三区| 亚洲精品美女| 亚洲国产精品一区制服丝袜| 久久久久久亚洲综合影院红桃|