|
![]() |
大連服務(wù)外包公共培訓(xùn)服務(wù)平臺 |
2023年成為AI芯片發(fā)展的分水嶺。隨著ChatGPT引爆全球AI熱潮,訓(xùn)練和運行大語言模型所需的算力呈指數(shù)級增長,AI芯片市場正以驚人的速度擴張。然而,這個被英偉達長期主導(dǎo)的市場,正在迎來前所未有的挑戰(zhàn)。
谷歌近日發(fā)布了最新一代TPU v5p,其性能比前代提升2倍,專門針對大語言模型訓(xùn)練進行了優(yōu)化。谷歌內(nèi)部已經(jīng)有超過90%的AI訓(xùn)練工作負載運行在自研TPU上。
亞馬遜AWS推出了第二代Trainium芯片,專注于大模型訓(xùn)練,并已經(jīng)開始向客戶提供基于自研芯片的云服務(wù)。數(shù)據(jù)顯示,使用Trainium芯片訓(xùn)練某些AI模型可以降低成本高達50%。
微軟在11月的Ignite大會上宣布了首款自研AI芯片Athena,該芯片采用5nm制程工藝,預(yù)計將于2024年開始在Azure數(shù)據(jù)中心部署。微軟同時還在開發(fā)基于Arm架構(gòu)的服務(wù)器CPU。
特斯拉的Dojo超算平臺已經(jīng)開始運行,該平臺使用特斯拉自研的D1芯片,專注于自動駕駛模型的訓(xùn)練。馬斯克表示,Dojo有望在2024年成為全球最強大的超級計算機之一。
Meta雖然仍在大量采購英偉達GPU,但也在積極推進自研芯片項目。最近流出的消息顯示,Meta正在開發(fā)一款專門用于推理任務(wù)的AI芯片。
在美國出口管制日益嚴格的背景下,中國科技企業(yè)正在加快國產(chǎn)AI芯片的研發(fā)和應(yīng)用:
華為昇騰910B芯片已成為國內(nèi)多數(shù)大模型企業(yè)的首選,其性能達到英偉達A100的80%左右,目前已經(jīng)供不應(yīng)求。華為正在擴大產(chǎn)能以滿足市場需求。
寒武紀思元590芯片采用7nm工藝,在部分推理場景表現(xiàn)接近國際先進水平。該公司最近獲得了來自多家互聯(lián)網(wǎng)企業(yè)的訂單。
壁仞科技BR100系列芯片在浮點運算性能上實現(xiàn)了突破,雖然制造工藝受到限制,但通過架構(gòu)創(chuàng)新仍實現(xiàn)了可觀的性能提升。
阿里巴巴平頭哥推出的含光800芯片已經(jīng)在阿里云上大規(guī)模部署,主要用于AI推理任務(wù)。最新消息顯示,下一代含光900正在研發(fā)中。
百度昆侖芯已經(jīng)發(fā)展到第二代,在百度文心大模型的訓(xùn)練和推理中都發(fā)揮著重要作用。百度計劃將昆侖芯推向更廣闊的市場。
*版權(quán)聲明:轉(zhuǎn)載文章和圖片均來自公開網(wǎng)絡(luò),版權(quán)歸作者本人所有,推送文章除非無法確認,都會注明作者和來源。如出處有誤或侵犯到原作者權(quán)益,請與我們聯(lián)系刪除或授權(quán)事宜,感謝原作者。