【導(dǎo)讀】在芯原AI專題技術(shù)研討會上,芯原高級副總裁、定制芯片平臺事業(yè)部總經(jīng)理汪志偉表示,“大模型”與AIGC對于算力需求正在不斷升級,這既然體現(xiàn)在云端,也體現(xiàn)在邊緣端和終端:云端訓(xùn)練主要側(cè)重于高性能計算、大數(shù)據(jù)分析、海量數(shù)據(jù)存儲,邊緣計算則側(cè)重于推理、實施決策和部分數(shù)據(jù)訓(xùn)練,終端數(shù)據(jù)采集則涵蓋原始數(shù)據(jù)采集、帶AI的智能傳感器、為大模型提供Tokenized的數(shù)據(jù)輸入。要解決這些從“云”到“端”的算力問題,就需要相應(yīng)的硬件、相應(yīng)的芯片。
6月13日,在芯原AI專題技術(shù)研討會上,芯原高級副總裁、定制芯片平臺事業(yè)部總經(jīng)理汪志偉表示,“大模型”與AIGC對于算力需求正在不斷升級,這既然體現(xiàn)在云端,也體現(xiàn)在邊緣端和終端:云端訓(xùn)練主要側(cè)重于高性能計算、大數(shù)據(jù)分析、海量數(shù)據(jù)存儲,邊緣計算則側(cè)重于推理、實施決策和部分數(shù)據(jù)訓(xùn)練,終端數(shù)據(jù)采集則涵蓋原始數(shù)據(jù)采集、帶AI的智能傳感器、為大模型提供Tokenized的數(shù)據(jù)輸入。要解決這些從“云”到“端”的算力問題,就需要相應(yīng)的硬件、相應(yīng)的芯片。
芯原IP業(yè)務(wù)全球市場領(lǐng)先
芯原是一家能提供從IP到芯片設(shè)計、定制芯片一站式服務(wù)的完整解決方案的公司,擁有六大類處理器IP儲備(神經(jīng)網(wǎng)絡(luò)NPU、圖形GPU、視頻VPU、音頻/語音DSP、圖象信號ISP、顯示處理IP)所有的這些處理器IP都會在我們設(shè)計AIGC相關(guān)的芯片里面都會用到。
目前,芯原的IP業(yè)務(wù)已經(jīng)在全球市場處于領(lǐng)先地位,半導(dǎo)體IP收入排名全球第七,License收入排名全球第五。
具體而言,視頻處理器(VCU)市占率排名全球第一,全球前二十大云平臺解決方案提供商中12個采用了芯原的IP;NPU全球累積出貨超1億顆,已被72家客戶用于其128款人工智能芯片中,擁有超過10個市場應(yīng)用領(lǐng)域;GPGPU在全球搭載出貨量接近20億。
汪志偉解析道,這幾年發(fā)展非常好的NPU、GPGPU直接貢獻到了AI機器人大模型所需的算力芯片和算力應(yīng)用上;VPU經(jīng)歷了三年發(fā)展,它既可以進行圖象的“放大、縮小、畫質(zhì)增強”,也可以成為AIGC生成式視頻與圖象的一部分;數(shù)模混這一部分,也支持到從250nm~5nm的不同芯片工藝節(jié)點,而且是在各個不同的方向上都有合作。
豐富的流片經(jīng)驗
為了更好的為AIGC提供IP,就一定需要一個平臺,即芯原的定制芯片服務(wù)平臺。每年該平臺幫助客戶設(shè)計30顆以上的芯片,全球首批7nm EUV芯片在2018年一次流片成功,已有多顆5nm芯片成功量產(chǎn)與流片。
汪志偉強調(diào),芯原在各種先進工藝節(jié)點都有著豐富的流片與量產(chǎn)經(jīng)驗,從28nm~5nm有大量的流片與量產(chǎn)的經(jīng)驗。
持續(xù)迭代的系統(tǒng)級芯片設(shè)計平臺
芯原針對系統(tǒng)級芯片的設(shè)計平臺SiPaaS已經(jīng)迭代很多年,i.MX覆蓋前端到后端。而該平臺為云端設(shè)計的芯片都與AI和AIGC相關(guān)。
“我們的SiPaaS系統(tǒng)設(shè)計平臺經(jīng)過多年不斷演進,每年都有大量芯片基于該平臺進行設(shè)計和流片。由于積累了豐富的技術(shù),可以支持不同處理器架構(gòu)、總線和存儲器。因此,每次設(shè)計新一代芯片時,差距都非常小。這也是為什么我們的一次流片成功率能達到90%以上。”汪志偉表示,芯原從前端設(shè)計入手,近年來已經(jīng)擴展到軟件設(shè)計,并將完整的軟件SDK交付給客戶。
舉例來說,一家全球性芯片大廠利用SiPaaS設(shè)計的轉(zhuǎn)碼芯片,是全球首批5nm高性能轉(zhuǎn)碼芯片之一,目前已經(jīng)應(yīng)用在數(shù)據(jù)中心。該芯片搭載了芯原自己的AI引擎,通過AI解碼后的圖像,可以生成新的圖像和視頻內(nèi)容。
再舉例來說,芯原還為客戶設(shè)計了用于數(shù)據(jù)中心的高算力AIGC芯片,適用于訓(xùn)練和推理,內(nèi)核包括多核高性能CPU和芯原高性能GPGPU-AI IP。由于高性能AIGC芯片需要非常龐大的帶寬,這款芯片還搭載了6400Mhz的HBM3。
為滿足數(shù)據(jù)中心對算力不斷增長的需求,芯原設(shè)計了支持Chiplet互聯(lián)的芯片。它可以通過4~6路接口互聯(lián),將4顆以上的芯片拼接在一起。
汪志偉介紹,芯原為客戶設(shè)計的芯片面積已經(jīng)達到六七百平方毫米,已經(jīng)接近光照極限,很難進一步增大面積,這種情況下Chiplet設(shè)計就是解決算力問題的途徑之一。
芯片需要軟件的支持,因此,芯原提供從IP到芯片再到軟件的一站式完整解決方案。通過這套解決方案,能夠充分發(fā)揮硬件性能的完整軟件協(xié)議棧,從底層到中間層,滿足推理和訓(xùn)練的要求,解決芯片間和板卡間互聯(lián)的通信問題。
通過車規(guī)認證的的設(shè)計流程
汽車是邊緣AIGC重要應(yīng)用場景之一,芯原設(shè)計流程早在兩年前就通過了車規(guī)安全認證,目前已經(jīng)有多個客戶和項目在進行車規(guī)芯片設(shè)計。
芯原設(shè)計的自動駕駛芯片支持300TOPS~500TOPS算力,能夠在車上運行大模型,實現(xiàn)超高算力。需要強調(diào)的是,芯原在設(shè)計階段就完成了基礎(chǔ)軟件的開發(fā),如多目標檢測和自動泊車功能。這樣,當客戶收到芯片后,就可以在一個月內(nèi)使用視覺、AI、傳感器和自動駕駛等車載功能,幫助客戶大大縮短整車的上市時間。
此外,在座艙中,芯原實現(xiàn)了人臉識別、手勢識別和駕駛員狀態(tài)識別等基礎(chǔ)算法和功能,提供基礎(chǔ)算法軟件平臺。對于軟件能力或算法較弱的客戶,這些平臺可以幫助其在基礎(chǔ)上進行優(yōu)化和二次開發(fā),針對自身需求微調(diào)算法或模型。
針對智慧出行應(yīng)用,芯原按照高算力、低功耗、高可靠性要求,設(shè)計開發(fā)所需的平臺化的Chiplet方案及相關(guān)技術(shù),并提供從Chiplet、Die-to-Die接口、封裝到軟件的整體解決方案。
不止如此,早在2022年4月2日,芯原宣布正式加入UCIe(Universal Chiplet Interconnect Express)產(chǎn)業(yè)聯(lián)盟。
作為中國大陸首批加入該組織的企業(yè),芯原將與UCIe產(chǎn)業(yè)聯(lián)盟其他成員共同致力于UCIe版本規(guī)范和新一代UCIe技術(shù)標準的研究與應(yīng)用,為芯原Chiplet技術(shù)和產(chǎn)品的發(fā)展進一步夯實基礎(chǔ)。
為邊緣帶來AIGC
在邊緣計算領(lǐng)域,芯原同樣擁有許多成果。
比如說,客戶設(shè)計的AI-ISP目前已經(jīng)成功流片,并應(yīng)用于國內(nèi)一家手機大廠。該芯片從確定到流片僅用9個月時間。
該AI-ISP芯片帶有AI增強功能,算力強勁,可以輕松運行一般的推理任務(wù),能夠提高手機用戶圖像成像質(zhì)量,獲得更好效果。這也是AIGC的一部分,所有的原始數(shù)據(jù)和通過AI處理的數(shù)據(jù)都可以通過手機上傳到云端,作為云端訓(xùn)練數(shù)據(jù)的一部分。
在端側(cè)比較典型的另一個案例是Open Se Cura項目,這是一個低功耗安全智能傳感芯片,與谷歌合作開發(fā)。
該芯片在端側(cè)幫助大模型采集數(shù)據(jù),適用于智能門鈴、安全攝像頭和智能圖像處理,還可以用于語音和圖像的喚醒功能。芯原進行了許多數(shù)字設(shè)計的最佳實踐,從確定到設(shè)計完成僅用了七個半月的時間。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。
推薦閱讀:
大聯(lián)大汽車技術(shù)應(yīng)用路演重慶場圓滿落幕