【導(dǎo)讀】Achronix 最新基于臺(tái)積電(TSMC)的7nm FinFET工藝的Speedster7t FPGA器件包含了革命性的新型二維片上網(wǎng)絡(luò)(2D NoC)。2D NoC如同在FPGA可編程邏輯結(jié)構(gòu)上運(yùn)行的高速公路網(wǎng)絡(luò)一樣,為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了超高帶寬。
1. 概述
Achronix 最新基于臺(tái)積電(TSMC)的7nm FinFET工藝的Speedster7t FPGA器件包含了革命性的新型二維片上網(wǎng)絡(luò)(2D NoC)。2D NoC如同在FPGA可編程邏輯結(jié)構(gòu)上運(yùn)行的高速公路網(wǎng)絡(luò)一樣,為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了超高帶寬。
如圖1所示。
圖1 Speedster 7t FPGA結(jié)構(gòu)圖
2. 2D NoC給Speedster 7t FPGA帶來(lái)的優(yōu)勢(shì)
日益增長(zhǎng)的數(shù)據(jù)加速需求對(duì)硬件平臺(tái)提出了越來(lái)越高的要求,F(xiàn)PGA作為一種可編程可定制化的高性能硬件發(fā)揮著越來(lái)越重要的作用。 近年來(lái)高端FPGA用了越來(lái)越多的Hard IP去提升FPGA外圍的數(shù)據(jù)傳輸帶寬以及存儲(chǔ)器帶寬。但是在邏輯陣列密度不斷提升的同時(shí),通信性能的提升并沒(méi)有那么明顯,所以FPGA內(nèi)部數(shù)據(jù)的交換越來(lái)越成為數(shù)據(jù)傳輸?shù)钠款i。
Achronix將此挑戰(zhàn)視為一個(gè)開(kāi)發(fā)全新架構(gòu)的機(jī)會(huì),以消除傳統(tǒng)FPGA的設(shè)計(jì)挑戰(zhàn)并提高系統(tǒng)性能。Achronix的解決方案是在傳統(tǒng)FPGA布線結(jié)構(gòu)之上,創(chuàng)新地使用了革命性的二維(2D)高速片上網(wǎng)絡(luò)(NoC)。Speedster7t NoC連接到所有片上高速接口:400G以太網(wǎng)、PCIe Gen5、GDDR6和DDR4 / 5的多個(gè)端口。
3. 2D NoC的性能
Speedster 7t FPGA上的二維片上網(wǎng)絡(luò)(2D NoC)不是由可編程邏輯搭建,而是固化的ASIC邏輯實(shí)現(xiàn),固定運(yùn)行頻率為2GHz,NoC使用一系列高速的行和列網(wǎng)絡(luò)通路在整個(gè)FPGA內(nèi)部分發(fā)數(shù)據(jù),從而在整個(gè)FPGA結(jié)構(gòu)中以水平和垂直方式分發(fā)數(shù)據(jù)流量。NoC中的每一行或每一列都有兩個(gè)256位的、單向的、行業(yè)標(biāo)準(zhǔn)的AXI通道,可以在每個(gè)方向上以512 Gbps(256bit x 2GHz)的傳輸帶寬運(yùn)行??値捀哌_(dá)27Tbps。
圖2 Speedster 7t FPGA NoC 和 接入點(diǎn)NAP
在Speedster 7t的二維片上網(wǎng)絡(luò)中,每個(gè)交叉節(jié)點(diǎn)都有兩個(gè)網(wǎng)絡(luò)接入點(diǎn)(NAP),如圖2所示,一個(gè)是master,一個(gè)是slave。整個(gè)器件總共有160個(gè)這樣的接入點(diǎn),這樣可以保證無(wú)論邏輯放置在器件的任何地方,工具都能找到最近的NAP,使之走上二維片上網(wǎng)絡(luò)。數(shù)據(jù)在二維片上網(wǎng)絡(luò)上傳輸也會(huì)有延遲,數(shù)據(jù)沒(méi)經(jīng)過(guò)一個(gè)網(wǎng)格的長(zhǎng)度,延時(shí)會(huì)增加2~3個(gè)時(shí)鐘周期,也就是1~1.5ns(時(shí)鐘固定為2GHz,所以一個(gè)周期為0.5ns)。
由此可見(jiàn),二維片上網(wǎng)絡(luò)給高端FPGA帶了巨大的性能優(yōu)勢(shì),但是如何高效的利用這種優(yōu)勢(shì)給自己的應(yīng)用帶來(lái)實(shí)質(zhì)性的性能提升至關(guān)重要。
4. 如何更高效地規(guī)劃2D NoC的性能—可視化的NoC性能分析
Achronix在新版ACE工具中提供一個(gè)可視化的NoC性能分析工具,只用導(dǎo)入simulation的log文件就可以直觀的看到在不同的時(shí)間片,NoC上面的帶寬占用情況,以便于設(shè)計(jì)者能更好地規(guī)劃NAP的位置,均衡NoC的帶寬利用,使其工作地更為高效。
工具使用起來(lái)非常簡(jiǎn)單,在ACE工具中點(diǎn)擊
圖標(biāo),就可以進(jìn)入NoC Performance View的頁(yè)面,在這個(gè)頁(yè)面中點(diǎn)擊Browse,導(dǎo)入仿真的log文件。
圖3 導(dǎo)入仿真log文件
在NoC Performance View頁(yè)面的右邊有一個(gè)選項(xiàng)列表,可以顯示不同條件下NoC占用情況。第一個(gè)選項(xiàng)是選擇顯示的協(xié)議,F(xiàn)lit還是AXI。第二個(gè)選項(xiàng)是選擇顯示哪種AXI Type。第三個(gè)選項(xiàng)是選擇顯示模式,Throughput模式還是Blockage模式。
圖4 NoC Performance View選項(xiàng)
在Throughput模式下,綠色代表高吞吐量,淺藍(lán)色代表中等吞吐量,深藍(lán)色代表低吞吐量,如圖5所示。
圖5 NoC Performance View的throughput模式
在Blockage模式下,紅色代表?yè)砣潭茸罡?,黃色代表?yè)砣潭戎械?,綠色代表?yè)砣潭鹊汀H鐖D6所示。
圖5 NoC Performance View的Blockage模式
在圖中用鼠標(biāo)懸停在有顏色的部分,在懸浮的窗口中會(huì)顯示圖中對(duì)應(yīng)的具體的log文件中的信息,包括時(shí)間點(diǎn)以及哪條會(huì)話。
圖6 鼠標(biāo)懸浮顯示
所以通過(guò)NoC Performance View的工具,我們可以很直觀的看到二維片上網(wǎng)絡(luò)的使用情況,哪里利用率比較高,哪里利用率比較低,根據(jù)這個(gè)工具我們可以更容易的為邏輯指定更適合接入點(diǎn)NAP去接入到而且片上網(wǎng)絡(luò),從而使二維片上網(wǎng)絡(luò)更高效的運(yùn)行。
后面我們會(huì)繼續(xù)深入了解Speedster 7t FPGA各種特性,并且會(huì)用一些例子來(lái)說(shuō)明如何更高效的利用這些特性,敬請(qǐng)期待。
參考文獻(xiàn):
1.Achronix網(wǎng)站:www.achronix.com
2.使用帶有片上高速網(wǎng)絡(luò)的FPGA的八大好處(WP020)
(來(lái)源:作者:Achronix高級(jí)應(yīng)用工程師黃侖)
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)電話或者郵箱editor@52solution.com聯(lián)系小編進(jìn)行侵刪。
推薦閱讀:
模擬與混合訊號(hào)設(shè)計(jì)領(lǐng)域仍求才若渴