無芯片不AI,芯片是支撐人工智能的基礎。2019年,云端AI芯片迎來亞馬遜、高通、阿里巴巴、Facebook等新玩家,軟硬一體化趨勢加強;終端芯片功耗比競爭加強,語音芯片持續(xù)火熱;邊緣AI芯片勢頭初現(xiàn)。2020年,AI芯片將逐漸進入洗牌期,機遇與挑戰(zhàn)并存。

邊緣AI芯片進入搶灘戰(zhàn)

AI正在從云端向邊緣端擴展,邊緣計算被視為人工智能的下一個戰(zhàn)場。寒武紀副總裁劉道福表示,在邊緣計算種類中,邊緣往往和各類傳感器相連,而傳感器的數(shù)據(jù)往往是非結構化的,很難直接用于控制和決策,因此需要邊緣人工智能計算將非結構化的數(shù)據(jù)結構化,從而用于控制和決策。

2019年,圍繞邊緣AI芯片的搶灘布局已經(jīng)開始。一方面,英偉達、寒武紀、百度等已經(jīng)在云、端有所積累的廠商,希望以邊緣芯片完善云、邊、端生態(tài),打造一體化的計算格局。英偉達發(fā)布了面向嵌入式物聯(lián)網(wǎng)的邊緣計算設備Jetson Nano,適用于入門級網(wǎng)絡硬盤錄像機、家用機器人以及具備全面分析功能的智能網(wǎng)關等應用,之后又發(fā)布了邊緣AI超級計算機Jetson Xavier NX,能夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能。寒武紀發(fā)布用于深度學習的SoC邊緣加速芯片思元220,采用臺積電16nm工藝,最大算力32TOPS(INT4),功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯(lián)合三大運營商、中興、愛立信、英特爾等,發(fā)起百度 AI 邊緣計算行動計劃,旨在利用 AI 推理、函數(shù)計算、大數(shù)據(jù)處理和產(chǎn)業(yè)模型訓練推動 AI 場景在邊緣計算的算力支撐和平臺支持。

另一方面,自動駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量產(chǎn)國內(nèi)首款車規(guī)級AI芯片“征程二代”,采用臺積電28nm工藝,可提供超過4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務模式下可以同時運行超過60個分類任務,每秒鐘識別目標數(shù)超過2000個,面向車聯(lián)網(wǎng)對強實時響應的需求。

多個新玩家入局云端

云端仍然是AI芯片的主要戰(zhàn)場。2019年,云端芯片迎來多個新玩家,算力大戰(zhàn)持續(xù)升級。高通推出了面向數(shù)據(jù)中心推理計算的云端AI芯片Cloud AI 100,峰值性能超過350 TOPS,與其他商用方案相比每瓦特性能提升10倍。云服務領跑者亞馬遜推出了機器學習推理芯片AWS Inferentia,最高算力為128 TOPS,在AI推理實例inf1可搭載16個Inferentia芯片,提供最高2000TOPS算力。阿里巴巴推出號稱全球最高性能AI推理芯片含光800,采用自研芯片架構和達摩院算法,在Resnet50基準測試中獲得單芯片性能第一。騰訊投資的燧原科技發(fā)布了面向云端數(shù)據(jù)中心的AI加速卡云燧 T10,單卡單精度算力達到20TFLOPS,支持單精度FP32和半精度BF16的混合精度計算,并為大中小型數(shù)據(jù)中心提供了單節(jié)點、單機柜、集群三種模式,在集群模式下通過片間互聯(lián)實現(xiàn)1024節(jié)點集群。

芯片是AI的載體,而軟件是完成智能操作的核心。隨著異構計算逐漸導入AI芯片,軟硬件協(xié)同成為云端AI的重要趨勢。英特爾推出了面向異構計算的統(tǒng)一軟件平臺One API,以隱藏硬件復雜性,根據(jù)系統(tǒng)和硬件自動適配功耗最低、性能最佳的加速方式,簡化并優(yōu)化編程過程。賽靈思也推出了軟件平臺Vitis AI,向用戶開放易于訪問的軟件接口,可根據(jù)軟件或算法自動適配賽靈思硬件架構。

功耗比仍是終端側重點

在終端側,功耗比仍然是角逐焦點。尤其在手機等對于續(xù)航能力錙銖必較的終端,主力廠商推出的AI引擎都對低功耗有所強調(diào)。麒麟990 5G的NPU采用雙大核+微核的方式,大核負責性能,微核擁有超低功耗。據(jù)介紹,微核在人臉檢測的應用場景下,能耗比大核工作降低24倍。高通發(fā)布的驍龍865集成了傳感器中樞,讓終端能夠以極低功耗感知周圍情境。三星提出通過較低功耗的NPU實現(xiàn)終端設備上的AI處理,實現(xiàn)在設備端直接執(zhí)行更復雜的任務。

除了手機,終端側的另一個當紅炸子雞是AI語音芯片??拼笥嶏w、阿里巴巴、探境科技、清微智能等都發(fā)布了針對智能家居的AI語音芯片,反映了AI芯片在特定領域的專業(yè)化、定制化趨勢。阿里達摩院公布了首款專用于語音合成算法的 AI FPGA芯片技術Ouroboros,使用了端上定制硬件加速技術,降低對云端網(wǎng)絡的依賴,支持實時語音合成和AI語音識別,有望在天貓精靈搭載。

2020機遇挑戰(zhàn)并存

2019-2021年,中國AI芯片市場規(guī)模仍將保持50%以上的增長速度,到2021年,市場規(guī)模將達到305.7億元。賽迪智庫預測,2019-2021年,云端訓練芯片增速放緩,云端推理芯片、終端推理芯片市場增長速度將持續(xù)呈上升趨勢。預計2021年,中國云端訓練芯片市場規(guī)模將達到139.3億元,云端推理芯片市場規(guī)模將達到82.2億元,終端推理芯片達到84.1億元。

集邦咨詢分析師姚嘉洋向記者指出,2019年,AI芯片大致已經(jīng)走出一條較為清晰的道路,端、邊、云的芯片規(guī)格相對明確。2020年,各大芯片廠會延續(xù)在2019年的產(chǎn)品發(fā)展路徑,持續(xù)深化芯片的性價比及功耗比表現(xiàn)。從訓練端來看,值得關注的是HBM(高頻寬存儲器)的整合與相關的封裝技術良率,這會牽動芯片廠商與存儲器及封測廠商之間合作關系的變化。推理端的決戰(zhàn)點在INT8領域,重點在于如何進一步提升芯片本身的性能及功耗表現(xiàn)。

5G、VR/AR等新技術,也將為AI芯片,尤其是邊緣側的AI芯片提供更多的發(fā)揮空間。Arm ML事業(yè)群商業(yè)與營銷副總裁Dennis Laudick曾向記者表示,5G通信技術改變了數(shù)據(jù)處理的方式,讓邊緣AI的工作負載也有了處理需求??梢哉f,5G帶來了網(wǎng)絡邊緣的更多創(chuàng)新。姚嘉洋也表示,AI在5G核心網(wǎng)絡存在機會,由于5G帶來了更多元的頻譜組合,AI可以輔助核心網(wǎng)絡更有效地調(diào)度網(wǎng)絡資源,將頻寬資源的利用達到極大化。同時,5G也涵蓋車聯(lián)網(wǎng),AI將在自動駕駛將大有機會。在VR/AR端,AI也在導入,主要聚焦在人眼追蹤或是場景識別等應用,有望改善VR/AR的流暢度與實時性表現(xiàn)。

清華大學微電子所所長魏少軍表示,從產(chǎn)業(yè)發(fā)展規(guī)律來看,在2019-2020年,AI芯片將持續(xù)火熱,企業(yè)扎堆進入;但是到了2020年前后,則將會出現(xiàn)一批出局者,行業(yè)洗牌開始。由于目前AI算法還在不斷演進匯總的過程中,最終的成功與否則將取決于各家技術路徑的選擇和產(chǎn)品落地的速度。

痛點尚待攻克

近兩年,AI在語音識別、圖像識別等應用領域取得突破,但要從單點突破走向全面開花,需要AI領域誕生如同CPU一樣的通用AI計算芯片。清華大學微納電子系副教授尹首一等專家指出,AI芯片短期內(nèi)以異構計算為主,中期要發(fā)展自重構、自學習、自適應,長期則朝向通用計算芯片發(fā)展。

具體來說,AI要從應用適應硬件走向硬件適應應用,就要求AI芯片具備可編程性、動態(tài)可變的計算架構,來應對層出不窮的新算法和新應用。魏少軍表示,AI芯片一要適應算法的演進,二要有適應所有應用的架構,這就要求架構具備高效的轉化能力。在成本敏感的消費電子領域,還需關注AI芯片的計算效能,達到低功耗、小體積、開發(fā)簡易,這些都需要探索架構上的創(chuàng)新。

全球AI芯片產(chǎn)業(yè)仍處于產(chǎn)業(yè)化早期階段,國產(chǎn)處理器廠商與國際廠商在人工智能這一全新賽場上處在同一起跑線。耐能創(chuàng)始人兼CEO 劉峻誠表示,中國擁有龐大的智能手機、智能家居、智能安防等市場,對中國的AI公司而言,不僅在服務國內(nèi)客戶時具有本土化的優(yōu)勢,還可借助這些客戶的生產(chǎn)制造優(yōu)勢進軍海外市場,實現(xiàn)“立足中國,放眼全球”的商業(yè)布局。