寒武紀科創(chuàng)板新進展,AI芯片第一股將至

寒武紀科創(chuàng)板新進展,AI芯片第一股將至

6月23日,媒體報道,證監(jiān)會宣布同意寒武紀科創(chuàng)板首次公開發(fā)行股票注冊,科創(chuàng)板將迎來國內(nèi)首家人工智能芯片領(lǐng)域龍頭公司。

資料顯示,寒武紀成立于2016年3月,注冊資本3.6億元,公司主業(yè)為應用于各類云服務器、邊緣計算設(shè)備、終端設(shè)備中人工智能核心芯片的研發(fā)、設(shè)計和銷售,主要產(chǎn)品包括終端智能處理器IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡以及與上述產(chǎn)品配套的基礎(chǔ)系統(tǒng)軟件平臺。

產(chǎn)品方面,寒武紀先后推出了用于終端場景的寒武紀1A、寒武紀1H、寒武紀1M系列芯片,基于思元100和思元270芯片的云端智能加速卡系列產(chǎn)品以及基于思元220芯片的邊緣智能加速卡等產(chǎn)品。

客戶方面,雖然成立不久,但寒武紀已為華為海思、紫光展銳、晨星(MStar)/星宸半導體等多家公司的SoC芯片和智能終端提供智能處理器IP。

招股書顯示,寒武紀此次IPO計劃融資28.01億元,將投入到新一代云端訓練芯片及系統(tǒng)、新一代云端推理芯片及系統(tǒng)、新一代邊緣人工智能芯片及系統(tǒng)、補充流動資金4個項目中。

接受上市輔導 AI芯片企業(yè)寒武紀開啟科創(chuàng)板IPO征程

接受上市輔導 AI芯片企業(yè)寒武紀開啟科創(chuàng)板IPO征程

日前,中國證監(jiān)會北京監(jiān)管局披露了中信證券關(guān)于中科寒武紀科技股份有限公司(以下簡稱“寒武紀”)首次公開發(fā)行股票并科創(chuàng)板上市之輔導基本情況表。信息顯示,寒武紀與中信證券于2019年12月5日簽署關(guān)于首次公開發(fā)行A股股票之輔導協(xié)議。

根據(jù)輔導備案信息,此次輔導目的包括促進公司建立良好的公司治理結(jié)構(gòu),形成獨立運營和持續(xù)發(fā)展的能力,督促寒武紀的董事、監(jiān)事、高級管理人員及持股5%以上(含5%)股東和實際控制人(或其法定代表人)全面理解境內(nèi)發(fā)行上市的有關(guān)法律法規(guī)、境內(nèi)證券市場規(guī)范運作和信息披露的要求,樹立進入證券市場的誠信意識、法制意識,具備進入證券市場的基本條件;同時促進輔導機構(gòu)履行勤勉盡責義務。

資料顯示,寒武紀成立于2016年3月,注冊資本3.6億元,其團隊來源于中科院計算所,主要聚焦端云一體、端云融合的智能新生態(tài),致力打造各類智能云服務器、智能終端以及智能機器人的核心處理器芯片,并為用戶提供IP授權(quán)、芯片服務、智能子卡和智能平臺等服務。

雖成立不久,但寒武紀已為華為海思、紫光展銳、晨星(MStar)/星宸半導體等多家公司的SoC芯片和智能終端提供智能處理器IP,此前華為麒麟970芯片和麒麟980芯片均采用了寒武紀的NPU(神經(jīng)網(wǎng)絡單元),而這兩款芯片已搭載于華為多款旗艦手機上。

在產(chǎn)品方面,寒武紀于2016年推出了首款AI處理器;2018年,寒武紀推出思元100(MLU100)機器學習處理器芯片;2019年6月,寒武紀推出云端AI芯片中文品牌“思元”、第二代云端AI芯片思元270(MLU270)及板卡產(chǎn)品;2019年11月,寒武紀發(fā)布邊緣AI系列產(chǎn)品思元220(MLU220)芯片及模組產(chǎn)品。

近年來,人工智能在國內(nèi)掀起投資熱潮,作為人工智能芯片領(lǐng)域的獨角獸,寒武紀在資本市場上頗受青睞。工商資料顯示,寒武紀此前已進行了多輪融資,投資方包括中科院、阿里巴巴、聯(lián)想創(chuàng)投、科大訊飛、國投創(chuàng)業(yè)等一眾明星資本。

2016年4月,寒武紀獲得來自中科院的數(shù)千萬元天使輪融資;2016年8月,寒武紀獲得來自元禾原點、科大訊飛、涌鏵投資的Pre-A輪融資;2017年8月,寒武紀完成1億美元A輪融資,投資方包括聯(lián)想創(chuàng)投、阿里巴巴創(chuàng)投、國投創(chuàng)業(yè),國科投資、中科圖靈、元禾原點、涌鏵投資。2018年6月,寒武紀完成由中國國有資本風險投資基金、國新啟迪、國投創(chuàng)業(yè)、國新資本聯(lián)合領(lǐng)投的數(shù)億美元B輪融資;2019年,寒武紀亦完成了股權(quán)融資,注冊資本多次擴增。

隨著5G時代到來,人工智能的應用將有望走向新階段,而人工智能芯片作為基石與核心,亦將迎來新一輪發(fā)展,登陸資本市場有利于寒武紀持續(xù)大規(guī)模投入研發(fā),科創(chuàng)板為其提供了一個好機會。如今,寒武紀已進行上市輔導,正式踏上了IPO之路,但最終能否結(jié)果如何則有待后續(xù)觀察。

接受上市輔導 寒武紀擬登陸科創(chuàng)板

接受上市輔導 寒武紀擬登陸科創(chuàng)板

人工智能芯片巨頭中科寒武紀科技股份有限公司(以下簡稱“寒武紀”)向科創(chuàng)板發(fā)起沖擊。北京證監(jiān)局官網(wǎng)2月28日晚間披露的信息顯示,中信證券與寒武紀在2019年12月5日簽署輔導協(xié)議,寒武紀計劃在科創(chuàng)板上市。

具體來看,中信證券和寒武紀于2019年12月5日簽署《中科寒武紀科技股份有限公司與中信證券股份有限公司關(guān)于首次公開發(fā)行A股股票之輔導協(xié)議》。

通報信息顯示,寒武紀擬在科創(chuàng)板上市。此次中信證券對其進行上市輔導目的在于促進寒武紀建立良好的公司治理結(jié)構(gòu),形成獨立運營和持續(xù)發(fā)展的能力,督促寒武紀的董事、監(jiān)事、高級管理人員及持股5%以上(含5%)股東和實際控制人(或其法定代表人)全面理解境內(nèi)發(fā)行上市的有關(guān)法律法規(guī)、境內(nèi)證券市場規(guī)范運作和信息披露的要求,樹立進入證券市場的誠信意識、法制意識,具備進入證券市場的基本條件。同時,促進輔導機構(gòu)履行勤勉盡責義務。

公開資料顯示,寒武紀成立于2016年,是聚焦端云一體、端云融合的智能新生態(tài),致力打造各類智能云服務器、智能終端以及智能機器人核心處理器芯片的AI芯片領(lǐng)域獨角獸。寒武紀與中國電信、中興通訊等均有合作。

“未來之芯” IC PARK 年產(chǎn)值已突破240億元

“未來之芯” IC PARK 年產(chǎn)值已突破240億元

剛滿周歲,“未來之芯”IC PARK 年產(chǎn)值已突破240億元5G與AI的齊頭并進,使得中國集成電路在制造、封測、設(shè)計領(lǐng)域迎來了前所未有的發(fā)展機遇。

5G芯片市場上演了一出“強強爭霸”的大戲。

2019年的12月5日,高通推出了全新處理器“驍龍865”和“驍龍765/765G”。就在同一天,華為發(fā)布已經(jīng)搭載了麒麟990芯片的最新款5G手機nova6。再早些時候,聯(lián)發(fā)科舉行5G方案發(fā)布會,在中國正式推出“天璣1000”,三星Exynos 980也于2019年9月問世。一場5G二代芯片的競技正式拉開帷幕。

5G芯片行業(yè)鏖戰(zhàn)未消,AI技術(shù)也開始走向商業(yè)化階段,中國芯片產(chǎn)業(yè)正處在一個高速發(fā)展的時期。各方面利好不斷,以中關(guān)村集成電路設(shè)計園(IC PARK)為代表的各地集成電路產(chǎn)業(yè)園區(qū)也日漸成熟,讓業(yè)界對芯片產(chǎn)業(yè)的未來十分看好。

IC和AI正在引發(fā)一場深刻變革

被譽為現(xiàn)代工業(yè)“糧食”的芯片,一定程度上也被視為國家科技創(chuàng)新能力的體現(xiàn)。直到最近幾年,以華為、中興為首的中國科技企業(yè)才開始嶄露頭角。

“5G是三十年一遇的大變化,很多產(chǎn)業(yè)和模式將被顛覆。”中國移動前董事長王建宙曾在公開場合這樣表示。從諾基亞,到摩托羅拉,無數(shù)事實證明,每一代通信技術(shù)的更迭,都伴隨著手機品牌和芯片廠商的洗牌。

行業(yè)從來不缺乏掉隊者,受制于技術(shù)與市場等諸多因素,目前全球能夠參與5G芯片競爭的也只有高通、三星、華為、聯(lián)發(fā)科以及展銳。

行業(yè)也從不缺乏后繼者,國內(nèi)一國產(chǎn)手機廠商負責人曾表示:“如果想要做更好的產(chǎn)品,芯片自研是一條必經(jīng)之路,雖然投資巨大,但在行業(yè)內(nèi),逐漸成為共識?!蹦壳埃ㄌO果、三星、華為、小米、OPPO和vivo在內(nèi)的手機廠商都在芯片層面或早或晚開始了投資。

“新陳代謝”正在行業(yè)的各個層面悄無聲息地進行著,在市場巨大潛力的推動下,誰都有可能成為下一個科技巨頭。

在5G芯片行業(yè)之外,一場人工智能的變革也正在醞釀著。經(jīng)過幾年的發(fā)酵,中國的AI技術(shù)已經(jīng)取得了巨大的進步。

技術(shù)的進步帶來市場的增長,到2020年我國人工智能產(chǎn)業(yè)規(guī)模有望突破1600億元,帶動相關(guān)產(chǎn)業(yè)突破1萬億元。

5G與AI的齊頭并進,使得中國集成電路的技術(shù)和市場均保持良好的發(fā)展態(tài)勢。IC PARK也給自己定下了“打造世界一流的集成電路設(shè)計產(chǎn)業(yè)園區(qū)”的目標,進一步優(yōu)化營商環(huán)境,提高園區(qū)綜合服務能力,增強對高端企業(yè)和項目吸引力。

理性投資,全面發(fā)展

在前不久的一場智能大會上,李開復如此說到:“AI行業(yè)正在回歸理性,這是一個退潮知道誰在裸泳的時刻,需要回歸商業(yè)本質(zhì)?!彼嘎?,AI作為最火的投資領(lǐng)域,曾有過許多不理性的投資,導致一些企業(yè)被過高估值。而到了2019年,上市則成為了他們無法越過的大山。

但回歸理性,并不意味著市場冷卻,事實上,更多的優(yōu)質(zhì)融投資正在改變AI行業(yè)的現(xiàn)狀。

AI行業(yè)白皮書顯示,2019年,產(chǎn)業(yè)資本和企業(yè)投資正在快速跟進。同時,AI技術(shù)與傳統(tǒng)行業(yè)進一步產(chǎn)生了實質(zhì)性融合,得益于聊天機器人和智能對話終端應用的大規(guī)模落地,企業(yè)級、消費級對話式人工智能平臺市場驅(qū)動了整個人工智能軟件市場的發(fā)展。

資金實力強勁的互聯(lián)網(wǎng)巨頭也加強了AI產(chǎn)業(yè)的戰(zhàn)略布局。阿里巴巴重點布局安防和基礎(chǔ)組件,投資了商湯、曠視和寒武紀科技等;騰訊投資的重點主要集中在智慧健康、教育、智慧汽車等領(lǐng)域,代表性的公司包括蔚來汽車、碳云智慧等企業(yè);百度投資的重點主要在汽車、零售和智慧家居等領(lǐng)域。

一場關(guān)乎未來的投資之戰(zhàn)正在上演,而這也表明,我國人工智能已進入商業(yè)化階段。

行業(yè)的跨越性發(fā)展,使得市場對人才的需求劇增。根據(jù)《中國集成電路產(chǎn)業(yè)人才白皮書(2018-2019年版)》,到2020年前后,我國集成電路行業(yè)人才需求規(guī)模約為72萬人左右,而我國現(xiàn)有人才存量46萬人,人才缺口將達到26萬人。城市之間,圍繞著人才的爭奪未曾停歇,各地紛紛出臺人才政策,一個個激勵I(lǐng)C創(chuàng)新研發(fā)的項目也在高校落地。

在區(qū)域產(chǎn)業(yè)聚集方面,中國集成電路已經(jīng)形成上海為中心的長三角、北京為中心的環(huán)渤海、深圳為中心的泛珠三角以及武漢、西安、成都為代表的中西部四個各具特色的產(chǎn)業(yè)集聚區(qū);北京、上海、合肥等數(shù)十個城市已建或者準備建設(shè)集成電路產(chǎn)業(yè)園。

IC PARK位于北京市海淀區(qū),是一所建筑面積近22萬平方米的IC設(shè)計產(chǎn)業(yè)園,正在以超越行業(yè)整體發(fā)展的速度,成為全國領(lǐng)先的園區(qū)范本,也為行業(yè)提供了諸多值得借鑒的經(jīng)驗。

被點贊的IC PARK ,如何做到了行業(yè)領(lǐng)先

好的園區(qū)要有頭部企業(yè),產(chǎn)生聚集效應;要有優(yōu)秀設(shè)計人才,打造人才聚集高地;要有政策支持,扶持引導戰(zhàn)略性產(chǎn)業(yè)發(fā)展;要有貼心服務,培養(yǎng)優(yōu)秀的運營服務團隊,用好公共科技創(chuàng)新服務平臺。

政策、企業(yè)、人才、服務四個方面,也正是IC PAKR的優(yōu)勢所在。

經(jīng)濟學家馬光遠曾表示:“在下一個十年,海淀最有前景的地方就是海淀北部新區(qū),北京科技創(chuàng)新的新增長點以及中關(guān)村未來的新發(fā)展就在海淀北部新區(qū)。”

依托于海淀北部新區(qū)的IC PARK,是北京“三城一區(qū)”的發(fā)展戰(zhàn)略中,中關(guān)村科學城的核心之一,享受首都扶持創(chuàng)新產(chǎn)業(yè)和引進創(chuàng)新人才的政策優(yōu)惠,入駐園區(qū)的企業(yè)在稅收方面,可以兩年免征,三至五年按25%的法定稅率減半征收企業(yè)所得稅。

不僅如此,這里還匯聚了清華大學、北京大學、中國人民大學等一批高精尖科研院校,是中國人才最扎堆的區(qū)域。

ICPARK董事長苗軍曾總結(jié)到:“IC PARK最大的優(yōu)勢其實也是北京的優(yōu)勢,那就是人才、技術(shù)、項目、資本密集。”

在園區(qū)的服務上,IC PARK構(gòu)建了“一平臺三節(jié)點”產(chǎn)業(yè)服務體系。一平臺指線上線下相結(jié)合的一站式企業(yè)服務平臺,構(gòu)建面向企業(yè)全生命周期的全方位、全過程服務價值鏈,其中的“三個節(jié)點”指的是投融資節(jié)點、孵化節(jié)點和人才節(jié)點。

近日,IC PARK主導的集成電路產(chǎn)業(yè)基金——芯創(chuàng)基金正式成立。這標志IC PARK以芯創(chuàng)基金為主導,“科技金融+認股權(quán)池+基金投資”的全生命周期的投融資體系已經(jīng)形成。IC PARK成立的認股權(quán)池,與進駐園區(qū)企業(yè)簽署認股權(quán)協(xié)議,在企業(yè)的增資擴股中,園區(qū)享有認股權(quán),助力企業(yè)發(fā)展。

據(jù)了解,芯創(chuàng)基金總投資規(guī)模達15億元,重點關(guān)注5G、云計算、汽車電子和AIOT等領(lǐng)域的投資。在2019年,芯創(chuàng)基金接收企業(yè)商業(yè)計劃書300余個,調(diào)研對接企業(yè)150余家,儲備項目40余個,立項5個,實現(xiàn)當年成立當年投資。2020年還將持續(xù)聚焦集成電路行業(yè),預計投資額1.2億左右。

在孵化方面,為了扶持中小型、創(chuàng)業(yè)公司的發(fā)展,IC PARK設(shè)立了3000平米孵化器“芯創(chuàng)空間”,以供小型的IC設(shè)計企業(yè)在園區(qū)進行獨立研發(fā)或與園區(qū)內(nèi)的大公司展開合作,還配有導師團隊輔導創(chuàng)業(yè)者。

在人才方面,IC PARK聯(lián)合七所在京示范性微電子學院和北京半導體行業(yè)協(xié)會、賽迪智庫、中關(guān)村芯園、安博教育、摩爾精英共同發(fā)起成立中關(guān)村芯學院,園區(qū)與龍頭企業(yè)共同發(fā)起成立人才產(chǎn)業(yè)化聯(lián)盟,充分利用海淀區(qū)的人才資源,搭建起高校與企業(yè)人才培養(yǎng)和成果轉(zhuǎn)化的橋梁,通過培養(yǎng)集成電路領(lǐng)域的復合型人才,助力“芯火”雙創(chuàng)平臺的建設(shè)與實施,緩解集成電路人才痛點問題。

芯片產(chǎn)業(yè)最關(guān)鍵的是產(chǎn)業(yè)鏈建設(shè),在這方面,以龍頭企業(yè)為引領(lǐng)、中小微創(chuàng)企業(yè)為補充,吸引了比特大陸、兆易創(chuàng)新、兆芯等數(shù)十家頭部企業(yè)進駐,匯聚芯片企業(yè)50多家,產(chǎn)業(yè)組織模式日益成熟,產(chǎn)業(yè)配套也日益完善。

向來重視文化、生活配套的IC PARK,還在載體空間以及服務手段上進行了革新與創(chuàng)造。園區(qū)內(nèi)配置了北京市唯一一家2000平方米的專業(yè)集成電路科技館、建筑面積4200平方米的配套圖書館、2400平方米的IC國際會議中心,以及能夠滿足IC精英品質(zhì)生活需求的兩萬平米的商業(yè)街區(qū)……足不出園,入駐人員的大部分商務、生活、交流需求都可以被滿足。不設(shè)圍墻的開放式空間布局,也惠及周邊企業(yè)和居民。

如今,開園剛滿周年的IC PARK,IC設(shè)計企業(yè)的年產(chǎn)值已經(jīng)達到240億元,占據(jù)全市集成電路設(shè)計領(lǐng)域產(chǎn)值的42%,創(chuàng)造稅收40億元,企業(yè)研發(fā)投入5億元,專利數(shù)也達到了6068項,成為了一顆“未來之芯”。

AI芯片怎么就進入了洗牌期?

AI芯片怎么就進入了洗牌期?

無芯片不AI,芯片是支撐人工智能的基礎(chǔ)。2019年,云端AI芯片迎來亞馬遜、高通、阿里巴巴、Facebook等新玩家,軟硬一體化趨勢加強;終端芯片功耗比競爭加強,語音芯片持續(xù)火熱;邊緣AI芯片勢頭初現(xiàn)。2020年,AI芯片將逐漸進入洗牌期,機遇與挑戰(zhàn)并存。

邊緣AI芯片進入搶灘戰(zhàn)

AI正在從云端向邊緣端擴展,邊緣計算被視為人工智能的下一個戰(zhàn)場。寒武紀副總裁劉道福表示,在邊緣計算種類中,邊緣往往和各類傳感器相連,而傳感器的數(shù)據(jù)往往是非結(jié)構(gòu)化的,很難直接用于控制和決策,因此需要邊緣人工智能計算將非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,從而用于控制和決策。

2019年,圍繞邊緣AI芯片的搶灘布局已經(jīng)開始。一方面,英偉達、寒武紀、百度等已經(jīng)在云、端有所積累的廠商,希望以邊緣芯片完善云、邊、端生態(tài),打造一體化的計算格局。英偉達發(fā)布了面向嵌入式物聯(lián)網(wǎng)的邊緣計算設(shè)備Jetson Nano,適用于入門級網(wǎng)絡硬盤錄像機、家用機器人以及具備全面分析功能的智能網(wǎng)關(guān)等應用,之后又發(fā)布了邊緣AI超級計算機Jetson Xavier NX,能夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能。寒武紀發(fā)布用于深度學習的SoC邊緣加速芯片思元220,采用臺積電16nm工藝,最大算力32TOPS(INT4),功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯(lián)合三大運營商、中興、愛立信、英特爾等,發(fā)起百度 AI 邊緣計算行動計劃,旨在利用 AI 推理、函數(shù)計算、大數(shù)據(jù)處理和產(chǎn)業(yè)模型訓練推動 AI 場景在邊緣計算的算力支撐和平臺支持。

另一方面,自動駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量產(chǎn)國內(nèi)首款車規(guī)級AI芯片“征程二代”,采用臺積電28nm工藝,可提供超過4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務模式下可以同時運行超過60個分類任務,每秒鐘識別目標數(shù)超過2000個,面向車聯(lián)網(wǎng)對強實時響應的需求。

多個新玩家入局云端

云端仍然是AI芯片的主要戰(zhàn)場。2019年,云端芯片迎來多個新玩家,算力大戰(zhàn)持續(xù)升級。高通推出了面向數(shù)據(jù)中心推理計算的云端AI芯片Cloud AI 100,峰值性能超過350 TOPS,與其他商用方案相比每瓦特性能提升10倍。云服務領(lǐng)跑者亞馬遜推出了機器學習推理芯片AWS Inferentia,最高算力為128 TOPS,在AI推理實例inf1可搭載16個Inferentia芯片,提供最高2000TOPS算力。阿里巴巴推出號稱全球最高性能AI推理芯片含光800,采用自研芯片架構(gòu)和達摩院算法,在Resnet50基準測試中獲得單芯片性能第一。騰訊投資的燧原科技發(fā)布了面向云端數(shù)據(jù)中心的AI加速卡云燧 T10,單卡單精度算力達到20TFLOPS,支持單精度FP32和半精度BF16的混合精度計算,并為大中小型數(shù)據(jù)中心提供了單節(jié)點、單機柜、集群三種模式,在集群模式下通過片間互聯(lián)實現(xiàn)1024節(jié)點集群。

芯片是AI的載體,而軟件是完成智能操作的核心。隨著異構(gòu)計算逐漸導入AI芯片,軟硬件協(xié)同成為云端AI的重要趨勢。英特爾推出了面向異構(gòu)計算的統(tǒng)一軟件平臺One API,以隱藏硬件復雜性,根據(jù)系統(tǒng)和硬件自動適配功耗最低、性能最佳的加速方式,簡化并優(yōu)化編程過程。賽靈思也推出了軟件平臺Vitis AI,向用戶開放易于訪問的軟件接口,可根據(jù)軟件或算法自動適配賽靈思硬件架構(gòu)。

功耗比仍是終端側(cè)重點

在終端側(cè),功耗比仍然是角逐焦點。尤其在手機等對于續(xù)航能力錙銖必較的終端,主力廠商推出的AI引擎都對低功耗有所強調(diào)。麒麟990 5G的NPU采用雙大核+微核的方式,大核負責性能,微核擁有超低功耗。據(jù)介紹,微核在人臉檢測的應用場景下,能耗比大核工作降低24倍。高通發(fā)布的驍龍865集成了傳感器中樞,讓終端能夠以極低功耗感知周圍情境。三星提出通過較低功耗的NPU實現(xiàn)終端設(shè)備上的AI處理,實現(xiàn)在設(shè)備端直接執(zhí)行更復雜的任務。

除了手機,終端側(cè)的另一個當紅炸子雞是AI語音芯片??拼笥嶏w、阿里巴巴、探境科技、清微智能等都發(fā)布了針對智能家居的AI語音芯片,反映了AI芯片在特定領(lǐng)域的專業(yè)化、定制化趨勢。阿里達摩院公布了首款專用于語音合成算法的 AI FPGA芯片技術(shù)Ouroboros,使用了端上定制硬件加速技術(shù),降低對云端網(wǎng)絡的依賴,支持實時語音合成和AI語音識別,有望在天貓精靈搭載。

2020機遇挑戰(zhàn)并存

2019-2021年,中國AI芯片市場規(guī)模仍將保持50%以上的增長速度,到2021年,市場規(guī)模將達到305.7億元。賽迪智庫預測,2019-2021年,云端訓練芯片增速放緩,云端推理芯片、終端推理芯片市場增長速度將持續(xù)呈上升趨勢。預計2021年,中國云端訓練芯片市場規(guī)模將達到139.3億元,云端推理芯片市場規(guī)模將達到82.2億元,終端推理芯片達到84.1億元。

集邦咨詢分析師姚嘉洋向記者指出,2019年,AI芯片大致已經(jīng)走出一條較為清晰的道路,端、邊、云的芯片規(guī)格相對明確。2020年,各大芯片廠會延續(xù)在2019年的產(chǎn)品發(fā)展路徑,持續(xù)深化芯片的性價比及功耗比表現(xiàn)。從訓練端來看,值得關(guān)注的是HBM(高頻寬存儲器)的整合與相關(guān)的封裝技術(shù)良率,這會牽動芯片廠商與存儲器及封測廠商之間合作關(guān)系的變化。推理端的決戰(zhàn)點在INT8領(lǐng)域,重點在于如何進一步提升芯片本身的性能及功耗表現(xiàn)。

5G、VR/AR等新技術(shù),也將為AI芯片,尤其是邊緣側(cè)的AI芯片提供更多的發(fā)揮空間。Arm ML事業(yè)群商業(yè)與營銷副總裁Dennis Laudick曾向記者表示,5G通信技術(shù)改變了數(shù)據(jù)處理的方式,讓邊緣AI的工作負載也有了處理需求。可以說,5G帶來了網(wǎng)絡邊緣的更多創(chuàng)新。姚嘉洋也表示,AI在5G核心網(wǎng)絡存在機會,由于5G帶來了更多元的頻譜組合,AI可以輔助核心網(wǎng)絡更有效地調(diào)度網(wǎng)絡資源,將頻寬資源的利用達到極大化。同時,5G也涵蓋車聯(lián)網(wǎng),AI將在自動駕駛將大有機會。在VR/AR端,AI也在導入,主要聚焦在人眼追蹤或是場景識別等應用,有望改善VR/AR的流暢度與實時性表現(xiàn)。

清華大學微電子所所長魏少軍表示,從產(chǎn)業(yè)發(fā)展規(guī)律來看,在2019-2020年,AI芯片將持續(xù)火熱,企業(yè)扎堆進入;但是到了2020年前后,則將會出現(xiàn)一批出局者,行業(yè)洗牌開始。由于目前AI算法還在不斷演進匯總的過程中,最終的成功與否則將取決于各家技術(shù)路徑的選擇和產(chǎn)品落地的速度。

痛點尚待攻克

近兩年,AI在語音識別、圖像識別等應用領(lǐng)域取得突破,但要從單點突破走向全面開花,需要AI領(lǐng)域誕生如同CPU一樣的通用AI計算芯片。清華大學微納電子系副教授尹首一等專家指出,AI芯片短期內(nèi)以異構(gòu)計算為主,中期要發(fā)展自重構(gòu)、自學習、自適應,長期則朝向通用計算芯片發(fā)展。

具體來說,AI要從應用適應硬件走向硬件適應應用,就要求AI芯片具備可編程性、動態(tài)可變的計算架構(gòu),來應對層出不窮的新算法和新應用。魏少軍表示,AI芯片一要適應算法的演進,二要有適應所有應用的架構(gòu),這就要求架構(gòu)具備高效的轉(zhuǎn)化能力。在成本敏感的消費電子領(lǐng)域,還需關(guān)注AI芯片的計算效能,達到低功耗、小體積、開發(fā)簡易,這些都需要探索架構(gòu)上的創(chuàng)新。

全球AI芯片產(chǎn)業(yè)仍處于產(chǎn)業(yè)化早期階段,國產(chǎn)處理器廠商與國際廠商在人工智能這一全新賽場上處在同一起跑線。耐能創(chuàng)始人兼CEO 劉峻誠表示,中國擁有龐大的智能手機、智能家居、智能安防等市場,對中國的AI公司而言,不僅在服務國內(nèi)客戶時具有本土化的優(yōu)勢,還可借助這些客戶的生產(chǎn)制造優(yōu)勢進軍海外市場,實現(xiàn)“立足中國,放眼全球”的商業(yè)布局。

三星14nm助攻 百度AI芯片昆侖明年量產(chǎn)

三星14nm助攻 百度AI芯片昆侖明年量產(chǎn)

在云端資料庫需求激增的當下,百度與三星共同宣布,將以百度自行開發(fā)完成的“昆侖”人工智能處理器為基礎(chǔ),2020年初以三星的14納米制程打造云端服務器處理器。

根據(jù)雙方共同公布的資料顯示,百度“崑侖”人工智能處理器主要針對云端運算、邊緣運算等應用所開發(fā)的人工智能的類神經(jīng)處理器(XPU)架構(gòu)。而處理器預計將采用三星的14納米制程技術(shù),以及旗下的I-Cube TM封裝解決方案來打造。

百度表示,這款處理器將能提供512GBps的存儲器頻寬,在150瓦的功率下達成260TOPS的運算效能。此外,這款新的處理器還將支援針對自然語言處理的預訓練模型Ernie,使得整體的推理速度比傳統(tǒng)GPU或FPGA的加速模型快3倍。

百度進一步指出,藉助這款芯片的計算能力和能效,百度可以支援包括大規(guī)模人工智能預算在內(nèi)的多種功能,例如搜尋排序、語音識別、圖像處理、自然語言處理、自動駕駛和PaddlePaddle等深度學習平臺。

百度表示與三星是首次處理器代工合作。百度將提供人工智能性能最大化的人工智能平臺,而三星將把芯片制造業(yè)務拓展至專門用于云端運算及邊緣計算的高性能計算(HPC)領(lǐng)域。

事實上,除了百度本身積極自行發(fā)展專用處理器,競爭對手Google也已投入該項領(lǐng)域多年。包括企業(yè)與云端服務器使用的處理器,Google也都做了相當大量的投資,這些處理器大多為張量處理單元(Tensor Processing Units,TPU)。而透過這些處理器的運算效能,Google能提供業(yè)界優(yōu)異的運算能力,以促進機器學習和人工智能訓練的發(fā)展。

亞馬遜入局,AI芯片熱潮再起

亞馬遜入局,AI芯片熱潮再起

人工智能芯片熱潮再起。近日,全球最大的云服務提供商亞馬遜AWS發(fā)布消息:Invent上發(fā)布了首款高性能機器學習加速芯片Inferentia。由騰訊領(lǐng)投的AI芯片企業(yè)燧原科技也于近日發(fā)布了首款云端AI訓練芯片邃思DTU及加速卡云燧T10。2019年人工智能技術(shù)加快滲透進入實際應用當中,成為業(yè)內(nèi)公認的AI落地之年。而其中關(guān)鍵在于AI芯片,算力的支撐成為人工智能發(fā)展的“發(fā)動機”。這也使得人工智能芯片市場有望快速成長。

AI芯片開發(fā)踴躍

全球最大的云服務提供商亞馬遜AWS發(fā)布了首款高性能機器學習加速芯片Inferentia。作為全球最大的云服務提供商,亞馬遜AWS此舉頗為引人關(guān)注。根據(jù)亞馬遜公布的指標,Inferentia芯片能夠提供128TOPS的算力,并支持INT-8和FP-16/bfloat-16計算類型。亞馬遜同時公布了幾種搭載了Inferentia芯片的服務器配置,最高性能的版本可以搭載16顆Inferentia芯片,從而能提供高達2000TOPS的峰值算力。

實際上,關(guān)于亞馬遜自研AI芯片的情況早有消息傳出。2018年美國科技媒體The Information報道稱,亞馬遜已經(jīng)開始設(shè)計定制人工智能芯片,未來將用在其開發(fā)的智能語音設(shè)備Echo之上,以幫助Alexa語音助手獲得更快的響應速度,從而提升整體的使用體驗。2015年,亞馬遜斥資3.5億美元收購以色列芯片制造商Annapurna Labs。Annapurna Labs設(shè)計開發(fā)的芯片用于數(shù)據(jù)存儲設(shè)備、WiFi路由器、智能家居設(shè)備和流媒體設(shè)備之上。

燧原科技的產(chǎn)品同樣引人關(guān)注。燧原科技是騰訊投資的第一家國內(nèi)AI芯片企業(yè),成立不足一年半,就完成超過6.6億元的累計融資。目前燧原已同騰訊一起針對通用AI應用場景項目展開密切合作,未來也將會擴展到更多AI應用場景。燧原科技CEO趙立東介紹,此次發(fā)布的邃思DTU采用格羅方德12nm FinFET工藝,480平方毫米主芯片上承載141億個晶體管,實現(xiàn)2.5D高級立體封裝,算力可達20TFLOPS,最大功耗225W。產(chǎn)品將于2020年第一季度上市。同時,燧原科技發(fā)布首款計算及編程平臺“馭算”,可支持開源學習平臺TensorFlow進行開發(fā)。

新應用驅(qū)動AI芯片增長

一家大型一家初創(chuàng),一家國際一家國內(nèi),亞馬遜AWS與燧原科技先后發(fā)布AI芯片,顯示了AI芯片當前的火熱。實際上,近年來各類勢力均在發(fā)力AI芯片,參與者包括傳統(tǒng)芯片設(shè)計、IT廠商、技術(shù)公司、互聯(lián)網(wǎng)以及初創(chuàng)企業(yè)等,產(chǎn)品覆蓋了CPU、GPU、FPGA、ASIC等。

安富利亞洲供應商及產(chǎn)品管理高級總監(jiān)鐘僑海指出,當前人工智能技術(shù)正在快速落地,正在滲透進入實際應用。這是AI芯片快速發(fā)展的原因之一。根據(jù)Fortunebusinessinsights的預測,2018年全球人工智能市場規(guī)模為206.7億美元,至2026年有望增長到2025.7億美元。而Gartner則預測,2018年AI芯片市場約為42.7億美元規(guī)模,有望在2022年增長至343億美元。

人工智能的應用首先是在云端服務器市場展開,這也是當前AI芯片開發(fā)的重點。不過隨著市場的不斷拓展,人工智能將向邊緣以及終端領(lǐng)域擴展。未來一段時間,邊緣計算將成為AI芯片發(fā)展最快的新領(lǐng)域。對此,清華大學電子工程系教授汪玉表示:“在發(fā)展過程中, AI芯片首先是受到了云端服務器市場的關(guān)注和應用,國際公司如Google的TPU、亞馬遜的Inferentia、英特爾的SpringCrest,國內(nèi)公司如寒武紀的MLU100、百度的昆侖、華為的升騰、比特大陸的算豐,都是面向云計算所開發(fā)”不過,隨著邊緣計算的發(fā)展,面向邊緣計算的AI芯片也開始受到越來越多的重視?!靶碌倪吘墕⒂茫瑪?shù)據(jù)密集型應用和工作負載將由AI提供支持。AI將用于分析和解釋來自這些應用程序的數(shù)據(jù),以幫助人們(在某些情況下,其他機器)實時做出關(guān)鍵決策。”汪玉表示。

鐘僑海也表示,人工智能在物聯(lián)網(wǎng)領(lǐng)域正在迅速展開。在人工智能以及物聯(lián)網(wǎng)上,安富利已經(jīng)開發(fā)出許多相關(guān)的成功案例,如智能制造系統(tǒng)、智能農(nóng)業(yè)系統(tǒng)、智慧城市系統(tǒng)等。“目前區(qū)分人工智能在云服務和邊緣側(cè)的市場份額還比較難。但是,很多用戶都希望在他們原有的物聯(lián)網(wǎng)系統(tǒng)當中能夠加上人工智能的功能。此外,越來越多的企業(yè)希望有他們自己的云,他們自己的云可以做訓練,他們自己的云可以做數(shù)據(jù)的分析,這些事情他們可能不希望通過公有云來做。因此,可以預計未來人工智能在邊緣側(cè)的市場將會越來越大。”

架構(gòu)彈性成為關(guān)注焦點

雖然前景看好,但是AI芯片在應用落地同樣存在挑戰(zhàn)。鐘僑海認為,人工智能落地還將面臨三個挑戰(zhàn):第一,人工智能需要繁多的訓練、數(shù)據(jù)分析、識別、大量計算。所以,AI解決方案應針對不同的應用對網(wǎng)絡和性能參數(shù),要求不同速度、延遲、能耗、準確性。第二,神經(jīng)網(wǎng)絡技術(shù)需要大量的數(shù)據(jù)以訓練模型,在大量的運算中有數(shù)十億次乘積累加運算以及幾十兆字節(jié)參數(shù),故需要大量運算符、自定義數(shù)學及存儲器層次結(jié)構(gòu)。第三,人工智能算法的更新?lián)Q代較為迅速,在固定架構(gòu)中會存在很多風險,一旦舊人工智能架構(gòu)失靈,在新架構(gòu)出現(xiàn)時,原本的固化架構(gòu)很大程度上即刻失效。所以,架構(gòu)的彈性成為業(yè)界需要聚焦關(guān)注的問題。

汪玉提出建議,目前AI芯片設(shè)計面臨著太多種的樞架,如TF 、Pytorch、Caffe、Mxnet等。同時現(xiàn)存的芯片平臺也有很多,如CPU、GPU、FPGA、ASIC等。這就給AI芯片的設(shè)計開發(fā)帶來了極大的挑戰(zhàn)。如果能有公司設(shè)計開發(fā)出一款中間層性質(zhì)的平臺產(chǎn)品,由它來向上支持不同類型的設(shè)計框架,向下支持各種芯片平臺,并最終服務于各個人工智能公司,將大大降低AI芯片設(shè)計中的復雜度,提高工作效率。這其中蘊含著巨大的商機。汪玉也呼吁應當加強產(chǎn)學研的結(jié)合,以技術(shù)為基本出發(fā)點,營造出有利于創(chuàng)新發(fā)展的環(huán)境。通過這一系列的努力,中國完全可以抓住新一輪由5G商用所趨動的邊緣計算市場商機。

魏少軍:目前的AI芯片并不是真正的AI,要從架構(gòu)上突破

魏少軍:目前的AI芯片并不是真正的AI,要從架構(gòu)上突破

12月3日,一年一度的Imagination Inspire在上海拉開序幕,同期第十代PowerVR圖形處理器架構(gòu)IMG A系列新品推出。會議邀請了業(yè)內(nèi)人士探討AI芯片發(fā)展趨勢和方向。清華大學、北京大學雙聘教授魏少軍出席會議并發(fā)表題為“深度學習與智慧芯片-路徑與架構(gòu)”的演講。

架構(gòu)創(chuàng)新推動智能化

“將AI芯片的計算能力與人類的計算能力比較,是走了一條錯誤的路線。與AI芯片相比,人腦的計算能力著實有限。”魏少軍表示,在計算能力方面,機器的計算能力遠超人類,可比性很小,多樣性的適應能力才是最大的差距。人類大腦具備適應多種不同神經(jīng)網(wǎng)絡的功能,這是AI芯片最難完成的功能之一。此外,功耗也讓兩者產(chǎn)生巨大差距。“人食三餐,就可以適應多樣化的神經(jīng)網(wǎng)絡。但是一臺裝上AI芯片的設(shè)備,很可能需要一臺發(fā)電機為其專有供電,功耗可達2400W?!蔽荷佘娬f。

“所以,目前的AI芯片并不是真正的AI。”他認為,真正的AI芯片要從架構(gòu)方面進行突破。目前市場廠商流行的架構(gòu)包括CPU+SW、CPU+GPU、CPU+FPGA等方式,“但這些都不是AI的理想架構(gòu)?!蔽荷佘姳硎荆暧^上看,計算、軟件、優(yōu)化、演進、訓練是AI芯片的幾個重要的架構(gòu)模塊,而在完成這些重要模塊的同時,是否可以設(shè)計出類似通用CPU獨立存在的“通用AI處理器”?如果存在的話,他的架構(gòu)應該是怎樣的?

可重構(gòu)的神經(jīng)網(wǎng)絡計算架構(gòu)或許可以給出答案,這是魏少軍認為最有可能迎接未來復雜人工智能市場的AI架構(gòu)。該架構(gòu)的可重構(gòu)性和可配置性為AI芯片適應多重神經(jīng)網(wǎng)絡架構(gòu)提供可能,實現(xiàn)最佳能源效應。通過應用來決定神經(jīng)網(wǎng)絡的選擇,實現(xiàn)“定制化AI芯片”,打造可重構(gòu)的神經(jīng)網(wǎng)絡計算架構(gòu)“高效能、低功耗”的訓練引擎。

“架構(gòu)創(chuàng)新讓AI芯片變得更智慧,讓機器模仿人的行為,教機器學會人能做的事情?!蔽荷佘娬f。

AI芯片發(fā)展新增三要素

架構(gòu)創(chuàng)新帶來了AI芯片基本要素發(fā)生微妙的變化。

傳統(tǒng)上,為了更好的適應算法的演進和應用的多樣性,AI芯片首先應該具備一定的可編程性。其次,AI芯片需要適應不同的算法,實現(xiàn)高效計算。因此,架構(gòu)需要具備一定的動態(tài)可變性?!暗烷_銷、低延遲”屬性也需要AI芯片具備高效的架構(gòu)變換能力。高計算效率也是AI芯片避免使用指令類低效率的架構(gòu)的方法之一。“這些是AI芯片應該具備的基本要素。”魏少軍說。

但即使具備這些要素,AI芯片依舊“還不夠智慧”?!案又悄堋钡男枨髱砹思軜?gòu)的創(chuàng)新,由此,類似于“軟件定義芯片”可重構(gòu)的神經(jīng)網(wǎng)絡計算架構(gòu)等創(chuàng)新帶來了AI芯片基本要素的變化。

魏少軍表示,架構(gòu)創(chuàng)新后,AI芯片需要增加學習能力、接受教育并成長的能力。人類差異性的來源是教育和學習,芯片也如此。如果AI芯片可以接受教育并成長,其不可替代性將會逐漸加強。因此,算法和軟件的自主演進能力也成為了“智慧AI芯片”新增的基本要素之一?!案又腔鄣腁I芯片,還需要具備自主認知、自主判斷、自主選擇和自主決策等基本要素。”魏少軍說。

比特大陸發(fā)布全新智能服務器SA5 超強算力賦能AI

比特大陸發(fā)布全新智能服務器SA5 超強算力賦能AI

2019年10月27日,全球領(lǐng)先的算力芯片公司比特大陸在深圳召開AI新品發(fā)布會,重磅推出了算豐第三代智能服務器SA5。該產(chǎn)品是基于比特大陸9月在福州城市大腦發(fā)布會上推出的最新AI芯片BM1684開發(fā)而成,具備低功耗、高算力、高密度的特點,擁有強大的深度學習加速能力,可以為視頻/圖像智能分析提供巨大算力。

值得一提的是,比特大陸也將攜新產(chǎn)品亮相10月28日-10月30日的深圳安博會現(xiàn)場,屆時也將看到比特大陸在城市大腦、智慧安防、智慧社區(qū)等領(lǐng)域的最新進展。

比特大陸AI業(yè)務線總裁王晨光在發(fā)布會現(xiàn)場表示,“比特大陸算豐智能服務器SA5主要面向視頻及圖像智能分析領(lǐng)域,可搭載第三方算法,運行視頻結(jié)構(gòu)化、人臉檢測識別、車輛檢測識別、物品檢測識別、視頻檢測等多類安防和互聯(lián)網(wǎng)視頻智能分析應用,是目前人工智能領(lǐng)域最為成熟、穩(wěn)定的智能服務器”。

性能8倍提升 可提供422T算力

算豐智能服務器SA5的核心是比特大陸最新研發(fā)的AI芯片BM1684。BM1684聚焦于云端及邊緣應用的人工智能推理,采用臺積電12nm工藝,在典型功耗僅16瓦的前提下,F(xiàn)P32精度算力達到2.2TFlops,INT8算力可高達17.6Tops,在Winograd卷積加速下,INT8算力更提升至35.2Tops,是一顆低功耗、高性能的SoC芯片。

基于BM1684的SA5是 19 英寸的標準 2U 服務器,內(nèi)置 3 個智能分析單元,包含24顆BM1684 芯片,可以提供2.2*24TFlops@FP32 ,17.6*24Tops@INT8的峰值計算力。SA5整體功耗小于700w,INT8模式下可提供高達422T的算力,性能較上一代產(chǎn)品提升約8倍。

值得一提的是,單臺SA5 具備768路 30幀每秒的1080P視頻的處理能力或每秒12000張人臉圖片的檢測分析,大大提升了智慧城市、智慧安防、互聯(lián)網(wǎng)等行業(yè)視頻/圖像智能分析的效率。

SA5采用可插拔模塊化設(shè)計,極大便利于后期運維,內(nèi)置主控單元、算力單元、存儲單元等核心模塊。

主控單元(MPU)是SA5的大腦,基于X86架構(gòu)的智能管理調(diào)度系統(tǒng),實現(xiàn)算法部署、系統(tǒng)升級、算力性能監(jiān)控、能耗管理、算力動態(tài)負載均衡。為AIU單元提供管理以及數(shù)據(jù)交換,高達10G的網(wǎng)絡接口以滿足算力數(shù)據(jù)的輸入輸出。

其中作為整機靈魂的算力單元(AIU),集成了比特大陸第三代算力芯片BM1684,單個單元最多集成8塊BM1684芯片,整機可以按需配置多個單元,為具體應用場景下的需求提供澎湃算力。

一站式工具鏈 便捷實現(xiàn)AI賦能

為了提升產(chǎn)品的易用性,比特大陸還為客戶提供了包括底層驅(qū)動環(huán)境、編譯器、推理部署工具等一站式的工具包,名為BMNNSDK(BITMAIN Neural Network SDK)。

BMNNSDK易用便捷,最大程度降低算法和軟件的開發(fā)周期和成本,使開發(fā)者和使用者能快速在智能服務器SA5上部署深度學習算法,便捷地實現(xiàn)視頻結(jié)構(gòu)化分析、人臉識別等智能應用。

通過BMNNSDK,可以將開發(fā)者基于深度學習框架開發(fā)訓練的模型,自動編譯轉(zhuǎn)化成在SA5高性能計算平臺效運行的應用,當前支持的深度學習框架包括TensorFlow、Caffe、mxnet、ONNX、Caffe2等,支持CNN/RNN/DNN等神經(jīng)網(wǎng)絡模型,具有極佳的編程靈活性。

與眾不同的是,比特大陸還在BM1684芯片內(nèi)置多種加解密算法,可保護客戶的算法安全、模型安全可靠,創(chuàng)建安全可信的計算環(huán)境。

比特大陸作為領(lǐng)先的算力芯片公司,始終將客戶利益放在首位,始終以創(chuàng)新為本,以為客戶創(chuàng)造價值為根本出發(fā)點,不斷引領(lǐng)著科技的發(fā)展方向和新的行業(yè)潮流。在本次發(fā)布會上,比特大陸與中科云從、以薩、深瞐、千視通、英飛拓、智慧眼科技、華付、南澤智能、華尊科技、藍典科技、靈想科技、航康信息、偉視清、叁拾柒號倉、考斯、鑫和匯通、小牛智能等17家生態(tài)合作伙伴同時簽約,共同搭建友好開放的生態(tài)系統(tǒng),使客戶輕松享受新技術(shù)帶來的優(yōu)質(zhì)用戶體驗。其中,來自中科云從、以薩、深瞐、千視通的嘉賓,還為現(xiàn)場觀眾奉獻了精彩的主題演講。

比特大陸未來將持續(xù)快速響應客戶需求,以先進技術(shù)、精密制造和卓越的資源整合能力為客戶提供最具競爭力的智能設(shè)備技術(shù)解決方案,精誠合作引領(lǐng)科技前沿,共贏全球市場。

阿里和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關(guān)系生變

阿里和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關(guān)系生變

2019年杭州云棲大會上,阿里首款AI芯片含光800雖然只有短短幾分鐘的介紹,卻成了外界最為關(guān)注的消息?;ヂ?lián)網(wǎng)巨頭進入自研芯片領(lǐng)域早已不是新聞,但每次他們自研芯片的正式推出和商用的宣布,依舊會吸引了無數(shù)的關(guān)注。

不少人應該也會疑問,這是不是芯片巨頭們要被替代的開始?

互聯(lián)網(wǎng)巨頭造芯的初衷

在互聯(lián)網(wǎng)企業(yè)造芯的路上,谷歌跑在了最前面。早在2006年,谷歌就開始考慮在其數(shù)據(jù)中心部署 GPU或者 FPGA,或?qū)S眉呻娐罚ˋSIC),當時的結(jié)論是,能在專門的硬件上運行的應用并不多,使用谷歌大型數(shù)據(jù)中心的富余計算能力即可。

情況在2013年發(fā)生了轉(zhuǎn)變,當時谷歌用戶每天使用語音識別 DNN 語音搜索三分鐘,使得谷歌數(shù)據(jù)中心的計算需求增加了一倍,而如果使用傳統(tǒng)的 CPU 將非常昂貴。因此,谷歌啟動了一項優(yōu)先級別非常高的項目,快速生產(chǎn)一款定制芯片(ASIC)用于推理,并購買現(xiàn)成的 GPU用于訓練。

谷歌的目標是將性價比提高 10 倍,為了完成這項任務,谷歌在其數(shù)據(jù)中心設(shè)計、驗證、構(gòu)建并部署了 TPU(張量處理器,Tensor Processing Unit),這一過程用了15個月。

2016年,谷歌I/O開發(fā)者大會上,谷歌正式發(fā)布了首代TPU。不過,TPU剛開始只僅限谷歌內(nèi)部使用,直到2018年2月,谷歌才在其云平臺博客上宣布TPU服務開放的消息,價格大約為每云 TPU 每小時 6.50 美元,而且數(shù)量有限。

阿里和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關(guān)系生變

也就是說,2018年,谷歌才開啟了TPU的商業(yè)化。同年的I/O大會上,TPU 3.0宣布推出,計算性能相比TPU 2.0提升八倍,可達 100PFlops(每秒 1000 萬億次浮點計算)。

可以明確,谷歌TPU的推出,主要還是因為市場上沒有滿足其需求的芯片,使得他們進入了自研芯片領(lǐng)域,并且,TPU作為云端推理芯片并不對外出售,而是通過谷歌云對外提供算力。

阿里的自研芯片之路與谷歌類似。1999年以淘寶起家的阿里,如今的業(yè)務早已橫跨電商、金融、物流、云計算、大數(shù)據(jù)、全球化等場景。不同的場景就有不同的計算需求,比如淘寶里的拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時。除了需要花費1小時的時間,這個時間里GPU的耗電量也非常巨大。

根據(jù)數(shù)據(jù)統(tǒng)計顯示,2017年中國有40個中小型數(shù)據(jù)中心,這些中小數(shù)據(jù)中心2017年消耗電量比三峽大壩的發(fā)電量還多,等量的碳排放量兩倍于民航的碳排放量。對于阿里和谷歌這樣擁有大型數(shù)據(jù)中心的科技公司,電量消耗也帶來了巨大的成本。

如果谷歌和阿里想要通過購買算力更強的最新款英偉達GPU來提升效率,GPU高昂的售價也是科技巨頭們無法忽視的問題。

因此阿里也開啟了自研芯片之路。2017年的云棲大會上,阿里宣布成立達摩院,由全球建設(shè)的自主研究中心、高校聯(lián)合實驗室,全球開放研究計劃三大部分組成,涵蓋量子計算、機器學習、基礎(chǔ)算法、網(wǎng)絡安全、視覺計算、自然語言處理、下一代人機交互、芯片技術(shù)、傳感器技術(shù)、嵌入式系統(tǒng)等,涵蓋機器智能、智聯(lián)網(wǎng)、金融科技等多個產(chǎn)業(yè)領(lǐng)域。

2018年云棲大會,阿里又宣布成立獨立芯片企業(yè)“平頭哥半導體有限公司”,由中天微與達摩院芯片團隊整合而成。

還是云棲大會宣布者還是張建鋒,2019年阿里首款AI云端推理芯片含光800正式推出。在業(yè)界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

性能提升帶來的效果顯而易見,繼續(xù)用上面的拍立淘舉例,阿里表示,采用含光800后,每天新增10億商品圖片的識別時間可以從GPU識別的1小時,可縮減至5分鐘。另外,根據(jù)云棲大會的現(xiàn)場演示,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。

由此做一個簡單的換算,那就是1個含光800的算力等于10個GPU。

相比谷歌遲遲沒有商用TPU,阿里在發(fā)布含光800之時表示這款產(chǎn)品已經(jīng)已經(jīng)實現(xiàn)了大規(guī)模應用,應用于阿里巴巴集團內(nèi)多個場景,例如視頻圖像識別/分類/搜索、城市大腦等,并且宣布基于含光800的AI云服務也正式上線。

顯然,阿里自研AI芯片最核心的目標同樣是為了獲得更低的經(jīng)濟成本。

科技巨頭與芯片巨頭不再只是合作

由此看來,目前阿里和谷歌商用的自研AI芯片都是云端推理芯片,對于傳統(tǒng)芯片巨頭英特爾和英偉達而言,這并不會帶來巨大的改變,但雙方的關(guān)系會從此前緊密合作變?yōu)楦偤详P(guān)系。

如何理解?雖然有了面向視覺場景的含光800推理芯片,但是這是一款ASIC芯片,其定位也是CNN類模型推理加速為主,通用可擴展到其它DNN模型。但對于更多的深度學習算法,含光800這款ASIC可以在一定支持,但無法體現(xiàn)出性能和能效最優(yōu)化。

所以,無論是阿里還是谷歌,他們依舊需要英特爾的CPU提供通用的計算能力,也需要FPGA進行AI的加速。另外,阿里性能強大的神龍架構(gòu)服務器,也需要英偉達GPU提供算力。

這種競合關(guān)系不僅會局限在云端。2018年7月,谷歌推出Edge TPU芯片,從命名上就可以看出這是此前推出的云TPU的簡化版本,是專門設(shè)計的加速器芯片,用于在邊緣運行TensorFlow Lite機器學習模型。

英雄所見略同,阿里也有端云一體的戰(zhàn)略。在含光800云端AI芯片發(fā)布之前的7月和8月,阿里接連發(fā)布了高性能RISC-V架構(gòu)處理器玄鐵910以及SoC芯片平臺“無劍”。也就是說,阿里的C-Sky系列、玄鐵系列AIoT終端芯片IP,一站式芯片設(shè)計平臺無劍,以及最新發(fā)布的云端AI芯片構(gòu)建了阿里端云一體的芯片生態(tài),平頭哥端云一體全棧芯片產(chǎn)品家族雛形已現(xiàn)。

另外,2019云棲大會期間還有一個芯片的重磅宣布,阿里人工智能實驗室和平頭哥共同定制開發(fā)的智能語音芯片TG6100N,會在即將推出的音箱產(chǎn)品中使用。

科技巨頭們的自研AI芯片要涵蓋云端和終端其實也很容易理解,無論是芯片巨頭還是科技巨頭,他們都認為未來數(shù)據(jù)將像石油一樣具有價值。因此,巨頭們需要端云一體的戰(zhàn)略挖掘數(shù)據(jù)的價值,在數(shù)據(jù)的時代保持領(lǐng)先,而這個戰(zhàn)略非常重要的支撐就是云端和終端的AI芯片。

此時科技巨頭和芯片巨頭都會有云端和終端的AI芯片,競爭就難以避免。雷鋒網(wǎng)認為,競爭激烈的程度更多會取決于科技巨頭,由于他們對自己的業(yè)務和數(shù)據(jù)有更深的理解,他們定制化的ASIC芯片更容易達到性能和能效的最優(yōu)。即便自研的AI處理器性能弱于芯片巨頭的產(chǎn)品,如果科技巨頭出于自主可控的考慮,用自身的業(yè)務和場景去支撐自研芯片的迭代和優(yōu)化,為此付出一些代價,最終也能研發(fā)出在特定領(lǐng)域非常具有競爭優(yōu)勢的芯片。

注意,科技巨頭們會在與自己業(yè)務和生態(tài)相關(guān)的領(lǐng)域自主研發(fā)AI芯片。但如果想要替代現(xiàn)有的成熟芯片,比如英特爾的至強CPU和英偉達GPU,既沒有價值也面臨巨大的風險。歸根結(jié)底,科技巨頭們自研AI芯片的初衷是為了獲得更大的經(jīng)濟效益,通過自主研發(fā)的芯片保持其技術(shù)和生態(tài)的領(lǐng)先性。同樣,他們的自研芯片也更多的會服務于自己的業(yè)務和生態(tài),而非搶食芯片巨頭們的市場。

小結(jié)

AI時代,科技巨頭們與芯片巨頭們不再只是緊密的合作伙伴,也會在特定領(lǐng)域成為競爭對手。也就是說,對于芯片巨頭們而言,想要在科技巨頭擁有自研芯片的領(lǐng)域獲得訂單,需要付出更多的努力。

反過來,芯片作為一個技術(shù)、資本、人才都密集的行業(yè),其長周期的特點也與互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)快速迭代的模式不同,如何找到軟硬之間的最佳平衡點,以及如何與芯片巨頭們多年在芯片領(lǐng)域積累的優(yōu)勢競爭,也都是科技巨頭自主研發(fā)芯片面臨的挑戰(zhàn)。