2019年杭州云棲大會(huì)上,阿里首款A(yù)I芯片含光800雖然只有短短幾分鐘的介紹,卻成了外界最為關(guān)注的消息?;ヂ?lián)網(wǎng)巨頭進(jìn)入自研芯片領(lǐng)域早已不是新聞,但每次他們自研芯片的正式推出和商用的宣布,依舊會(huì)吸引了無數(shù)的關(guān)注。

不少人應(yīng)該也會(huì)疑問,這是不是芯片巨頭們要被替代的開始?

互聯(lián)網(wǎng)巨頭造芯的初衷

在互聯(lián)網(wǎng)企業(yè)造芯的路上,谷歌跑在了最前面。早在2006年,谷歌就開始考慮在其數(shù)據(jù)中心部署 GPU或者 FPGA,或?qū)S眉呻娐罚ˋSIC),當(dāng)時(shí)的結(jié)論是,能在專門的硬件上運(yùn)行的應(yīng)用并不多,使用谷歌大型數(shù)據(jù)中心的富余計(jì)算能力即可。

情況在2013年發(fā)生了轉(zhuǎn)變,當(dāng)時(shí)谷歌用戶每天使用語音識(shí)別 DNN 語音搜索三分鐘,使得谷歌數(shù)據(jù)中心的計(jì)算需求增加了一倍,而如果使用傳統(tǒng)的 CPU 將非常昂貴。因此,谷歌啟動(dòng)了一項(xiàng)優(yōu)先級(jí)別非常高的項(xiàng)目,快速生產(chǎn)一款定制芯片(ASIC)用于推理,并購買現(xiàn)成的 GPU用于訓(xùn)練。

谷歌的目標(biāo)是將性價(jià)比提高 10 倍,為了完成這項(xiàng)任務(wù),谷歌在其數(shù)據(jù)中心設(shè)計(jì)、驗(yàn)證、構(gòu)建并部署了 TPU(張量處理器,Tensor Processing Unit),這一過程用了15個(gè)月。

2016年,谷歌I/O開發(fā)者大會(huì)上,谷歌正式發(fā)布了首代TPU。不過,TPU剛開始只僅限谷歌內(nèi)部使用,直到2018年2月,谷歌才在其云平臺(tái)博客上宣布TPU服務(wù)開放的消息,價(jià)格大約為每云 TPU 每小時(shí) 6.50 美元,而且數(shù)量有限。

阿里和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關(guān)系生變

也就是說,2018年,谷歌才開啟了TPU的商業(yè)化。同年的I/O大會(huì)上,TPU 3.0宣布推出,計(jì)算性能相比TPU 2.0提升八倍,可達(dá) 100PFlops(每秒 1000 萬億次浮點(diǎn)計(jì)算)。

可以明確,谷歌TPU的推出,主要還是因?yàn)槭袌?chǎng)上沒有滿足其需求的芯片,使得他們進(jìn)入了自研芯片領(lǐng)域,并且,TPU作為云端推理芯片并不對(duì)外出售,而是通過谷歌云對(duì)外提供算力。

阿里的自研芯片之路與谷歌類似。1999年以淘寶起家的阿里,如今的業(yè)務(wù)早已橫跨電商、金融、物流、云計(jì)算、大數(shù)據(jù)、全球化等場(chǎng)景。不同的場(chǎng)景就有不同的計(jì)算需求,比如淘寶里的拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識(shí)別需要1小時(shí)。除了需要花費(fèi)1小時(shí)的時(shí)間,這個(gè)時(shí)間里GPU的耗電量也非常巨大。

根據(jù)數(shù)據(jù)統(tǒng)計(jì)顯示,2017年中國有40個(gè)中小型數(shù)據(jù)中心,這些中小數(shù)據(jù)中心2017年消耗電量比三峽大壩的發(fā)電量還多,等量的碳排放量兩倍于民航的碳排放量。對(duì)于阿里和谷歌這樣擁有大型數(shù)據(jù)中心的科技公司,電量消耗也帶來了巨大的成本。

如果谷歌和阿里想要通過購買算力更強(qiáng)的最新款英偉達(dá)GPU來提升效率,GPU高昂的售價(jià)也是科技巨頭們無法忽視的問題。

因此阿里也開啟了自研芯片之路。2017年的云棲大會(huì)上,阿里宣布成立達(dá)摩院,由全球建設(shè)的自主研究中心、高校聯(lián)合實(shí)驗(yàn)室,全球開放研究計(jì)劃三大部分組成,涵蓋量子計(jì)算、機(jī)器學(xué)習(xí)、基礎(chǔ)算法、網(wǎng)絡(luò)安全、視覺計(jì)算、自然語言處理、下一代人機(jī)交互、芯片技術(shù)、傳感器技術(shù)、嵌入式系統(tǒng)等,涵蓋機(jī)器智能、智聯(lián)網(wǎng)、金融科技等多個(gè)產(chǎn)業(yè)領(lǐng)域。

2018年云棲大會(huì),阿里又宣布成立獨(dú)立芯片企業(yè)“平頭哥半導(dǎo)體有限公司”,由中天微與達(dá)摩院芯片團(tuán)隊(duì)整合而成。

還是云棲大會(huì)宣布者還是張建鋒,2019年阿里首款A(yù)I云端推理芯片含光800正式推出。在業(yè)界標(biāo)準(zhǔn)的ResNet-50測(cè)試中,含光800推理性能達(dá)到78563 IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

性能提升帶來的效果顯而易見,繼續(xù)用上面的拍立淘舉例,阿里表示,采用含光800后,每天新增10億商品圖片的識(shí)別時(shí)間可以從GPU識(shí)別的1小時(shí),可縮減至5分鐘。另外,根據(jù)云棲大會(huì)的現(xiàn)場(chǎng)演示,在城市大腦中實(shí)時(shí)處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時(shí)為300ms,使用含光800僅需4顆,延時(shí)降至150ms。

由此做一個(gè)簡(jiǎn)單的換算,那就是1個(gè)含光800的算力等于10個(gè)GPU。

相比谷歌遲遲沒有商用TPU,阿里在發(fā)布含光800之時(shí)表示這款產(chǎn)品已經(jīng)已經(jīng)實(shí)現(xiàn)了大規(guī)模應(yīng)用,應(yīng)用于阿里巴巴集團(tuán)內(nèi)多個(gè)場(chǎng)景,例如視頻圖像識(shí)別/分類/搜索、城市大腦等,并且宣布基于含光800的AI云服務(wù)也正式上線。

顯然,阿里自研AI芯片最核心的目標(biāo)同樣是為了獲得更低的經(jīng)濟(jì)成本。

科技巨頭與芯片巨頭不再只是合作

由此看來,目前阿里和谷歌商用的自研AI芯片都是云端推理芯片,對(duì)于傳統(tǒng)芯片巨頭英特爾和英偉達(dá)而言,這并不會(huì)帶來巨大的改變,但雙方的關(guān)系會(huì)從此前緊密合作變?yōu)楦?jìng)合關(guān)系。

如何理解?雖然有了面向視覺場(chǎng)景的含光800推理芯片,但是這是一款A(yù)SIC芯片,其定位也是CNN類模型推理加速為主,通用可擴(kuò)展到其它DNN模型。但對(duì)于更多的深度學(xué)習(xí)算法,含光800這款A(yù)SIC可以在一定支持,但無法體現(xiàn)出性能和能效最優(yōu)化。

所以,無論是阿里還是谷歌,他們依舊需要英特爾的CPU提供通用的計(jì)算能力,也需要FPGA進(jìn)行AI的加速。另外,阿里性能強(qiáng)大的神龍架構(gòu)服務(wù)器,也需要英偉達(dá)GPU提供算力。

這種競(jìng)合關(guān)系不僅會(huì)局限在云端。2018年7月,谷歌推出Edge TPU芯片,從命名上就可以看出這是此前推出的云TPU的簡(jiǎn)化版本,是專門設(shè)計(jì)的加速器芯片,用于在邊緣運(yùn)行TensorFlow Lite機(jī)器學(xué)習(xí)模型。

英雄所見略同,阿里也有端云一體的戰(zhàn)略。在含光800云端AI芯片發(fā)布之前的7月和8月,阿里接連發(fā)布了高性能RISC-V架構(gòu)處理器玄鐵910以及SoC芯片平臺(tái)“無劍”。也就是說,阿里的C-Sky系列、玄鐵系列AIoT終端芯片IP,一站式芯片設(shè)計(jì)平臺(tái)無劍,以及最新發(fā)布的云端AI芯片構(gòu)建了阿里端云一體的芯片生態(tài),平頭哥端云一體全棧芯片產(chǎn)品家族雛形已現(xiàn)。

另外,2019云棲大會(huì)期間還有一個(gè)芯片的重磅宣布,阿里人工智能實(shí)驗(yàn)室和平頭哥共同定制開發(fā)的智能語音芯片TG6100N,會(huì)在即將推出的音箱產(chǎn)品中使用。

科技巨頭們的自研AI芯片要涵蓋云端和終端其實(shí)也很容易理解,無論是芯片巨頭還是科技巨頭,他們都認(rèn)為未來數(shù)據(jù)將像石油一樣具有價(jià)值。因此,巨頭們需要端云一體的戰(zhàn)略挖掘數(shù)據(jù)的價(jià)值,在數(shù)據(jù)的時(shí)代保持領(lǐng)先,而這個(gè)戰(zhàn)略非常重要的支撐就是云端和終端的AI芯片。

此時(shí)科技巨頭和芯片巨頭都會(huì)有云端和終端的AI芯片,競(jìng)爭(zhēng)就難以避免。雷鋒網(wǎng)認(rèn)為,競(jìng)爭(zhēng)激烈的程度更多會(huì)取決于科技巨頭,由于他們對(duì)自己的業(yè)務(wù)和數(shù)據(jù)有更深的理解,他們定制化的ASIC芯片更容易達(dá)到性能和能效的最優(yōu)。即便自研的AI處理器性能弱于芯片巨頭的產(chǎn)品,如果科技巨頭出于自主可控的考慮,用自身的業(yè)務(wù)和場(chǎng)景去支撐自研芯片的迭代和優(yōu)化,為此付出一些代價(jià),最終也能研發(fā)出在特定領(lǐng)域非常具有競(jìng)爭(zhēng)優(yōu)勢(shì)的芯片。

注意,科技巨頭們會(huì)在與自己業(yè)務(wù)和生態(tài)相關(guān)的領(lǐng)域自主研發(fā)AI芯片。但如果想要替代現(xiàn)有的成熟芯片,比如英特爾的至強(qiáng)CPU和英偉達(dá)GPU,既沒有價(jià)值也面臨巨大的風(fēng)險(xiǎn)。歸根結(jié)底,科技巨頭們自研AI芯片的初衷是為了獲得更大的經(jīng)濟(jì)效益,通過自主研發(fā)的芯片保持其技術(shù)和生態(tài)的領(lǐng)先性。同樣,他們的自研芯片也更多的會(huì)服務(wù)于自己的業(yè)務(wù)和生態(tài),而非搶食芯片巨頭們的市場(chǎng)。

小結(jié)

AI時(shí)代,科技巨頭們與芯片巨頭們不再只是緊密的合作伙伴,也會(huì)在特定領(lǐng)域成為競(jìng)爭(zhēng)對(duì)手。也就是說,對(duì)于芯片巨頭們而言,想要在科技巨頭擁有自研芯片的領(lǐng)域獲得訂單,需要付出更多的努力。

反過來,芯片作為一個(gè)技術(shù)、資本、人才都密集的行業(yè),其長周期的特點(diǎn)也與互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)快速迭代的模式不同,如何找到軟硬之間的最佳平衡點(diǎn),以及如何與芯片巨頭們多年在芯片領(lǐng)域積累的優(yōu)勢(shì)競(jìng)爭(zhēng),也都是科技巨頭自主研發(fā)芯片面臨的挑戰(zhàn)。