Arm為細(xì)分市場(chǎng)發(fā)布多款NPU,架構(gòu)將繼續(xù)向中企授權(quán)

Arm為細(xì)分市場(chǎng)發(fā)布多款NPU,架構(gòu)將繼續(xù)向中企授權(quán)

10月23日,英國(guó)半導(dǎo)體知識(shí)產(chǎn)權(quán) (IP) 提供商Arm公司推出多款產(chǎn)品,并宣布將繼續(xù)為中國(guó)企業(yè)提供授權(quán)支持。

今日在Arm技術(shù)峰會(huì)北京站上,Arm中國(guó)董事長(zhǎng)兼首席執(zhí)行官吳雄昂透露,目前Arm在中國(guó)有超過(guò)200個(gè)合作伙伴,中國(guó)客戶基于Arm技術(shù)的芯片累計(jì)出貨量超過(guò)160億顆,95%的國(guó)產(chǎn)芯片都是基于Arm架構(gòu)。吳雄昂表示,Arm是唯一的非美國(guó)計(jì)算平臺(tái),并且經(jīng)過(guò)法務(wù)調(diào)查,無(wú)論v8還是v9架構(gòu)均源自英國(guó)的技術(shù),Arm會(huì)和過(guò)去一樣持續(xù)向中國(guó)企業(yè)進(jìn)行授權(quán)和服務(wù)支持。

此前,Arm全球負(fù)責(zé)芯片授權(quán)的IP產(chǎn)品事業(yè)群總裁熱內(nèi)·哈斯(Rene Haas)明確表示,華為海思是Arm的長(zhǎng)期合作伙伴,后續(xù)的芯片架構(gòu)都可以授權(quán)給華為海思。

細(xì)分更多市場(chǎng),推出兩款NPU

在今日技術(shù)峰會(huì)上,Arm還發(fā)布了Ethos-N57/Ethos-N37 NPUs(神經(jīng)單元系統(tǒng))、Mail-G57 GPU(圖形處理器)、Mali-D37 DPU(視覺(jué)核心)處理器IP設(shè)計(jì)。

Ethos-N57/Ethos-N37 NPU是繼發(fā)布的N77之后推出的兩款面向不同市場(chǎng)的NPU。Arm Ethos的組合會(huì)對(duì)AI(人工智能)與ML(機(jī)器學(xué)習(xí))作出復(fù)雜的運(yùn)算,以滿足用戶在日常生活對(duì)設(shè)備的需求。加上N77,三款NPU從高至低細(xì)分,N77為目前最高級(jí)用于VR/AR、旗艦手機(jī)等復(fù)雜運(yùn)算;N57、N37則是在作為AI處理器運(yùn)算時(shí),對(duì)性能與成本、面積、帶寬與電池壽命間達(dá)成平衡。

N57主要針對(duì)中端手機(jī)產(chǎn)品、智能家居中樞所準(zhǔn)備;N37則是針對(duì)數(shù)字電視(DTV)、智能攝像頭作出的產(chǎn)品。

更“接地氣”的Mali-G57 GPU

GPU主要負(fù)責(zé)圖像處理,Mali-G57將更好的沉浸式體驗(yàn)帶到消費(fèi)級(jí),針對(duì)VR(虛擬現(xiàn)實(shí))提供視點(diǎn)渲染支持,Mali-G57采用Valhall架構(gòu),和此前的Mali-G52相比提升1.3倍的性能密度,能效提升30%、性能密度提升30%、機(jī)器學(xué)習(xí)提升60%。

此外,Arm和實(shí)時(shí)3D開(kāi)發(fā)平臺(tái)untiy公司合作發(fā)布的基于Arm IP的片上系統(tǒng)(SoC),CPU,GPU會(huì)有更好的沉浸式體驗(yàn)。

面積更迷你的Mali-D37 DPU

據(jù)Arm介紹Mali-D37是目前其面積最小的DPU(視覺(jué)核心處理),可用于入門(mén)級(jí)智能手機(jī)、平板電腦或分辨率在2K以內(nèi)的小顯示屏等低成本的設(shè)備上。

Mali-D37采用Komeda架構(gòu),此前已經(jīng)有D71和D77兩款DPU。Mali-D37定位是16納米制程下小于1平方毫米的面積內(nèi)就能輸出2K和1080P內(nèi)容。

Arm:不會(huì)對(duì)華為斷供,后續(xù)架構(gòu)可以向中國(guó)客戶授權(quán)

Arm:不會(huì)對(duì)華為斷供,后續(xù)架構(gòu)可以向中國(guó)客戶授權(quán)

9月25日,Arm中國(guó)在深圳舉辦媒體溝通會(huì),會(huì)上圍繞關(guān)于對(duì)華為等客戶的授權(quán)、Arm與Arm中國(guó)的關(guān)系做出了相應(yīng)回答。

首先是業(yè)界最關(guān)心的對(duì)華為的IP授權(quán)的問(wèn)題。眾所周知,由于美國(guó)實(shí)體清單的影響,不少半導(dǎo)體公司先后對(duì)華為實(shí)施斷供。不過(guò),Arm中國(guó)執(zhí)行董事長(zhǎng)兼 CEO 吳雄昂在此次會(huì)上表示,華為和海思是ARM長(zhǎng)期的合作伙伴,經(jīng)過(guò)實(shí)體清單事件后,Arm已經(jīng)理清了,不會(huì)對(duì)華為斷供。

另外,Arm中國(guó)市場(chǎng)部負(fù)責(zé)人梁泉也補(bǔ)充道,從架構(gòu)的角度來(lái)說(shuō),Arm技術(shù)源自英國(guó),論是之前的V8架構(gòu)還是后續(xù)架構(gòu),都可以向包括華為海思在內(nèi)的中國(guó)客戶進(jìn)行授權(quán)。所以,ARM與華為和海思的合作,不會(huì)受到目前形勢(shì)的影響。

此外,對(duì)于Arm和Arm中國(guó)的關(guān)系,梁泉也做了最新的解釋,首先,成立于2018年的Arm中國(guó)是完全獨(dú)立的運(yùn)營(yíng)實(shí)體,Arm中國(guó)的目標(biāo)是做中國(guó)本土的芯片IP公司,現(xiàn)在與包括Arm及很多客戶在內(nèi),都是非常深入的合作關(guān)系。其次,Arm中國(guó)的使命也是逐步地推動(dòng)本土研發(fā),目標(biāo)是“全球標(biāo)準(zhǔn)、本土創(chuàng)新”,也就是說(shuō)Arm中國(guó)會(huì)沿用并且跟全球先進(jìn)的Arm技術(shù)保持一致的生態(tài),并且會(huì)保持盡量一致的產(chǎn)品規(guī)劃。

對(duì)于Arm中國(guó),梁泉還強(qiáng)調(diào)了一點(diǎn),即Arm中國(guó)是獨(dú)立運(yùn)營(yíng)的公司,其產(chǎn)品規(guī)劃、產(chǎn)品合作有非常大的獨(dú)立自主權(quán)。

Arm中國(guó)還邀請(qǐng)了合作伙伴華為海思CIO刁焱秋參加了此次會(huì)議。刁焱秋并表示,華為目前的狀態(tài)很好,在生態(tài)方面的投資,華為會(huì)堅(jiān)定不移地走下去。Arm是我們長(zhǎng)期的合作伙伴,通過(guò)這次事件后,大家的合作也會(huì)更加清晰,也會(huì)更堅(jiān)定。

從左到右依次為:Arm IP產(chǎn)品事業(yè)群總裁 Rene Haas,海思CIO刁焱秋,Arm中國(guó)執(zhí)行董事長(zhǎng)兼CEO吳雄昂

2019 COMPUTEX CPX 論壇,ARM 談超越摩爾定律

2019 COMPUTEX CPX 論壇,ARM 談超越摩爾定律

今年的COMPUTEX CPX論壇邀請(qǐng)了ARM、Nvidia、Siemens及Micron等知名廠商前來(lái)講述未來(lái)人工智能的發(fā)展。

ARM IP產(chǎn)品事業(yè)群總裁Rene Haas在此次演講大膽的用超越摩爾定律為主題。眾所周知,目前新興科技應(yīng)用的興起,使得高性能芯片技術(shù)越來(lái)越受矚目。然而在半導(dǎo)體制程方面,卻開(kāi)始看到了盡頭,這引發(fā)了業(yè)界的未雨綢繆。其中ARM做為處理器及相關(guān)外圍組件電路設(shè)計(jì)方案的知名研發(fā)商,采用ARM處理器架構(gòu)的相關(guān)產(chǎn)品市占近9成,其對(duì)未來(lái)計(jì)算力發(fā)展的觀點(diǎn)相當(dāng)值得關(guān)注。

處理器種類已有許多,但目前CPU仍然是主導(dǎo)人工智能發(fā)展的主要元件。不過(guò)人工智能的應(yīng)用仍有許多不同的情境,且所需的性能超乎想像,可以說(shuō)目前的技術(shù)仍然處于普及這些想像的早期階段,例如自駕系統(tǒng)、邊緣運(yùn)算、行動(dòng)AI裝置等,都需要更高的蒜力。然而眾所周知,光靠半導(dǎo)體制程可能會(huì)走向一個(gè)瓶頸,但這并非沒(méi)有其他路可走。

目前有關(guān)AI的解決的方案大部分都是零碎的,但若能針對(duì)應(yīng)用場(chǎng)景,結(jié)合不同的元件,將可以組成更高效的方案,例如整合CPU、NPU及GPU的芯片方案。ARM為此提出了CoreLink Interconnect規(guī)范,在保持一致性下,最大限度地提高了數(shù)據(jù)移動(dòng)和儲(chǔ)存的效率,以最低的功耗和成本提供所需的性能。Rene Haas表示,總體運(yùn)算(Total Computing)的時(shí)代即將到來(lái)。

不僅如此,ARM在軟件上也將提供研發(fā)人員更多的工具,如Compute Library及Developments Solutions等,以加速異質(zhì)芯片整合,透過(guò)軟件生態(tài)以強(qiáng)化人工智能的運(yùn)算表現(xiàn),所有的市場(chǎng)應(yīng)用都將歸納于總體運(yùn)算策略之下。

值得一提的是,在硬件架構(gòu)上,美光科技的運(yùn)算與網(wǎng)路業(yè)務(wù)總經(jīng)理Thomas T.Eby則指出,存儲(chǔ)器對(duì)AI運(yùn)算表現(xiàn)有很大的影響,更甚于處理器,所以存儲(chǔ)器架構(gòu)的優(yōu)化勢(shì)在必行,是普及AI必須經(jīng)歷的技術(shù)門(mén)檻。無(wú)論是從固態(tài)儲(chǔ)存或是揮發(fā)性存儲(chǔ)器的性能,數(shù)據(jù)吞吐量及頻寬等關(guān)鍵性能將決定新興科技是否真能成熟應(yīng)用。

而軟件開(kāi)發(fā)上,Nvidia工程副總裁Marc Hamilton在其演講中提到,AI與傳統(tǒng)編碼有所不同。對(duì)人工智能而言,應(yīng)用在機(jī)器學(xué)習(xí)上的大數(shù)據(jù),本身就是源代碼,所以用于開(kāi)發(fā)AI的工具將與以往不同,而無(wú)論是硬件或軟件,Nvidia都能提供最好的技術(shù)催生平臺(tái)。

傳華為即將發(fā)表采用ARM架構(gòu)的麒麟720處理器

傳華為即將發(fā)表采用ARM架構(gòu)的麒麟720處理器

根據(jù)外媒指出,華為旗下的IC設(shè)計(jì)廠商海思,預(yù)計(jì)將在30日推出麒麟(Kirin)系列處理器。

不過(guò),新推出的處理器將不是預(yù)計(jì)搭載在2019年稍后發(fā)表Mate 30智能手機(jī)上的高端處理器麒麟985處理器,而是中端處理器麒麟710的升級(jí)款──麒麟720。

報(bào)導(dǎo)指出,采用臺(tái)積電10納米制程所打造的麒麟720處理器,相較上一代的麒麟710處理器由12納米制程所打造的,其制程技術(shù)有所升級(jí),而這也顯示未來(lái)麒麟720處理器將相較于目前采用4個(gè)主頻為2.2GHz的ARM Cortex-A73大核心,以及4個(gè)主頻為1.7GHz的ARM Cortex-A53小核心的麒麟710處理器有所升級(jí)。

另外,針對(duì)麒麟70處理器所使用的ARM Mali G51 MP4 GPU,麒麟720處理器也將提升,并且還將加入主司人工智能運(yùn)算的NPU單元。

華為發(fā)布7nm鯤鵬920 芯片

華為發(fā)布7nm鯤鵬920 芯片

今天(1月7日)上午,華為在深圳發(fā)布“鯤鵬920”芯片,華為董事、戰(zhàn)略Marketing總裁徐文偉稱其為目前業(yè)界最高性能ARM-based處理器。

鯤鵬920采用7nm制造工藝,基于ARM架構(gòu)授權(quán),由華為公司自主設(shè)計(jì)完成。該處理器有64個(gè)內(nèi)核,主頻可達(dá)2.6GHz,集成8通道DDR4,內(nèi)存帶寬超出業(yè)界主流46%,還集成100G RoCE以太網(wǎng)卡功能,大幅提高系統(tǒng)集成度。

此外,鯤鵬920支持PCIe4.0及CCIX接口,可提供640Gbps總帶寬,單槽位接口速率為業(yè)界主流速率的兩倍,有效提升存儲(chǔ)及各類加速器的性能。

據(jù)徐文偉介紹,鯤鵬920是為大數(shù)據(jù)處理和分布式存儲(chǔ)等應(yīng)用而專門(mén)設(shè)計(jì),能以更低功耗為數(shù)據(jù)中心提供更強(qiáng)性能。該處理器通過(guò)優(yōu)化分支預(yù)測(cè)算法、提升運(yùn)算單元數(shù)量、改進(jìn)內(nèi)存子系統(tǒng)架構(gòu)等一系列微架構(gòu)設(shè)計(jì),大幅提高處理器性能。

在基準(zhǔn)測(cè)試中,鯤鵬920典型主頻下的SPECint Benchmark評(píng)分超過(guò)930,超出行業(yè)基準(zhǔn)25%,同時(shí)能效比優(yōu)于業(yè)界標(biāo)桿30%。

鯤鵬920是華為繼麒麟芯片和昇騰芯片后,新推出的芯片系列,至此華為自研芯片已覆蓋移動(dòng)終端、AI人工智能以及服務(wù)器三大領(lǐng)域。徐文偉表示,麒麟980助力華為手機(jī)推向智慧新高度,基于昇騰310的產(chǎn)品和服務(wù)使能行業(yè)普惠AI,鯤鵬920則把計(jì)算帶入多核異構(gòu)的多樣性時(shí)代。

發(fā)布會(huì)上,華為還同步推出基于鯤鵬920的泰山(TaiShan)系列服務(wù)器產(chǎn)品,包括均衡型,存儲(chǔ)型和高密型三個(gè)機(jī)型,主要面向大數(shù)據(jù)、分布式存儲(chǔ)和ARM原生應(yīng)用等場(chǎng)景,將于2019年推出。

華為推ARM架構(gòu)服務(wù)器處理器「鯤鵬 920」,市場(chǎng)有待考驗(yàn)

華為推ARM架構(gòu)服務(wù)器處理器「鯤鵬 920」,市場(chǎng)有待考驗(yàn)

就在陸續(xù)推出自有行動(dòng)處理器與人工智能芯片之后,7 日華為宣布,推出號(hào)稱業(yè)界最高性能 ARM 架構(gòu)的服務(wù)器處理器「鯤鵬 920 (Kunpeng 920)」,以及搭載「鯤鵬 920」處理器的 TaiShan 服務(wù)器、以及華為云端服務(wù)。

事實(shí)上,在 2018 年 12 月 21 日的華為智慧計(jì)算大會(huì)上,華為就透露將于 2019 年發(fā)布首顆以 7 納米制程所打造的資料中心 ARM 架構(gòu)處理器。如今,這個(gè)定名為「鯤鵬 920」的服務(wù)器處理器正式揭開(kāi)揭曉。

華為表示,「鯤鵬 920」采用 7 納米制程技術(shù)所生產(chǎn),與目前市場(chǎng)主流,也就是競(jìng)爭(zhēng)對(duì)手英特爾 (intel) 的 x86 架構(gòu)有所不同,采用的是 ARM 架構(gòu)。而且,是由華為所自主設(shè)計(jì)完成。在藉由優(yōu)化分支預(yù)測(cè)算法、提升運(yùn)算單元數(shù)量、并改進(jìn)內(nèi)建存儲(chǔ)器子系統(tǒng)架構(gòu)等一系列微架構(gòu)設(shè)計(jì)下,可以大幅提高處理器的運(yùn)算性能。

華為進(jìn)一步指出,在一般頻率的運(yùn)算下,透過(guò)測(cè)試軟件 SPECint Benchmark 所測(cè)出的評(píng)分達(dá)到 930,超出業(yè)界水平的 25%。同時(shí),能效比也高出業(yè)界標(biāo)準(zhǔn) 30%。而由于是采 ARM 架構(gòu)的設(shè)計(jì),因此「鯤鵬 920」能以更低功耗為資料中心提供預(yù)算能力。

根據(jù)華為所公布的數(shù)據(jù),「鯤鵬 920」主頻可達(dá) 2.6GHz,單晶片可支援 64 核心。而該處理器還整合了 8 通道的 DDR4 存儲(chǔ)器,內(nèi)建存儲(chǔ)器頻寬超出業(yè)界主流標(biāo)準(zhǔn)的 46%。另外,處理器還整合了 100G RoCE 以太網(wǎng)卡功能,大幅提高系統(tǒng)整合度,并且支持 PCIe4.0 及 CCIX 界面,可提供 640Gbps 總頻寬,單槽位界面速率為業(yè)界主流速率的兩倍,可以有效提升儲(chǔ)存及各類加速器的性能。

雖然,華為指出,「鯤鵬 920」的各項(xiàng)性能都高出目前業(yè)界的標(biāo)準(zhǔn)。不過(guò),因?yàn)椴捎玫氖?ARM 架構(gòu)的處理器,這在目前以英特爾為主的 X86 服務(wù)器處理器市場(chǎng)中,在設(shè)計(jì)不同,軟件、韌體狀況都必須要有符合相同設(shè)計(jì)的情況下,會(huì)有多少企業(yè)或是服務(wù)器廠商采用,還有待觀察。畢竟,在 ARM 架構(gòu)行動(dòng)處理器的霸主高通 (Qualcomm) 也曾經(jīng)試圖以 ARM 架構(gòu)處理器想搶進(jìn),無(wú)奈如今以裁員、關(guān)閉業(yè)務(wù)的結(jié)果退出該市場(chǎng)。

華為推7nm Arm架構(gòu)服務(wù)器處理器,展現(xiàn)強(qiáng)大技術(shù)實(shí)力

華為推7nm Arm架構(gòu)服務(wù)器處理器,展現(xiàn)強(qiáng)大技術(shù)實(shí)力

華為推出新一代以Arm架構(gòu)為主的服務(wù)器處理器,采用7nm制程,產(chǎn)品型號(hào)Hi1620,依據(jù)目前公布訊息來(lái)看,華為最新推出的服務(wù)器處理器搭載之CPU,是由華為以Arm v8指令集設(shè)定俢改而成,CPU名稱TaiShan,核心數(shù)量有48與64核兩種版本,核心頻率分別為2.6GHz與3.0GHz;其他規(guī)格方面,有40組PCIe Gen 4.0與CCIX,及2組100GE網(wǎng)絡(luò)界面,存儲(chǔ)器則是支援8通道的DDR4-2933。

Arm陣營(yíng)在服務(wù)器市場(chǎng)發(fā)展,華為態(tài)度應(yīng)為關(guān)鍵

依據(jù)華為官方提供的資料,Hi1620應(yīng)是華為第四款A(yù)rm架構(gòu)的服務(wù)器處理器,自2013年推出第一款Hi1610到2018年Hi1620,歷時(shí)約5年。華為過(guò)去在智能手機(jī)領(lǐng)域花費(fèi)不少時(shí)間,以Kirin系列處理器為中心搭配旗下手機(jī)產(chǎn)品,才逐漸在智能手機(jī)市場(chǎng)上取得領(lǐng)導(dǎo)地位,某種程度上也必須歸功于華為不斷開(kāi)發(fā)Kirin處理器,從落后領(lǐng)先集團(tuán)到成為領(lǐng)先集團(tuán)群的旗艦級(jí)處理器供應(yīng)商,至少花費(fèi)3~4年時(shí)間。

回到服務(wù)器處理器發(fā)展,華為也秉持持續(xù)精進(jìn)態(tài)度,盡管Arm陣營(yíng)在服務(wù)器的能見(jiàn)度仍相當(dāng)有限,但華為在這方面的投入,顯然是持續(xù)堅(jiān)守國(guó)家一貫的政策指導(dǎo),強(qiáng)化國(guó)產(chǎn)芯片自給率,設(shè)法減少對(duì)國(guó)外芯片大廠如Intel與NVIDIA的依賴;由于華為是目前全球前五大服務(wù)器供應(yīng)商,雖然2018年市占率僅有6.4%,但華為力挺Arm架構(gòu)服務(wù)器處理器發(fā)展,對(duì)Arm陣營(yíng)來(lái)說(shuō)的確有鼓舞士氣。

另一方面,對(duì)于Qualcomm在服務(wù)器市場(chǎng)發(fā)展恐怕不是好消息,截至目前為止,Qualcomm在服務(wù)器處理器發(fā)展仍處于未有客戶采用的消息,未來(lái)是否會(huì)由系統(tǒng)廠主導(dǎo)Arm架構(gòu)服務(wù)器處理器發(fā)展,進(jìn)而提升能見(jiàn)度,將是2019年可觀察的重點(diǎn)指標(biāo)。

展現(xiàn)強(qiáng)大技術(shù)實(shí)力,也加深與臺(tái)積電合作關(guān)系

值得注意的是,華為目前已經(jīng)確定發(fā)布3款7nm處理器,分別為智能手機(jī)專用的Kirin 980,聚焦AI訓(xùn)練的Ascend(升騰) 910,以及服務(wù)器專用的Hi1620?,F(xiàn)階段發(fā)布7nm芯片的各大芯片廠商,不外乎有Apple、Qualcomm、AMD與Xilinx等,單以應(yīng)用類別來(lái)看,扣除Xilinx以7nm制程,針對(duì)不同應(yīng)用類別推出各自對(duì)應(yīng)的產(chǎn)品線外,華為應(yīng)是各大廠商中,最多應(yīng)用類別的7nm芯片供應(yīng)商,不僅顯示出其強(qiáng)大的技術(shù)與研發(fā)實(shí)力,同時(shí)也加深華為與臺(tái)積電互為依存的合作關(guān)系。