國產芯押注AI潮 技術引領新市場

發(fā)布時間:2019-12-23 11:36:03  |  來源:TechWeb  

人工智能的應用浪潮推動了國產芯片的替代進程。為打破壟斷,國內頭部及傳統(tǒng)的IC制造商試圖繞過被英偉達壟斷的GPU框架,集體轉向設計并研制專用計算芯片(ASIC)、FPGA及融合型異構處理器,以滿足人工智能市場廣泛需求的云端訓練及終端推理作業(yè)。

01、樓閣坍塌

2016年至今,中國人工智能產業(yè)蓬勃發(fā)展,一連出現了如商湯、曠視、科大訊飛、云從等獨角獸公司。時至2019年,這一現象達到高潮。

2017年,廣州市政府向云從科技注資3.01億美元,同年國有資本風險投資基金向曠視科技投入4.6億美元資金。2017年,中國人工智能初創(chuàng)企業(yè)股權融資額占全球總量的48%,高出美國10個百分點。截止2018年底,中國人工智能企業(yè)獲得風險投資總額接近1100億元,超過美國同期的932億美元;2019年10月,北京市海淀區(qū)政府為響應人工智能發(fā)展政策,提出愿為重點項目提供最高3000萬的資金支持···

然而,一切高歌猛進在復雜的中美摩擦中戛然而止。

2019年5月,華為公司及其在分布在國內外的百家機構被美列入實體名單,大批量半導體斷貨。

6月21日,中科曙光、天津海光、成都海光集成電路等五家機構被列入實體名單。

10月7日,“黑色”恐怖相繼蔓延,??低暋⒋笕A科技、科大訊飛、曠視科技、商湯科技、美亞柏科、頤信科技和依圖科技等28家中國與人工智能技術相關的機構和公司集體被列入實體名單,被限制從美國購買零部件。

面對突如其來的“制裁”,AI公司們能做的只有譴責。

科大訊飛表示,列入黑名單不會影響其日常運營。

美亞柏科表示,海外收入不足總收入1%、貨源大多來自國內。

大華則在股東會議上表示,主營產品的多數組件可獲得替代。

然而正如一位業(yè)內人士所說,一項超速發(fā)展的下游產業(yè),很難不被緩慢進步的上游產業(yè)的缺口所牽制。

8家AI公司表面說沒事,實則暗地流血。

數據統(tǒng)計,海康威視500億元人民幣(合70億美元)的收入中有近30%來自海外;2019Q3財報顯示,海康威視存貨金額由年初的57億增長到98億,浮動+71.96%;外幣借貸額增勢更明顯,由年初4.4億增長到期末45億,同比增長+929.69%,顯然,??档馁Y本重心發(fā)生了大角度轉變。

為避免帶有情緒的股民集體拋售,海康、大華在名單公布當日一早,宣布了臨時停盤。

一位接近曠視科技的人士稱,“名單對公司上市進程影響很大···為繞開敏感GPU供應商,不得不把產品分成軟件、硬件兩標投。然而,一邊合作方將硬件加價掛牌出售,套走大筆利潤;另一邊,客戶以名單為由,坐地壓價甚至重新招標···”

由于AI公司普遍采用的美國產的半導體,此次事件對于8家AI公司影響頗大,并險些陷入此前與中興相似的境遇。若無自主可控的AI芯片,業(yè)務定位很難逃離微笑曲線谷底。

樓閣已塌。

據統(tǒng)計,在中國使用的半導體中,只有16%是國內生產的,而這其中又僅有不到一半是由中國公司自主設計的。工業(yè)和信息化部科技司司長胡燕認為,人工智能的發(fā)展不能再走“沙灘建高樓”的模式,若芯片、操作系統(tǒng)等頂層基礎不突破,我們的人工智能產業(yè),就是空中閣樓、是為別人做嫁衣。

AI公司受芯片牽制久已。由于抵擋不住“抽芯”壓力,人工智能產業(yè)迫切的需要國產芯片的一臂之力。而時至2019年底,這一產業(yè)的國產化替代趨勢初露頭角。

02、尋找最優(yōu)技術路線

為理解這個趨勢,需要從基礎技術談起。

首先,如何抽象人工智能?簡單來講,軟件通過對現有信息進行自動化分析并得到規(guī)律,利用規(guī)律對未知數據進行預測,便是人工智能最基本的工作流。

即便有了學術界數十年探索,工業(yè)界通過大量實踐得出一項共識:面對確定性問題,AI有著得天獨厚的優(yōu)勢;而面對不確定的問題,AI和人腦(動物腦)之間仍存在難以逾越的鴻溝。人腦善于線性推理,AI反之,善于高精度、大規(guī)模運算。人工智能的分支中的“強化學習”,就是在填補這個條鴻溝。

而在人類社會中,智力相較于勞動力,有著更高溢價范疇。

2012~2016年,巔峰時期的互聯(lián)網經濟回歸基本面,一部分互聯(lián)網公司、AI初創(chuàng)解決方案商看到智能服務的缺口,人工智能創(chuàng)業(yè)浪潮隨之涌現。其中不乏涉及人臉識別、自動駕駛、機器學習等分支技術,并落地于金融、安防、工業(yè)、農業(yè)、教育等領域。這些領域受數據隱私、商業(yè)機密限制,依賴高性能運算同時,對運算屬性需求獨立分散且靈活。

AI運算包含大量矩陣、卷積、積分等并行運算,我們熟知的CPU并不適用。為滿足不同環(huán)境下的AI運算,業(yè)界普遍采用GPU(圖形顯示卡)、FPGA(現場可編程邏輯門陣列)、ASIC(專用集成電路),亦或是在SoC內封裝NPU(神經網絡處理器)、IPU(圖像處理單元)等技術路線,以滿足AI的訓練(train)和推理(inference)。

云端訓練芯片市場,英偉達(Nvidia)一家獨大,主推GPU單卡或多卡集成主機方案。其GPU產品線覆蓋不同程度算力、不同數據類型的訓練需求,且編程環(huán)境成熟,產品支持市場上主要的開發(fā)框架和語言。然而由于成本等因素,GPU并不適用于AI推理端。國內AI芯片廠也有著統(tǒng)一共識:絕不走純GPU路線,嘗試其他技術路線“繞道超車”。

FPGA,適用于高凈值的「推理端」,例如自動駕駛,工控集成,成本略高,優(yōu)勢在于定制性強、設計周期短,然而FPGA的設計人才難聘。同時,近些年來看,其高昂成本仍難以繞開。當然也有聲音稱,國內某家智能駕駛公司與賽靈思合作,將進口單片成本降至2000元,配給主機廠做L2套件。

從經濟角度講,FPGA具備“暫時性”替代ASIC芯片地位,可彌補ASIC長研發(fā)周期、流片周期的時間缺口,是目前少有能兼顧訓練和推理的高性能芯片。然則全球僅四家公司具備FPGA的生產能力:Xilinx(美)、Altera(被intel收購)、Lattice(美)、Microsemi,先有英特爾、IBM、德州儀器,再有摩托羅拉、飛利浦、東芝等公司成立獨立部門投入FPGA研發(fā),均無疾而終。

ASIC(專用集成電路),研發(fā)-流片周期長,成本卻可降至FPGA十分之一水平。Google獨家技術的TPU(張量處理器)及英偉達DLA(Deep Learning Accelerator,深度學習加速器)即采用ASIC技術路線。國內華為海思、寒武紀、比特大陸、嘉楠智耘等幾大芯片廠商,主要產品同樣采用該技術路線,目前已實現一定規(guī)模的量產。相比FPGA這類剛剛起步的技術路線,ASIC是國內芯片生產商唯一能夠在短期獲得盈利的半導體產品。

面對殘酷的歷史教訓,傳統(tǒng)芯片廠也好,新晉半導體設計公司也好,量產推理端芯片,ASIC是最優(yōu)解。

03、云端訓練

AI芯片的供需主要分為兩類:云端訓練,終端推理。

AI訓練階端,主流云端訓練采用GPU + CPU、FPGA + CPU等形式。Google則采用自研TPU(一種ASIC)+ CPU。

剛剛提到,云端GPU英偉達一家獨大,市場近乎壟斷,國產翻身很難。是因為GPU在并行計算方面具有天然優(yōu)勢。而FPGA的定制化能夠補足GPU的部分劣勢。普華永道預測,云端芯片中FPGA將與GPU共存很長一端時間。

由于云端訓練芯片的研發(fā)投入大、流產風險高,國內僅有少數公司能夠進入該領域。目前有,華為海思昇騰系列(SoC),阿里含光,依圖QuestCore,燧原,景嘉微(GPU)等。

華為昇騰系列:

2018年10月10日,華為正式在2018全聯(lián)接大會上發(fā)布昇騰310和昇騰910兩款AI芯片。昇騰系列可以看做華為AI芯片的拼圖,這張拼圖一共5塊:Max,Mini,Lite,Tiny和Nano。昇騰910屬于Max那塊,一經發(fā)布就直奔310W的TDP,算力達256TFOPS。華為自稱910是目前單芯片計算密度最大的芯片,計算力甚至遠超谷歌(TPU)及英偉達(GPU)。

而昇騰310占據Mini板塊,最大功耗僅8W,是極致高效計算低功耗AI芯片,用于推理端。推理端芯片之后會講到。

時至2019年8月23日,昇騰910(Ascend 910)的商用版本才在深圳正式發(fā)布。

關于昇騰910的性能,徐直軍表示,昇騰910技術表現超預期,配合MindSpore(華為推出的自主可控的AI計算平臺),在ResNet50網絡的訓練中,效果超現有主流訓練單卡配合TensorFlow兩倍提升之多。

面對昇騰強大性能,「互聯(lián)網周刊」甚至在《2019人工智能服務器TOP25》榜單中把該系列芯片排在了第一位,而服務器市場占有率超51%的浪潮科技僅僅名列第6。

然而,昇騰目前最大問題是,來自對于主流AI開發(fā)框架的支持程度未知,如TensorFlow、PyTorch等,徐直軍在發(fā)布會上一直未提及。MindSpore并不一定能完全取代上述幾種開源AI框架,這是一個伏筆,華為想把MindSpore做出成績來尚需一端時間。

整體來看,昇騰910已經準備好了進入商業(yè)化初期階端,對于自主可控要求較高的云服務商、AI服務商值得期待下。

以上這些AI訓練芯片并非無懈可擊。其入市前遇到的矛盾甚至比昇騰910還多,普遍缺少類似Nvidia公司CUDA軟件層,所以還是那個觀點:在推出穩(wěn)定的開發(fā)接口上,培養(yǎng)足夠量級的開發(fā)者仍有待時日。

昇騰910首次亮相披露的合作伙伴有四維圖新、用友網絡、浪潮信息、長亮科技、超圖軟件、東方通、東方國信、華宇軟件等。

國產GPU景嘉微:

11月28日,國產GPU廠商景嘉微與國內高性能計算機廠商長城科技簽署了10萬塊GPU采購協(xié)議(擬采購)。

景嘉微,可能很多人不太了解,甚至都沒聽說過,A股股民一定熟悉:這是國內唯一一家上市、并能夠生產自主可控的圖形顯示卡制造商。

近年,景嘉微先后推出的JM5400、JM7200型號顯卡整體帶動國產GPU實力提升一大截。剛剛說的10萬塊采購協(xié)議,便是最新型號JM7200顯卡。

此前有消息稱,景嘉微將于2020年也就是明年將推出JM9系列顯卡,有網絡媒體把這塊顯卡參數與英偉達產品線的產品進行對比,發(fā)現JM9系列堪比同等性能、功耗更低的GTX1080。

回到供貨長城一事。此前,景嘉微業(yè)務限制于軍工、航天,并無介入商用、消費市場。甚至這幾公司的2018年報顯示,全年應收賬款的86.06%來自中航工業(yè)。

目前來看,景嘉微業(yè)務線可能會在2019年發(fā)生轉變。先是國產芯片市場的缺口越裂越大,然后是供貨長城一事。尤其在國內相關科技公司被美國列入出口管制實體名單后,云計算芯片國產替代需求大增,JM系列雖然和英偉達技術差距4、5年,但自主可控的缺口已到來,供不應求,明年的JM9系列很有潛力進入商用云計算領域,或是與國產CPU一同出現在政務辦公整機、工控機、高端機床等。

燧原科技:

燧原科技是少有自主研發(fā)云端AI芯片的初創(chuàng)企業(yè)。這里說它初創(chuàng),一是公司成立時間短,二是采用的芯片架構非常新(DTU),沒有得到市場驗證。

2019年12月,燧原科技發(fā)布兩款訓練卡:T10,T11。兩張卡搭載燧原自研芯片“邃思”,最大功耗分別是225W及300W。其中云端訓練卡T10半精度及混合精度下算力達80TFLOPS。

燧原從成立到兩款板卡推出,時間上僅用了21個月,按照公司發(fā)布會上的說法,T10、T11將在2020年第一季度出貨。屆時,市場反饋值得期待。

數據顯示,燧原COO張亞林持股27.4%,CEO趙立東對等持股27.4%,而背后另一大股東是來自互聯(lián)網巨頭:騰訊(23.2%)。此外,曾帶頭作出國內第一顆移動高速存儲芯片、兆易創(chuàng)新創(chuàng)始人朱一明也通過投資關系占股0.35%。

外界猜測,按照創(chuàng)始人前職務來看,邃思大概率采用內置CPU、GPU、NPU等模塊的融合型異構框架,這也是AMD最具代表性的處理器技術路線之一(APU)??傊?,值得期待。

04、終端推理

推理端芯片近乎空白。

根據移動互聯(lián)網發(fā)展經驗,消費電子、基礎設施等推理端產品的芯片需求量及增長速度將遠超訓練端市場。而剛剛提到的GPU芯片并不適用推理。

無論是中國還是美國,AI推理芯片的發(fā)展仍處于早期。

廣證恒生分析師認為,AI芯片競爭格局未定,即便在云端AI芯片英偉達一家獨大的情況下,國產邊緣端(推理)芯片,國產化有廣闊的應用場景和市場空間。

在此基礎上,多家不同技術路線的AI芯片廠商涌現。

首先是FPGA。國產FPGA并不是沒有公司做,而是大多和軍工、衛(wèi)星項目掛鉤,難以供給民用端。存儲芯片龍頭紫光國徽,分支業(yè)務線中也推出了國內較為稀缺的自主可控FPGA,并計劃2020年推出28nm制程的相關產品。華微電子研制出國內首個自主可控的宇航用FPGA芯片,目前被報道是華為二級供應商。

FGPA技術路線具有幾大特點:性價比,低功耗,可編程。通過定制,可以適應深度學習、機器學習等在云端做的模型訓練。但橫向來看,國內外利用FGPA的部署AI服務器的量還不能與GPU相提并論,主要原因就是:太貴。

開發(fā)框架也沒有開源,IP閉鎖。FGPA是一種趨勢,未來BAT或許會更多采用FGPA集成AI算法。CPU頭部的英特爾最先注意到現階端FGPA與GPU的差距,急忙忙一連收購了多家FPGA創(chuàng)業(yè)公司。

IoT也好,AIoT也好,單純做推理,搭載ASIC是不錯的選擇。根據不同需求,衍生兩條思路:IoT網聯(lián)后做邊緣運算,搭載于邊緣服務器;或直接搭載于終端設備。這里值得強調:由于數據隱私,ASIC暫無法被云端推理+5G取代。

嘉楠耘智就是一家ASIC芯片設計公司。嘉楠創(chuàng)辦初期,2014年成功量產55nm芯片、2015年28nm、2016年16nm,2018年直接突破7nm。流片良品率放在一邊,單純看7nm工藝,不得不說里面的噱頭占比較高。例如,最高每秒50TH算力、主機大小的阿瓦隆1066礦機中塞下了342枚16nm制程A3205芯片。工藝難度越高、集成電路體積越小的流片,即便良品率被低,成本仍在可接受范圍。所以,芯片做小非常討巧。只不過2018年嘉楠7nm概念被瘋炒后又被實錘,為嘉楠當時的赴美上市計劃帶來了負面影響。直到2019年下半年,區(qū)塊鏈概念才被普遍關注,嘉楠逮住機會再次赴美上市、拿下了國產“區(qū)塊鏈+AI+芯片”第一股的稱號。

嘉楠耘智轉向AI芯片的動因很簡單:比特幣挖礦的生意越來越難做。2017到2018年,嘉楠靠出售礦機營收增幅106%,而凈利潤逆勢下滑67.4%,截至2018年6月30日的6個月里,嘉楠的總收入為19.471億元人民幣;但在截至2019年6月30日的6個月里,嘉楠的總收入僅為2.888億元人民幣(合4210萬美元),降幅為85.2%。

到了2019年,伴隨著比特幣10萬元神話跌落,嘉楠礦機的毛利潤率又一次被腰斬。

挖礦潮退燒,嘉楠需另尋出路。

此消彼長。嘉楠沿襲制造礦機的思路,擬量產適用于邊緣計算服務器的勘智K210等系列ASIC芯片。按照目前能夠找到的資料顯示,這塊指甲蓋大小的芯片能夠在定制版卡上流暢地跑人臉識別算法。

拼條命去搭的人工智能市場的首班車。嘉楠在招股書里不斷強調勘智K210的各種優(yōu)點,并提及另一款名為K510的芯片將于2020問世。當然,K系列芯片有沒有人買單就是另一回事了,至少嘉楠是少量擁有完整制造ASIC經驗的IC設計廠商之一。

為產品可靠性考慮,目前主流的視頻、語音推理端芯片還仍圍繞ARM、英偉達Xavier(SoC)、海思。這里提一下華為海思,雖然在業(yè)內,海思多款芯片被各路吐槽、貼吧論壇里流傳著各路黑,但不管怎么說海思是目前能夠唯一一家能覆蓋視頻處理、手機、顯示器、機頂盒等基本生活家電的芯片廠,我們有理由相信,海思的產品更適合中國市場,并且上下游供應鏈成熟,穩(wěn)定供貨有底氣。

定義上講,寒武紀科技是全球第一個成功流片并擁有成熟產品的AI芯片公司,2016做起了推理端AI處理器IP和云端AI加速卡兩條產品線。

2016年,寒武紀發(fā)布了首款10nm工藝的1A處理器(Cambricon-1A),當時這款芯片反響很大,特別是因為2016年,10nm工藝剛剛進入工業(yè)市場,臺積電剛剛宣布能夠支持10nm工藝,這家初創(chuàng)公司便向臺積電下放了訂單,并在2018流片成功。在芯片發(fā)布同時,寒武紀給出了完整配套開發(fā)環(huán)境:Cambricon NeuWare SDK。

2017年,華為麒麟970搭載寒武紀NPU上線。與華為合作的招牌成功為寒武紀帶來巨額熱錢,公司在2017、2018之間不足一年的時間里,依靠兩次上億元美金的投資,估值直接飆升至25億美金。相比同時期成立的AI芯片設計商,寒武紀在還沒有對等的實際收入前提下,已經在資本市場占有一席。

05、底層重建or擁抱全球分工?

一種關于未來趨勢的說法是,技術領域將逐步走向兩個平行系統(tǒng),以方面多多少少倚靠美國,一方面完全擺脫美國。后者里面,臺積電(TSMC)和ARM便是很好案例。

而一些AI細分領域,如智能語音,國內的全志、海思、Amlogic(晶晨半導體)等已處于領先地位。

然而,一項產業(yè)的建設一日建成的可能。以國產數據庫為例,前不久,一家國產數據庫廠商的高管表示,即便企業(yè)不用Hadoop一類軟件,主流國產數據庫的代碼量還只是幾千萬行量級,Oracle幾年前就達到了1億行,追是可以追,但追上還要花“點”時間。

想想幾年前阿里提出的“去IOE”化,實現難度并不是一家企業(yè)、集團能夠赤手一搏的。國產芯替代的進程也注定不會順風順水。另外一些矛盾在于,企業(yè)為生存為利潤會更愿擁抱全球分工。半導體產業(yè)的國產化,大量底層技術的起步無異于重建,投入與資本風險不能小覷。

所以,是從最底層開始重建一遍,還是繼續(xù)擁抱全球分工?

如果以眼下世界芯片格局來看,中國大概率會從今年起,通過刺激資本,將技術流向轉移到以芯片制造業(yè)為主導的產業(yè)推進。什么是供給側改革?這便是。

歷史上,每一代半導體新巨頭和新興地區(qū)的出現都伴隨著終端遷移:PC市場成就了英特爾;移動市場成就了ARM、高通、三星、臺積電;而在AIoT的普及趨勢中,中國IC廠商很可能脫穎而出。眼下,中國已是AI公司、芯片公司創(chuàng)業(yè)和發(fā)展最旺盛的時期,而全球范圍來看,中國目前已經是傳統(tǒng)產業(yè)智能化需求最旺盛的市場。

2019可以說是國產半導體產業(yè)轉折性的一年。截至發(fā)稿,中證全指半導體指數半年漲幅超98%,動態(tài)市盈率(TTM)超85。國聯(lián)安半導體基金指數也已經在2019后半年與滬深300指數拉開明顯差距。

眼下,以AI芯片為導向的半導體產業(yè)路線逐漸明晰,而背后的芯片代工及封測等工藝接收到訂單需求也逐漸增多,或許在未來10年,我們可以看到一批在AI市場中幸存下來的獨角獸,也或許可以親眼目睹半導體基礎技術的飛速發(fā)展。

關鍵詞:

 

網站介紹  |  版權說明  |  聯(lián)系我們  |  網站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com