近期,任正非在與ICPC(國際大學生程序設計競賽)基金會談話中表示,我們即將進入第四次工業革命,基礎就是大算力。
孟晚舟在華為全聯接大會公開演講中提到不容忽視的信息點: “突破算力瓶頸”、“構建第二選擇”。
可見華為對於AI算力的重視程度非常之高。
假期期間我梳理瞭華為算力產業鏈,今天先簡要分享下我對昇騰的幾點理解。
一,昇騰生態究竟是什麼?
狹義來說,華為昇騰是指華為發佈的兩款人工智能處理器芯片,一個是昇騰310用於推理,另一個是910用於訓練業務。
廣義來說,華為昇騰是指整個昇騰計算架構,包括硬件、基礎軟件、應用使能與行業應用及服務等四層。
也就是說,昇騰計算產業以昇騰AI處理器為核心,通過系列硬件和基礎軟件構建全棧AI計算基礎設施,為各行各業賦能。
在硬件方面,包括模塊、標卡、小站、服務器、集群等產品形態;在軟件層面,包括異構計算架構、AI框架、應用使能、全流程開發工具鏈等產品。
01f6f06643483c015f565b76b9f3ef83
昇騰 AI 應用開發過程:以芯片及處理器等硬件為基礎,CANN(異構計算框架)承接硬件與計算框架,搭配自有開發與管理工具,聯接應用使能以投入具體行業應用。
具體來說:
1,硬件:AI體系的基礎,提供強大計算能力
1.1 芯片
主要是指:
昇騰310處理器:本質上是人工智能片上系統,昇騰 310 整數精度(INT8)算力可達 16TOPS,主要應用於邊緣計算產品和移動端設備等低功耗的領域,目前已經大量用於自動駕駛領域。
昇騰910處理器: 整數精度(INT8)算力可達 640TOPS,在業內其算力處於領先水平,性能水平接近於英偉達 A100。主要應用於雲端,可以為深度學習的訓練算法提供強大算力。功耗隻有310W,同時采用瞭7nm先進工藝進程,支持128通道全高清視頻解碼。
1.2 服務器
昇騰AI服務器具有超強算力,適用於中心側AI推理以及深度學習模型開發和訓練場景。包括1)Atlas 800 推理服務器(型號:3000)2)Atlas 800 推理服務器(型號:3010)3)Atlas 800 訓練服務器(型號:9000)4)Atlas 800訓練服務器(型號:9010)5)Atals 800T A2訓練服務器6)Atlas 500 Pro 智能邊緣服務器。
f32df3c16ba1384ec57a28f69a318e86
1.3 標卡
華為昇騰超強算力推理+訓練標卡。
訓練及推理標卡融合“通用處理器、AI Core、編解碼”於一體,需要安裝到服務器上,通過服務器提供運算和模型,為數據中心提供強勁算力。
1)推理卡:包括Atlas 300V 視頻解析卡、Atlas 300V Pro 視頻解析卡、Atlas 300I Pro 推理卡、Atlas 300I Duo 推理卡。其中,Atlas 300I Duo 推理卡在配置下可以輸出整數精度(INT8)達到280TOPS,半精度(FP16)算力達到140TOPS。
2)訓練卡:主要以Atlas 300T Pro 訓練卡(型號:9000)、Atlas 300T A2 訓練卡為主,可廣泛應用於智慧城市、智慧交通、智慧園區、智慧金融等諸多AI行業場景。
1.4 訓練集群
華為昇騰面向人工智能計算中心等重算力場景,構築性能領先的訓練集群,目前主要包含Atlas 900 PoD(型號:9000)、Atlas 900 A2 PoD、Atlas 900 AI集群三種產品,廣泛應用於深度學習模型開發和訓練。
1.5 其他
其他華為昇騰超高算力集成產品包括:
Atlas 200I DK A2 開發者套件,是一款高性能的 AI 開發者套件,4 核 CPU,可提供 8TOPS INT8 的計算能力,可以實現圖像、視頻等多種數據分析與推理計算,可廣泛用於教育、機器人、無人機等場景。
Atlas 500 A2 智能小站是面向邊緣應用的產品,具有環境適應性強、超強計算性能、雲邊協同等特點,可以在邊緣環境廣泛部署,滿足在交通、社區、園區、商場、超市等復雜環境區域的應用需求。
2,軟件:釋放硬件性能,推動AI生態繁榮
針對AI場景,華為設計瞭異構計算架構CANN、AI計算框架MindSpore和第三方適配以及全流程開發工具鏈MindStudio。
2.1 CANN
異構計算架構(CANN)是功能類似於英偉達CUDA+ CuDNN 的核心軟件層。CANN位於計算資源層和應用層之間,即芯片使能層,實現瞭在高性能計算硬件和AI應用之間架起一座橋梁。
CANN包括引擎、編譯器、執行器、算子庫等,承載計算機的單元為 AI 芯片。
異構計算架構主要負責調度分配計算到對應的硬件上。
從層級來看,CANN 上承 AI 框架,下接 AI 處理器硬件,先進的異構架構使得神經網絡執行過程的硬件交互時間有效縮短,從而實現對硬件性能的進一步利用。
2.2 MindSpore
在 CANN 的基礎之上,昇騰提供瞭昇思深度學習框架MindSpore。作為支持雲、邊、端靈活部署的深度學習框架,於2020年正式開源,和TensorFlow、PyTorch、飛槳等框架共同為人工智能領域發力。
MindSpore旨在實現易開發、高效執行、全場景覆蓋三大目標。兼旨在實現易開發、高效執行、全場景覆蓋三大目標。
910c544e1518a8083e8bec5c79a44159
在人工智能框架使用率方面,TensorFlow、PyTorch、昇思MindSpore和飛槳合計占瞭86%的市場份額,其中,MindSpore以11%的占比在全球框架裡排名第三,逆勢進入瞭AI框架的第一梯隊。
2.3 MindStudio
華為還提供瞭全流程開發的工具鏈MindStudio。開發者可以利用MindStudio提供的簡單易用的開發工具,高效地完成端到端開發,讓開發者能夠在安裝部署、模型訓練、模型推理、算子開發、應用開發、調試調優和應用部署全流程中一站式完成,無需切換不同的工具,從而顯著降低瞭開發門檻。
MindStudio支持訓練、推理場景。1)訓練場景:MindStudio(昇騰訓練加速工具)利用獨有的算法,使訓練速度提升25%。2)推理場景:MindStudio(昇騰模型壓縮工具)利用獨有的智能算法,加速推理進程,可大致提速47%。
二,華為昇騰的五類合作夥伴
昇騰生態夥伴包含:整機硬件夥伴、IHV硬件夥伴、應用軟件夥伴、一體機解決方案夥伴以及生態運營夥伴五大類。
其中,整機硬件夥伴有13傢、IHV硬件夥伴有6傢、軟件夥伴大約1200傢,以薩技術是其一體機解決方案夥伴,極視角科技以及中軟國際是其生態運營夥伴。
1、整機硬件夥伴
在昇騰計算整機硬件的產品方面,華為通過包括寶德、華鯤振宇、神州數碼等眾多主流的廠商合作,內容主要涵蓋服務器,共同打造適應產業發展的產品。
2、IHV硬件夥伴
凌華科技、研揚科技、研華科技、飛途、東聲智能、全愛科技6大公司成為IHV硬件夥伴。該合作夥伴基於華為昇騰部件進行二次開發,形成自有品牌硬件產品並進行銷售。
3,應用軟件夥伴:
對接昇騰服務器、智能小站、集群、加速模塊和卡以及MindSpore等產品,華為昇騰應用軟件夥伴開發、銷售自有知識產權的應用程序、軟件、垂直細分應用等產品。該合作夥伴屬於數字政府和制造行業的居多。
4,一體機解決方案夥伴
以薩技術成為華為昇騰唯一的一體機解決方案夥伴,基於昇騰系列的產品,打造瞭以薩智慧交通和以薩智慧交通兩大解決方案。
5,生態運營夥伴
華為昇騰和極視角科技以及中軟國際達成合作。其中,極視角通過昇騰產品構建瞭“智慧城市”解決方案,具有部署方便、一鍵式安裝、一站式管理和數據不外泄功能;而中軟國際年蟬聯中國軟件和信息服務綜合競爭力百強企業前15位,致力於昇騰算力企業合作、方案構建、算力運營等領域。
三,昇騰當前有哪些不足?
當前昇騰需求的爆發式增長動力主要來自1)AI算力行業自身的快速增長;2)國內自主可控的替代,比如說國傢級別的人工智能計算中心,大部分開始會采用昇騰。
當相比於英偉達目前也有不少核心問題:
1,昇騰隻能用於華為自身生態中的大模型業務,比如昇騰不能做GPT-3,因為910不支持32位浮點,而目前大模型訓練幾乎都要使用32位的浮點,所以昇騰芯片隻能利用華為開發的框架(如MindSpore),再加上優化好的大模型,比如盤古CV。
2,生態依然需要完善。英偉達最強大的護城河在於它的生態系統CUDA。目前CANN還有差距。
3,先進制程的卡脖子問題得到瞭一定解決,但依然需要擔憂產能問題。
四,出貨情況
預計今年出貨量40萬顆,310卡占90%,910占比10%。現在每年昇騰40萬顆,明年預計出貨在2倍多。
整體上來說,910卡換成服務器在1萬多臺,910滿配,終端標價110-120萬,預計終端是80- 90萬左右,不會超過90萬,今年在90億左右,明年翻倍180億。
五,未來主要關註事項
1.華為不斷更新昇騰910的適配范圍和軟件;
2,國產7nm制程開始有更多事實做支撐;
3,如果美國開始禁止H800和A800,,昇騰起量可能也會比較快。
參考資料:
民生證券《華為昇騰深度:國產AI算力“扛旗者”》
下一篇