9月18日,在第四屆HUAWEI CONNECT 2019(華為全聯接大會),在本次大會上,中國工程院院士、鵬城實驗室主任高文院士,分享了鵬城實驗室與華為的合作,力求共同打造中國首個動態(tài)進化的E級AI超算系統,構建新一代人工智能基礎研究創(chuàng)新平臺。華為云業(yè)務總裁鄭葉來,則從商業(yè)應用的角度,基于華為云在10多個行業(yè)、500多個項目的實踐,指出行業(yè)AI正在跨越商用裂谷,成為重塑企業(yè)數字化轉型的關鍵驅動。
華為首次發(fā)布計算戰(zhàn)略,基于架構創(chuàng)新、投資全場景處理器族、有所為有所不為的商業(yè)策略、構建開放生態(tài)進行布局。同時,華為重磅發(fā)布了全球最快AI訓練集群Atlas 900,加速科學研究與商業(yè)創(chuàng)新的智能化進程。
華為首次發(fā)布計算戰(zhàn)略
華為副董事長胡厚崑表示,“我們面臨的是一個2萬億美元的計算產業(yè)大藍海,華為堅定不移地投入計算產業(yè),通過對架構創(chuàng)新的突破、對全場景處理器的投資、堅持有所為有所不為的商業(yè)策略,以及構建開放生態(tài)來布局戰(zhàn)略。”
第一,架構創(chuàng)新。投資基礎研究,推出達芬奇架構,用創(chuàng)新的處理器架構來匹配算力的增速。
第二,投資全場景處理器族,包括面向通用計算的鯤鵬系列,面向AI計算的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列等。
第三,有所為有所不為的商業(yè)策略。華為不直接對外銷售處理器,以云服務面向客戶,以部件為主面向合作伙伴,優(yōu)先支持合作伙伴發(fā)展整機。
第四,構建開放生態(tài)。未來5年,繼續(xù)投入15億美元,匯聚500萬開發(fā)者,使能全球合作伙伴開發(fā)應用及解決方案。
Atlas 900創(chuàng)造全新世界紀錄
這款產品匯聚了華為十多年的技術沉淀,在衡量AI計算能力的金標準ResNet-50圖片分類模型下,Atlas 900只需59.8秒就完成了訓練,在同等精度下比原來的世界紀錄快10秒。 “ ImageNet-1k數據集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓練集群比第2名快15%。
據了解,Atlas 900 AI集群主要為大型數據集神經網絡訓練提供超強算力,可廣泛應用于科學研究與商業(yè)創(chuàng)新,讓研究人員更快地進行圖像、視頻和語音等AI模型訓練,讓人類更高效地探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。
Atlas 900 AI集群也可以提供云服務,以云的方式提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗的“易獲取、用得起、方便用”的普惠AI算力。為了讓各行各業(yè)獲取超強算力,華為將Atlas 900部署到云上,推出華為云EI集群服務,并以極優(yōu)惠的價格,面向全球科研機構和大學,即刻開放申請使用。
“這是計算產業(yè)新的大航海時代,我們期待的是千帆競發(fā),而不是獨舟奮進。我們期望和各行各業(yè)的伙伴共同努力,抓住歷史機遇,共創(chuàng)智能新高度。” 胡厚崑最后強調。
Atlas 900 代表當今全球
算力巔峰
此次發(fā)布的Atlas 900 AI訓練集群由數千顆昇騰910 AI處理器互聯構成,是當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
除了昇騰910帶來的高性能外,Atlas 900還有四大亮點。
其一是AI算力業(yè)界領先。Atlas 900 AI訓練集群采用業(yè)界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力。
其二是最佳集群網絡。Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式,百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%。獨創(chuàng)iLossless 智能無損交換算法,對集群內的網絡流量進行實時的學習訓練,實現網絡0丟包與E2E μs級時延。
其三是系統級調優(yōu)。Atlas 900 AI訓練集群通過華為集合通信庫和作業(yè)調度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強大性能。華為集合通信庫提供訓練網絡所需的分布式并行庫,通信庫+網絡拓撲+訓練算法進行系統級調優(yōu),實現集群線性度>80%,極大提升了作業(yè)調度效率。
其四是極致散熱系統。傳統數據中心多以風冷技術對設備進行散熱,但在人工智能時代傳統數據中心卻面臨非常大的挑戰(zhàn)。Atlas 900 AI訓練集群采用全液冷方案,創(chuàng)新性設計業(yè)界最強柜級密閉絕熱技術,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現PUE<1.1的極致數據中心能源效率。極致的液冷散熱技術滿足了高功率、高密設備部署、低PUE的需求,極大地降低了客戶的TCO。
計算是人類認知世界的一種模式。從大型機到個人計算機,從智能手機到可穿戴設備,計算能力日益成為人類能力的延伸。同時,計算模式也在不斷演進,基于統計的計算模式將逐漸成為主流。預計5年后,AI計算所消耗的算力,將占到算力消耗總量的80%以上,計算正在進入一個新的智能時代。





