2025年10月16日,深圳——在今日舉行的灣區(qū)半導體大會上,英特爾發(fā)表了題為《英特爾銳炫多卡方案助陣AI應用落地部署》的演講。演講著重闡釋了英特爾為加速企業(yè)AI部署所推出的創(chuàng)新路徑——通過打造基于英特爾銳炫多卡的Battlematrix(戰(zhàn)斗陣列)推理工作站平臺,突破單GPU的算力和應用瓶頸,為從邊緣、工作站到服務器的廣泛應用場景,提供高效且極具成本效益的AI部署方案,讓更多企業(yè)將AI轉化為實際生產力。
英特爾中國區(qū)顯卡和AI高級產品總監(jiān)徐金平發(fā)表演講
在AI時代,企業(yè)面臨的是一個充滿機遇與挑戰(zhàn)的局面:一方面,大模型規(guī)?;逃眠M展突飛猛進,蘊藏的機遇近在咫尺。另一方面,無論是海量圖像、文本、音視頻數據的處理,還是復雜精細化AI模型的部署等等,都給傳統(tǒng)算力架構的性能和能耗帶來了挑戰(zhàn)。AI浪潮的確是席卷而來,但如何將AI潛力有效地轉化為實際生產力,仍是一道橫亙在前的難題。
英特爾銳炫多卡方案希望憑借靈活的擴展能力,不僅高效承接多模態(tài)數據的密集型計算需求,又能降低企業(yè)AI部署的成本與復雜度,為AI的大規(guī)模、普惠化落地筑牢支撐。
作為方案的核心硬件,英特爾銳炫?ProB60GPU有著為AI推理量身打造的關鍵亮點——24GB的大顯存和456GB/s的高內存帶寬,滿足了AI推理對顯存容量的迫切需求,讓大參數模型流暢運行,讓海量數據高效吞吐;同時,197TOPS的峰值算力則為各類復雜AI推理任務提供了源源不斷的動力。
英特爾銳炫ProB60GPU的另一大亮點是支持多顯卡協(xié)同工作??紤]到邊緣端和服務器等更廣泛應用場景的需求,英特爾設計了基于銳炫ProB60GPU的多卡互聯方案——Battlematrix(戰(zhàn)斗陣列)推理工作站平臺。它最多可搭載8/16張英特爾銳炫ProGPU,顯存最高可達192GB/384GB,支持100B+參數模型,可順暢處理大規(guī)模數據集與復雜模型等任務,契合企業(yè)對“高算力+大顯存+成本效益”的多重訴求。在實際應用中,英特爾工程師團隊借助該方案,將原本需數天完成的代碼修復全流程縮短至數小時,充分驗證了多卡互聯方案在復雜任務處理中的高效與可靠。
以英特爾銳炫ProB60和銳炫多卡解決方案為核心,英特爾為不同場景的AI部署提供了靈活的產品形態(tài)選擇。具體而言:
個人和邊緣側輕量級AI推理場景:提供搭載1塊英特爾®酷睿?處理器和1-2塊英特爾銳炫ProB60GPU的方案,支持7B至32B模型,實現單用戶到16+多用戶的并發(fā)處理。
通用工作站及服務器場景:通過搭載英特爾®至強®處理器平臺,并配置4塊英特爾銳炫ProB60GPU,可支持32B至70B模型,滿足50+用戶的并發(fā)需求。
專用AI服務器場景:可借助2塊英特爾®至強®處理器平臺和8-16塊英特爾銳炫ProB60,支持32B至100B模型,服務100+以上用戶。
由此一來,無論是個人電腦、邊緣設備、通用工作站/服務器,乃至專用AI服務器,都能找到與之匹配的高效且具備成本優(yōu)勢的部署方案,這正是英特爾助力更多企業(yè)快速推進AI部署與實踐的具體體現。
今年,英特爾已經推出了英特爾銳炫多卡AI算力一體機方案,而基于英特爾銳炫ProB系列的多卡方案的到來,進一步豐富了英特爾支持AI大模型部署的硬件形態(tài)。在AI快速迭代的當下,英特爾強調的是軟硬結合的綜合價值,將通過底層硬件創(chuàng)新與開放軟件生態(tài),讓AI部署更普惠、更便捷。





