日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 芯聞號 > 美通社全球TMT
[導(dǎo)讀]北京2025年3月20日 /美通社/ -- 浪潮信息宣布推出元腦CPU推理服務(wù)器,可高效運行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務(wù)器NF8260G7和NF8480G7設(shè)計采用4顆高性能通用CPU和多通道內(nèi)存系統(tǒng),通過先進的張量并行策略和AMX加速技術(shù),...

北京2025年3月20日 /美通社/ -- 浪潮信息宣布推出元腦CPU推理服務(wù)器,可高效運行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務(wù)器NF8260G7和NF8480G7設(shè)計采用4顆高性能通用CPU和多通道內(nèi)存系統(tǒng),通過先進的張量并行策略和AMX加速技術(shù),單機即可高效運行DeepSeek-R1 32BQwQ-32B推理模型,單用戶性能超20 tokens/s,可同時處理20個并發(fā)用戶請求,是企業(yè)快速、易獲得、低投入部署上線大模型平臺的理想算力選擇,將加速DeepSeek帶動下AI落地普及速度。

大模型行業(yè)應(yīng)用落地加速,DeepSeek-R1 32B、QwQ-32B等模型中文能力見長,并在理解能力和知識儲備上有顯著優(yōu)勢,是企業(yè)平衡性能和部署成本的最佳模型選擇。元腦CPU推理服務(wù)器僅基于通用處理器進行軟硬協(xié)同優(yōu)化,可為企業(yè)32B模型推理與云計算、數(shù)據(jù)庫等通用關(guān)鍵業(yè)務(wù)場景融合提供更高效、更靈活、更穩(wěn)定的AI通用算力支撐。

浪潮信息:推出CPU推理服務(wù)器支持DeepSeek和QwQ,元腦加速AI普及


隨著DeepSeek等大模型在企業(yè)場景中的應(yīng)用日趨廣泛,以及與企業(yè)業(yè)務(wù)系統(tǒng)的融合更加緊密,CPU服務(wù)器憑借其獨特優(yōu)勢成為中小規(guī)模并發(fā)場景部署DeepSeek的最佳選擇。CPU服務(wù)器具備卓越的通用性和靈活性,可同時支持AI推理、云計算、數(shù)據(jù)庫等多種工作負載,避免了專用AI硬件的使用局限,為大模型應(yīng)用與現(xiàn)有IT基礎(chǔ)設(shè)施的融合提供了更加靈活、經(jīng)濟的方案選擇,使企業(yè)能夠以較低的硬件投入快速實現(xiàn)大模型應(yīng)用落地。

在企業(yè)部署大模型的過程中,參數(shù)規(guī)模與其應(yīng)用場景息息相關(guān)。浪潮信息與IDC聯(lián)合發(fā)布的《2025年中國人工智能計算力發(fā)展評估報告》顯示,目前92%企業(yè)使用的生成式人工智能模型平均參數(shù)量小于50B。一般而言,671B等超大規(guī)模參數(shù)的模型性能更強,但對硬件資源要求高,部署成本昂貴;而32B級模型在理解能力和知識儲備上有顯著優(yōu)勢,能夠平衡性能和部署成本。以業(yè)界32B模型為例,DeepSeek-R1 32B在知識問答、智能寫作、內(nèi)容生成等方面表現(xiàn)優(yōu)秀,QwQ-32B則在數(shù)學(xué)推理、編程任務(wù)和長文本處理等方面的性能優(yōu)異。DeepSeek-R1 32B和QwQ-32B的訓(xùn)練數(shù)據(jù)中包含海量的高質(zhì)量中文語料庫,會更加適合于國內(nèi)企業(yè)應(yīng)用,而Llama 70B主要基于英文語料進行訓(xùn)練,對中文用戶而言不夠友好。因此,大多數(shù)企業(yè)應(yīng)用場景中,如企業(yè)知識庫問答、文檔寫作、會議紀(jì)要整理等場景,32B參數(shù)級別的模型往往是最佳選擇,既能提供強大的能力支持,又能保持合理的硬件投入。

目前元腦CPU推理服務(wù)器NF8260G7和NF8480G7基于通用處理器架構(gòu)進行軟硬協(xié)同優(yōu)化,已經(jīng)完成與DeepSeek-R1 32B和QwQ-32B等大模型的深度適配和優(yōu)化。元腦CPU推理服務(wù)器通過采用先進的張量并行策略和AMX加速技術(shù),業(yè)界主流企業(yè)級大模型推理服務(wù)框架,實現(xiàn)多處理器并行計算,并使用AWQ(激活感知權(quán)重量化)技術(shù),進一步提升推理解碼性能,成功實現(xiàn)單用戶最高20tokens/s的最佳性能,為企業(yè)的AI大模型部署應(yīng)用帶來流暢體驗。

面對CPU服務(wù)器部署大模型面臨算力和帶寬方面的挑戰(zhàn),元腦CPU推理服務(wù)器采用了多項創(chuàng)新技術(shù)。

  • 在算力方面,元腦CPU推理服務(wù)器NF8260G7和NF8480G7,設(shè)計上采用4顆32核心的英特爾至強處理器6448H,具有AMX(高級矩陣擴展)AI加速功能,支持張量并行計算,并通過多通道內(nèi)存系統(tǒng)設(shè)計可支持32組DDR5內(nèi)存,從而在單機具備超強的BF16精度AI推理能力、最大16T內(nèi)存容量和1.2TB/s內(nèi)存帶寬,可以更好滿足模型權(quán)重、KVCache等計算和存儲需求,快速讀取和存儲數(shù)據(jù),大幅提升大模型推理性能。同時,元腦四路服務(wù)器具備高可靠性,平均無故障時間可達200,000小時,保障關(guān)鍵應(yīng)用和AI推理應(yīng)用持續(xù)穩(wěn)定運行。
  • 在算法方面,元腦CPU推理服務(wù)器對業(yè)界主流的企業(yè)級大模型推理服務(wù)框架vLLM進行深度定制優(yōu)化,通過張量并行和內(nèi)存綁定技術(shù),充分釋放服務(wù)器CPU算力和內(nèi)存帶寬潛能,實現(xiàn)多處理器并行計算,效率最高提升4倍,并使用AWQ(激活感知權(quán)重量化)技術(shù)進一步加速解碼性能,實現(xiàn)了2倍解碼性能提升。測試數(shù)據(jù)顯示,基于單臺NF8260G7,在使用DeepSeek-R1 32B進行帶思維鏈深度思考的短輸入長輸出的問答場景下,解碼性能超過20tokens/s,20個并發(fā)用戶下,總token數(shù)達到255.2tokens/s;在使用QwQ-32B進行模型推理時,支持20個并發(fā)用戶數(shù),總token數(shù)達到224.3tokens/s,可以提供流暢穩(wěn)定的用戶體驗。

基于DeepSeek-R1 32B 并發(fā)性能測試數(shù)據(jù)


基于DeepSeek-R1 32B 并發(fā)性能測試數(shù)據(jù)

 

基于QwQ-32B 并發(fā)性能測試數(shù)據(jù)


基于QwQ-32B 并發(fā)性能測試數(shù)據(jù)

當(dāng)前,元腦服務(wù)器研發(fā)團隊正與業(yè)內(nèi)團隊密切合作,在計算架構(gòu)、算子調(diào)優(yōu)、并行策略、框架適配、調(diào)度管理等多個方面持續(xù)發(fā)力,旨在為用戶帶來高效、穩(wěn)定的DeepSeek等大模型部署方案,助力大模型快速落地應(yīng)用。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉