Qwen3-Max成阿里通義“地表最強(qiáng)”：性能超GPT5

時(shí)間：2025-09-24 12:38:14

關(guān)鍵字： Qwen3-Max 阿里

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]9月24日消息，今日，2025云棲大會(huì)開(kāi)幕，阿里通義旗艦?zāi)Ｐ蚎wen3-Max重磅亮相，性能超過(guò)GPT5、Claude Opus 4等，躋身全球前三。

9月24日消息，今日，2025云棲大會(huì)開(kāi)幕，阿里通義旗艦?zāi)Ｐ蚎wen3-Max重磅亮相，性能超過(guò)GPT5、Claude Opus 4等，躋身全球前三。

據(jù)悉，Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本，其預(yù)覽版已在 Chatbot Arena 排行榜上位列第三，正式版性可望再度實(shí)現(xiàn)突破。

Qwen3-Max作為通義千問(wèn)家族中最大、最強(qiáng)的基礎(chǔ)模型。

該模型預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens，總參數(shù)超過(guò)萬(wàn)億，擁有極強(qiáng)的Coding編程能力和Agent工具調(diào)用能力。

在大模型用Coding解決真實(shí)世界問(wèn)題的SWE-Bench Verified測(cè)試中，Instruct版本斬獲69.6分，位列全球第一梯隊(duì);

在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中，Qwen3-Max取得突破性的74.8分，超過(guò)Claude Opus4和DeepSeek-V3.1。

與此同時(shí)，Qwen3-Max的推理增強(qiáng)版本Qwen3-Max-Thinking-Heavy也展現(xiàn)出非凡性能，結(jié)合工具調(diào)用和并行推理技術(shù)，其推理能力創(chuàng)下新高，尤其在聚焦數(shù)學(xué)推理的AIME 25和HMMT測(cè)試中，均達(dá)到突破性的滿分100分，為國(guó)內(nèi)首次。

Qwen3-Max推理模型之所以能夠取得優(yōu)異成績(jī)，原因在于大模型在解數(shù)學(xué)題時(shí)懂得調(diào)動(dòng)工具，能夠?qū)懘a做題，同時(shí)，增加測(cè)試時(shí)的計(jì)算資源，也讓模型表現(xiàn)變得更好。

目前，通義千問(wèn)系列模型已經(jīng)實(shí)現(xiàn)從0.5B到超萬(wàn)億的全尺寸覆蓋，包含三百多個(gè)大模型，可滿足不同場(chǎng)景的需求。

即日起，用戶可在通義千問(wèn)QwenChat上免費(fèi)體驗(yàn)Qwen3-Max，也可通過(guò)阿里云百煉平臺(tái)調(diào)用API服務(wù)。