當(dāng)前位置：首頁 > 芯聞號(hào) > 極客網(wǎng)

原創(chuàng)

模型越新幻覺越重！AI幻覺扣住產(chǎn)業(yè)發(fā)展命脈

時(shí)間：2025-05-07 14:23:09

關(guān)鍵字：人工智能大模型 AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]自誕生以來，人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”，指的是大語言模型會(huì)將虛構(gòu)信息當(dāng)作真實(shí)事實(shí)輸出。

自誕生以來，人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”，指的是大語言模型會(huì)將虛構(gòu)信息當(dāng)作真實(shí)事實(shí)輸出。實(shí)際上，“幻覺”這一表述相當(dāng)委婉，它實(shí)則暴露出AI的核心缺陷——當(dāng)前的大語言模型尚未達(dá)到真正意義上的智能水平。

就在上個(gè)月，編程工具Cursor引發(fā)一場(chǎng)風(fēng)波。用戶收到消息稱，其使用政策將進(jìn)行調(diào)整，未來僅支持在單臺(tái)電腦上使用。然而，這條消息很快被證實(shí)為假。Cursor首席執(zhí)行官兼聯(lián)合創(chuàng)始人Michael Truell迅速出面澄清：“我們并未制定類似政策，用戶完全可以在多臺(tái)設(shè)備上使用Cursor。這一錯(cuò)誤信息源于一線AI機(jī)器人的錯(cuò)誤回復(fù)。”

此次事件不僅讓用戶虛驚一場(chǎng)，更直觀展現(xiàn)了人工智能系統(tǒng)的不穩(wěn)定。

幻覺成為AI進(jìn)化的攔路虎

經(jīng)過數(shù)年發(fā)展，盡管AI技術(shù)在諸多領(lǐng)域取得突破，但在判斷信息真假時(shí)仍不盡如人意。即使是OpenAI、谷歌、DeepSeek等行業(yè)頭部機(jī)構(gòu)研發(fā)的模型也存在許多錯(cuò)誤輸出。

值得警惕的是，這些錯(cuò)誤并未隨著時(shí)間推移而減少，反而呈現(xiàn)增多趨勢(shì)。誠然，AI在數(shù)學(xué)運(yùn)算、編程領(lǐng)域有所提升，但在處理復(fù)雜事實(shí)性信息時(shí)依然存在明顯短板，難以滿足用戶需求。

今天的AI實(shí)際上是根據(jù)“復(fù)雜數(shù)學(xué)系統(tǒng)”構(gòu)建的，它們通過不斷分析海量數(shù)字?jǐn)?shù)據(jù)，持續(xù)優(yōu)化自身性能。然而，算法系統(tǒng)始終存在一個(gè)根本性缺陷——無法有效區(qū)分信息真假。在一項(xiàng)測(cè)試中，相較于舊版AI系統(tǒng)，新版AI系統(tǒng)的“幻覺率”竟然更高，這說明AI面臨嚴(yán)峻挑戰(zhàn)。

Vectara專注于企業(yè)級(jí)AI工具開發(fā)，其首席執(zhí)行官Amr Awadallah直言：“盡管我們傾盡全力，可‘幻覺’問題還是存在，它并沒有消失?！爆F(xiàn)狀表明，即便在專業(yè)團(tuán)隊(duì)的持續(xù)攻堅(jiān)下，AI“幻覺”依然是難以攻克的技術(shù)頑疾。

Okahu致力于解決AI“幻覺”問題，其首席執(zhí)行官Pratik Verma也指出：“判斷AI回應(yīng)是事實(shí)還是虛假需要耗費(fèi)大量時(shí)間。如果不能妥善處理這些錯(cuò)誤，就無法保證人工智能系統(tǒng)發(fā)揮應(yīng)有價(jià)值，畢竟這些系統(tǒng)的設(shè)計(jì)初衷是幫助用戶自動(dòng)完成各項(xiàng)任務(wù)。”

AI企業(yè)并非不清楚“幻覺”問題的存在，它們付出了巨大努力，但始終無法有效解決這一難題。OpenAI的內(nèi)部測(cè)試顯示，相比老系統(tǒng)，它所開發(fā)的新系統(tǒng)“幻覺率”反而更高。

在PersonQA標(biāo)準(zhǔn)測(cè)試中，o3模型在33%的回答中產(chǎn)生幻覺，幾乎是o1模型（16%）的兩倍，而最新的o4-mini模型表現(xiàn)更差，“幻覺率”高達(dá)48%。若采用SimpleQA標(biāo)準(zhǔn)測(cè)試，情況同樣不容樂觀。o3和o4-mini的“幻覺率”分別達(dá)到51%和79%，o1模型的“幻覺率”也有44%。

OpenAI指出，AI系統(tǒng)從海量數(shù)據(jù)中學(xué)習(xí)，數(shù)據(jù)量之巨遠(yuǎn)超人類專家的理解能力，因此很難確定問題根源究竟在哪里。

人類恐怕不能解決AI幻覺

華盛頓大學(xué)及艾倫人工智能研究所研究人員Hannaneh Hajishirzi表示，他們找到一種新方法，能夠追溯AI特定行為在訓(xùn)練數(shù)據(jù)中的源頭。但由于系統(tǒng)學(xué)習(xí)的數(shù)據(jù)量過于龐大，新工具無法解釋所有情況。Hannaneh Hajishirzi坦言：“我們?nèi)匀桓悴磺暹@些模型到底是如何運(yùn)行的。”

Vectara近年來持續(xù)對(duì)AI系統(tǒng)展開測(cè)試，通過讓系統(tǒng)總結(jié)新聞內(nèi)容的方式，觀察“幻覺率”的變化情況。然而，測(cè)試結(jié)果令人沮喪——“幻覺率”不僅未降低，反而呈上升趨勢(shì)。

長(zhǎng)期以來，OpenAI認(rèn)定一個(gè)理念：向AI投喂的數(shù)據(jù)越多，AI就會(huì)越聰明。但如今，AI在訓(xùn)練時(shí)幾乎耗盡所有互聯(lián)網(wǎng)英文信息，它的幻覺卻愈發(fā)嚴(yán)重。這一現(xiàn)實(shí)表明，若想突破“幻覺”困境必須探尋新的技術(shù)路徑。

當(dāng)前，工程師們開始倚重“強(qiáng)化學(xué)習(xí)”技術(shù)。在數(shù)學(xué)、編程等領(lǐng)域，強(qiáng)化學(xué)習(xí)確實(shí)能通過試錯(cuò)機(jī)制實(shí)現(xiàn)學(xué)習(xí)與進(jìn)步，但在部分領(lǐng)域，該技術(shù)仍未帶來明顯改善。

此外，推理模型在解答復(fù)雜問題時(shí)會(huì)先進(jìn)行“思考”，采用分步解決的策略。然而，每個(gè)思考步驟都潛藏著產(chǎn)生“幻覺”的風(fēng)險(xiǎn)，思考步驟越多，累積的錯(cuò)誤也就越多，這無疑給提升AI信息準(zhǔn)確性帶來更大挑戰(zhàn)。

如今的AI能夠展示思考過程，使用戶可以看到錯(cuò)誤產(chǎn)生的環(huán)節(jié)，這無疑是技術(shù)層面的一大進(jìn)步。然而研究人員發(fā)現(xiàn)，AI所展示的思考步驟可能與最終答案毫無關(guān)聯(lián)。Anthropic研究人員Aryo Pradipta Gema直言：“AI系統(tǒng)聲稱自己正在思考，但它的思考有時(shí)并無必要。”

一些研究人員甚至認(rèn)為，杜絕AI“幻覺”不可能實(shí)現(xiàn)，只能通過多種方法降低“幻覺率”。比如讓AI直面自身知識(shí)盲區(qū)，主動(dòng)向用戶承認(rèn)“我不知道”；引入“檢索增強(qiáng)生成”技術(shù)，促使AI通過檢索相關(guān)文檔輔助作答，而非單純依賴記憶數(shù)據(jù)直接輸出答案。

美國東北大學(xué)體驗(yàn)式人工智能研究所研究人員Usama Fayyad提出，“幻覺”這一表述存在概念偏差，它過度擬人化。Usama Fayyad強(qiáng)調(diào)，AI生成錯(cuò)誤信息與人類產(chǎn)生幻覺存在本質(zhì)差異——AI既無意圖，也無意識(shí)，應(yīng)避免用帶有情感色彩的詞匯模糊技術(shù)本質(zhì)。（小刀）

聲明：該篇文章為本站原創(chuàng)，未經(jīng)授權(quán)不予轉(zhuǎn)載，侵權(quán)必究。

換一批

與傳統(tǒng)的驅(qū)動(dòng)方式相比，共陰恒流驅(qū)動(dòng)在能效有哪些優(yōu)勢(shì)

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動(dòng)電源

[電源]

工業(yè)電機(jī)驅(qū)動(dòng)電源設(shè)計(jì)：反電動(dòng)勢(shì)抑制與過流保護(hù)的集成方案

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動(dòng)力設(shè)備，其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動(dòng)勢(shì)抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié)，集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動(dòng)電源

[電源]

如何解決 LED 驅(qū)動(dòng)電源的易損壞問題

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而，在實(shí)際應(yīng)用中，LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗(yàn)。要解決這一問題，需從設(shè)計(jì)、生...

關(guān)鍵字：驅(qū)動(dòng)電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計(jì)中LED驅(qū)動(dòng)電源的公式

根據(jù)LED驅(qū)動(dòng)電源的公式，電感內(nèi)電流波動(dòng)大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計(jì) 驅(qū)動(dòng)電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動(dòng)電源方案選擇問題探討

電動(dòng)汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字：電動(dòng)汽車新能源驅(qū)動(dòng)電源

[電源]

合理的驅(qū)動(dòng)電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動(dòng)電源 LED

[消費(fèi)電子]

AC-DC電源轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字： LED 驅(qū)動(dòng)電源功率因數(shù)校正

[電源]

針對(duì)于LED照明驅(qū)動(dòng)電源技術(shù)中的電磁干擾其中的三大硬件問題措施

在LED照明技術(shù)日益普及的今天，LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作，還可能對(duì)周圍電子設(shè)備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來解決L...

關(guān)鍵字： LED照明技術(shù) 電磁干擾驅(qū)動(dòng)電源

[電源]

LED驅(qū)動(dòng)電源的核心部分“開關(guān)管”和“變換器”設(shè)計(jì)技巧

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字： LED 驅(qū)動(dòng)電源開關(guān)電源

[電源]

最全LED驅(qū)動(dòng)電源及散熱設(shè)計(jì)方案介紹

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器，通常情況下：LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字： LED 隧道燈驅(qū)動(dòng)電源