日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 芯聞號 > 極客網(wǎng)
[導讀]學生參加考試,當他不知道題目的答案時,可能會猜測。實際上,AI聊天機器人也一樣。AI給出的答案可能看起來正確,實際卻是完全錯誤的,這就是所謂的“幻覺”。

學生參加考試,當他不知道題目的答案時,可能會猜測。實際上,AI聊天機器人也一樣。AI給出的答案可能看起來正確,實際卻是完全錯誤的,這就是所謂的“幻覺”。

從本質(zhì)上講,AI大語言模型生成的回復偏離事實或者不符合邏輯,就會產(chǎn)生幻覺。在訓練時模型難免存在數(shù)據(jù)空白,但它會用看似合理、實則錯誤的細節(jié)填補、掩飾。

AI并非有意欺騙人類,而是人類利用龐大數(shù)據(jù)進行訓練時存在缺陷。AI預測序列的下一個單詞或者詞匯時,并未真正理解含義,所以導致錯誤。

雖然近年來AI技術有所進步,但即便是在OpenAI的GPT-5模型中,幻覺依然存在,而且還很嚴重。

AI幻覺出現(xiàn)與獎勵出錯有關

為什么會出現(xiàn)幻覺?一些專家認為,主要是訓練數(shù)據(jù)和算法存在局限性。OpenAI開發(fā)的AI模型實際上就是模式匹配機器,它擅長模仿,但是當數(shù)據(jù)不完整或者含糊不清時就容易出錯。

OpenAI最近發(fā)表論文,認為造成幻覺的原因是訓練時方法錯誤。當模型輸出充滿自信的結果時會獲得“獎勵”,哪怕給出的結果是猜測的,也會得到獎勵,這就誘導AI輸出過度自信但存在錯誤的信息。

也就是說,在回復時AI喜歡“假裝”自己能準確回答問題,不承認自己存在不確定性,這一問題屬于隱性結構性缺陷,暫時找不到解決方法。

一些專家斷言,當前的訓練方法鼓勵AI猜測,導致AI過度自信,不承認自己無知,結果導致“幻覺”問題有可能越來越嚴重。

就連OpenAI也不得不承認,幻覺可能是永遠無法解決的問題。所以OpenAI認為,不應該鼓勵AI猜測,而應該鼓勵AI承認不確定性。

然而,另一個問題隨之到來。Claude模型鼓勵AI承認不確定性,對于不準確的回復,它總是避免給出定論。但如此一來,必然會導致Claude在回復時拒絕率居高不下,進而導致用戶不滿,最終影響實用性。

今天的AI實際上有點像“應試者”,面對問題時如果無法給出確定答案,為了提高成績,AI會通過猜測來應對,因為猜測后成績更高。我們的世界并非絕對的二元對立,對與錯、黑與白,并非如此純粹簡單。生活中到處都是不確定性,真正的準確可能根本就無法實現(xiàn)。

作為人類,當我們走出校園,經(jīng)歷挫折和實踐,會逐漸領悟到“表達存在不確定性”的價值,但在語言模型中,表達不確定卻會遭到懲罰。

為了解決這一問題,OpenAI建議重新設計評估標準。在評估AI時,如果存在不確定情況,AI棄權,拒絕回應,不應該懲罰它。

OpenAI認為:“我們的評估方法偏愛準確性,這種方法需要更新,評分機制應該努力抑制猜測行為。如果主要的評分系統(tǒng)一直鼓勵猜測,那么模型就會不斷學習如何猜測?!?

幻覺成了AI的“癌癥”

“幻覺”問題嚴重阻礙了AI的普及。如果應用于醫(yī)療保健或者金融領域,不可靠的結果可能會造成嚴重后果。

美國普渡大學研究人員Tianyang Xu認為:“對于大多數(shù)幻覺而言,發(fā)生概率已經(jīng)降低到一個用戶可以接受的水平。”但在法律、數(shù)學等領域,幻覺仍然是一大障礙。

加州大學認知科學與人工智能研究專家Mark Steyvers表示:“OpenAI在做一些小努力,有進步,但離目標還很遠,GPT并沒有頻繁地承認自己不知道?!?

Tianyang Xu認為,擴大模型規(guī)??梢愿纳苹糜X問題,我們還可以豐富模型的內(nèi)部關聯(lián),提高訓練數(shù)據(jù)質(zhì)量。當模型訓練數(shù)據(jù)不足或者基礎信息存在錯誤時,幻覺問題尤其嚴重。此外,當AI面對的論文太長、內(nèi)容超出理解能力時,無論是總結還是分析,都會產(chǎn)生幻覺現(xiàn)象。

哥本哈根AI公司Silvi的研究人員Mushtaq Bilal指出,完全消除幻覺幾乎是不可能的,如果能做到,AI企業(yè)早就做了。

Saachi Jain管理一個AI安全團隊,他認為,減少錯誤,讓模型承認自己不知道,這是OpenAI關注的重點。針對問題,OpenAI傾向于給出冗長、開放式回答,這樣也能減少幻覺現(xiàn)象。

艾倫人工智能研究所AI研究員Akari Asai認為,在一項名為“ScholarQA-CS”的文獻綜述基準測試中,如果GPT-5允許聯(lián)網(wǎng),它的表現(xiàn)很好。如果無法聯(lián)網(wǎng),GPT-5就會出現(xiàn)問題,因為大多文獻綜述系統(tǒng)具備與學術數(shù)據(jù)庫交叉核對的能力,交叉校對至關重要。如果不聯(lián)網(wǎng),GPT-5出現(xiàn)錯誤的概率相當于GPT-4的兩倍。

New Scientist在一篇文章中表示,AI出現(xiàn)一定程度的幻覺是難以避免的,人類可以通過檢索增強生成技術來緩解,也就是讓模型參考外部數(shù)據(jù),進行交叉對比。問題在于,隨著模型的擴大,“幻覺率”似乎并沒有降低,反而提高了。

New Scientist在2025年5月的一篇文章中指出,由于AI復雜度增加,幻覺更嚴重了。甚至有人大聲疾呼:“當AI變得更智能時,幻覺不僅不會減少,反而會增加?!?

看來幻覺的確像是AI的癌癥,人類努力多年,無法治愈癌癥,可能幻覺也超出了人類認知,屬于不可解決的范疇。(小刀)

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權不予轉載,侵權必究。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉