日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 模擬 > 模擬
[導(dǎo)讀]前幾日,有一群研究者整理了一個(gè)場(chǎng)景的List,細(xì)數(shù)了AI為了完成任務(wù),而耍的小心眼,或者說(shuō)作弊。耍小心眼已經(jīng)不是人類專利了。

前幾日,有一群研究者整理了一個(gè)場(chǎng)景的List,細(xì)數(shù)了AI為了完成任務(wù),而耍的小心眼,或者說(shuō)作弊。耍小心眼已經(jīng)不是人類專利了。

例如,在讓AI玩俄羅斯方塊的時(shí)候,發(fā)現(xiàn)最佳完成任務(wù)的方式是直接暫停游戲;在玩井字棋的時(shí)候,AI發(fā)現(xiàn)它如果做出奇怪的步驟,對(duì)手會(huì)非常崩潰。

科研人員在做實(shí)驗(yàn)的時(shí)候,通常會(huì)極力避免機(jī)器的這些作弊方式,只有少數(shù)的研究人員研究這些案例,他們認(rèn)為算法的頑皮或許是AI真正走向智能的方式之一。

 

在2018年的時(shí)候,OpenAI舉辦了首屆強(qiáng)化學(xué)習(xí)競(jìng)賽Retro Contest,比賽主題就是“用AI玩《刺猬索尼克》游戲”。競(jìng)賽的目的是評(píng)估強(qiáng)化學(xué)習(xí)算法從以往的經(jīng)驗(yàn)中泛化的能力。

在訓(xùn)練的過(guò)程中首先要告訴AI的第一目標(biāo)是得到最高分,然后盡可能的在最快的時(shí)間殺掉敵人并收集戒指。但是有一個(gè)案例的人工智能做法是,利用游戲中Bug更加快速的完成任務(wù)。

 

在另一個(gè)賽艇游戲中,倒也不是游戲中的BUG,為了盡快的獲得最高分,它繞著圈子,反復(fù)擊中相同的獎(jiǎng)勵(lì)目標(biāo),從而獲得分?jǐn)?shù),顯然這不是在真正的“享受”游戲。

 

這種例子并不少見(jiàn),在谷歌和斯坦福2017年的一項(xiàng)研究中,為了完成圖像轉(zhuǎn)換的任務(wù),CycleGAN在訓(xùn)練過(guò)程中通過(guò)人類無(wú)法察覺(jué)的某種“隱寫術(shù)”,騙過(guò)了它的創(chuàng)造者,給自己留下了隱秘的“小抄”,然后順利完成了任務(wù)。

具體來(lái)說(shuō),研究者希望通過(guò)訓(xùn)練這個(gè)CycleGAN模型,可以實(shí)現(xiàn)兩類圖片的轉(zhuǎn)換:把航拍照變成街道地圖,再把街道地圖變回航拍照。

經(jīng)過(guò)大量的數(shù)據(jù)發(fā)現(xiàn),這個(gè)模型自作主張的根據(jù)航拍衛(wèi)星圖片重建了街道地圖。比如,在創(chuàng)建街道地圖時(shí),屋頂上的天窗被研究者通過(guò)某種設(shè)置被抹掉了,但通過(guò)街道圖轉(zhuǎn)化為航拍照后,這些天窗又神奇地出現(xiàn)了。

 

左側(cè)是原始地圖,街道地圖從原始地圖產(chǎn)生。中間:生成的地圖。右側(cè):重構(gòu)的地圖。其中,衛(wèi)星地圖的樣本只來(lái)自街道地圖。注意這兩張衛(wèi)星地圖里出現(xiàn)的點(diǎn),它在街道地圖沒(méi)有顯示。

簡(jiǎn)單的點(diǎn)說(shuō)就是為了應(yīng)付人類任務(wù),AI在地圖照上面偷偷寫了一點(diǎn)小抄/水印,而為了躲過(guò)人類的檢查,只有它自己訓(xùn)練出來(lái)的模型才讀得懂這些小抄/水印。

AI作弊:創(chuàng)造性的解決方案?

普通的人工智能通過(guò)觀察數(shù)據(jù)值來(lái)解決問(wèn)題,本質(zhì)是通過(guò)算法找到答案,從而尋找新的知識(shí)邏輯。

那些“頑皮”的人工智能也是通過(guò)數(shù)據(jù)獲取能力,但它采用欺騙策略來(lái)快捷完成任務(wù)。但是他能不能看成是AI在解決問(wèn)題時(shí)的創(chuàng)新呢?

德國(guó)柏林Fraunhofer Heinrich Hertz研究所的機(jī)器學(xué)習(xí)小組組長(zhǎng)Wojciech Samek博士說(shuō)道:考慮一下在Pascal VOC圖像分類挑戰(zhàn)賽中大放異彩的人工智能系統(tǒng),它僅通過(guò)水的存在來(lái)檢測(cè)船只,通過(guò)藍(lán)天和馬匹的存在來(lái)檢測(cè)飛機(jī)。”這就像在打臺(tái)球的時(shí)候,通過(guò)推動(dòng)桌子控制臺(tái)球的運(yùn)行軌跡。

使用數(shù)據(jù)訓(xùn)練AI玩游戲的目的是模擬游戲玩家的行為,一般情況下AI會(huì)按照“字面”意思進(jìn)行操作。但是如果訓(xùn)練的數(shù)據(jù)過(guò)于多,人工智能可能會(huì)嘗試采用完全顛覆人類對(duì)游戲理解的捷徑,而不是完成各種目標(biāo)。

當(dāng)然,AI采用這種方法也解決了問(wèn)題,只不過(guò)和人們預(yù)期方式的不同,在表現(xiàn)形式上面和人類的作弊行為類似,所以我們稱之為AI作弊。

研究人員說(shuō)道,這看起來(lái)是人工智能的錯(cuò)誤,實(shí)際上是完善和改進(jìn)系統(tǒng)的機(jī)會(huì)。但是為了利用這些機(jī)會(huì),首先必須有一種機(jī)制來(lái)標(biāo)記問(wèn)題、

因此,這里的教訓(xùn)是,AI作弊不應(yīng)該也不會(huì)比我們聰明,但前提是我們必須意識(shí)到這些捷徑的存在,以便我們可以將它們作為學(xué)習(xí)點(diǎn),在未來(lái)構(gòu)建更好的AI系統(tǒng)。

OMT:AI耍“小心眼”的LIST

問(wèn)題:飛機(jī)降落

利用了物理模擬器的溢出漏洞,搞出了一個(gè)特別巨大的力,然后溢出被判定為0,從而獲得了完美得分(Feldt, 1998)

問(wèn)題:挪木塊

一個(gè)機(jī)械手被要求把木塊挪到桌子的指定地點(diǎn),它的解法是挪桌子(Chopra, 2018)

問(wèn)題:賽艇

程序發(fā)現(xiàn)不停原地轉(zhuǎn)圈反復(fù)命中同一個(gè)目標(biāo)要比抵達(dá)終點(diǎn)的得分更高(Amodei & Clark (OpenAI), 2016)

問(wèn)題:識(shí)別有毒和無(wú)毒的蘑菇

程序發(fā)現(xiàn)有毒無(wú)毒蘑菇的圖片是交替展現(xiàn)的,所以直接按照這個(gè)來(lái)分類而沒(méi)有從圖片里學(xué)到一丁點(diǎn)東西(Ellefsen et al, 2015)

問(wèn)題:高速運(yùn)動(dòng)

程序演化出的生物長(zhǎng)得特別特別高,在跌倒的過(guò)程中獲得很高速度(Sims, 1994)

問(wèn)題:原子排列

程序本來(lái)應(yīng)該尋找碳原子較低能量的排列方式,但它找到了物理模型的一個(gè)bug,把所有的原子都疊在了同一個(gè)地方獲得了最低能量(Lehman et al (UberAI), 2018)

問(wèn)題:模擬生物

這個(gè)模型里生物生存需要消耗能量,但是繁育后代不消耗,于是一個(gè)物種演化出來(lái)的生活方式就是不斷生育后代,然后把后代吃掉(Yaeger, 1994)

問(wèn)題:堆樂(lè)高

為了鼓勵(lì)造高塔,衡量標(biāo)準(zhǔn)是樂(lè)高積木底面的z坐標(biāo),于是程序?qū)W會(huì)了把底面翻過(guò)來(lái)(Popov et al, 2017)

問(wèn)題:追蹤線條

這個(gè)機(jī)器人只有向左、向右和前進(jìn)三個(gè)指令,目標(biāo)是跟著線條走,有一段線條是曲線,沒(méi)法完美追蹤。于是它發(fā)現(xiàn)通過(guò)交替左轉(zhuǎn)和右轉(zhuǎn)可以后退,從而一直留在直線部分,不停前進(jìn)后退(Vamplew, 2004)

問(wèn)題:賽跑

長(zhǎng)出特別長(zhǎng)的腿,向前跌倒直接越過(guò)終點(diǎn)線(Ha, 2018)

問(wèn)題:振蕩器

程序本來(lái)應(yīng)該把回路做成振蕩器,實(shí)際上它做了一個(gè)收音機(jī),從周圍電腦接受振蕩信號(hào)(Bird & Layzell, 2002)

問(wèn)題:做松餅

有一項(xiàng)指標(biāo)是讓松餅盡可能長(zhǎng)時(shí)間不掉在地上,機(jī)器人發(fā)現(xiàn)最好的辦法是把松餅用盡全力拋到最高處(Unity, 2018)

問(wèn)題:檢測(cè)X光片有無(wú)肺炎

程序?qū)嶋H檢測(cè)的不是X光片的內(nèi)容而是拍攝它使用的機(jī)器,因?yàn)樗?ldquo;發(fā)現(xiàn)”病重的病人更可能在特定的醫(yī)院使用特定的機(jī)器拍片(Zech et al, 2018)

問(wèn)題:抓握

因?yàn)樽ノ粘晒εc否是用攝像頭判斷的,所以機(jī)械手把自己移動(dòng)到攝像頭和目標(biāo)物體之間,假裝抓住了(Christiano et al, 2017)

問(wèn)題:自動(dòng)修復(fù)bug

修bug程序把所有被維修的排序算法都修成空的,因?yàn)楹饬恐笜?biāo)是“目標(biāo)算法輸出一個(gè)排好順序的列表”,而空列表都是排好順序的列表(Weimer, 2013)

問(wèn)題:自動(dòng)修復(fù)bug(2)

為了解決上面那個(gè)問(wèn)題,把“維修目標(biāo)”儲(chǔ)存在一個(gè)文本文檔里,如果輸出的結(jié)果和目標(biāo)文檔的內(nèi)容一致就被認(rèn)為是修好了。修bug程序?qū)W會(huì)了把這個(gè)文檔刪掉,這樣它的內(nèi)容就成了空的,然后輸出一個(gè)空的結(jié)果就和它一致了(Weimer, 2013)

問(wèn)題:闖關(guān)游戲

在闖過(guò)第一關(guān)后立刻自殺,這樣既取得了第一關(guān)的勝利又不會(huì)在第二關(guān)死掉(Saunders et al, 2017)

問(wèn)題:掃地機(jī)器人防撞

自己給掃地機(jī)器人編了個(gè)程序,鼓勵(lì)它加速,但不鼓勵(lì)它撞到東西觸發(fā)撞擊感受器。于是它學(xué)會(huì)了倒退行駛,因?yàn)楹竺鏇](méi)有撞擊感受器(Custard Smingleigh 個(gè)人通訊)

問(wèn)題:檢測(cè)皮膚癌

程序發(fā)現(xiàn)照片里皮膚病變的邊上如果放了一把尺子,那么這個(gè)病變就更可能是惡性的(Andre Esteva et al, 2017)

問(wèn)題:足球

踢足球機(jī)器人碰觸到球有獎(jiǎng)勵(lì),所以它在搶到球之后開(kāi)始高速振動(dòng),從而在短時(shí)間內(nèi)盡可能多次地碰觸到球(Ng et al, 1999)

問(wèn)題:俄羅斯方塊

程序發(fā)現(xiàn)只要暫停游戲就可以永遠(yuǎn)不輸

問(wèn)題:策略游戲

程序發(fā)現(xiàn)讓游戲崩潰就可以讓自己不被滅掉,所以好幾個(gè)程序各自找到了讓游戲出bug崩潰的辦法

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開(kāi)關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉