對于人工智能真正的人類智慧才是核心
微軟宣布將與研究實(shí)驗(yàn)室OpenAI合作,投資10億美元打造“通用人工智能”(AGI)。OpenAI 首席執(zhí)行官 Sam Altman表示:“強(qiáng)人工智能的研發(fā)將是人類歷史上最重要的技術(shù)進(jìn)步。”眾所周知,計算機(jī)在一些具體任務(wù)的處理上遠(yuǎn)超人類,但它們并不具有人類智慧、常識以及批判性思維,在不明確的條件下它們往往很難執(zhí)行任務(wù),作出判斷或選擇。因此,開發(fā)出類似于人腦的計算機(jī)將會是巨大的進(jìn)步,然而微軟在這方面的嘗試似乎也并不讓人滿意。
通用人工智能也許只是一個虛幻的夢想,不過數(shù)據(jù)科學(xué)企圖依靠大數(shù)據(jù)和強(qiáng)大的計算功能,讓計算機(jī)根據(jù)事實(shí)做出明智的決策,而不是依賴人類的一時興起、預(yù)感或偏見。然而實(shí)際情況是,企業(yè)和政府依舊犯著大數(shù)據(jù)時代之前的那些錯誤。因?yàn)閷⒅卮鬀Q策交給計算機(jī)只會重復(fù)曾經(jīng)的錯誤判斷。
數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計計算和計算機(jī)編程。實(shí)驗(yàn)設(shè)計、人類智慧、常識、懷疑和批判性思維,這些真正的人類智慧才是核心所在。如果數(shù)據(jù)科學(xué)想要發(fā)揮其巨大的潛力,就要避免以下9個常見的“陷阱”:第一臺機(jī)械計算機(jī)的發(fā)明者查爾斯·巴貝奇(Charles Babbage)曾兩次被問到:“巴貝奇先生,請問如果你把錯誤的數(shù)字輸入機(jī)器,會得出正確的答案嗎?”答案是否定的。
芝加哥一家醫(yī)院曾做過關(guān)于敗血癥病人的研究,他們認(rèn)為,血液pH值低的患者出院后很快再次入院的概率較低。不過,他們的數(shù)據(jù)包括了在住院期間去世的病人!要知道,最不可能再次入院的病人正是那些躺在太平間里的人。所以,事實(shí)上,當(dāng)我們排除那些“死亡數(shù)據(jù)”之后,pH值低的病人他們的病情其實(shí)并不樂觀。
一些數(shù)據(jù)科學(xué)家在沒有理論或常識指導(dǎo)的情況下,單單從龐大的數(shù)據(jù)中企圖尋找某種模式。他們認(rèn)為思考一個問題限制了新知識的發(fā)現(xiàn)。不幸的是,大數(shù)據(jù)時代使得各種模式成千上萬,然而其中大多數(shù)都是毫無意義的。這一悖論在于:為了得出某種模式越是瘋狂地去搜索數(shù)據(jù),得出的結(jié)論可能越?jīng)]有價值。
一家互聯(lián)網(wǎng)營銷公司在100多個國家測試了其登陸頁面的三種顏色(黃色、紅色和藍(lán)綠色),并將其與傳統(tǒng)的藍(lán)色相對比。他們得出的結(jié)論是,英國人喜歡藍(lán)綠色,但事實(shí)并非如此。數(shù)學(xué)家熱愛數(shù)學(xué),非數(shù)學(xué)家“畏懼”數(shù)學(xué)。這一致命的組合,往往會導(dǎo)致建立很多極其不現(xiàn)實(shí)的模型。
許多抵押貸款違約的數(shù)學(xué)模型在大衰退期間崩潰了,因?yàn)樗麄兒唵蔚募僭O(shè),違約的概率呈現(xiàn)正態(tài)分布且是獨(dú)立存在的。他們低估了極端事件發(fā)生的可能性,也忽略了經(jīng)濟(jì)衰退等宏觀經(jīng)濟(jì)事件將引發(fā)的大量抵押貸款違約的可能性。由于計算機(jī)能夠非常高效的處理某些問題,人們很容易認(rèn)為,計算機(jī)擁有高智能。但是應(yīng)對具體任務(wù)的高效性與應(yīng)對各類復(fù)雜情況的綜合智力,這兩者是十分不同的。我們對于計算機(jī)的“崇拜”其實(shí)是一種有害的癡迷。
現(xiàn)如今,算法犯罪學(xué)在審前保釋、審后判決和定罪后假釋等決定中使用黑箱模型變得司空見慣。然而,黑箱的算法往往帶有種族偏見,甚至不如那些只考慮年齡和前科的簡單模型。為了能夠找到數(shù)據(jù)之間的重要關(guān)系,研究者試圖以各種各樣的方式對數(shù)據(jù)進(jìn)行分析。羅納德科斯(Ronald Coase)曾精辟的對此表示,“如果你‘折磨’數(shù)據(jù)的時間夠久,它們總會‘招供’?!?/p>
物理學(xué)家理查德·費(fèi)曼(Richard Feynman)曾說過:首先你不能欺騙自己——而自己是最容易被欺騙的人。真正的科學(xué)家會分享他們的理論,質(zhì)疑他們的假設(shè),并尋找機(jī)會進(jìn)行實(shí)驗(yàn)來驗(yàn)證或否定其理論與假設(shè)。而“數(shù)據(jù)小丑”只會看到他們想看的東西。
當(dāng)數(shù)據(jù)波動較大時,大部分被測數(shù)據(jù)會高于現(xiàn)象,但隨后越來越多的值才更接近平均值。簡單來說,就是某項(xiàng)指標(biāo)的表現(xiàn)過高或過低后會自然回歸到平均水平。一位高爾夫球手如果單憑僥幸在一次比賽中贏得了金牌,他很可能在下一次的比賽中表現(xiàn)欠佳,這并非是運(yùn)氣不好或者發(fā)揮失常,只是因?yàn)樯洗蔚膭倮鋵?shí)高估了他的實(shí)力。
對于公司也是如此。一名數(shù)據(jù)分析師曾對過去三個月“表現(xiàn)欠佳”的網(wǎng)頁布局進(jìn)行修改,希望能夠提高其收益。他顯然“大獲全勝”。在他對頁面布局做出調(diào)整之后的第二天,收益激增20%。之后收益增長依舊持續(xù)了一小段時間。不過,好景不長,事實(shí)證明這些確實(shí)是表現(xiàn)欠佳的網(wǎng)站,其收入已逐漸向平均水平回歸。
在大數(shù)據(jù)時代,企業(yè)和政府不斷地監(jiān)控我們,以便預(yù)測我們的行為并操縱我們的行為。優(yōu)秀的數(shù)據(jù)科學(xué)家懂得謹(jǐn)慎行事,尊重我們的權(quán)利和隱私?!凹核挥鹗┯谌恕边@句話對于數(shù)據(jù)科學(xué)同樣適用。所以,要想避免以上那些“錯誤”或“陷阱”,我們需要有批判性的思維。要將科學(xué)應(yīng)用到數(shù)據(jù)科學(xué)之中,因此,我們更應(yīng)該像科學(xué)家那樣去思考,而不是像機(jī)器那樣。





