曾經(jīng)人工智能的翹楚IBM Watson,如今為何成為笑柄
早在2011年時,Watson(沃森)就在智力競賽節(jié)目 Jeopardy! 中獲勝,自此之后IBM 就在一直積極宣傳沃森。然而最近一段時間沃森帶來了許多壞消息。沃森曾與休斯敦安德森癌癥研究中心合作,去年雙方分道揚鑣。IBM營收停止增長,股價起起落落,分析師甚至開始質(zhì)疑:沃森真能帶來更多價值嗎?知名科技投資人 Chamath Palihapitiya 今年5月接受 CNBC 采訪時表示:“沃森就是一個笑話。”
保羅·唐(Paul Tang)的妻子在醫(yī)院做了膝關(guān)節(jié)替換手術(shù),他陪妻子住院。每年,美國有大約70萬人做這樣的手術(shù)。外科醫(yī)生來了,唐本人就是初級治療內(nèi)科醫(yī)生,他問醫(yī)生,預(yù)計什么時候妻子才能回歸正常人的生活,根據(jù)他的經(jīng)驗判斷。外科醫(yī)生一直含糊其辭,沒有明確答案。唐說:“我真是被打敗了,他居然不知道。”Paul Tang很快了解到,大多數(shù)內(nèi)科醫(yī)生基本上都不知道病人回到家、回到工作中的生活是怎樣的,他們無法對病人的生活進(jìn)行評估,對于病人而言,這種評估至關(guān)重要。
沃森是一個機器學(xué)習(xí)系統(tǒng),IBM 將未來押在沃森身上。沃森可以給內(nèi)科醫(yī)生提供信息,例如,告訴醫(yī)生還要等多長時間,病人才能正常行走或者爬樓梯,不會疼痛。它還可以分析圖片和組織樣本,為特定病人制定最佳治療策略。
自從沃森在智力競賽節(jié)目 Jeopardy! 中獲勝之后,衛(wèi)生保健便成為機器學(xué)習(xí)技術(shù)瞄準(zhǔn)的熱門市場。研究公司 CB Insights 在報告中指出,自2013年以來至少出現(xiàn)106家創(chuàng)業(yè)公司,它們?nèi)匀辉跔I業(yè)。
今年,沃森曾與休斯敦安德森癌癥研究中心分道揚鑣。針對沃森的批評(包括安德森癌癥中心的批評)似乎與技術(shù)無關(guān),并不是說技術(shù)存在缺陷。只是IBM對于目前沃森所處的水平太過樂觀,這才招來批評。事實上,談到將AI應(yīng)用于衛(wèi)生保健,沃森健康有很大的可能會成為領(lǐng)導(dǎo)者。如果說現(xiàn)在還沒有取得很大的成就,那么最大的障礙于數(shù)據(jù),IBM需要特定類型的數(shù)據(jù),用來訓(xùn)練系統(tǒng)。在多種環(huán)境下,數(shù)據(jù)供應(yīng)嚴(yán)重不足,很難獲得。這個問題不只是沃森的問題,其它系統(tǒng)也一樣。對于整個衛(wèi)生保健機器學(xué)習(xí)領(lǐng)域而言,都面臨這樣的問題。
缺少數(shù)據(jù)、無法獲得數(shù)據(jù)可能會讓沃森的發(fā)展速度變慢,同樣的,IBM的競爭對手也會受到傷害。為什么呢?因為要獲得數(shù)據(jù),最好的辦法就是與大型衛(wèi)生保健機構(gòu)密切合作,而這些機構(gòu)在技術(shù)面前有點保守。與創(chuàng)業(yè)公司相比,有一點IBM做得比較好:它得到了大機構(gòu)高管和IT經(jīng)理的信任。雖然安德森項目存在一些問題,IBM仍然有著很大的優(yōu)勢。許多醫(yī)療中心、衛(wèi)生保健管理團(tuán)體、生命科學(xué)企業(yè)都引進(jìn)了沃森,它們都會提供關(guān)鍵數(shù)據(jù),正是這些數(shù)據(jù)為未來的醫(yī)療模式奠定了基礎(chǔ)。
時間表不切實際
沃森與安德森癌癥中心“分手”說明IBM對沃森鼓吹過度,結(jié)果招來麻煩。
2012年,安德森癌癥中心與IBM開始合作,它們的目標(biāo)是讓沃森閱讀數(shù)據(jù),數(shù)據(jù)涉及病人的癥狀、基因序列、病理報告,然后將信息與內(nèi)科醫(yī)生的報告、重要期刊論文整合,幫助醫(yī)生制定診斷和治療策略。IBM和安德森癌癥中心對技術(shù)期待過高。2013年,IBM曾經(jīng)豪言壯語說“計算新時代來了”,這種論斷給了《福布斯》一種錯覺,似乎沃森“現(xiàn)在可以處理臨床實驗”問題,再過幾個月就能用在病人身上了。2015年,《華盛頓郵報》引述一名IBM沃森管理者的話說,沃森正在構(gòu)建集體智慧模式,介于機器與人之間?!度A盛頓郵報》還說,訓(xùn)練時機器系統(tǒng)的目標(biāo)是成為醫(yī)生的助理,幫助他們做之前不能做的事。
今年2月,德州大學(xué)(安德森癌癥中心就是它運營的)宣布項目終結(jié),癌癥中心向IBM支付3900萬美元賠款,原本項目合同的規(guī)模只有240萬美元。研究4年之后,雙方?jīng)]有開發(fā)出一個可以用在病人身上的工具,技術(shù)只能用在實驗性測試中,沒辦法投入使用。關(guān)于沃森一事,安德森癌癥中心不予置評,內(nèi)部不知道如何管理項目,如何獲得資金,這可能才是問題的根源。
并不是說IBM沃森沒有問題,事實上,它的問題比任何其它的項目都要大。
到底是什么使得研究受挫?首先你要深入理解機器學(xué)習(xí)系統(tǒng)(比如沃森)的訓(xùn)練方式。沃森持續(xù)對內(nèi)部處理流程進(jìn)行微調(diào),從中學(xué)習(xí)經(jīng)驗,這樣一來解決某些問題時獲得正確答案的概率就會提高。正確答案必須是已知的,這樣系統(tǒng)才會知道什么時候?qū)α?,什么時候錯了。系統(tǒng)處理的訓(xùn)練問題越多,結(jié)果就會越好。
要訓(xùn)練系統(tǒng)在X線中識別惡性腫瘤還是比較簡單的。如果解決的謎題大大超出人類的已知范疇,比如了解基因變異與疾病的關(guān)系,沃森就會顯得無能為力,它會碰到“雞與蛋”的問題:數(shù)據(jù)沒有經(jīng)過專家的篩選,沒有有效組織過,如何用這樣的數(shù)據(jù)訓(xùn)練系統(tǒng)呢?紐約斯隆-凱特琳癌癥中心計算病理學(xué)家Thomas Fuchs解釋說:“如果你正在訓(xùn)練自動駕駛汽車,任何人都可以給樹、標(biāo)志貼標(biāo)簽,這樣系統(tǒng)就可以學(xué)習(xí)如何識別它。但是醫(yī)學(xué)是一個特殊的領(lǐng)域,需要專家訓(xùn)練幾十年,給信息貼上正確的標(biāo)簽,輸入計算機。”
IBM希望沃森能夠在一些領(lǐng)域做出貢獻(xiàn),其它企業(yè)的機器學(xué)習(xí)解決方案也是樣打算的,在所有這些領(lǐng)域都有障礙存在。要訓(xùn)練沃森處理海量數(shù)據(jù),從中挑選出少數(shù)與單個病人有關(guān)的重要信息,首先需要人親自訓(xùn)練,用成千上萬個案例訓(xùn)練。
例如,為了讓沃森識別與疾病有關(guān)的基因,它需要成千上萬的病歷,這些病人患有特殊疾病,他們的DNA已經(jīng)分析過。然而,要獲得“基因-病歷”結(jié)合的數(shù)據(jù)相當(dāng)難。許多時候,數(shù)據(jù)并沒有以正確的格式記錄,或者根本不存在,又或者數(shù)據(jù)來自于幾十個不同的系統(tǒng),很難處理。
如果將更好的數(shù)據(jù)交給臨床醫(yī)生,就可以提高初級治療水平。在日常的初級治療過程中,當(dāng)問題不太嚴(yán)重時醫(yī)生如果錯過了治療機會,等到病情變得嚴(yán)重起來,病人進(jìn)了急診室或者讓專家治療,此時承受的痛苦會更大,成本也會大幅增加。IBM沃森健康首席醫(yī)療官Anil Jain說:“在健康方面花的錢有三分之一是不需要的。”人們認(rèn)為,機器學(xué)習(xí)有機會解決這個問題。
診斷病人時,為了讓醫(yī)生得出更好的結(jié)論,沃森需要找到彼此的關(guān)聯(lián),也就是健康記錄和健康社會決定因素的關(guān)系。這些因素包括:病人是否吸毒、飲食是否健康、呼吸的空氣是否清新等等。唐認(rèn)為,今天,幾乎沒有醫(yī)院或者醫(yī)療實踐從大量病人身上獲得可靠的數(shù)據(jù)。部分是因為醫(yī)生接受現(xiàn)代數(shù)據(jù)驅(qū)動型醫(yī)療實踐方法的速度有點慢??死m夫診所(Cleveland Clinic)的內(nèi)科醫(yī)生、衛(wèi)生保健信息專家Manish Kohli認(rèn)為:“衛(wèi)生保健行業(yè)接受技術(shù)的速度很慢,真是讓人尷尬。”
如果存在這樣的數(shù)據(jù),IBM一般會花錢購買。IBM收購了一些企業(yè),比如Truven Health Analytics、Explorys和Phytel,它們都是處理大數(shù)據(jù)的企業(yè),這些數(shù)據(jù)來自醫(yī)院和病人群體。雖然與安德森癌癥中心的合作終止了,IBM還是與其它機構(gòu)達(dá)成了重要合作,進(jìn)一步獲得更多的病人數(shù)據(jù)。
與IBM合作的就有Atrius Health,它是一個網(wǎng)絡(luò),里面有將近900位內(nèi)科醫(yī)生,主要是初級護(hù)理內(nèi)科醫(yī)生,他們來自波士頓地區(qū)。合作的目標(biāo)是為開發(fā)、測試以沃森作為基礎(chǔ)的系統(tǒng)功能,從筆記、記錄、文章中提取面向獨立個體的關(guān)鍵信息。Atrius Health首席醫(yī)療官Joe Kimura說:“對于初級護(hù)理內(nèi)科醫(yī)生而言,提取所有相關(guān)信息是一項繁重的任務(wù)。”他還說,每一次訪問數(shù)據(jù)都會增加,有了這樣的系統(tǒng)數(shù)據(jù)會大幅增加,不需要按標(biāo)準(zhǔn)格式提交,檢索很方便。
還有,病人病歷中許多重要的筆記是以句子的形式存在的,傳統(tǒng)IT系統(tǒng)無法識別。沃森使用了自然語言處理技術(shù),這種技術(shù)當(dāng)時是為參加 Jeopardy! 開發(fā)的,它可以從句子中提取意義。在理想的情況下,系統(tǒng)可以給內(nèi)科醫(yī)生提建議,給病人更好的幫助,省去不必要的護(hù)理。Kimura說:“病人臀部受傷,我們?nèi)娜庹湛矗瑸槭裁次覀冎魂P(guān)心這個?為什么不能提前預(yù)測,判斷病人有跌倒的風(fēng)險,讓他們避免臀部受傷?我們要讓護(hù)理朝著上游延伸。”
沃森健康還與紐約中央醫(yī)療中心(Central New York Care Collaborative)合作,這是一個州政府提供資金成立的機構(gòu),與6個國家大約2000個衛(wèi)生保健提供商合作。合作的目標(biāo)很明確:將急診數(shù)量、再入院數(shù)量降低25%,有時病人已經(jīng)獲得批準(zhǔn)出院,結(jié)果又因為相關(guān)的問題重新回醫(yī)院治療。合作還帶來了大量的病人數(shù)據(jù)。
拿到更多數(shù)據(jù)
獲得數(shù)據(jù)還有其它的辦法。谷歌有一家姊妹公司,它想直接從病人身上提取數(shù)據(jù)。這家公司就是Verily Life Sciences,它是Alphabet的衛(wèi)生保健部門,該公司與杜克大學(xué)、斯坦福大學(xué)合作,開發(fā)一套高度結(jié)構(gòu)化的健康數(shù)據(jù)庫,里面有1萬名志愿者。數(shù)據(jù)庫包含了門診信息,還有穿戴健康監(jiān)測設(shè)備提供的數(shù)據(jù)。這樣一來數(shù)據(jù)就會大大增加,只是要生成高度可用的結(jié)果,可能還要等10年甚至更長時間。
紀(jì)念斯隆-凱特林(Memorial Sloan-Kettering)癌癥研究中心的Fuchs率領(lǐng)團(tuán)隊訓(xùn)練一個AI系統(tǒng),它可以閱讀“組織染色幻燈片”(tissue-stain slides),在訓(xùn)練過程中,研究人員需要建立一個龐大的數(shù)字幻燈片庫,幻燈片上有注釋信息,包括確診及其它關(guān)鍵數(shù)據(jù)。每個月,團(tuán)隊自己會制作4萬張幻燈片。Fuchs說:“數(shù)量比其它人多很多,任務(wù)很龐大,因為在生物領(lǐng)域變量太多了。”
雖然沃森項目失敗,安德森癌癥研究中心還是在繼續(xù)執(zhí)行一個大項目,它要收集1700種門診數(shù)據(jù),走進(jìn)中心的每一個人病人都會貢獻(xiàn)自己的數(shù)據(jù)。項目負(fù)責(zé)人Andy Futreal說,要讓沃森這樣的AI系統(tǒng)發(fā)揮作用,將病人信息與研究數(shù)據(jù)結(jié)合起來至關(guān)重要。他還說:“一旦我們獲得了數(shù)據(jù),就可以進(jìn)入AI機器學(xué)習(xí)業(yè)務(wù),看看在各種治療方法下什么原因?qū)е抡l的效果好、誰的效果不好。”
IBM繼續(xù)從合作伙伴手中獲得數(shù)據(jù)。在癌癥診斷與治療方面,IBM與紀(jì)念斯隆-凱特林癌癥研究中心、Mayo Clinic、哈佛和MIT附屬研究所、醫(yī)療測試巨頭Quest Diagnostics攜手合作。通過與紀(jì)念斯隆-凱特林癌癥研究中心合作,IBM開發(fā)出一套系統(tǒng),它可以篩選期刊文獻(xiàn),形成正式的治療決策,佛羅里達(dá)Jupiter Medical Center(木星醫(yī)療中心)和印度一家醫(yī)院連鎖企業(yè)已經(jīng)引進(jìn)系統(tǒng)。在發(fā)現(xiàn)藥物方面,沃森健康與Barrow Neurological Institute(巴羅神經(jīng)學(xué)研究所)合作,它幫助該機構(gòu)找到了5種與ALS有關(guān)的基因,之前人們并不認(rèn)為這些基因與該疾病有關(guān);通過與Ontario Brain Institute(安省腦科研究所)合作,沃森篩選出21種最有希望的候選藥物。
提供更好的醫(yī)療結(jié)果,降低成本,沃森真的能帶來變革嗎?Bessemer Venture Partners基金的合伙人Stephen Kraus認(rèn)為的確有這種可能,他專注于衛(wèi)生保健行業(yè),投資了許多與衛(wèi)生保健有關(guān)的AI創(chuàng)業(yè)公司。Kraus說:“它是真實存在的,不是用來刺激股價上漲的‘霧件’。”和大多數(shù)專家一樣,Kraus也對不切實際的時間表、承諾保持謹(jǐn)慎態(tài)度,當(dāng)中一些過高的承諾來自于IBM自己。Kraus說:“相當(dāng)難,今天沒有發(fā)生,再過5年可能也不會發(fā)生,這種技術(shù)不會替代醫(yī)生。”





