腦細胞研究員的獨白:感謝人工智能,不用再每天對著顯微鏡苦干了
2007年,在進入大三之前的那個夏天,我一直在做一件事:從小鼠身上取下小塊腦組織,放到培養(yǎng)皿中進行培養(yǎng),仔細觀察其中的神經元。在三個月時間里,我每周有5、6天,每天有3、4個小時都待在一個小房間里,盯著一臺顯微鏡看,給腦細胞拍照。房間漆黑一片,只有神經元發(fā)出的瑩瑩綠光。
當時,我正在研究一種特定的生長因子能否保護神經元免受神經退行性疾病的影響,比如帕金森玻這種在神經學研究中很常見的工作需要耗費大量時間,以及對細節(jié)幾近病態(tài)的關注。這就是為什么課題組負責人要培訓我這樣一個低級別的本科生來做這件事,正如幾十年前,某個人來培訓他做這件事一樣。
現(xiàn)在,研究人員認為,他們可以訓練機器接管這些瑣碎的工作。
在刊于《細胞》雜志的一項研究中,由格拉德斯通研究所(Gladstone Institutes)和加州大學舊金山分校神經科學家史蒂芬芬克拜納(Steven Finkbeiner)領導的團隊與谷歌的研究人員進行了合作,他們訓練出一種機器學習算法,可以對培養(yǎng)皿中的神經元細胞進行分析。
研究人員使用了一種名為深度學習的方法,這種機器學習技術不僅推動谷歌取得了一系列成果,在亞馬遜、Facebook、微軟等一系列人們耳熟能詳的科技公司中,也得到了重用。深度學習依靠的是模式識別:向系統(tǒng)饋入足夠多的訓練數據可能是動物圖像,可能是專業(yè)圍棋棋手的招式,也可能是人工培養(yǎng)腦細胞的照片然后,它就可以去辨識貓,去挑戰(zhàn)世界頂級棋手,或是弄清神經元的形態(tài)特征。
用這種方式訓練人工智能系統(tǒng),最難的兩件事在于:
1)生成規(guī)模足夠大的數據集;
2)找人對數據集進行標記。
幸運的是,大多數神經科學實驗室都擁有足夠多的細胞培養(yǎng)物可供轉化為訓練數據(芬克拜納的實驗室已經讓顯微鏡檢查過程的多個環(huán)節(jié)實現(xiàn)了自動化,它生成的圖像數量已經超出了實驗室的分析能力),而且也有足夠多的人手對數據進行標記。
“基本上,這有賴于大量的暑期學生、研究生和博士后,讓他們來做人工標記,將數據饋入計算機。”分子神經科學家瑪格麗特薩瑟蘭德(Margaret Sutherland)說。她是全美神經病學與中風研究所的項目主任,該機構資助了上述研究。(即便有了人工智能,學生和博士后似乎還是免不了要干這些累活。)
芬克拜納的團隊開發(fā)了一個深度神經網絡,并使用細胞圖像對它進行了訓練,這些圖像有的帶有熒光標記,有的則沒有。這些發(fā)光的標記有助于區(qū)分不同的細胞類型,還可以讓研究人員更容易判斷神經元的末端位置以及軸突和樹突的起始點。(軸突和樹突是神經元中突出的部分,負責跟其他神經元交換電化學信號。)不過,很多標記方法也會損害你試圖觀察的細胞。
然而,通過訓練,研究人員的算法能夠識別出它之前從未見過的特定類型的腦細胞。此外,算法還可以辨別死細胞和活細胞,定位細胞核,區(qū)分軸突和樹突,而且這一切都不需要熒光標記的幫助。芬克拜納團隊把他們的機器學習方法稱為ISL。
由于分析細胞并不需要添加固定劑或熒光染料,因此與傳統(tǒng)方法相比,ISL的優(yōu)點包括:前后標記更一致,對培養(yǎng)物的損害更小,而且能夠對細胞的健康狀況實現(xiàn)更長期的監(jiān)測。
此外,由于只有訓練算法時才需要用到人手,這種方法還可以為研究人員提供一種分析大量數據的途徑,他們不再需要招募大量實驗室技術人員在黑暗中對著顯微鏡埋頭苦干。
對生物醫(yī)學領域的研究人員來說不管他們是在大型研究院校資金充裕的實驗室工作,還是為一家小型初創(chuàng)公司效力這都是個好消息。“像這樣的技術往往會產生民主化效應。”計算機生物學家、艾倫細胞科學研究所(Allen InsTItute for Cell Science)的數學建模主管莫莉馬拉卡(Molly Maleckar)說。馬拉卡沒有參與芬克拜納的研究。
她和同事們曾利用類似的無標記機器學習技術來識別亞細胞結構。她說,通過結合機器學習方法,規(guī)模較小的生物醫(yī)學研究機構在研制新藥過程中的每一個步驟,或許都可以提速?!叭绻懔私庾约核惴ǖ木窒扌?,并清楚如何去解讀、去提升其表現(xiàn),你就不需要那么多人手來收集和分析大量數據?!?/p>





