深度學(xué)習是人工智能技術(shù)的一種方法,它通常利用大型的數(shù)據(jù)集來訓(xùn)練神經(jīng)網(wǎng)絡(luò),最終以較高的準確率得出問題的結(jié)果。深度學(xué)習(Deep Learning)從快速發(fā)展到實際應(yīng)用,短短幾年時間里,已經(jīng)改變了語音識別、圖像分類、文本理解等眾多領(lǐng)域的算法設(shè)計思路。最近,科學(xué)家又成功將深度學(xué)習算法應(yīng)用到復(fù)雜的植物分類領(lǐng)域。
據(jù)發(fā)表在 8 月 11 日的 BMC 進化生物學(xué)雜志上的一項研究顯示,研究人員運用深度學(xué)習方法成功地對數(shù)千種植物標本的圖像進行了自動識別,而且,人工智能成功做出了正確的分類。這是研究人員首次嘗試將人工智能技術(shù)運用到物種識別領(lǐng)域上。賓夕法尼亞州立大學(xué)的古植物學(xué)家 Peter Wilf 說,這是第一次嘗試,但肯定不會是最后一次嘗試。這種技術(shù)是博物學(xué)界物種識別分類領(lǐng)域的未來。
此次研究人員用了 26 萬份植物標本的掃描圖像來訓(xùn)練深度學(xué)習算法,這些植物標本的物種數(shù)超過了 1000 個。該算法最終以接近 80% 的準確率識別出了這些物種。Wilf 說,這可比人類的分類學(xué)家做得好多了。
如今,世界各地的自然歷史博物館都在競相將他們的標本藏品數(shù)字化,把他們的標本放在公開的數(shù)據(jù)庫中,讓任何地方的研究人員都可以通過這些數(shù)據(jù)庫對標本進行使用。比如,美國國家科學(xué)基金會的 iDigBio 項目,其實就是一個數(shù)據(jù)聚合器,它擁有超過 1.5 億張來自全國各地的植物和動物的收藏標本圖片。
世界上大約有 3000 個植物標本館,據(jù)估計這些植物標本館擁有 3.5 億份標本,其中只有一小部分被數(shù)字化。但是,不斷膨脹的標本數(shù)據(jù)集,以及計算機技術(shù)的進步,吸引了來自哥斯達黎加理工學(xué)院的計算機科學(xué)家 Erick Mata-Montero 和法國農(nóng)業(yè)研究中心的植物學(xué)家 Pierre Bonnet 的關(guān)注,他們總覺得這些龐大的標本數(shù)據(jù)會有一些其他的用途。
Bonnet 的團隊已經(jīng)通過 pl@ntnet 項目實現(xiàn)了植物識別的自動化。pl@ntnet 是法國研究人員基于深度學(xué)習技術(shù)開發(fā)的一個 APP,它已經(jīng)積累了數(shù)以百萬計的植物圖像,并能對部分植物進行自動識別,它的這些植物圖像通常是人們用智能手機拍照上傳得來的,圖像數(shù)據(jù)越多,它識別的準確率就越大。此外,它還會向拍照者詢問圖像里的植物是一朵花還是一片葉子等,以增加識別的準確度。
Bonnet 說,雖然這種人工智能技術(shù)極大地提高了植物學(xué)家進行植物識別分類的效率,但是有一些植物學(xué)家擔心,這種高效技術(shù)會降低植物學(xué)領(lǐng)域的門檻,會讓民眾覺得植物學(xué)家已沒有什么專業(yè)技術(shù)價值。但是 Bonnet 卻堅持認為,這種人工智能技術(shù)是很有作為的,因為它是基于人類的專業(yè)知識。它永遠不會消除人類的專業(yè)知識。何況,植物學(xué)家還需要對這種技術(shù)的結(jié)果進行最后驗證。
這種新技術(shù)可以幫助植物標本館快速地處理新樣本,簡化一項需要數(shù)小時工作的艱巨任務(wù)。另外,Bonnet 說,這種技術(shù)還可以更有效地幫助小型植物標本館進行物種識別。他的研究小組發(fā)現(xiàn),從大型植物標本館中獲得的大型數(shù)據(jù)集的深度學(xué)習算法改進了對世界上相對數(shù)據(jù)缺乏的標本館的植物物種的識別。這一發(fā)現(xiàn)對于那些生物多樣性豐富但擁有很少植物標本收藏的地區(qū)來說尤其有用。
這種人工智能物種識別技術(shù)并不只是局限于植物標本。Nelson 目前正在努力實現(xiàn)對蠅幼蟲的自動識別。此外,古植物學(xué)家 Peter Wilf 正在與人合作來對植物化石進行類似的分析識別。對植物化石的分析相當困難,因為植物化石的形式多種多樣,比如石化了的水果和花朵,石化樹干或壓印在巖石里的石化樹葉。相比之下,植物標本的識別就容易多了,它們扁平,干燥,而且通常是放在標準尺寸的紙上的。
總之,包括 Wilf 在內(nèi)的一些博物界研究人員非常確信,這種深度學(xué)習技術(shù)將會逐步解決各種識別分類問題,并且會最終成為物種識別領(lǐng)域的基本技術(shù)手段。





