大數(shù)據(jù)與人工智能的主要發(fā)展趨勢
技術的進步推動著經濟和生活的全面數(shù)字化,對數(shù)據(jù)的重視提到了前所未有的高度,“數(shù)據(jù)是資產”已經被廣泛認可。正如《大數(shù)據(jù)時代》作者舍恩伯格所說,“雖然數(shù)據(jù)還沒有被列入企業(yè)的資產負債表,但這只是一個時間問題”。
在過去幾年,我們已經開始通過數(shù)據(jù)科學、機器學習和人工智能讓部分應用場景的數(shù)據(jù)產生價值。這些技術也逐步從最初的早期采用者(BAT和初創(chuàng)公司)擴展到更廣泛的經濟。如何存儲數(shù)據(jù)、管理數(shù)據(jù)并深挖數(shù)據(jù)的價值已經變成了幾乎所有的企業(yè)都需要思考的問題。
盡管角度不同,Serverless模式就是這種簡化的一種嘗試。這種執(zhí)行模型允許用戶編寫和部署代碼,而無需擔心底層基礎設施。云提供商處理所有后端服務,客戶根據(jù)實際使用情況的付費。在過去的幾年里,Serverless模式無疑是一個重要的新興主題,這也是我們在今年的Data&AI領域中增加的新品類。然而,將Serverless模式應用于機器學習和數(shù)據(jù)科學仍有較多工作要做,像Algorithmia和Iguazio/Nuclio這樣的公司是早期進入者。
數(shù)據(jù)環(huán)境日益混合的另一個后果是,企業(yè)需要加大努力來獲得對數(shù)據(jù)的控制。目前的數(shù)據(jù)環(huán)境非常復雜,有些位于數(shù)據(jù)倉庫、有些位于數(shù)據(jù)湖、有些位于各種其他數(shù)據(jù)源,跨越本地部署、私有云和公共云,那應該如何查找、管理、控制和跟蹤數(shù)據(jù)?這包含各種相關的形式和名稱,包括數(shù)據(jù)查詢、數(shù)據(jù)治理、數(shù)據(jù)編目和數(shù)據(jù)沿襲,所有這些都越來越重要和突出。
今年一直在加速發(fā)展的最后一個關鍵趨勢,是AI專用基礎設施的不斷涌現(xiàn)。管理人工智能管道和模型的需求導致了MLOps(或AIOps)領域的快速增長。為了呼應這種新趨勢,今年的Landscape里面,我們添加了兩個新的框,一個名為基礎設施(各種早期創(chuàng)業(yè)公司包括Algorithmia、Spell、 Weights&Biases等等),一個名為開放源碼(各種各樣的項目,通常相當早,包括Pachyderm、Seldon、Snorkel、MLeap等等)。
企業(yè)部署ML/AI的階段已來企業(yè)自動化和RPA的興起在這個階段,我們可能需要3到4年的時間來嘗試為企業(yè)構建ML/AI應用。當然已經有過一些遠遠早于現(xiàn)實的尷尬產品嘗試(第一代聊天機器人)和一些重大的營銷聲明,特別是一些公司試圖改造現(xiàn)有產品實現(xiàn)ML/AI。
但是,我們已經逐步進入了ML/AI在企業(yè)中的部署階段,從好奇和實驗到實際的生產使用。未來幾年的趨勢似乎很明顯:以一個給定的問題為例,看看ML/AI(通常是深度學習,或其變體)是否會產生影響,如果是的話,構建一個AI應用程序來更有效地解決問題。
自從信息技術出現(xiàn)以來,企業(yè)就被信息孤島所困擾,各種系統(tǒng)和數(shù)據(jù)分散到各個部門,彼此之間無法溝通(這導致了大規(guī)模的系統(tǒng)集成服務行業(yè)),而人類充當了兩者之間的“粘合劑”。當前數(shù)據(jù)和系統(tǒng)日益集成、ML/AI有能力逐步將人類從某些功能中移除,企業(yè)完全有可能以一種日益自動化、系統(tǒng)化的方式運作。
RPA是機器人過程自動化的簡稱(盡管可能令人失望的是,它沒有利用任何實際的機器人),涉及到通常非常簡單的工作流,通常是手工的(由人類執(zhí)行)和重復的,并由軟件替代它們。許多RPA發(fā)生在后臺辦公室功能中(例如,發(fā)票處理)。
RPA應該與智能自動化區(qū)分開來,智能自動化是以ML/AI為核心的新興領域。智能自動化也以企業(yè)流程和工作流為目標,但是它更以數(shù)據(jù)為中心,而不是以流程為中心,并且最終能夠學習、改進和治愈。智能自動化的一個例子是智能文檔處理(ADP),這是一個可以利用ML/AI來理解文檔(表單、發(fā)票、合同等)的類別,其水平與人類相當或更好。
在未來幾年觀察這些領域將特別有趣,RPA和智能自動化有可能通過并購或推出新的本土產品進行合并,除非后者的進展如此之快,限制了對前者的需求。





