AI人工智能在政策紅利和藍海市場的雙重利好中迎來快速發(fā)展。2018年中國人工智能市場規(guī)模約為238.2億元,增長率達到56.6%。根據第三方預測,到2020年,中國在人工智能的市場規(guī)模將接近500億元。
AI人工智能正在滲透到各領域,為各領域賦能。結合各種場景的AI人工智能產業(yè)也逐漸細分、垂直,圍繞AI芯片、前沿算法、無人駕駛、智能機器人、AI+5G等產業(yè)發(fā)展,涵蓋AI+教育、AI+醫(yī)療、AI+工業(yè)等場景應用,而決定這些產業(yè)的發(fā)展和場景應用的“基礎設施”便是數據。
“沒有好的數據,人工智能就沒有未來”正在成為行業(yè)共識。
人工智能的“臺前”和“幕后”
人工智能領域里,談到前沿算法都比較熟悉,而談到AI數據則鮮有人知,如果說算法是活躍在臺前,那么AI數據就是身居幕后。臺前的光鮮都是幕后十年功,AI數據就是人工智能的“基礎設施”一樣的存在,沒有數據,所有的場景和應用都是空談,無法實際落地。
人工智能在經過最初的“跑馬圈地”式發(fā)展之后也進入深耕細作階段,對于AI數據的需求更為精準、高質。
日前,愛分析舉行的中國人工智能高峰論發(fā)布了中國人工智能科技服務商50強,商湯、曠視、云測數據等企業(yè)入選。
對于商湯大家已經很熟悉,商湯科技是人工智能領域算法類企業(yè)中的早期玩家,也是國家政策第一批受惠者,而云測數據則是榜單內唯一一家數據標注服務商。整體而言,榜單的50家企業(yè)中算法類、算力類、應用類的企業(yè)較多,而數據標注類只有一家,一方面說明大家開始關注到數據標注的重要性,這個行業(yè)也有待跑出更多的獨角獸企業(yè),另一方面說明這一細分領域目前的玩家和頭部企業(yè)還是鳳毛麟角,還有更多的需求和藍海市場有待挖掘。
AI數據市場有多大?
AI數據服務站在算法類企業(yè)的背后,用技術和服務讓算法類企業(yè)可以完成各種各樣的落地和場景突破。那么這一細分市場到底有多大呢?
根據2018年智研發(fā)布的《2019-2025年中國數據標注與審核行業(yè)市場專項分析研究及投資前景預測報告》顯示,近幾年,數據標注與審核行業(yè)快速發(fā)展,2018年市場規(guī)模已達到52.55億元。
有數據預測,這個幾何級的增量市場中,到2020年市場規(guī)模有望突破百億,未來存在很大的想象空間。
AI數據標注作為人工智能領域的基礎設施,直接掣肘著AI技術應用落地的效能。隨著人工智能的落地應用已經迎來新的發(fā)展,行業(yè)開始回歸理智,關注技術應用落地。AI技術和數據基礎的成熟,視覺識別、NLP等技術和無數終端設備產生的數據相結合,可以幫助企業(yè)有效的降本增效。
我們欣喜的看到,經過幾年的發(fā)展,一些優(yōu)秀的AI數據服務商正在通過技術創(chuàng)新和驅動為人工智能產業(yè)打牢根基并且成績斐然。
以云測數據為例,通過自建數據場景實驗室和數據標注基地,云測數據為智能駕駛、智能家居、智慧城市、智慧金融、新零售等領域提供定制化的數據采集標注服務,全方位支持文本、語音、圖像、視頻等各類型數據的處理。截止到目前,云測數據已成功為數百家企業(yè)提供AI數據服務。
數據之爭中 頭部玩家們怎么做?
說到數據,必繞不開的難題和爭議便是數據的合法使用和隱私保護等。有預測顯示,到2020年,數萬億的物品將實現互聯,每天將有500億部機器進行數據交互,海量信息以及數據的安全問題將成為巨大的挑戰(zhàn)。
當前數據使用主要面臨三大挑戰(zhàn):一是技術挑戰(zhàn),包括需要解決數據承載平臺問題、算法問題、算力問題,二是數據治理的挑戰(zhàn),三是合規(guī)性的挑戰(zhàn)。
數據的合規(guī)性和監(jiān)管已經成為重中之重。各國在這一領域的監(jiān)管也亮出了達摩克利斯之劍,2018年5月歐盟出臺《通用數據保護條例》(簡稱GDPR),側重保護個人權利,對企業(yè)收集和使用個人數據,提出了更高的透明度要求;俄羅斯設立《關于信息、信息技術和信息保護法》及《個人數據法》,對互聯網信息服務組織傳播者、信息擁有者以及運營商都有嚴格管控。2019年5月,國家互聯網信息辦公室公布了《數據安全管理辦法(征求意見稿)》以及《網絡安全審查辦法(征求意見稿)》,直指數據安全。
那么數據標注領域們的頭部玩家們如何在這些數據之爭中實現技術和安全的平衡對整個行業(yè)的發(fā)展都會帶來深刻的影響。
作為頭部玩家,云測數據一直致力于保證數據隱私性和安全性。
首先是數據絕不復用,出于強烈的自我規(guī)范意識,云測數據對客戶定制的數據交付后不留底,全部清刪;
第二是保證數據隱私性。與所有數據采集的用戶都簽訂數據授權協議,包括歐盟GDPR協議也做支持,確保AI企業(yè)用于訓練的數據合法合規(guī);
第三,建立相關的數據保障機制,如從防火墻的設置、內部信息系統(tǒng)的管護、各個終端也做了不聯網、USB接口封死等管理,從源頭上保證了客戶的數據安全。
“從整體看來,AI數據行業(yè)關于安全、隱私等方面并沒有統(tǒng)一的標準和強調重視。但從我們長遠角度出發(fā),一直在隱私和安全防護角度下大力氣服務行業(yè)、樹立數據質量標桿,只有以這種負責的態(tài)度來服務客戶,我們的行業(yè)才能‘良幣驅除劣幣’,真正讓人工智能成為新一輪技術革命,改變整個社會和人類進程”。Testin云測CMO張鵬飛表示。
不管是技術的進步,還是行業(yè)的進一步垂直和共識,亦或是數據之爭中的探索,不可否認的是,AI數據正在從“幕后”走到“臺前”,也正在扮演越來越重要的角色。在算法領域已經跑出了以商湯為代表的獨角獸,而在AI數據領域又將跑出哪些獨角獸值得期待。





