澳鵬張童皓:專業(yè)化數(shù)據(jù)服務平臺是AI工業(yè)化的突破口
(全球TMT2021年7月13日訊)一份最新的全球《2021人工智能與機器學習現(xiàn)狀》調研報告顯示:2021年,53%的AI團隊報告預算在50萬美元到500萬美元之間(而2020年約為三分之一),這個強烈的信號表明AI對于各行各業(yè)各種規(guī)模企業(yè)的成功變得越來越重要。這份由AI數(shù)據(jù)服務平臺公司澳鵬(Appen)連續(xù)第7年發(fā)布的AI現(xiàn)狀年度報告還強調,在2020年由于新冠疫情,各規(guī)模的企業(yè)都加速推進了AI戰(zhàn)略,并且在2021年還將繼續(xù)保持這種勢頭。
在中國,AI技術應用開始全面覆蓋日常生活、科學研究、社會治理、商業(yè)創(chuàng)新和國家安全等經(jīng)濟社會的關鍵領域,以空前的廣度和深度推動社會發(fā)展。由中國信通院與中國人工智能產業(yè)發(fā)展聯(lián)盟推出的《2021人工智能核心產業(yè)白皮書》指出,工程技術正在引領AI產業(yè) -- 技術成本快速下降,同等算法水平所需計算量每8個月降低一倍、成本降低百倍,涌現(xiàn)了多樣化的研發(fā)和技術服務平臺,這些說明AI正從技術理論突破過渡到工程化落地應用的階段。
深度神經(jīng)網(wǎng)絡是當前AI的主要模型,而監(jiān)督學習則是構建(訓練)深度神經(jīng)網(wǎng)絡的主要方法,監(jiān)督學習所需要的大規(guī)模、高質量的人工標注數(shù)據(jù)集是AI產業(yè)發(fā)展的剛需,也是AI工業(yè)化的主要瓶頸之一。在中國,正在大量涌現(xiàn)AI數(shù)據(jù)標注產業(yè)基地,但當前的AI數(shù)據(jù)標注產業(yè)仍處于初級階段。澳鵬公司產品研發(fā)總監(jiān)張童皓表示,用戶對于數(shù)據(jù)規(guī)模、質量和多樣性等要求越來越高,專業(yè)化數(shù)據(jù)服務平臺是AI工業(yè)化的突破口。
澳鵬《2021人工智能與機器學習現(xiàn)狀》調研報告指出,獲取足夠的優(yōu)質訓練數(shù)據(jù)來部署AI是各種規(guī)模企業(yè)成功的重大障礙,而全球絕大多數(shù)企業(yè)都在某種程度上采用了專業(yè)數(shù)據(jù)供應商 -- 這反映了數(shù)據(jù)采集、準備和管理是AI面臨的首要挑戰(zhàn)。

根據(jù)澳鵬的調研,使用專業(yè)數(shù)據(jù)供應商的企業(yè)表示他們在AI部署方面領先于其他企業(yè)的可能性要高1.5倍,而落后的可能性要低4倍,也就是說使用專業(yè)數(shù)據(jù)供應商的企業(yè)部署了更多的AI項目,而且實現(xiàn)了更大的投資回報率。特別是,澳鵬發(fā)現(xiàn)使用專業(yè)數(shù)據(jù)供應商的企業(yè)更有可能將AI部署到生產環(huán)境。
此外,AI部署是一個持續(xù)的過程,而不是一勞永逸。去年,80%的被調研企業(yè)至少每季度更新一次模型,今年已增加到87%;2021 年,57%的受訪者表示至少每月更新一次模型,高于 2020年的45%。而與較小的企業(yè)相比,大型企業(yè)更有可能更新AI模型,至少每季度更新一次的比例為91%。其中,使用專業(yè)數(shù)據(jù)供應商的企業(yè)最有可能每月更新其模型。
就中國市場來說,以數(shù)據(jù)標注為代表的專業(yè)數(shù)據(jù)服務行業(yè)才剛剛起步,相關技術發(fā)展程度低,屬于勞動力密集型行業(yè),而且該行業(yè)缺乏大型專業(yè)數(shù)據(jù)供應商和服務商,行業(yè)以中小企業(yè)為主,呈現(xiàn)高度的競爭狀態(tài)。在另一方面,數(shù)據(jù)標注正從簡單、重復的拉框標注向精細化方向發(fā)展,也就是說數(shù)據(jù)標注行業(yè)正從簡單的勞動力密集型向專業(yè)型數(shù)據(jù)服務過渡。
當前,中國的AI行業(yè)和AI應用正在高速發(fā)展,相應帶動了AI數(shù)據(jù)標注行業(yè)的快速成長。特別是AI用戶對于AI數(shù)據(jù)標注質量的要求越來越高、越來越精細化和專業(yè)化,諸如自動駕駛、工業(yè)制造等智能應用場景越來越復雜,高質量、精細化的標注數(shù)據(jù)將直接影響算法模型的效果。
專業(yè)化的AI訓練數(shù)據(jù)標注平臺及眾包管理平臺是當前中國AI工業(yè)化瓶頸的重要突破口之一,這也是澳鵬(Appen)進入中國市場的重要原因。澳鵬迄今已經(jīng)有25年的歷史,擁有業(yè)內先進的人工智能輔助數(shù)據(jù)標注平臺和一體化AI數(shù)據(jù)及資源管理平臺,以及全球100多萬名技能嫻熟的眾包資源 -- 來自全球170多個國家和70,000個地區(qū),支持235多種語言和方言。澳鵬中國團隊從2019年就開始就重新構建面向中國市場的AI數(shù)據(jù)標注平臺、相應的工具以及眾包資源渠道和管理平臺,2021年澳鵬大中華區(qū)正式成立并獨立運作。
作為全球領先的AI訓練數(shù)據(jù)服務提供商,澳鵬的拳頭產品和服務就是數(shù)據(jù)標注平臺和眾包資源。針對中國市場,澳鵬中國研發(fā)中心借鑒公司在海外的實戰(zhàn)經(jīng)驗,重新獨立開發(fā)了中國版本的數(shù)據(jù)服務平臺。





