是針對人工智能(AI)領(lǐng)域提供的一項服務(wù),它包括數(shù)據(jù)采集、數(shù)據(jù)清洗、信息抽取和數(shù)據(jù)標(biāo)注等服務(wù)。AI數(shù)據(jù)服務(wù)旨在為AI算法的訓(xùn)練和優(yōu)化提供必要的數(shù)據(jù)支持,為AI算法的性能提供保障。
據(jù)統(tǒng)計,2020中國AI行業(yè)核心產(chǎn)業(yè)市場規(guī)模將超過1500億元,市場發(fā)展向好隨著互聯(lián)網(wǎng)技術(shù)發(fā)展,市場AI需求愈發(fā)明顯,同時在經(jīng)濟、政策不斷利好下,2020年中國AI行業(yè)核心產(chǎn)業(yè)市場規(guī)模將超過1500億元,AI數(shù)據(jù)服務(wù)行業(yè)市場前景廣闊。
數(shù)據(jù)服務(wù)的技術(shù)升級成為競爭焦點
伴隨企業(yè)客戶定制化場景升級,對相應(yīng)數(shù)據(jù)服務(wù)提出更高的需求,各大數(shù)據(jù)服務(wù)提供商將會持續(xù)進行對技術(shù)、軟硬件設(shè)施方面的投入,未來AI數(shù)據(jù)服務(wù)方式將從原來的粗放型向精細化方向過渡,數(shù)據(jù)服務(wù)的技術(shù)升級也將成為競爭焦點。
(1)數(shù)據(jù)時代來臨,數(shù)據(jù)總量與處理需求量快速增長
大數(shù)據(jù)、云、物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)設(shè)備的普及產(chǎn)生了前所未有的海量數(shù)據(jù),宣告了數(shù)據(jù)時代的來臨。物聯(lián)網(wǎng)的發(fā)展更使線下業(yè)務(wù)產(chǎn)生的大量數(shù)據(jù)被采集起來,數(shù)據(jù)量呈指數(shù)式增長,據(jù)國際數(shù)據(jù)公司(IDC)預(yù)測,全球每年的數(shù)據(jù)量將從2018年的33ZB快速增加到2025年的175ZB,年復(fù)合增長率達26.91%。其中,中國的數(shù)據(jù)量增速最快,平均每年的增長速度比全球快3%。2018年,中國的數(shù)據(jù)量為7.6ZB,占全球總量的23.4%,預(yù)計到2025年將增至48.6ZB,占全球總量的27.8%,年復(fù)合增長率達30.35%。
全球生產(chǎn)的數(shù)據(jù)中絕大部分為非結(jié)構(gòu)化數(shù)據(jù),需要經(jīng)過清洗與標(biāo)注才能符合技術(shù)需求。據(jù)艾瑞咨詢統(tǒng)計,在我國每年需要進行標(biāo)注的語音數(shù)據(jù)超過200萬小時,視覺類圖片則有數(shù)億張。數(shù)據(jù)時代的來臨,產(chǎn)生了海量數(shù)據(jù),也為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)提供了源源不斷的清洗與標(biāo)注數(shù)據(jù)業(yè)務(wù)需求。
(2)人工智能產(chǎn)業(yè)化落地,為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)提供發(fā)展紅利
當(dāng)前人工智能技術(shù)開始廣泛應(yīng)用于不同產(chǎn)業(yè),展現(xiàn)出可觀的商業(yè)價值和巨大的發(fā)展?jié)摿?。人工智能的產(chǎn)業(yè)化落地為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)提供巨大的發(fā)展紅利。產(chǎn)業(yè)化應(yīng)用新產(chǎn)品、新應(yīng)用、新場景層出不窮,產(chǎn)生了大量新興垂直領(lǐng)域的基礎(chǔ)數(shù)據(jù)需求,作為算法訓(xùn)練支撐的大量落地場景內(nèi)訓(xùn)練數(shù)據(jù)正成為行業(yè)需求痛點。下游的人工智能產(chǎn)業(yè)應(yīng)用快速增長,為基礎(chǔ)數(shù)據(jù)服務(wù)的發(fā)展提供了長期向好的基本面。
(3)良好的國家政策環(huán)境
我國高度重視人工智能產(chǎn)業(yè)的發(fā)展,出臺了多個國家層面的政策規(guī)劃推動行業(yè)發(fā)展。按照相關(guān)政策要求,我國將繼續(xù)構(gòu)建人工智能支撐體系,支持建設(shè)高質(zhì)量訓(xùn)練資源庫、標(biāo)準測試數(shù)據(jù)集,進一步提升基礎(chǔ)語音、視頻圖像、文本對話等訓(xùn)練數(shù)據(jù)量,在行業(yè)訓(xùn)練資源庫領(lǐng)域取得突破。國家產(chǎn)業(yè)政策的支持,為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展提供了良好的政策環(huán)境。
(4)地方積極推動基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展,促進人工智能創(chuàng)新融合
全球各地的主要城市在人工智能技術(shù)的發(fā)展中發(fā)揮了差異化作用,構(gòu)建了各自的生態(tài)體系,并在賦能產(chǎn)業(yè)應(yīng)用、助力區(qū)域經(jīng)濟發(fā)展方面實現(xiàn)初步效果。
訓(xùn)練數(shù)據(jù)服務(wù)企業(yè)快速成長策略研究報告
在我國,發(fā)展基礎(chǔ)數(shù)據(jù)服務(wù)是各地方推進人工智能建設(shè)的重要方向之一。貴州、山西、重慶等地相繼出臺指導(dǎo)意見,引入基礎(chǔ)數(shù)據(jù)服務(wù)公司,共建數(shù)據(jù)基地、數(shù)據(jù)交易中心,打造具有地方特色的人工智能產(chǎn)業(yè)園。貴州省打造的惠水百鳥河數(shù)字小鎮(zhèn),園區(qū)自營超過1,500個席位的數(shù)據(jù)工場,提供了大量數(shù)據(jù)采集和標(biāo)注服務(wù),同時計劃在全省范圍內(nèi)積極拓展新一代信息技術(shù)能力;成都市計劃到2020年推進政府?dāng)?shù)據(jù)開放數(shù)據(jù)集1,000個以上,實現(xiàn)大數(shù)據(jù)從業(yè)人員規(guī)模和核心產(chǎn)業(yè)產(chǎn)值快速增長;山西省計劃到2022年初步形成集數(shù)據(jù)采集、清洗、標(biāo)注、交易、應(yīng)用為一體的基礎(chǔ)數(shù)據(jù)服務(wù)產(chǎn)業(yè)體系。
地方積極推動基礎(chǔ)數(shù)據(jù)服務(wù)產(chǎn)業(yè)發(fā)展,有利于形成人工智能產(chǎn)業(yè)集聚,促進創(chuàng)新融合,為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展創(chuàng)造有利局面。
總之,數(shù)據(jù)服務(wù)是企業(yè)保持競爭性的戰(zhàn)略性必備元素,可以幫助企業(yè)更快速、精準地處理和分析數(shù)據(jù),降低數(shù)據(jù)處理成本和風(fēng)險,提高數(shù)據(jù)質(zhì)量和安全性,為企業(yè)提供更加完善的服務(wù)。