何寶宏:讓數(shù)據(jù)資源向數(shù)據(jù)資產(chǎn)發(fā)展,從能存、能算到釋放價值、對外流通

發(fā)布時間:2023-09-08 10:44:04  |  來源:人民數(shù)據(jù)  

9月1日,由人民網(wǎng)·人民數(shù)據(jù)主辦的“數(shù)據(jù)要素發(fā)展座談會暨數(shù)據(jù)要素公共服務(wù)平臺上線儀式”活動在人民日報社成功舉辦。


(相關(guān)資料圖)

在主題演講環(huán)節(jié),中國信息通信研究院云計算與大數(shù)據(jù)研究所所長何寶宏發(fā)表《數(shù)據(jù)要素技術(shù)概覽》主題演講。

圖為中國信息通信研究院云計算與大數(shù)據(jù)研究所所長何寶宏發(fā)表演講

何寶宏表示,數(shù)據(jù)市場發(fā)展幾十年來,技術(shù)一直在變化。在過去20年,大數(shù)據(jù)時代讓所有的數(shù)據(jù)能夠管起來、用起來,把原始數(shù)據(jù)提煉成數(shù)據(jù)資源,但仍然面臨“用得不夠好、價值釋放不夠”的難題。從大數(shù)據(jù)到數(shù)據(jù)要素時代的目標,是讓數(shù)據(jù)資源向數(shù)據(jù)資產(chǎn)發(fā)展,從能存、能算到釋放價值、對外流通,真正進入數(shù)據(jù)3.0時代。

何寶宏指出,圍繞數(shù)據(jù)資產(chǎn)化過程主要有三大類:第一是數(shù)據(jù)管理,當(dāng)前的數(shù)據(jù)管理的工具和智能化不夠,人為介入比較高,應(yīng)該更技術(shù)化;第二是數(shù)據(jù)安全,原來數(shù)據(jù)安全主要靠防火墻的邊界,只有在邊界內(nèi)才是安全可控的,數(shù)據(jù)要素要求在流通中解決安全問題,就要將邊界安全變?yōu)閿?shù)據(jù)的內(nèi)生安全;第三類是數(shù)據(jù)流通,致力于從“流通即失控”變?yōu)椤翱捎貌豢梢姟薄?/p>

何寶宏認為,數(shù)據(jù)管理技術(shù)應(yīng)達到好用、易用的技術(shù)需求。易用,即靈活應(yīng)對各類需求;好用,即數(shù)據(jù)質(zhì)量全面提升。數(shù)據(jù)管理的基礎(chǔ)性技術(shù)現(xiàn)已成熟,而創(chuàng)新融合還在繼續(xù)。面向數(shù)據(jù)質(zhì)量自動化管理的AI技術(shù)方案已基本成熟,有待進一步推廣應(yīng)用;針對“讓數(shù)據(jù)更好地找到人,而不是讓人找數(shù)據(jù)”的問題,融合各類技術(shù)進行數(shù)據(jù)管理以實現(xiàn)“數(shù)據(jù)主動找人”的數(shù)據(jù)編織技術(shù)正在快速興起,但目前處于概念期;數(shù)據(jù)倉庫和數(shù)據(jù)湖技術(shù)已得到廣泛應(yīng)用,融合數(shù)據(jù)倉庫、數(shù)據(jù)湖各自優(yōu)勢的湖倉一體技術(shù)有待進一步提高性能。

何寶宏指出,數(shù)據(jù)安全保護技術(shù)已相對成熟,全生命周期的模式創(chuàng)新不斷。數(shù)據(jù)安全技術(shù)方面,應(yīng)從數(shù)據(jù)存儲、訪問、使用和流通安全及數(shù)據(jù)的分級分類幾個方面實現(xiàn)數(shù)據(jù)的有效保護和有力控制。建立“規(guī)則+AI識別”是當(dāng)前常用的數(shù)據(jù)安全保護技術(shù)路線,分類分級、防泄露、零信任驗證等均在一定程度上依賴相應(yīng)規(guī)則的設(shè)置和人工智能的精準度;基于“持續(xù)驗證,永不信任”理念的零信任技術(shù)架構(gòu)進一步適應(yīng)不斷突破邊界的云、網(wǎng)環(huán)境,進一步推動數(shù)據(jù)安全對全生命周期的覆蓋。

何寶宏表示,數(shù)據(jù)流通的技術(shù)需求:確權(quán)、轉(zhuǎn)移和定價。數(shù)據(jù)流通中的問題主要是確權(quán)、轉(zhuǎn)移和定價在法律法規(guī)的基礎(chǔ)上需要相應(yīng)技術(shù)手段的支持。在確權(quán)方面要解決聲明技術(shù)和共識:聲明權(quán)利可通過在數(shù)據(jù)內(nèi)嵌入標識、憑證以聲明權(quán)利的數(shù)字水印等技術(shù)來實現(xiàn);權(quán)利獲得共識且不可篡改則可通過數(shù)據(jù)各類權(quán)利共識存證、不可篡改、可追溯的區(qū)塊鏈/web3等技術(shù)來實現(xiàn)。

何寶宏認為,數(shù)據(jù)轉(zhuǎn)移則是核心問題,涉及到很多的相關(guān)技術(shù)。API接口和數(shù)據(jù)脫敏是目前最常用的兩個技術(shù),兩者經(jīng)常會結(jié)合使用。何寶宏指出,這兩者當(dāng)前也存在一定的局限性。首先,API接口只提供數(shù)據(jù)集中的部分記錄、字段,數(shù)據(jù)脫敏改變了原始數(shù)據(jù)的形態(tài),原始數(shù)據(jù)的全量信息均受到損失,價值較原始數(shù)據(jù)大幅降低;其次,通過API或脫敏給出的數(shù)據(jù)已不再受數(shù)據(jù)提供方掌控,容易被濫用,或通過其他關(guān)聯(lián)反推原始數(shù)據(jù)。何寶宏表示,基于加密隱藏的多方安全計算技術(shù)是數(shù)據(jù)轉(zhuǎn)移的另一個重要技術(shù),其需要去中心化及支持通用計算,目前計算效率還較低、開發(fā)難度較大,應(yīng)用性距產(chǎn)業(yè)化推廣還需要一個過程;另一方面,傳遞建模中間信息隱藏原始數(shù)據(jù)的聯(lián)邦學(xué)習(xí)日趨發(fā)展成熟,廣泛適用于風(fēng)控、營銷、政務(wù)、醫(yī)療、互聯(lián)網(wǎng)金融等應(yīng)用場景,但這項技術(shù)的局限性在于目前缺乏嚴謹?shù)陌踩C明機制,參與方可能通過交互的中間數(shù)據(jù)反推出原始數(shù)據(jù),還易受到數(shù)據(jù)投毒和模型攻擊等攻擊方式;另外,聯(lián)合建模往往需要多輪迭代,在多方參與情況下,由于計算資源不同會造成數(shù)據(jù)聚合不同步,從而影響整體性能;再者,該技術(shù)目前尚缺乏相關(guān)法律法規(guī)的支持。何寶宏還提到,智能合約則能實現(xiàn)數(shù)據(jù)流通使用限量、限目的、不可篡改,實現(xiàn)完全數(shù)字原生的合約,數(shù)字原生的定價機制等,但目前總體處于初步發(fā)展階段,理論和技術(shù)手段還不太成熟。隱私計算的“可用不可見”——企業(yè)在控制所持數(shù)據(jù)的基礎(chǔ)上,讓數(shù)據(jù)“來去自由”,成為自主可控的數(shù)據(jù)資產(chǎn),已經(jīng)可以產(chǎn)業(yè)化應(yīng)用了。

何寶宏指出,定價問題的技術(shù)需求則是多方合作時的數(shù)據(jù)價值貢獻度量。對于多方聯(lián)合參與計算的場景,每方所提供數(shù)據(jù)的價值衡量需要技術(shù)支持,即在聯(lián)合計算的過程中通過算法公平合理地衡量數(shù)據(jù)價值貢獻度,作為收益分配的依據(jù)。數(shù)據(jù)定價在多方參與聯(lián)合建模的場景中,綜合運用博弈論、人工智能模型、信息論等技術(shù),探討數(shù)據(jù)價值與決策模型精度的關(guān)系,可以為度量各數(shù)據(jù)方的貢獻度、進一步分配收益提供依據(jù)。何寶宏認為,目前其應(yīng)用的場景相對比較局限、產(chǎn)業(yè)化不足,新的應(yīng)用場景還不多。

何寶宏表示,總體而言,圍繞著數(shù)據(jù)要素需要更多的新技術(shù),也需要相關(guān)法律法規(guī)的密切配合,目前依然面臨著嚴峻考驗。

來自29個中央部委相關(guān)部門負責(zé)人,湖北、河南、黑龍江、安徽、內(nèi)蒙古等省區(qū)的地方政府部門負責(zé)人,以及各地大數(shù)據(jù)交易所、大數(shù)據(jù)企業(yè)的代表500多人出席會議。

關(guān)鍵詞:

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com