香港商报官网 > 广东 > 特别报道

如何兼顧私隱保護與數據挖掘?方濱興院士發佈「AI靶場」方案

2021-05-08
来源:香港商报网
    5月7日,由哈爾濱工業大學(深圳)主辦的規範促進數據生產要素流通交易研討會在深圳召開。此次會議由哈工大(深圳)-奇安信數據安全研究院,深圳高質量發展與新結構研究院承辦,深圳市計算機學會網絡安全專委會協辦。
 

方濱興院士發佈「AI靶場」解決方案
 
    全國政協經濟委員會副主任、哈爾濱工業大學(深圳)經濟管理學院創院院長劉世錦教授視頻中發言:「數據作為生產要素的流通交易,面臨確權和私隱保護兩大關鍵難題。數據本質上是信息,不具備獨享性或說專享性,多數人可同時佔有。數字經濟時代,與個人有關的信息傳播邊際成本幾乎為零,能夠迅速傳遍整個世界,這種低成本使得數據保護面臨特殊困難。
 
    他以 5G 建設和運用為例,分析數據作為生產要素如何用起來。「先有路再通車」,5G實際是修建信息的通道。但和4G不同,5G是在道路修建完成後並沒有現成的通行車輛,所以需要在修路的同時尋找或製造車輛,發現或創造各類垂直領域的應用場景。數據運用要與5G融合,首先需要找到應用場景。為此,亟需調動各級政府、企業、相關機構和個人拓展5G應用的積極性創造性,重視已有成功案例的示範引領作用。
 
    中國工程院院士、哈爾濱工業大學(深圳)首席學術顧問方濱興教授則從技術解決方案的角度,做了《AI靶場——基於可信平台的模型加工場》的主題演講分享。他認為,數據成為新型生產要素的大幕剛剛開啟,數據價值挖掘的重要性空前增加。與此同時,隨着《數據安全法(草案)》和《個人信息保護法(草案)》的頒佈,個人私隱保護受到國家的高度重視。在此背景下,數據流通將面臨大數據場景下私隱保護與數據挖掘的矛盾問題,即如何在保護原始數據私隱的前提下,最大限度地挖掘大數據價值。
 

主辦方與嘉賓合影
 
    為解決這一矛盾,他提出了破局私隱保護與數據挖掘相悖的方法-模型加工場。這是一套系統的解決方案:基於核心方法-數據不動程序動:採取網絡靶場技術,構建一個可信計算平台,私隱數據可以以裸數據的形式放在該平台中,由擺渡過來的外部程序利用這些數據來進行模型加工,但人員不能進入該模型加工場查看調閱數據;採用關鍵手段-分享價值不分享數據:使用信息過濾技術構建一個「防水堡」,確保外部程序在可信計算平台中計算之後,向外輸出的只能是參數之類的宏觀信息,而不能是微觀的原始數據,由此確保不會將私隱泄漏出去;基於輔助模式-數據可用不可見:數據分析師根據經過置換的樣本數據進行潛在價值的挖掘分析,即「數據可用不可見」;基於擴展模式-保留所有權釋放使用權,將所有權與使用權相分離,可信計算平台可提供遠程控制模式,讓數據的所有者來遠程決定其放到平台中的數據向誰賦予使用權,且由可信計算平台來保障被賦予使用權的人只能使用數據來生成相應的模型,以此發揮出模型加工場的作用,達到交易使用權、不觸及所有權的目的。該方法可升級數據信託與交易模式,有力支撐大數據國家戰略,預期引領大數據挖掘的國際潮流。
 
    對於「數據可用不可見」,方濱興做了個比喻,這種方案的效果好比是:「根據大數據精準分析,為患者提供有效藥片,卻不會告知藥片的成份。」
 
    哈工大(深圳)經濟管理學院學術委員會主席、深圳市原副市長唐傑教授認為,政府部門在行使公權力的過程中,沉澱了大量機構和個人數據,應當將這些數據反饋社會,便利社會應用。建議相關立法解決好數據安全、個人私隱和數據應用的關係,促進數據交易和數字經濟健康發展。
 
    深圳人大法工委主任林正茂認為,立法需要在個人私隱保護和數據利用之間找到平衡點,既能夠保護個人私隱,又能夠促進數據產業,真正起到良法善治的作用。數據要素流通形式包括開放、共享、交易,什麼情況下進行開放,什麼情況下進行共享,什麼情況下進行交易——這這些形式對應不同的數據主體和不同的場景,如何運用法律進行規制,仍有存在若干立法難題。
 
    深圳市發展改革委副主任劉偉介紹,依據財政倫理,政府原始數據理論上可以免費開放使用,但根據特別需求對數據再加工產生額外成本和新價值時,可考慮合理收費。政府或國企背書成立數據交易平台,能夠在市場規範發育的早期階段,為各方參與有價值數據交易提供信心和動力。
 
    深圳市政務服務數據管理局副局長王耀文談及數據立法問題:深圳市政府希望通過立法為數據要素市場的流通交易提供最基礎的法律支撐。其思路是,不可只講保護不講發展,也不可只講發展減弱保護;不可只講個人數據和公共數據,而要有綜合性,注意基礎性。儘管立法不能完全解決數據管理的所有問題,但能解決共性問題和基礎性問題,如產權、各種數據關係、數據要素市場各類主客體的關係規範等。(記者 黃鳳鳴)
[责任编辑:赵书琪 ]