- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2024-03-13來源:于戲王瀏覽數:230次
前言
挖掘金融業數據資源巨大價值的同時必須確保數據安全,注重對數據主體和數據持有者合法權益的保護。為解決這一過程中的實踐難點,本文基于區塊鏈技術,設計數據集動態標簽管理“TEAM”體系——一個集Tagging(打標)、Ensuring(保障)、Authorization(授權)、Monitoring(監控)四大功能于一體的保護體系。該體系旨在使公共數據、企業數據、個人數據等各類數據信息在流通與價值釋放過程中,能夠得到與其安全需求相匹配的“貼身”保護。
一數據權益保護的難點及解決思路
金融行業匯聚了包括金融業務數據、企業經營數據、消費者數據、公共數據等在內的各種數據。這些數據來源廣泛、涉及主體眾多、類別多樣,經過匯集、整理、分析、交易后可產生巨大經濟和社會價值,為數據主體和持有者帶來各種可能的實用價值與經濟收益。但與此同時,如果這些數據應用不當,也很容易觸發數據權益侵犯和數據安全違規等風險。
各類金融機構在數據收集、獲取的過程中,通常會采用必要的措施和審查確保數據采集的合法性和合理性。但是數據在獲取之后的處理與流通過程中,普遍缺少有效的管理與監控。從金融機構視角看,因為缺少對數據全生命周期的可控管理,在合規要求下難以對海量的數據進行進一步開發和開放。從監管機構視角看,目前很難全面監督數據處理者對數據的使用和流轉是否具有合法授權以及是否匹配其安全等級。要解決這些問題,就需要設計一套可行的數據權益保護與跟蹤方案。
本文基于區塊鏈技術,通過建立一套標準化的數據權益保護標簽與運行規則,供所有參與數據應用與流通的數據提供方和數據需求方共同遵守,以此保證數據使用的安全性、一致性與合法性,達成對數據主體和持有者權益的持續保護。在數據開放及應用過程中,參與者通過數據集標簽即可獲得相關授權,并在數據處理過程中對標簽信息進行追加,以實現對數據權益的遵守、記錄和傳遞。圍繞這一思路,需要建立配套的數據權益保護標簽管理體系,形成對數據權益保護的全面高效保障機制。
二數據權益保護的“TEAM”管理體系
數據權益的保護既依賴于技術的實現,更有賴于管理措施和機制的完善,需要技術與管理相配合。本文提出的“TEAM”體系,旨在為金融業的數據共享、流通、應用提供一個全面的、可行的解決方案(見圖1)。
圖1 ?基于動態標簽管理的數據權益保護“TEAM”體系

Tagging(打標):為數據資源提供全生命周期跟蹤保護
由于在數據資源的開發與流通中普遍處理的是數據的集合,因此,該方案將打標對象設定為數據集,特別是沒有對個人數據進行去標識化或匿名化處理的數據集。一個集中的數據具有基本相同或相似的結構、安全級別、權益標準和應用價值。分析數據集中的數據規模、類型、風險屬性、涉及主體,確定其安全分級、限定使用場景、是否可再次流轉、是否可用于數據集聯合、是否可智能分析和自動化決策等因素,根據這些分析結果為數據集配置標準化的標簽?;趨^塊鏈技術,在數據集的流通過程中對標簽進行動態化、去中心化、不可篡改的管理、記錄和跟蹤。
打標過程有兩個關鍵點。
(1)第一個關鍵點,是標簽的標準化設計。由于金融行業數據的內容、形式、存儲結構、應用場景等復雜多變,因此,需要針對不同的數據集安全級別、數據結構、內容屬性以及業務場景,設計出靈活兼容的標簽標準,以滿足成本、效益、安全的三者平衡。數據標簽需包含以下信息。
數據集描述信息:包括數據的規模、結構、內容、范圍等信息;
數據主體授權信息:包括授權期限、使用范圍、權限內容、權限變更信息等;
數據持有者授權信息:包括數據持有者信息以及對數據再流傳使用的權限約束信息;
數據應用約束信息:包括數據集的可應用范圍、場景、處理方式等信息;
數據安全等級信息:包括數據集的安全等級、保護級別、保護措施等信息;
數據集防篡改及加密信息:包括根據數據集中的內容形成哈希值,作為數據集驗證碼,以確保整個數據集的不可篡改性,并采用加密技術保護數據集標簽,使之只能被合法的數據使用者進行解讀和續寫;
數據傳輸路徑跟蹤信息:包括記錄數據集收集、處理、應用等環節的參與者信息以及數據集的流轉和處理信息。
(2)第二個關鍵點,是標簽的全生命周期動態管理,旨在有效約束數據使用的場景、限制數據集或其中部分數據在非授權情況下傳播擴散等。標簽將跟隨數據集從創建直至數據集生命周期結束。在數據集應用流通的各個節點,數據處理者應對標簽進行信息追加和維護。
數據標簽伴隨數據集的自始至終,當數據集的生命周期結束時,在出現以下情況時,標簽才會進行歸檔封存或刪除處理:數據集徹底刪除;完全融入新的數據集,重新評估形成新標簽;數據集分裝為兩個或多個子集,重新評估打標;數據集結構、規模、重要信息發生變化,重新評估打標(見圖2)。
圖2 ?數據權益保護標簽的內容及基本使用過程

支持打標環節的主要技術除了區塊鏈技術,還有自然語言處理、機器學習等。需要配套的管理措施有數據分類分級、數據影響評估等。特別是需要大量使用自然語言處理算法對特征字段進行分類打標、敏感分級;利用機器學習技術,結合業務規則和合規策略,使得數據集的打標實現自動化、智能化、標準化。
Ensuring(保障):為數據資源合法開發提供有效監管機制
數據集標簽為數據資源的開發應用提供了最直接、便捷的安全監管方法,有助于形成數據流通上下游機構自查、數據交易機構核查、數據和金融監管部門審查的三層數據流通安全審核機制。各層審核的范圍可以包括且不限于數據流通與應用中各參與方的數據來源、數據使用范圍、授權期限、技術與安全保障能力等是否與數據集標簽一致以及數據集標簽是否與數據集內容一致。
除了借助于動態標簽管理機制,Ensuring保障功能模塊還要依賴于數據流通與管理機制的完善,建立數據權益管理的載體與平臺,有以下幾種方式:一是政府部門或金融監管部門牽頭建立金融數據中心和數據權益保護區塊鏈基礎設施,發揮政府、監管機構公信、公正、公開的作用;二是數據交易所、數據中介等對數據流通的上下游參與方進行審核;三是金融機構建立健全內部相關制度措施。
Authorization(授權):實現數據權益的管理與激勵
在取得數據主體或數據原持有者合法授權后,數據獲取方還需要建立對數據授權的跟蹤管理,以便有效實現對數據授權的控制、撤銷、變更等需求。將數據集動態標簽與數據治理體系中的數據資產管理、元數據管理等模塊相融合,建立數據權益管理機制、多方授權機制等,權益動態標簽成為權益管理機制的實現載體和基礎。
授權管理模塊的相關支持措施還包括:對一攬子授權同意進行細化管理,如權益期限、信息授權分級等;提供對數據授權的查詢、撤銷方法;同時從政府和監管部門角度設置具有公允性的數據權益保障機制,使金融數據的收集與處理不僅擁有數據主體的授權,而且也遵循數據倫理與法律道德(見圖3)。
圖3 數據權益保護標簽管理與數據治理體系的融合

Monitoring(監控):全網掃描以偵察數據流通的異常
數據集的標簽管理也能幫助網絡安全機構和金融機構偵察識別無授權使用的數據集,提供防數據泄露、查找數據泄露證據、處置泄露風險的手段。
對金融機構而言,還需在現有的網絡安全防護、終端防護、數據庫安全管理、防數據泄露等措施和體系的基礎上,完善對數據集標簽的監控功能,做好數據權益保護的全面監管。
結束語
數字經濟發展過程中,金融行業數據開放共享將產生巨大的社會價值和經濟價值,數據權益標簽的標準化設計有助于加快數據開放共享的進程。未來,隨著數據價值的不斷挖掘和量化,數據主體及數據持有者對數據的經濟價值分配、權益分配等問題也可以基于本文所探討的動態標簽管理機制進行擴展與研究。