日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

干貨 | 數據合理定價:利用數據資產圖譜解析數據價值網絡

時間:2023-09-19來源:純屬浪費瀏覽數:917


在《中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(以下簡稱“數據二十條”)指導下,我國正在快速建設數據要素市場。本文從“數據二十條”對數據收益的指導原則出發,基于公平性與有效性原則,構建數據定價與數據資產價值評估的理論基礎,并以與央企、互聯網集團和金融機構的合作為基礎,開發相關計算技術。理論證明:在滿足公平性與有效性原則的情形下,在任一經濟活動中的參與貢獻數據要素,存在一個唯一、公平有效的收益分配理論解。進一步,開發數據資產圖譜技術,用以解析數據生產使用鏈條上下游數據的貢獻度,并可不斷自動化盤點數據在各項經濟活動中的收益值,為數據資產價值評估提供參數依據。


一、問題的提出

2022年12月,中共中央、國務院發布《關于構建數據基礎制度更好發揮數據要素作用的意見》(以下簡稱“數據二十條”),這是關于數據要素市場全局發展的戰略性指導意見。該意見確立了數據要素作為一個新的生產要素的重要戰略地位,涵蓋了相應制度安排和發展方向等具體內容。其中,數據定價及收益分配問題被認為是至關重要的一個環節。“數據二十條”明確提出:“建立體現效率、促進公平的數據要素收益分配制度”,并指出“健全數據要素由市場評價貢獻、按貢獻決定報酬機制。結合數據要素特征,優化分配結構,構建公平、高效、激勵與規范相結合的數據價值分配機制”。同時,國家數據局的成立也將為數據要素市場的制度建設提供有力基礎保障。然而,目前數據定價和收益分配是亟需解決的難題。數字經濟的發展需要核心技術為基礎,在核心技術層面,應當進一步增加數據交易類技術、數據流通審計技術、數據建模與模型治理等底層技術的投入,并以這些底層技術“新基建”為引領,加快實現數據要素市場化配置、合理分配數據要素收益等。不論是市場參與者還是政策制定者都需要客觀了解數據與場景、數據與數據之間的價值關系,從而形成與數據要素價值和貢獻相適應的收入分配機制,進而驅動企業內部的獨立核算、企業間的數據共享,形成數據要素市場。本文專注于從經濟學與數據科學的交叉維度,討論數據實際的經濟價值并給出客觀的計算方法。

數據定價為什么難,本質上是因為數據有不同于其他要素的特殊價值特征:也就是姚期智(2022)指出的特異性、協同性與無限可用性。首先,數據價值具有特異性特征:同一數據對于不同場景的價值是不同的,對于同一場景不同數據的可用性與價值也是不同的。例如:某種電力數據,可以應用在電力定價、調度優化等場景實現經濟價值;也可以與金融場景結合對企業金融服務參與信用評價產生經濟價值;還可以用于地區經濟的統計分析、規劃決策的模型中。可見,對于不同使用場景,同一個數據產生的貢獻與經濟價值是不同的。其次,數據價值具有協同性特征:在使用數據的時候經常會發現多種數據的組合對某個場景的應用產生超過單一數據生產價值的總和,這種“1+1>2”的現象也是數據科學非常有魅力的地方。多維度的數據可以更精準地幫助分析、預測、決策等關鍵經濟活動中的動作,不像傳統要素一樣,數據價值的加總不能是線性的簡單相加。最后,數據價值具有無限可復用性:這也是數據要素具有的獨特特征。不同于傳統的生產要素,如土地(蓋了房子就不能蓋停車場,蓋停車場就不能蓋商城)同一時間單一使用場景的限制,數據可以在同一時間被不同主體調用參與多種經濟活動(當然,在安全合規使用的前提下),在這個過程中數據產生了經濟價值倍增的效應。


因此,數據對不同場景的價值關系形成了一個客觀的圖譜,數據與數據之間的協同關系也形成了一個客觀的圖譜。數據參與到無限可復用的各種場景下形成了潛在數據價值的廣闊圖譜,數據的價值本身形成了一個廣闊而豐富的網絡化圖景,這也就是建設數據要素市場所追尋的星辰大海。如果能開發數據資產網絡圖譜相關理論和技術,就可以解決一系列關鍵問題:如交易中數據定價難的問題,數據資產入表的價值核算問題;數據收益分配的問題,大集團多主體數據交叉應用時如何合理分配權益激勵使用問題;數據與場景的價值關系即供需關系的分析問題,基于供需關系的大量解析與積累就能解決數據交易使用撮合效率低的問題等等。在姚期智院士的指導下,交叉信息核心技術研究院團隊與國家發展改革委價格監測中心緊密合作,為解決數據定價難、數據交易效率低提供了全新思路。


二、數據要素定價體系構建

1(一)基于經濟場景的數據定價理論基礎

目前國內外對于數據定價與價值管理的研究仍舊處于初期,還未形成一套切實可用的體系。數據定價的研究容易陷入了一種“非對稱性”陷阱,即將數據提供方和數據使用方處于“不對等” “非對稱”的地位,這種設置就使得數據定價成為甲乙雙方各執一詞的討價還價場景,容易陷入主觀維度、主觀指標的爭執,失去了客觀性的準繩。

如何能建立客觀的數據定價理論基礎呢?實際上,中央文件已給出高瞻遠矚的指示。根據“數據要素二十條”的要求,公平性與有效性是數據價值分配機制的基礎。首先,本文給數據定價問題一個更通用的設置:參與方可以是多方,大家使用數據共同完成某項經濟活動。無論是數據的提供方還是數據的使用方,都將其定義為“數據協作方”,這樣大家的地位是平等的,形成了公平性的基礎,問題的設置也形成了一個對稱性問題。即使是買賣兩方也符合這一更通用的設置,即存在兩個數據協作方,一方提供的數據量必須不為零(賣方),另一方用在這項經濟活動中的數據量可以為零(買方),兩個數據協作方即對應傳統概念中的“供需雙方”。

根據這兩項原則,基于信息經濟學、博弈論、計算經濟學和計算復雜性等交叉學科理論,構建形成在某項經濟場景中數據定價的理論基礎:首先,利用信息經濟學中信息價值的相關理論,建立各個業務場景中經濟價值與數據應用之間的映射關系①,從而將經濟價值轉化為對數據應用精度與風險的度量。在這一過程中需要將場景中數據使用者的價值度量,即經濟學中應用的效用函數與數據應用的決策過程耦合起來。因此,這是純粹意義上數據的經濟價值;在此基礎之上,運用合作博弈的理論基礎,對參與數據應用的所有數據都可以進行公平有效的價值分配,由此建立數據與某項經濟活動的價值關聯。這樣,就可以建立某項數據與某項經濟場景之間的定價理論。


2(二)數據要素價值實現路徑與風險治理

1.數據價值實現路徑。數據要素的價值發揮,離不開業務場景,而通過各式各樣的數據,結合數據模型,設定優化/預測等決策目標,搭建數據模型,進一步通過模型輸出結果,提取出信息,實現對業務生產過程的決策輔助指導,這是數據發揮價值的實現路徑。目前,數據價值實現的路徑有些是模型化的(例如利用人工智能算法建模),有些是非模型化的(例如通過商業智能展示和數據報表供決策人分析)。對于非模型化的應用場景,可以利用宏觀的統計模型核算要素的投入產出以歸因數據要素的經濟貢獻;對于模型化的數據應用場景,由于已經完成了可獨立量化評估的數據貢獻,可以用更精細化的方法進行計算,在一些場景里,我們已與行業專家定義了具體的效用函數,利用自動化程序計算各顆粒度的數據定價。我們在大型機構中發現約20%的數據使用場景已經是模型化的,其余是非模型化的。模型化數據應用場景隨著人工智能的發展,尤其是現今大模型的飛速發展會呈顯著上升趨勢。


2.數據模型評估及其潛在風險控制。在數據模型使用過程中,需要充分考慮模型的評估以及潛在風險控制。而數據作為模型的輸入端,同樣影響著模型的評估與潛在風險控制這兩方面。

——數據模型的評估。數據進入生產后,依賴于模型結果,即當用算法建立模型后,使得數據進行自動化生產。比如,個人信用評估模型、個性化推薦模型等等,這些數據通過模型形成數據產品,再與人的決策和運營產生經濟價值。而這些進入各個生產活動中的數據模型,也需要通過在各個場景進行評測,才能建立“數據—經濟價值”的映射關系。

通常情況下,數據模型的精度越高,決策效率越高,產生的經濟價值就會越大。因此,數據模型的精度與模型價值息息相關。隨著數據的大規模應用,人工智能算法的不斷演進,模型算法的評測和治理也成為重要的一個環節。模型評測的技術可以揭示數據模型的價值與實際經濟價值的關聯關系,這對數據定價是一個重要的基礎。

——數據模型的風險。與數據模型精度相對應的是模型的風險,也就是人工智能應用的風險。這些風險來源于以下方面:一是數據模型本身誤差的風險,比如2008年全球金融危機的導火索就是金融衍生品的定價模型誤差。對于模型誤差帶來的風險需要進行合理的評估和治理;二是模型的結果在應用中會產生虛假或錯誤信息。當前,人工智能模型合成的數據和信息有可能是錯誤或虛假的,但這種情況下人類無法辨別這類信息的虛實。因此,需要算法來監管這些模型,避免產生虛假或錯誤信息的生成;三是人工智能模型有可能會產生歧視和不公平的結果,這種現象有可能是由數據本身自帶的偏差造成,也有可能是算法設計存在缺陷。現實生活中常見的例子有價格歧視、大數據殺熟等,即平臺算法有可能面對不同的人對于同樣的產品展示不同的價格。金融領域也有可能出現放貸審批模型對不同的人群有所偏差,使得本應合格的申請人由于因為處于某個群體而遭到拒絕。監管模型、測試重要的公平性指標是減少這類問題的關鍵。

以上是數據模型治理方面需要重點關注的方向,模型治理既是技術問題,又是制度問題。通過逐步推動人工智能模型治理的技術發展和制度安排,將更有助于利用數據資產構建智能化的人工智能模型,使得各領域的數據集合于人工智能大模型,實現生產力的倍增。


3(三)數據資產總價值的評估

數據資產評價與估值是數據資產運營的有效舉措。通過對數據資產的管理、使用情況進行全面評估,運用科學的方法和適用的原則,以貨幣為計算權益的統一尺度,對在一定時點上的數據資產進行價值評估,從而實現以數據價值為導向的持續運營能力提升。目前全球對數據資產價值評估和數據資產定價都有一定的探索,但還未到成熟可全面推廣應用的階段,相關的理論、技術和模型等還有待進一步研究和開發。國家標準《信息技術 大數據 數據資產價值評估(征求意見稿)》中明確列舉收益法、成本法、市場法等相關評估方法。同時,指出在對數據資產進行價值評估時,應分析數據資產的基本屬性和基本特征。基于評估資料選擇適用的評估方法,對數據資產的價值進行評估。由于前文中提到的數據資產特殊性,數據資產與其他資產類別在估值定價方面存在相似的方法論,也有明顯差異。對于金融資產或實物資產,其估值定價通常是通過未來現金流折現加總等傳統方法計算。土地作為一種資產常常被用于與數據資產進行比較:在對土地進行估值時,從金融學的角度出發,土地本質為一種實物期權。這種實物期權只能在同一時間應用于一項特定的活動中,比如土地可以用于建造寫字樓或停車場。建成寫字樓后,可以通過出租辦公室或出售寫字樓獲得現金流,而停車場則可以通過出租停車位獲得現金流。因此,土地資產的估值取決于各項經濟活動的市場價格,投資者會根據這個市場價格進行決策,以獲取最大經濟價值。

然而,數據資產具有無限可復用性,在同一時間可應用在多個經濟活動和場景中,其價值應該是所有潛在的經濟活動分配權益的加總。因此,需要圖譜化的規范統計,匯總收益信息和成本信息,或者是與市場可比的數據協同信息,就可以對各類的場景中產生的經濟價值進行公平、合理的核算和加總,完成數據資產的完整估值。基于對某個場景數據定價的客觀計算,可以為數據資產的價值評估提供參數依據,下文將具體介紹。


4(四)數據要素定價體系框架總體設計

基于前述數據本身的特征與數據應用模型的評估風險特性,數據作為資產與其他資產有全然不同的本質特性與價值發揮模式。因此,數據定價理論研究需要充分考慮上述方面,形成一套特殊的結合數據實際情況的解決思路;基于前述數據資產化需要的成本信息以及收益信息等價值評估重要參數估計,數據作為資產其生產與價值發揮鏈路錯綜復雜,需要考慮圖譜化建設。基于此,本文設計了一套數據要素定價體系,以數據要素定價方法為核心技術出發,結合數據資產圖譜,實現了一套通用合理的技術框架。


三、數據要素定價方法分析——以銀行個人信貸模型為例


綜合前述,我們搭建了一個理論框架用來處理數據在某一項經濟活動中產生的價值,實現公平、合理的計算。如果要對數據的總價值進行計算,則需要結合以上提及的數據要素三個特征。

首先,需要將理論與實際場景相結合,建立業務價值與數據模型之間的映射關系。這個具象化的過程需要考慮數據的使用者及其對經濟學意義上的效用函數和數據使用價值產生耦合關系的明確定義。我們將此算法在一系列具體場景中實現,例如,銀行信貸和推薦領域,通過大規模數據應用和模型自動化展示,實現了對效用函數和數據價值的自動化計算,實現在業務開展的同時,計算數據在該場景中產生的經濟價值。在其他場景中,一方面,我們致力于實現不斷迭代此結合場景的經濟價值與數據模型的耦合公式;另一方面,與各行業各領域的專家一起明確定義這些效用函數,進而形成行業標準

在行業實踐中,算法落地需要理解數據使用者的經濟目標,如最大化生產收益、最小化生產成本、最小化倉存儲成本等,并在不同業務場景中定義這些目標,以實現自動化數據價值計算。此外,對于一些數據應用仍未完全智能化的場景,需要適用于基于宏觀要素投入產出計算的方法論,用以計算數據價值。

本文以某銀行合作落地個人信貸場景的數據價值利益分配算法模型為例。個人信貸數據使用場景主要解決的業務問題是基于各個數據提供方的個人信貸相關數據,通過識別良好/不良信用的客戶,預測客戶貸款違約傾向,從而輔助銀行控制信貸風險。這是一個典型的機器學習監督學習數據應用模型,其中模型使用邏輯回歸二分類模型,模型評測標準為準確率。

在這個數據模型應用場景下,入模數據來源于不同數據提供機構。需要研究解決的問題是對不同數據提供方分配合理的數據利益價值。監督學習的核心要素包括訓練數據集、模型以及模型評測標準。評估此模型下的數據價值對模型的貢獻度,就需要充分考量不同數據源對模型準確率的貢獻情況

收益分配問題本質上可以理解成一種權重分配機制。本文定價算法基于合作博弈理論,可以建立與模型貢獻相匹配的收入分配機制。其基本原理是:基于各方數據的貢獻值進行數據提供方的利益分配。這種分配方式體現了各成員對總目標的貢獻程度,避免了分配上的平均主義。比任何一種僅按資源投入價值、資源配置效率及將二者相結合的分配方式都更具合理性和公平性,也體現了各盟員相互博弈的過程。從這個原理出發,本文定價模式將不同來源的數據集當作聯盟成員,計算各方數據對模型的貢獻程度,以此為標準,實現收益分配(各方數據定價)。利用合作博弈分支下的Shapley算法,得到每個數據參與方的貢獻度(計算過程略去)。通過模型貢獻度的計算可得出一些有意思的結論:提供樣本量多的機構,有時貢獻值偏低;有些樣本量較少的機構,反而貢獻值較高。


四、數據資產圖譜構建

當前全行業數字化轉型加速,數據是底層基礎要素,一定程度支撐著上層業務化模型的表現。隨著包括人工智能模型、業務上云、物聯網、區塊鏈等新技術的落地,數據將會繼續呈指數級增長,成為全社會最有價值的資產之一。可以預見,全行業亟需對數據資產化價值管理。這就需要對整個數據生產與價值發揮鏈條做出價值解析。

在產業中數據的應用層面,數據生產本身會形成一個上下游的關系:從原始的數據資源,經過數據治理的過程,完成數據的歸集、清洗、整理,再到數據的分析建模,以及建模后的模型應用。整個鏈條最終會與業務場景相結合,產生價值。因此,在數據的價值計算中,沿著數據生產鏈條進行價值回溯是一個與實際結合、行之有效的解決思路,可以實現參與各個場景的每個數據元素價值的精確計算。由此,基于合作博弈理論,提出將數據產生的業務價值公平有效地分給任意單元參與經濟任務的數據源的重要算法,研發了數據資產圖譜技術,實現自動化盤點、計算和解析數據資產與各個場景的價值關聯關系,穿透數據間的價值關聯關系。


1(一)數據資產圖譜功能實現

在數據生產過程中,數據需要經過一系列的加工處理才能形成萃取層數據,發揮其價值。其中,上游數據的價值可以通過價值回溯的方法進行計算。為了實現這一點,需要對數據生產鏈條進行解析,以便清楚地了解數據的信息流轉過程。更確切地說,對在實際數據包括生產、使用、創造價值的全生命周期中,追溯數據資產之間的生產與業務價值關系,對數據生產過程實行結構化、知識化的管理,通過完整地刻畫數據生產流程,實現數據合規、高效生產和使用


2(二)數據資產圖譜與數據資產評估

通過不斷記錄、更新所有數據資產在各個場景中產生的價值以及數據與數據之間的價值,數據資產圖譜形成了數據定價的堅實基礎。更確切地講,數據資產圖譜是一個可以無限擴展的工具。在發現某項數據對某個場景有價值時,可以使用數據資產圖譜的技術進行解析和價值回溯。在不斷使用和發掘數據價值的過程中,數據資產圖譜也會不斷盤點和擴展數據價值。有了數據資產圖譜,就可以對數據資產本身的價值進行評估。

如上文中提到,國家標準《信息技術 大數據 數據資產價值評估(征求意見稿)》中明確列舉了收益法、成本法等相關評估方法。其中,收益法需要通過測算數據資產的所有未來收益并折現加總;市場法需要可比數據的比較與估值;而成本法需要重置成本信息。利用數據資產圖譜可以幫助評估人員得到這些參數的估計值,同時也需要領域估值專家對場景界定與效用函數(經濟價值)的具象化,以及確權專家對權益歸屬的界定。例如,收益法需要數據的各項收益加權求和,這些信息可以利用數據資產圖譜里數據對不同場景直接或通過下游間接產生的收益分配為依據;市場法需要輸入可比數據價格,可以利用圖譜信息把待估數據的信息量依據分配算法拆解映射到一些已有市場價格的數據上;使用成本法時也可以利用數據資產圖譜中上下游生產信息和可比數據集進行成本核算。數據定價算法相當于在實際計算落地指導層面給出了一個通用的框架,對于任意經濟活動中的數據都可以實現公平有效的價值計算。同時,借助數據資產圖譜技術,能夠對數據生產鏈條中的所有數據進行合理的價值分配。

基于數據資產定價與數據資產圖譜技術兩項理論和技術基礎,可以實現在探索數據應用場景的過程中,不斷擴大數據資產圖譜積累的信息,還原數據形成的廣闊而豐富的價值網絡全貌,從而進行數據資產的估值計算。在數據資產估值的過程中,一方面,依賴于數據定價算法計算,不同場景中每項參與的數據應該分配到公平合理的價值;另一方面,通過數據資產圖譜,可以對不同場景下數據產生的收益進行加總,實現總價值的評估。

然而,實際上,若將所有微觀數據都進行細致計算,工作量將十分龐大,所需信息也受限于現實環境,存在可得性有限的問題——這時可以通過構建“數據價格指數”作為輔助解決路徑,對某類數據在某個場景產生的價值進行宏觀指標核算。


3(三)數據資產圖譜的應用前景分析

依托數據資產圖譜,首先,可以基本直接實現不同數據使用場景下的收益定價。其次,可以實現數據資產的評估驗證。未來,數據資產圖譜中會包含越來越多的數據、場景的價值信息以及數據之間的價值協同關系——這些信息可以對數據資產評估進行驗證。如果評估結果與其他可比結果相比過高或過低,就可通過在數據資產圖譜中找到依據作為參考。最后,可以實現數據交易的智能撮合。因為數據資產圖譜中積累了很多數據的供需關系信息,可以基于數據資產圖譜中的信息指導下一次的數據交易,對數據供給方和需求方進行智能撮合。


數據資產圖譜在未來行業發展中有廣泛的應用場景。比如,數據經濟建設通過數據定價與模型治理,作為數據要素流通市場的基礎設施,暢通數據交易流動,可以將全產業鏈數據圖譜應用在金融機構與地方政府對實體經濟的支持。同時,在企業集團內部不同部門,不同法人主體之間可以建設以數據資產圖譜為支撐的數據要素流動與定價平臺,推動數據共享與收益核算分配,推動數據資產計價、核算與審計;在行業內部建立“監管沙盒”先行先試。尤其是通過在集團內部打造智能化模型,利用銀行與產業集團的數據,在保護隱私的環境下進行聯合建模,產生各類生產模型:如智能營銷、智能推薦、智能信貸風險模型等。在聯合建模的同時,依托數據定價算法以及數據資產圖譜在集團不同法人主體、不同部門之間根據數據的貢獻度進行經濟價值的分配、部門貢獻的獨立核算,用市場化的力量將整個集團的資源協調起來進行數字經濟的建設,形成“以產助融,以融助產”的產融協同模式,將集團內部的應用推廣至全行業,促進全行業數字化產能提升。

五、結語

在全球進入數字經濟時代的今天,數據是發展數字經濟的基礎性與關鍵性資源。2022年3月,國家發展改革委發布的《“十四五”數字經濟發展規劃》指出:數據要素是數字經濟深化發展的核心引擎。并明確了未來發展目標,要實現“數據確權、定價、交易有序開展,探索建立與數據要素價值和貢獻相適應的收入分配機制,激發市場主體創新活力”。通過制定公平合理的數據定價方法,以及數據資產圖譜核心技術追溯數據應用價值本源參數,形成一套數據定價體系,可以有效解決數據要素流通的關鍵問題,賦能數據資產化之路,也是解決數據要素市場培育、交易,形成“標準化”產品的必要前提。通過建立公平合理的數據定價模型,以及構建數據資產圖譜技術在數據生產鏈路里追溯數據價值,形成一套數據定價體系,可以有效解決數據要素流通的關鍵定價問題,從理論與技術層面助力“健全數據要素由市場評價貢獻、按貢獻決定報酬機制。結合數據要素特征,優化分配結構,構建公平、高效、激勵與規范相結合的數據價值分配機制”,對于數據資產價值評估與數據資產入表、快速提升數據與場景的撮合效率等研究也具有重要意義。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢