在《中共中央國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(以下簡稱“數(shù)據(jù)二十條”)指導(dǎo)下,我國正在快速建設(shè)數(shù)據(jù)要素市場。本文從“數(shù)據(jù)二十條”對數(shù)據(jù)收益的指導(dǎo)原則出發(fā),基于公平性與有效性原則,構(gòu)建數(shù)據(jù)定價(jià)與數(shù)據(jù)資產(chǎn)價(jià)值評估的理論基礎(chǔ),并以與央企、互聯(lián)網(wǎng)集團(tuán)和金融機(jī)構(gòu)的合作為基礎(chǔ),開發(fā)相關(guān)計(jì)算技術(shù)。理論證明:在滿足公平性與有效性原則的情形下,在任一經(jīng)濟(jì)活動(dòng)中的參與貢獻(xiàn)數(shù)據(jù)要素,存在一個(gè)唯一、公平有效的收益分配理論解。進(jìn)一步,開發(fā)數(shù)據(jù)資產(chǎn)圖譜技術(shù),用以解析數(shù)據(jù)生產(chǎn)使用鏈條上下游數(shù)據(jù)的貢獻(xiàn)度,并可不斷自動(dòng)化盤點(diǎn)數(shù)據(jù)在各項(xiàng)經(jīng)濟(jì)活動(dòng)中的收益值,為數(shù)據(jù)資產(chǎn)價(jià)值評估提供參數(shù)依據(jù)。
一、問題的提出
2022年12月,中共中央、國務(wù)院發(fā)布《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(以下簡稱“數(shù)據(jù)二十條”),這是關(guān)于數(shù)據(jù)要素市場全局發(fā)展的戰(zhàn)略性指導(dǎo)意見。該意見確立了數(shù)據(jù)要素作為一個(gè)新的生產(chǎn)要素的重要戰(zhàn)略地位,涵蓋了相應(yīng)制度安排和發(fā)展方向等具體內(nèi)容。其中,數(shù)據(jù)定價(jià)及收益分配問題被認(rèn)為是至關(guān)重要的一個(gè)環(huán)節(jié)。“數(shù)據(jù)二十條”明確提出:“建立體現(xiàn)效率、促進(jìn)公平的數(shù)據(jù)要素收益分配制度”,并指出“健全數(shù)據(jù)要素由市場評價(jià)貢獻(xiàn)、按貢獻(xiàn)決定報(bào)酬機(jī)制。結(jié)合數(shù)據(jù)要素特征,優(yōu)化分配結(jié)構(gòu),構(gòu)建公平、高效、激勵(lì)與規(guī)范相結(jié)合的數(shù)據(jù)價(jià)值分配機(jī)制”。
同時(shí),國家數(shù)據(jù)局的成立也將為數(shù)據(jù)要素市場的制度建設(shè)提供有力基礎(chǔ)保障。然而,目前數(shù)據(jù)定價(jià)和收益分配是亟需解決的難題。數(shù)字經(jīng)濟(jì)的發(fā)展需要核心技術(shù)為基礎(chǔ),在核心技術(shù)層面,應(yīng)當(dāng)進(jìn)一步增加數(shù)據(jù)交易類技術(shù)、數(shù)據(jù)流通審計(jì)技術(shù)、數(shù)據(jù)建模與模型治理等底層技術(shù)的投入,并以這些底層技術(shù)“新基建”為引領(lǐng),加快實(shí)現(xiàn)數(shù)據(jù)要素市場化配置、合理分配數(shù)據(jù)要素收益等。不論是市場參與者還是政策制定者都需要客觀了解數(shù)據(jù)與場景、數(shù)據(jù)與數(shù)據(jù)之間的價(jià)值關(guān)系,從而形成與數(shù)據(jù)要素價(jià)值和貢獻(xiàn)相適應(yīng)的收入分配機(jī)制,進(jìn)而驅(qū)動(dòng)企業(yè)內(nèi)部的獨(dú)立核算、企業(yè)間的數(shù)據(jù)共享,形成數(shù)據(jù)要素市場。本文專注于從經(jīng)濟(jì)學(xué)與數(shù)據(jù)科學(xué)的交叉維度,討論數(shù)據(jù)實(shí)際的經(jīng)濟(jì)價(jià)值并給出客觀的計(jì)算方法。
數(shù)據(jù)定價(jià)為什么難,本質(zhì)上是因?yàn)閿?shù)據(jù)有不同于其他要素的特殊價(jià)值特征:也就是姚期智(2022)指出的特異性、協(xié)同性與無限可用性。首先,數(shù)據(jù)價(jià)值具有特異性特征:同一數(shù)據(jù)對于不同場景的價(jià)值是不同的,對于同一場景不同數(shù)據(jù)的可用性與價(jià)值也是不同的。
例如:某種電力數(shù)據(jù),可以應(yīng)用在電力定價(jià)、調(diào)度優(yōu)化等場景實(shí)現(xiàn)經(jīng)濟(jì)價(jià)值;也可以與金融場景結(jié)合對企業(yè)金融服務(wù)參與信用評價(jià)產(chǎn)生經(jīng)濟(jì)價(jià)值;還可以用于地區(qū)經(jīng)濟(jì)的統(tǒng)計(jì)分析、規(guī)劃決策的模型中。可見,對于不同使用場景,同一個(gè)數(shù)據(jù)產(chǎn)生的貢獻(xiàn)與經(jīng)濟(jì)價(jià)值是不同的。其次,數(shù)據(jù)價(jià)值具有協(xié)同性特征:在使用數(shù)據(jù)的時(shí)候經(jīng)常會(huì)發(fā)現(xiàn)多種數(shù)據(jù)的組合對某個(gè)場景的應(yīng)用產(chǎn)生超過單一數(shù)據(jù)生產(chǎn)價(jià)值的總和,這種“1+1>2”的現(xiàn)象也是數(shù)據(jù)科學(xué)非常有魅力的地方。多維度的數(shù)據(jù)可以更精準(zhǔn)地幫助分析、預(yù)測、決策等關(guān)鍵經(jīng)濟(jì)活動(dòng)中的動(dòng)作,不像傳統(tǒng)要素一樣,數(shù)據(jù)價(jià)值的加總不能是線性的簡單相加。最后,數(shù)據(jù)價(jià)值具有無限可復(fù)用性:這也是數(shù)據(jù)要素具有的獨(dú)特特征。不同于傳統(tǒng)的生產(chǎn)要素,如土地(蓋了房子就不能蓋停車場,蓋停車場就不能蓋商城)同一時(shí)間單一使用場景的限制,數(shù)據(jù)可以在同一時(shí)間被不同主體調(diào)用參與多種經(jīng)濟(jì)活動(dòng)(當(dāng)然,在安全合規(guī)使用的前提下),在這個(gè)過程中數(shù)據(jù)產(chǎn)生了經(jīng)濟(jì)價(jià)值倍增的效應(yīng)。
因此,數(shù)據(jù)對不同場景的價(jià)值關(guān)系形成了一個(gè)客觀的圖譜,數(shù)據(jù)與數(shù)據(jù)之間的協(xié)同關(guān)系也形成了一個(gè)客觀的圖譜。數(shù)據(jù)參與到無限可復(fù)用的各種場景下形成了潛在數(shù)據(jù)價(jià)值的廣闊圖譜,數(shù)據(jù)的價(jià)值本身形成了一個(gè)廣闊而豐富的網(wǎng)絡(luò)化圖景,這也就是建設(shè)數(shù)據(jù)要素市場所追尋的星辰大海。如果能開發(fā)數(shù)據(jù)資產(chǎn)網(wǎng)絡(luò)圖譜相關(guān)理論和技術(shù),就可以解決一系列關(guān)鍵問題:如交易中數(shù)據(jù)定價(jià)難的問題,數(shù)據(jù)資產(chǎn)入表的價(jià)值核算問題;數(shù)據(jù)收益分配的問題,大集團(tuán)多主體數(shù)據(jù)交叉應(yīng)用時(shí)如何合理分配權(quán)益激勵(lì)使用問題;數(shù)據(jù)與場景的價(jià)值關(guān)系即供需關(guān)系的分析問題,基于供需關(guān)系的大量解析與積累就能解決數(shù)據(jù)交易使用撮合效率低的問題等等。在姚期智院士的指導(dǎo)下,交叉信息核心技術(shù)研究院團(tuán)隊(duì)與國家發(fā)展改革委價(jià)格監(jiān)測中心緊密合作,為解決數(shù)據(jù)定價(jià)難、數(shù)據(jù)交易效率低提供了全新思路。
二、數(shù)據(jù)要素定價(jià)體系構(gòu)建
(一)基于經(jīng)濟(jì)場景的數(shù)據(jù)定價(jià)理論基礎(chǔ)
目前國內(nèi)外對于數(shù)據(jù)定價(jià)與價(jià)值管理的研究仍舊處于初期,還未形成一套切實(shí)可用的體系。數(shù)據(jù)定價(jià)的研究容易陷入了一種“非對稱性”陷阱,即將數(shù)據(jù)提供方和數(shù)據(jù)使用方處于“不對等” “非對稱”的地位,這種設(shè)置就使得數(shù)據(jù)定價(jià)成為甲乙雙方各執(zhí)一詞的討價(jià)還價(jià)場景,容易陷入主觀維度、主觀指標(biāo)的爭執(zhí),失去了客觀性的準(zhǔn)繩。
如何能建立客觀的數(shù)據(jù)定價(jià)理論基礎(chǔ)呢?實(shí)際上,中央文件已給出高瞻遠(yuǎn)矚的指示。根據(jù)“數(shù)據(jù)要素二十條”的要求,公平性與有效性是數(shù)據(jù)價(jià)值分配機(jī)制的基礎(chǔ)。首先,本文給數(shù)據(jù)定價(jià)問題一個(gè)更通用的設(shè)置:參與方可以是多方,大家使用數(shù)據(jù)共同完成某項(xiàng)經(jīng)濟(jì)活動(dòng)。無論是數(shù)據(jù)的提供方還是數(shù)據(jù)的使用方,都將其定義為“數(shù)據(jù)協(xié)作方”,這樣大家的地位是平等的,形成了公平性的基礎(chǔ),問題的設(shè)置也形成了一個(gè)對稱性問題。即使是買賣兩方也符合這一更通用的設(shè)置,即存在兩個(gè)數(shù)據(jù)協(xié)作方,一方提供的數(shù)據(jù)量必須不為零(賣方),另一方用在這項(xiàng)經(jīng)濟(jì)活動(dòng)中的數(shù)據(jù)量可以為零(買方),兩個(gè)數(shù)據(jù)協(xié)作方即對應(yīng)傳統(tǒng)概念中的“供需雙方”。
根據(jù)這兩項(xiàng)原則,基于信息經(jīng)濟(jì)學(xué)、博弈論、計(jì)算經(jīng)濟(jì)學(xué)和計(jì)算復(fù)雜性等交叉學(xué)科理論,構(gòu)建形成在某項(xiàng)經(jīng)濟(jì)場景中數(shù)據(jù)定價(jià)的理論基礎(chǔ):首先,利用信息經(jīng)濟(jì)學(xué)中信息價(jià)值的相關(guān)理論,建立各個(gè)業(yè)務(wù)場景中經(jīng)濟(jì)價(jià)值與數(shù)據(jù)應(yīng)用之間的映射關(guān)系①,從而將經(jīng)濟(jì)價(jià)值轉(zhuǎn)化為對數(shù)據(jù)應(yīng)用精度與風(fēng)險(xiǎn)的度量。在這一過程中需要將場景中數(shù)據(jù)使用者的價(jià)值度量,即經(jīng)濟(jì)學(xué)中應(yīng)用的效用函數(shù)與數(shù)據(jù)應(yīng)用的決策過程耦合起來。因此,這是純粹意義上數(shù)據(jù)的經(jīng)濟(jì)價(jià)值;在此基礎(chǔ)之上,運(yùn)用合作博弈的理論基礎(chǔ),對參與數(shù)據(jù)應(yīng)用的所有數(shù)據(jù)都可以進(jìn)行公平有效的價(jià)值分配,由此建立數(shù)據(jù)與某項(xiàng)經(jīng)濟(jì)活動(dòng)的價(jià)值關(guān)聯(lián)。這樣,就可以建立某項(xiàng)數(shù)據(jù)與某項(xiàng)經(jīng)濟(jì)場景之間的定價(jià)理論。
(二)數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)路徑與風(fēng)險(xiǎn)治理
1.數(shù)據(jù)價(jià)值實(shí)現(xiàn)路徑。
數(shù)據(jù)要素的價(jià)值發(fā)揮,離不開業(yè)務(wù)場景,而通過各式各樣的數(shù)據(jù),結(jié)合數(shù)據(jù)模型,設(shè)定優(yōu)化/預(yù)測等決策目標(biāo),搭建數(shù)據(jù)模型,進(jìn)一步通過模型輸出結(jié)果,提取出信息,實(shí)現(xiàn)對業(yè)務(wù)生產(chǎn)過程的決策輔助指導(dǎo),這是數(shù)據(jù)發(fā)揮價(jià)值的實(shí)現(xiàn)路徑。
目前,數(shù)據(jù)價(jià)值實(shí)現(xiàn)的路徑有些是模型化的(例如利用人工智能算法建模),有些是非模型化的(例如通過商業(yè)智能展示和數(shù)據(jù)報(bào)表供決策人分析)。對于非模型化的應(yīng)用場景,可以利用宏觀的統(tǒng)計(jì)模型核算要素的投入產(chǎn)出以歸因數(shù)據(jù)要素的經(jīng)濟(jì)貢獻(xiàn);對于模型化的數(shù)據(jù)應(yīng)用場景,由于已經(jīng)完成了可獨(dú)立量化評估的數(shù)據(jù)貢獻(xiàn),可以用更精細(xì)化的方法進(jìn)行計(jì)算,在一些場景里,我們已與行業(yè)專家定義了具體的效用函數(shù),利用自動(dòng)化程序計(jì)算各顆粒度的數(shù)據(jù)定價(jià)。我們在大型機(jī)構(gòu)中發(fā)現(xiàn)約20%的數(shù)據(jù)使用場景已經(jīng)是模型化的,其余是非模型化的。模型化數(shù)據(jù)應(yīng)用場景隨著人工智能的發(fā)展,尤其是現(xiàn)今大模型的飛速發(fā)展會(huì)呈顯著上升趨勢。
2.數(shù)據(jù)模型評估及其潛在風(fēng)險(xiǎn)控制。
在數(shù)據(jù)模型使用過程中,需要充分考慮模型的評估以及潛在風(fēng)險(xiǎn)控制。而數(shù)據(jù)作為模型的輸入端,同樣影響著模型的評估與潛在風(fēng)險(xiǎn)控制這兩方面。
——數(shù)據(jù)模型的評估。數(shù)據(jù)進(jìn)入生產(chǎn)后,依賴于模型結(jié)果,即當(dāng)用算法建立模型后,使得數(shù)據(jù)進(jìn)行自動(dòng)化生產(chǎn)。比如,個(gè)人信用評估模型、個(gè)性化推薦模型等等,這些數(shù)據(jù)通過模型形成數(shù)據(jù)產(chǎn)品,再與人的決策和運(yùn)營產(chǎn)生經(jīng)濟(jì)價(jià)值。而這些進(jìn)入各個(gè)生產(chǎn)活動(dòng)中的數(shù)據(jù)模型,也需要通過在各個(gè)場景進(jìn)行評測,才能建立“數(shù)據(jù)—經(jīng)濟(jì)價(jià)值”的映射關(guān)系。
通常情況下,數(shù)據(jù)模型的精度越高,決策效率越高,產(chǎn)生的經(jīng)濟(jì)價(jià)值就會(huì)越大。因此,數(shù)據(jù)模型的精度與模型價(jià)值息息相關(guān)。隨著數(shù)據(jù)的大規(guī)模應(yīng)用,人工智能算法的不斷演進(jìn),模型算法的評測和治理也成為重要的一個(gè)環(huán)節(jié)。模型評測的技術(shù)可以揭示數(shù)據(jù)模型的價(jià)值與實(shí)際經(jīng)濟(jì)價(jià)值的關(guān)聯(lián)關(guān)系,這對數(shù)據(jù)定價(jià)是一個(gè)重要的基礎(chǔ)。
——數(shù)據(jù)模型的風(fēng)險(xiǎn)。與數(shù)據(jù)模型精度相對應(yīng)的是模型的風(fēng)險(xiǎn),也就是人工智能應(yīng)用的風(fēng)險(xiǎn)。這些風(fēng)險(xiǎn)來源于以下方面:一是數(shù)據(jù)模型本身誤差的風(fēng)險(xiǎn),比如2008年全球金融危機(jī)的導(dǎo)火索就是金融衍生品的定價(jià)模型誤差。對于模型誤差帶來的風(fēng)險(xiǎn)需要進(jìn)行合理的評估和治理;二是模型的結(jié)果在應(yīng)用中會(huì)產(chǎn)生虛假或錯(cuò)誤信息。當(dāng)前,人工智能模型合成的數(shù)據(jù)和信息有可能是錯(cuò)誤或虛假的,但這種情況下人類無法辨別這類信息的虛實(shí)。因此,需要算法來監(jiān)管這些模型,避免產(chǎn)生虛假或錯(cuò)誤信息的生成;三是人工智能模型有可能會(huì)產(chǎn)生歧視和不公平的結(jié)果,這種現(xiàn)象有可能是由數(shù)據(jù)本身自帶的偏差造成,也有可能是算法設(shè)計(jì)存在缺陷。現(xiàn)實(shí)生活中常見的例子有價(jià)格歧視、大數(shù)據(jù)殺熟等,即平臺(tái)算法有可能面對不同的人對于同樣的產(chǎn)品展示不同的價(jià)格。金融領(lǐng)域也有可能出現(xiàn)放貸審批模型對不同的人群有所偏差,使得本應(yīng)合格的申請人由于因?yàn)樘幱谀硞€(gè)群體而遭到拒絕。監(jiān)管模型、測試重要的公平性指標(biāo)是減少這類問題的關(guān)鍵。
以上是數(shù)據(jù)模型治理方面需要重點(diǎn)關(guān)注的方向,模型治理既是技術(shù)問題,又是制度問題。通過逐步推動(dòng)人工智能模型治理的技術(shù)發(fā)展和制度安排,將更有助于利用數(shù)據(jù)資產(chǎn)構(gòu)建智能化的人工智能模型,使得各領(lǐng)域的數(shù)據(jù)集合于人工智能大模型,實(shí)現(xiàn)生產(chǎn)力的倍增。
(三)數(shù)據(jù)資產(chǎn)總價(jià)值的評估
數(shù)據(jù)資產(chǎn)評價(jià)與估值是數(shù)據(jù)資產(chǎn)運(yùn)營的有效舉措。通過對數(shù)據(jù)資產(chǎn)的管理、使用情況進(jìn)行全面評估,運(yùn)用科學(xué)的方法和適用的原則,以貨幣為計(jì)算權(quán)益的統(tǒng)一尺度,對在一定時(shí)點(diǎn)上的數(shù)據(jù)資產(chǎn)進(jìn)行價(jià)值評估,從而實(shí)現(xiàn)以數(shù)據(jù)價(jià)值為導(dǎo)向的持續(xù)運(yùn)營能力提升。
目前全球?qū)?shù)據(jù)資產(chǎn)價(jià)值評估和數(shù)據(jù)資產(chǎn)定價(jià)都有一定的探索,但還未到成熟可全面推廣應(yīng)用的階段,相關(guān)的理論、技術(shù)和模型等還有待進(jìn)一步研究和開發(fā)。國家標(biāo)準(zhǔn)《信息技術(shù) 大數(shù)據(jù) 數(shù)據(jù)資產(chǎn)價(jià)值評估(征求意見稿)》中明確列舉收益法、成本法、市場法等相關(guān)評估方法。
同時(shí),指出在對數(shù)據(jù)資產(chǎn)進(jìn)行價(jià)值評估時(shí),應(yīng)分析數(shù)據(jù)資產(chǎn)的基本屬性和基本特征。基于評估資料選擇適用的評估方法,對數(shù)據(jù)資產(chǎn)的價(jià)值進(jìn)行評估。由于前文中提到的數(shù)據(jù)資產(chǎn)特殊性,數(shù)據(jù)資產(chǎn)與其他資產(chǎn)類別在估值定價(jià)方面存在相似的方法論,也有明顯差異。對于金融資產(chǎn)或?qū)嵨镔Y產(chǎn),其估值定價(jià)通常是通過未來現(xiàn)金流折現(xiàn)加總等傳統(tǒng)方法計(jì)算。
土地作為一種資產(chǎn)常常被用于與數(shù)據(jù)資產(chǎn)進(jìn)行比較:在對土地進(jìn)行估值時(shí),從金融學(xué)的角度出發(fā),土地本質(zhì)為一種實(shí)物期權(quán)。這種實(shí)物期權(quán)只能在同一時(shí)間應(yīng)用于一項(xiàng)特定的活動(dòng)中,比如土地可以用于建造寫字樓或停車場。建成寫字樓后,可以通過出租辦公室或出售寫字樓獲得現(xiàn)金流,而停車場則可以通過出租停車位獲得現(xiàn)金流。因此,土地資產(chǎn)的估值取決于各項(xiàng)經(jīng)濟(jì)活動(dòng)的市場價(jià)格,投資者會(huì)根據(jù)這個(gè)市場價(jià)格進(jìn)行決策,以獲取最大經(jīng)濟(jì)價(jià)值。
然而,數(shù)據(jù)資產(chǎn)具有無限可復(fù)用性,在同一時(shí)間可應(yīng)用在多個(gè)經(jīng)濟(jì)活動(dòng)和場景中,其價(jià)值應(yīng)該是所有潛在的經(jīng)濟(jì)活動(dòng)分配權(quán)益的加總。因此,需要圖譜化的規(guī)范統(tǒng)計(jì),匯總收益信息和成本信息,或者是與市場可比的數(shù)據(jù)協(xié)同信息,就可以對各類的場景中產(chǎn)生的經(jīng)濟(jì)價(jià)值進(jìn)行公平、合理的核算和加總,完成數(shù)據(jù)資產(chǎn)的完整估值。基于對某個(gè)場景數(shù)據(jù)定價(jià)的客觀計(jì)算,可以為數(shù)據(jù)資產(chǎn)的價(jià)值評估提供參數(shù)依據(jù),下文將具體介紹。
(四)數(shù)據(jù)要素定價(jià)體系框架總體設(shè)計(jì)
基于前述數(shù)據(jù)本身的特征與數(shù)據(jù)應(yīng)用模型的評估風(fēng)險(xiǎn)特性,數(shù)據(jù)作為資產(chǎn)與其他資產(chǎn)有全然不同的本質(zhì)特性與價(jià)值發(fā)揮模式。因此,數(shù)據(jù)定價(jià)理論研究需要充分考慮上述方面,形成一套特殊的結(jié)合數(shù)據(jù)實(shí)際情況的解決思路;基于前述數(shù)據(jù)資產(chǎn)化需要的成本信息以及收益信息等價(jià)值評估重要參數(shù)估計(jì),數(shù)據(jù)作為資產(chǎn)其生產(chǎn)與價(jià)值發(fā)揮鏈路錯(cuò)綜復(fù)雜,需要考慮圖譜化建設(shè)。基于此,本文設(shè)計(jì)了一套數(shù)據(jù)要素定價(jià)體系,以數(shù)據(jù)要素定價(jià)方法為核心技術(shù)出發(fā),結(jié)合數(shù)據(jù)資產(chǎn)圖譜,實(shí)現(xiàn)了一套通用合理的技術(shù)框架。
三、數(shù)據(jù)要素定價(jià)方法分析——以銀行個(gè)人信貸模型為例
綜合前述,我們搭建了一個(gè)理論框架用來處理數(shù)據(jù)在某一項(xiàng)經(jīng)濟(jì)活動(dòng)中產(chǎn)生的價(jià)值,實(shí)現(xiàn)公平、合理的計(jì)算。如果要對數(shù)據(jù)的總價(jià)值進(jìn)行計(jì)算,則需要結(jié)合以上提及的數(shù)據(jù)要素三個(gè)特征。
首先,需要將理論與實(shí)際場景相結(jié)合,建立業(yè)務(wù)價(jià)值與數(shù)據(jù)模型之間的映射關(guān)系。這個(gè)具象化的過程需要考慮數(shù)據(jù)的使用者及其對經(jīng)濟(jì)學(xué)意義上的效用函數(shù)和數(shù)據(jù)使用價(jià)值產(chǎn)生耦合關(guān)系的明確定義。我們將此算法在一系列具體場景中實(shí)現(xiàn),例如,銀行信貸和推薦領(lǐng)域,通過大規(guī)模數(shù)據(jù)應(yīng)用和模型自動(dòng)化展示,實(shí)現(xiàn)了對效用函數(shù)和數(shù)據(jù)價(jià)值的自動(dòng)化計(jì)算,實(shí)現(xiàn)在業(yè)務(wù)開展的同時(shí),計(jì)算數(shù)據(jù)在該場景中產(chǎn)生的經(jīng)濟(jì)價(jià)值。在其他場景中,一方面,我們致力于實(shí)現(xiàn)不斷迭代此結(jié)合場景的經(jīng)濟(jì)價(jià)值與數(shù)據(jù)模型的耦合公式;另一方面,與各行業(yè)各領(lǐng)域的專家一起明確定義這些效用函數(shù),進(jìn)而形成行業(yè)標(biāo)準(zhǔn)。
在行業(yè)實(shí)踐中,算法落地需要理解數(shù)據(jù)使用者的經(jīng)濟(jì)目標(biāo),如最大化生產(chǎn)收益、最小化生產(chǎn)成本、最小化倉存儲(chǔ)成本等,并在不同業(yè)務(wù)場景中定義這些目標(biāo),以實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)價(jià)值計(jì)算。此外,對于一些數(shù)據(jù)應(yīng)用仍未完全智能化的場景,需要適用于基于宏觀要素投入產(chǎn)出計(jì)算的方法論,用以計(jì)算數(shù)據(jù)價(jià)值。
本文以某銀行合作落地個(gè)人信貸場景的數(shù)據(jù)價(jià)值利益分配算法模型為例。個(gè)人信貸數(shù)據(jù)使用場景主要解決的業(yè)務(wù)問題是基于各個(gè)數(shù)據(jù)提供方的個(gè)人信貸相關(guān)數(shù)據(jù),通過識別良好/不良信用的客戶,預(yù)測客戶貸款違約傾向,從而輔助銀行控制信貸風(fēng)險(xiǎn)。這是一個(gè)典型的機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)數(shù)據(jù)應(yīng)用模型,其中模型使用邏輯回歸二分類模型,模型評測標(biāo)準(zhǔn)為準(zhǔn)確率。
在這個(gè)數(shù)據(jù)模型應(yīng)用場景下,入模數(shù)據(jù)來源于不同數(shù)據(jù)提供機(jī)構(gòu)。需要研究解決的問題是對不同數(shù)據(jù)提供方分配合理的數(shù)據(jù)利益價(jià)值。監(jiān)督學(xué)習(xí)的核心要素包括訓(xùn)練數(shù)據(jù)集、模型以及模型評測標(biāo)準(zhǔn)。評估此模型下的數(shù)據(jù)價(jià)值對模型的貢獻(xiàn)度,就需要充分考量不同數(shù)據(jù)源對模型準(zhǔn)確率的貢獻(xiàn)情況。
收益分配問題本質(zhì)上可以理解成一種權(quán)重分配機(jī)制。本文定價(jià)算法基于合作博弈理論,可以建立與模型貢獻(xiàn)相匹配的收入分配機(jī)制。其基本原理是:基于各方數(shù)據(jù)的貢獻(xiàn)值進(jìn)行數(shù)據(jù)提供方的利益分配。這種分配方式體現(xiàn)了各成員對總目標(biāo)的貢獻(xiàn)程度,避免了分配上的平均主義。比任何一種僅按資源投入價(jià)值、資源配置效率及將二者相結(jié)合的分配方式都更具合理性和公平性,也體現(xiàn)了各盟員相互博弈的過程。從這個(gè)原理出發(fā),本文定價(jià)模式將不同來源的數(shù)據(jù)集當(dāng)作聯(lián)盟成員,計(jì)算各方數(shù)據(jù)對模型的貢獻(xiàn)程度,以此為標(biāo)準(zhǔn),實(shí)現(xiàn)收益分配(各方數(shù)據(jù)定價(jià))。利用合作博弈分支下的Shapley算法,得到每個(gè)數(shù)據(jù)參與方的貢獻(xiàn)度(計(jì)算過程略去)。通過模型貢獻(xiàn)度的計(jì)算可得出一些有意思的結(jié)論:提供樣本量多的機(jī)構(gòu),有時(shí)貢獻(xiàn)值偏低;有些樣本量較少的機(jī)構(gòu),反而貢獻(xiàn)值較高。
四、數(shù)據(jù)資產(chǎn)圖譜構(gòu)建
當(dāng)前全行業(yè)數(shù)字化轉(zhuǎn)型加速,數(shù)據(jù)是底層基礎(chǔ)要素,一定程度支撐著上層業(yè)務(wù)化模型的表現(xiàn)。隨著包括人工智能模型、業(yè)務(wù)上云、物聯(lián)網(wǎng)、區(qū)塊鏈等新技術(shù)的落地,數(shù)據(jù)將會(huì)繼續(xù)呈指數(shù)級增長,成為全社會(huì)最有價(jià)值的資產(chǎn)之一。可以預(yù)見,全行業(yè)亟需對數(shù)據(jù)資產(chǎn)化價(jià)值管理。這就需要對整個(gè)數(shù)據(jù)生產(chǎn)與價(jià)值發(fā)揮鏈條做出價(jià)值解析。
在產(chǎn)業(yè)中數(shù)據(jù)的應(yīng)用層面,數(shù)據(jù)生產(chǎn)本身會(huì)形成一個(gè)上下游的關(guān)系:從原始的數(shù)據(jù)資源,經(jīng)過數(shù)據(jù)治理的過程,完成數(shù)據(jù)的歸集、清洗、整理,再到數(shù)據(jù)的分析建模,以及建模后的模型應(yīng)用。整個(gè)鏈條最終會(huì)與業(yè)務(wù)場景相結(jié)合,產(chǎn)生價(jià)值。因此,在數(shù)據(jù)的價(jià)值計(jì)算中,沿著數(shù)據(jù)生產(chǎn)鏈條進(jìn)行價(jià)值回溯是一個(gè)與實(shí)際結(jié)合、行之有效的解決思路,可以實(shí)現(xiàn)參與各個(gè)場景的每個(gè)數(shù)據(jù)元素價(jià)值的精確計(jì)算。由此,基于合作博弈理論,提出將數(shù)據(jù)產(chǎn)生的業(yè)務(wù)價(jià)值公平有效地分給任意單元參與經(jīng)濟(jì)任務(wù)的數(shù)據(jù)源的重要算法,研發(fā)了數(shù)據(jù)資產(chǎn)圖譜技術(shù),實(shí)現(xiàn)自動(dòng)化盤點(diǎn)、計(jì)算和解析數(shù)據(jù)資產(chǎn)與各個(gè)場景的價(jià)值關(guān)聯(lián)關(guān)系,穿透數(shù)據(jù)間的價(jià)值關(guān)聯(lián)關(guān)系。
(一)數(shù)據(jù)資產(chǎn)圖譜功能實(shí)現(xiàn)
在數(shù)據(jù)生產(chǎn)過程中,數(shù)據(jù)需要經(jīng)過一系列的加工處理才能形成萃取層數(shù)據(jù),發(fā)揮其價(jià)值。其中,上游數(shù)據(jù)的價(jià)值可以通過價(jià)值回溯的方法進(jìn)行計(jì)算。為了實(shí)現(xiàn)這一點(diǎn),需要對數(shù)據(jù)生產(chǎn)鏈條進(jìn)行解析,以便清楚地了解數(shù)據(jù)的信息流轉(zhuǎn)過程。更確切地說,對在實(shí)際數(shù)據(jù)包括生產(chǎn)、使用、創(chuàng)造價(jià)值的全生命周期中,追溯數(shù)據(jù)資產(chǎn)之間的生產(chǎn)與業(yè)務(wù)價(jià)值關(guān)系,對數(shù)據(jù)生產(chǎn)過程實(shí)行結(jié)構(gòu)化、知識化的管理,通過完整地刻畫數(shù)據(jù)生產(chǎn)流程,實(shí)現(xiàn)數(shù)據(jù)合規(guī)、高效生產(chǎn)和使用。
(二)數(shù)據(jù)資產(chǎn)圖譜與數(shù)據(jù)資產(chǎn)評估
通過不斷記錄、更新所有數(shù)據(jù)資產(chǎn)在各個(gè)場景中產(chǎn)生的價(jià)值以及數(shù)據(jù)與數(shù)據(jù)之間的價(jià)值,數(shù)據(jù)資產(chǎn)圖譜形成了數(shù)據(jù)定價(jià)的堅(jiān)實(shí)基礎(chǔ)。更確切地講,數(shù)據(jù)資產(chǎn)圖譜是一個(gè)可以無限擴(kuò)展的工具。在發(fā)現(xiàn)某項(xiàng)數(shù)據(jù)對某個(gè)場景有價(jià)值時(shí),可以使用數(shù)據(jù)資產(chǎn)圖譜的技術(shù)進(jìn)行解析和價(jià)值回溯。在不斷使用和發(fā)掘數(shù)據(jù)價(jià)值的過程中,數(shù)據(jù)資產(chǎn)圖譜也會(huì)不斷盤點(diǎn)和擴(kuò)展數(shù)據(jù)價(jià)值。有了數(shù)據(jù)資產(chǎn)圖譜,就可以對數(shù)據(jù)資產(chǎn)本身的價(jià)值進(jìn)行評估。
如上文中提到,國家標(biāo)準(zhǔn)《信息技術(shù) 大數(shù)據(jù) 數(shù)據(jù)資產(chǎn)價(jià)值評估(征求意見稿)》中明確列舉了收益法、成本法等相關(guān)評估方法。其中,收益法需要通過測算數(shù)據(jù)資產(chǎn)的所有未來收益并折現(xiàn)加總;市場法需要可比數(shù)據(jù)的比較與估值;而成本法需要重置成本信息。利用數(shù)據(jù)資產(chǎn)圖譜可以幫助評估人員得到這些參數(shù)的估計(jì)值,同時(shí)也需要領(lǐng)域估值專家對場景界定與效用函數(shù)(經(jīng)濟(jì)價(jià)值)的具象化,以及確權(quán)專家對權(quán)益歸屬的界定。例如,收益法需要數(shù)據(jù)的各項(xiàng)收益加權(quán)求和,這些信息可以利用數(shù)據(jù)資產(chǎn)圖譜里數(shù)據(jù)對不同場景直接或通過下游間接產(chǎn)生的收益分配為依據(jù);市場法需要輸入可比數(shù)據(jù)價(jià)格,可以利用圖譜信息把待估數(shù)據(jù)的信息量依據(jù)分配算法拆解映射到一些已有市場價(jià)格的數(shù)據(jù)上;使用成本法時(shí)也可以利用數(shù)據(jù)資產(chǎn)圖譜中上下游生產(chǎn)信息和可比數(shù)據(jù)集進(jìn)行成本核算。數(shù)據(jù)定價(jià)算法相當(dāng)于在實(shí)際計(jì)算落地指導(dǎo)層面給出了一個(gè)通用的框架,對于任意經(jīng)濟(jì)活動(dòng)中的數(shù)據(jù)都可以實(shí)現(xiàn)公平有效的價(jià)值計(jì)算。同時(shí),借助數(shù)據(jù)資產(chǎn)圖譜技術(shù),能夠?qū)?shù)據(jù)生產(chǎn)鏈條中的所有數(shù)據(jù)進(jìn)行合理的價(jià)值分配。
基于數(shù)據(jù)資產(chǎn)定價(jià)與數(shù)據(jù)資產(chǎn)圖譜技術(shù)兩項(xiàng)理論和技術(shù)基礎(chǔ),可以實(shí)現(xiàn)在探索數(shù)據(jù)應(yīng)用場景的過程中,不斷擴(kuò)大數(shù)據(jù)資產(chǎn)圖譜積累的信息,還原數(shù)據(jù)形成的廣闊而豐富的價(jià)值網(wǎng)絡(luò)全貌,從而進(jìn)行數(shù)據(jù)資產(chǎn)的估值計(jì)算。在數(shù)據(jù)資產(chǎn)估值的過程中,一方面,依賴于數(shù)據(jù)定價(jià)算法計(jì)算,不同場景中每項(xiàng)參與的數(shù)據(jù)應(yīng)該分配到公平合理的價(jià)值;另一方面,通過數(shù)據(jù)資產(chǎn)圖譜,可以對不同場景下數(shù)據(jù)產(chǎn)生的收益進(jìn)行加總,實(shí)現(xiàn)總價(jià)值的評估。
然而,實(shí)際上,若將所有微觀數(shù)據(jù)都進(jìn)行細(xì)致計(jì)算,工作量將十分龐大,所需信息也受限于現(xiàn)實(shí)環(huán)境,存在可得性有限的問題——這時(shí)可以通過構(gòu)建“數(shù)據(jù)價(jià)格指數(shù)”作為輔助解決路徑,對某類數(shù)據(jù)在某個(gè)場景產(chǎn)生的價(jià)值進(jìn)行宏觀指標(biāo)核算。
(三)數(shù)據(jù)資產(chǎn)圖譜的應(yīng)用前景分析
依托數(shù)據(jù)資產(chǎn)圖譜,首先,可以基本直接實(shí)現(xiàn)不同數(shù)據(jù)使用場景下的收益定價(jià)。其次,可以實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)的評估驗(yàn)證。未來,數(shù)據(jù)資產(chǎn)圖譜中會(huì)包含越來越多的數(shù)據(jù)、場景的價(jià)值信息以及數(shù)據(jù)之間的價(jià)值協(xié)同關(guān)系——這些信息可以對數(shù)據(jù)資產(chǎn)評估進(jìn)行驗(yàn)證。如果評估結(jié)果與其他可比結(jié)果相比過高或過低,就可通過在數(shù)據(jù)資產(chǎn)圖譜中找到依據(jù)作為參考。最后,可以實(shí)現(xiàn)數(shù)據(jù)交易的智能撮合。因?yàn)閿?shù)據(jù)資產(chǎn)圖譜中積累了很多數(shù)據(jù)的供需關(guān)系信息,可以基于數(shù)據(jù)資產(chǎn)圖譜中的信息指導(dǎo)下一次的數(shù)據(jù)交易,對數(shù)據(jù)供給方和需求方進(jìn)行智能撮合。
數(shù)據(jù)資產(chǎn)圖譜在未來行業(yè)發(fā)展中有廣泛的應(yīng)用場景。比如,數(shù)據(jù)經(jīng)濟(jì)建設(shè)通過數(shù)據(jù)定價(jià)與模型治理,作為數(shù)據(jù)要素流通市場的基礎(chǔ)設(shè)施,暢通數(shù)據(jù)交易流動(dòng),可以將全產(chǎn)業(yè)鏈數(shù)據(jù)圖譜應(yīng)用在金融機(jī)構(gòu)與地方政府對實(shí)體經(jīng)濟(jì)的支持。同時(shí),在企業(yè)集團(tuán)內(nèi)部不同部門,不同法人主體之間可以建設(shè)以數(shù)據(jù)資產(chǎn)圖譜為支撐的數(shù)據(jù)要素流動(dòng)與定價(jià)平臺(tái),推動(dòng)數(shù)據(jù)共享與收益核算分配,推動(dòng)數(shù)據(jù)資產(chǎn)計(jì)價(jià)、核算與審計(jì);在行業(yè)內(nèi)部建立“監(jiān)管沙盒”先行先試。尤其是通過在集團(tuán)內(nèi)部打造智能化模型,利用銀行與產(chǎn)業(yè)集團(tuán)的數(shù)據(jù),在保護(hù)隱私的環(huán)境下進(jìn)行聯(lián)合建模,產(chǎn)生各類生產(chǎn)模型:如智能營銷、智能推薦、智能信貸風(fēng)險(xiǎn)模型等。在聯(lián)合建模的同時(shí),依托數(shù)據(jù)定價(jià)算法以及數(shù)據(jù)資產(chǎn)圖譜在集團(tuán)不同法人主體、不同部門之間根據(jù)數(shù)據(jù)的貢獻(xiàn)度進(jìn)行經(jīng)濟(jì)價(jià)值的分配、部門貢獻(xiàn)的獨(dú)立核算,用市場化的力量將整個(gè)集團(tuán)的資源協(xié)調(diào)起來進(jìn)行數(shù)字經(jīng)濟(jì)的建設(shè),形成“以產(chǎn)助融,以融助產(chǎn)”的產(chǎn)融協(xié)同模式,將集團(tuán)內(nèi)部的應(yīng)用推廣至全行業(yè),促進(jìn)全行業(yè)數(shù)字化產(chǎn)能提升。
五、結(jié)語
在全球進(jìn)入數(shù)字經(jīng)濟(jì)時(shí)代的今天,數(shù)據(jù)是發(fā)展數(shù)字經(jīng)濟(jì)的基礎(chǔ)性與關(guān)鍵性資源。2022年3月,國家發(fā)展改革委發(fā)布的《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》指出:數(shù)據(jù)要素是數(shù)字經(jīng)濟(jì)深化發(fā)展的核心引擎。并明確了未來發(fā)展目標(biāo),要實(shí)現(xiàn)“數(shù)據(jù)確權(quán)、定價(jià)、交易有序開展,探索建立與數(shù)據(jù)要素價(jià)值和貢獻(xiàn)相適應(yīng)的收入分配機(jī)制,激發(fā)市場主體創(chuàng)新活力”。通過制定公平合理的數(shù)據(jù)定價(jià)方法,以及數(shù)據(jù)資產(chǎn)圖譜核心技術(shù)追溯數(shù)據(jù)應(yīng)用價(jià)值本源參數(shù),形成一套數(shù)據(jù)定價(jià)體系,可以有效解決數(shù)據(jù)要素流通的關(guān)鍵問題,賦能數(shù)據(jù)資產(chǎn)化之路,也是解決數(shù)據(jù)要素市場培育、交易,形成“標(biāo)準(zhǔn)化”產(chǎn)品的必要前提。通過建立公平合理的數(shù)據(jù)定價(jià)模型,以及構(gòu)建數(shù)據(jù)資產(chǎn)圖譜技術(shù)在數(shù)據(jù)生產(chǎn)鏈路里追溯數(shù)據(jù)價(jià)值,形成一套數(shù)據(jù)定價(jià)體系,可以有效解決數(shù)據(jù)要素流通的關(guān)鍵定價(jià)問題,從理論與技術(shù)層面助力“健全數(shù)據(jù)要素由市場評價(jià)貢獻(xiàn)、按貢獻(xiàn)決定報(bào)酬機(jī)制。結(jié)合數(shù)據(jù)要素特征,優(yōu)化分配結(jié)構(gòu),構(gòu)建公平、高效、激勵(lì)與規(guī)范相結(jié)合的數(shù)據(jù)價(jià)值分配機(jī)制”,對于數(shù)據(jù)資產(chǎn)價(jià)值評估與數(shù)據(jù)資產(chǎn)入表、快速提升數(shù)據(jù)與場景的撮合效率等研究也具有重要意義。
來源:專知智庫
國家工業(yè)信息安全發(fā)展研究中心(以下簡稱“中心”)牽頭立項(xiàng)了《公共數(shù)據(jù)授權(quán)運(yùn)營平臺(tái)技術(shù)要求》團(tuán)體標(biāo)準(zhǔn),并于中國電子商會(huì)歸口。該標(biāo)準(zhǔn)現(xiàn)已形成標(biāo)準(zhǔn)征求意見稿。
現(xiàn)將該標(biāo)準(zhǔn)征求意見稿面向社會(huì)公開征求意見。如有意見或建議請于2023年9月25日20:00前反饋至工作組。
聯(lián) 系 人:孫博聞聯(lián)系電話:010-88686166電子郵箱:ai_cic@163.com附 件:《公共數(shù)據(jù)授權(quán)運(yùn)營平臺(tái)技術(shù)要求(征求意見稿)》
由國家工業(yè)信息安全發(fā)展研究中心(以下簡稱“中心”)牽頭立項(xiàng),中國電子商會(huì)歸口的《公共數(shù)據(jù)授權(quán)運(yùn)營平臺(tái)技術(shù)要求》團(tuán)體標(biāo)準(zhǔn)于9月20日形成標(biāo)準(zhǔn)征求意見稿。本標(biāo)準(zhǔn)學(xué)習(xí)內(nèi)容如下:
1、標(biāo)準(zhǔn)適用范圍。
本文件提供了公共數(shù)據(jù)運(yùn)營平臺(tái)參考架構(gòu)、功能要求、性能要求、運(yùn)維要求、安全要求和互聯(lián)互通要求。本文件適用于公共數(shù)據(jù)授權(quán)運(yùn)營平臺(tái)的設(shè)計(jì)與實(shí)施,可通過與其他平臺(tái)對接實(shí)現(xiàn)相應(yīng)功能。目前各地均在開展公共數(shù)據(jù)(授權(quán))運(yùn)營平臺(tái)建設(shè),并且相關(guān)廠商也在考慮平臺(tái)開發(fā)設(shè)計(jì),本標(biāo)準(zhǔn)可為提供參考思路。
2、公共數(shù)據(jù)運(yùn)營平臺(tái)參考架構(gòu)。

公共數(shù)據(jù)授權(quán)運(yùn)營平臺(tái)主要包括基礎(chǔ)設(shè)施層、應(yīng)用層、運(yùn)維管理與安全管理等四個(gè)方面。其中基礎(chǔ)設(shè)施層主要是為支撐平臺(tái)運(yùn)行與安全的核心技術(shù)與系統(tǒng),主要包括區(qū)塊鏈、標(biāo)識解析以及隱私計(jì)算等;平臺(tái)互聯(lián)互通系統(tǒng)主要支持平臺(tái)之間的互聯(lián)互通與互操作,便于提供跨平臺(tái)的集約化服務(wù)。應(yīng)用層主要包括數(shù)據(jù)登記、數(shù)據(jù)流通、授權(quán)管理與授權(quán)運(yùn)營等主要功能系統(tǒng),支持全流程的公共數(shù)據(jù)運(yùn)營服務(wù)。
3、公共數(shù)據(jù)運(yùn)營平臺(tái)主要流程

公共數(shù)據(jù)授權(quán)運(yùn)營主要參與主體有數(shù)據(jù)持有方、運(yùn)營主體、數(shù)據(jù)需求方、增值服務(wù)方。公共數(shù)據(jù)授權(quán)運(yùn)營的主要流程應(yīng)包括三個(gè)部分,即數(shù)據(jù)登記、數(shù)據(jù)流通和授權(quán)運(yùn)營,數(shù)據(jù)運(yùn)營監(jiān)管應(yīng)貫穿所有環(huán)節(jié)。
4、結(jié)合浙江省授權(quán)運(yùn)營域系統(tǒng)架構(gòu),在此提出2點(diǎn)個(gè)人補(bǔ)充建議。
(1)公共數(shù)據(jù)運(yùn)營平臺(tái)技術(shù)要求中關(guān)于“角色”的賬號體系設(shè)計(jì)體現(xiàn)不足。如(二級)數(shù)商需要登陸平臺(tái)進(jìn)行公共數(shù)據(jù)申請,授權(quán)運(yùn)營單位/一級數(shù)商需要登陸平臺(tái)進(jìn)行審批,公共數(shù)據(jù)主管部門需要登陸平臺(tái)進(jìn)行監(jiān)管,甚至包括個(gè)人/企業(yè)用戶需要登陸平臺(tái)進(jìn)行授權(quán)。所以建議通過子系統(tǒng)/子模塊的方式,在平臺(tái)技術(shù)架構(gòu)上加以區(qū)別,進(jìn)一步增強(qiáng)標(biāo)準(zhǔn)可讀性。
(2)建議補(bǔ)充公共數(shù)據(jù)運(yùn)營平臺(tái)網(wǎng)絡(luò)部署示意圖。結(jié)合“數(shù)據(jù)不出域”的安全要求,公共數(shù)據(jù)只能將計(jì)算結(jié)果輸出到互聯(lián)網(wǎng),但平臺(tái)功能模塊中如發(fā)布申請、數(shù)據(jù)目錄等系統(tǒng),應(yīng)該需要部署在互聯(lián)網(wǎng)區(qū)。所以建議補(bǔ)充平臺(tái)網(wǎng)絡(luò)架構(gòu)圖,表明模塊部署位置及業(yè)務(wù)流程。

(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)