- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-10-17來源:生氣叻瀏覽數:197次
摘要:發展數字經濟是把握新一輪科技革命和產業變革新機遇的戰略選擇。以數據資源為關鍵要素,以現代信息網絡為主要載體,以信息通信技術整合應用、全要素數字化轉型為重要推動力,數字經濟已成為當前經濟社會可持續發展的重大研究課題。但數據作為驅動經濟運行的生產要素,其自身的權屬問題尚未厘清,同時,數據通過算法和互聯網的鏈接解構原有經濟形態并重組經濟秩序,帶來的交易運行方式的重大變革以及交易信用關系強技術依賴等重大問題還有待深入研究。本文嘗試從信息技術視角厘清數據基本屬性,梳理數據交易中的關鍵問題,探討了數據要素在參與市場活動中,需要經歷可確權、可管控、可計量、可交易四個階段,各階段遇到的問題及目前的探索性嘗試。最后,針對數據交易中普遍存在的個性化及定制化交易類型,提出數據中介和數據指數兩種模式,以期為促進數字經濟健康發展提供解決方案。
近年來,以數據作為關鍵要素的數字經濟正在快速發展,成為我國經濟發展的重要推動力,促進了我國社會經濟高質量發展[1],受到政府的高度重視[2]。2017年國務院政府工作報告首次在政府文件中明確提出“數字經濟”的概念,次年,數字經濟發展已經上升到國家戰略層面,各級政府不斷推出相關政策。2019年,我國數字經濟規模已經位居全球第二、占GDP的比重約為36.2%[3],同年10月,黨的十九屆四中全會提出:“健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定報酬的機制”,首次將數據作為生產要素參與收益分配。繼而,2020年4月中共中央、國務院在《關于構建更加完善的要素市場化配置體制機制的意見》一文中,正式提出將數據與土地、勞動力、資本、技術要素并列為第五大生產要素,充分明確了數據作生產要素在市場中的地位。2021年12月,國務院印發《“十四五”數字經濟發展規劃》,給出了數字經濟的定義:“繼農業經濟、工業經濟之后的主要經濟形態,是以數據資源為關鍵要素,以現代信息網絡為主要載體、以信息通信技術融合應用、全要素數字化轉型為重要推動力,促進公平與效率更加統一的新經濟形態”,規劃中同時明確,“數據要素市場體系初步建立”是我國2025年數字經濟的發展目標之一。今年3月,中共中央、國務院發布的《關于加快建設全國統一大市場的意見》中提出:“加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用”的重要要求。然而,數據作為一種新型生產要素要構建市場,不僅解構了原有經濟形態并重組經濟秩序[4],而且可能引發市場的產權制度、信用關系以及組織結構等方面發生根本性的變化[5],為數據在后續的流通和交易中帶來許多問題。
鑒于此,本文重點分析建設數據要素市場的核心問題,并針對數據市場提出兩種解決路徑,試圖探索推動數據要素市場建立的解決方案,助力我國數字經濟健康快速發展。
2.1 數據要素的基本特征
農業經濟中重要的生產要素是土地與勞動力,工業經濟中是資本與技術,而數字經濟時代,數據是非常重要的生產要素。同時數據作為一種與經濟和社會活動的孿生品,是自然界和社會活動的天然產物,是長期存在的客觀事實。許多學者從不同的層面對數據特點做了討論。如:數據有“三非”[6]的顯著特性:
“
一是非稀缺性,自然界及人類活動每時每刻都在產生數據,從這個意義上講,數據資源與自然資源、社會資源有著本質的區別。
二是非損耗性,即數據在傳播與使用過程中不會有衰減與損耗。
三是非排他性,即數據可以被許多主體同時擁有,但無論有多少份拷貝,其在價值上都沒有排他性,其重復使用幾乎沒有邊際成本。
也有學者從經濟學的角度,得出數據具有高初始固定成本、零邊際成本、累積溢出效應等三大特點[7]。
從數據與信息技術結合的角度分析,數據具備“七強”的顯著特性:
“
一是強規模效應,隨著信息技術與各產業的深度融合,數據量呈爆發式增長,一輛自動駕駛汽車每天會產生多達4TB的數據[7],連接到物聯網的設備數據量也將很快超過地球上的人數[8]。
二是強算法導向性,同樣的數據在不同的算法導向下,會產生迥異的分析結果,互聯網企業及電商平臺也一直都在用算法推薦技術及服務引導用戶消費、干預用戶選擇。
三是強多樣性,數據類型可分為結構化、半結構化以及非結構化數據,根據國際數據公司(IDC)預測,到2023年,中國的數據量將達到40ZB,其中超過80%是非結構化數據[8],這也為后期的數據治理帶來極大挑戰。
四是強應用耦合性,數據可以應用于不同的平臺,同時應用或平臺又可以產生大量的數據用于分析與處理,因此,數據與應用是強耦合關系。
五是強融合增值性[9],單一數據的價值往往有限,但是通過與其他數據融合,能夠挖掘的有效信息更多,數據價值也會增加[10],因此,看似不相關的大量數據在融合關聯分析時,常常會得出顛覆性的結論從而產生巨大的價值。
六是強時效性,如道路擁堵情況有即時有效性,同時,長時間序列的數據匯聚又會有非常重要的價值。
七是強壟斷效應,數字時代“數字平臺寡頭”不斷涌現,平臺企業帶來的壟斷效應與傳統的市場、自然和行政壟斷有著非常明顯的區別[11],會導致壟斷結構的關聯性及市場進入的高壁壘性。
2.2 國內大數據市場發展中的問題
2015年國務院《促進大數據發展行動綱要》提出“引導培育大數據交易市場”以來,國家多個部門相繼出臺了各類政策文件以促進大數據產業發展,推動大數據交易市場建設。隨著《數據安全法》《個人信息保護法》等法律法規的先后出臺,我國大數據市場的法律保障體系建設也在不斷完善。據國家工信安全中心測算數據,2020年我國數據要素市場規模達到545億元[12],“十四五”期間,這一數值將突破1749億元,整體進入高速發展階段。但是,中國信息通信研究院發布的《大數據白皮書》也指出[13],“現階段,我國數據交易以點對點模式為主,交易規模已相當可觀,僅商業銀行每年的數據采購金額就超過百億元。點對點模式雖然能滿足企業定向采購數據的需求,但由于信息不對稱,很難形成供需關系指導下的市場調節機制,無法實現大規模的數據要素市場化配置”。
通過梳理我國大數據市場發展歷程,發現主要存在以下問題:
“
一是我國數據權屬不明晰,數據確權滯后于大數據市場的發展,阻礙了數據交易的發展。
二是數據市場監管職能不突出,目前國家層面有多個部門具備數據市場的監管職能,但各部門監管邊界不清,主責部門不夠明確,互聯網巨頭隨意收集、使用個人信息等問題仍然非常嚴重。
三是數據交易雙方信任機制尚未建立,在點對點的數據交易模式中,交易雙方由于信息不對稱,同時又缺乏市場統一的數據質量、數據產品的評估體系,難以建立交易雙方的信任關系,制約了數據交易市場的向上發展。
2.3 數據要素市場化的核心問題
基于數據要素的特征分析,本文研究發現數據要素在參與市場活動中,需要經歷可確權、可管控、可計量、可交易四個階段,從而完成數據要素在市場中的流通,實現數據要素市場化。
2.3.1
數據的可確權
目前,學界多采用“數據確權”表述數據可確權[14],但對數據權屬界定的理論與實踐路徑均未達成統一定論,其根源在于以下三個基本問題:
“
一是數據權利屬性,即給予數據何種權利保護。
二是數據權利主體,即誰應該享有數據上附著的利益。
三是數據權利內容,即能明確數據主體享有哪些具體的權能[15]。
國外對數據的權屬問題仍處于理論探索階段,但大多不建議確立數據專有權屬。政府介入確立數據產權會增加市場的不確定性,阻礙數字經濟的創新發展[16-17]。2016年德國馬普創新與競爭研究所發布針對數據所有權與數據訪問的立場聲明[17],認為數據權利并不是必須分配給特定的法律主體的,目前既沒有理由也沒有必要創設數據專有權,若要通過將數據中的權利法定分配給個人來干擾目前的數據交易模式,并不能保證改善市場情況,反而存在擾亂運轉良好市場的風險。針對數據的權利主體,美國學者Lothar Determann認為,任何人都不擁有對數據的所有權,也不需要對數據創造新的產權[18]。這也非常契合美國在數字貿易方面一直以來秉持的支持跨境數據自由流動這一根本性訴求。歐盟則更強調對個人數據保護的核心訴求,分別出臺了《一般數據保護條例》(GDPR)[19]與《非個人數據在歐盟境內自由流動框架》,但并未針對數據控制者的權利、義務做出詳細規定[20]。
此外,加拿大約克大學的Kean Birch[21]等提出個人數據的所有權和控制權可以分離,并將所有權和控制權作為不同權利出售的設想,并進一步提出“數據代理”這種使數據資產化的方式,還提出了各平臺不能以收集個人數據為前提提供數字(及其他)商品和服務;可對收集和處理個人數據的公司征稅,以確保此類數據使用能帶來一些社會集體利益等決策建議。將所有權與控制權分離的做法,實際上為數據交易提供了基本的底層邏輯,或可將數據交易的可行性進一步落地。
國內對于數據確權的研究成果主要集中在規制和技術兩個方向。
第一類研究是從法律法規的角度對數據權屬進行剖析。對于數字權利屬性,或從現有權屬關系出發[22-26],或構建新的權利體系框架[27-35],但在數據確權上依然沒有顯著進展。在對數據權屬的認知上,與美國和歐盟相似,也明顯存在兩類不同出發點:
“
一是對數據權利屬性本身持續研究。
二是暫時摒棄權屬之爭而著力于市場穩定運行[36]。
此外,國家發改委正在就《數據基礎制度若干觀點》[37]征求意見,其中在“關于數據產權制度”一節提出“將建議探索建立現代數據產權制度,推動數據持有權、使用權等相關權利有序分離與流通,滿足數據流通使用需求”以及“建議充分保護數據來源者合法權益,數據處理者持有、使用、許可他人使用數據,需獲得數據來源者同意或存在法定事由,確保數據來源者享有獲取或轉移由其促成所產生數據的權利”等條款,明確提到的數據持有權、使用權以及數據來源者、處理者等權利和身份,也可認為是國家層面對于數據權屬問題的最新結論及標志性進展。
第二類研究是從技術角度出發,研究如何實現數據確權。該方向的研究多依靠區塊鏈技術以及隱私計算、可信計算等信息技術來具體實現。
“
如基于區塊鏈技術和數字水印技術,實現大數據交易生命周期中的可追責性[38]。
基于區塊鏈智能合約的物聯網數據資產化方法解決物聯網系統中個人數據難以確權的問題[39]。
存儲到區塊鏈的數字資源或者在區塊鏈中新產生的資源采用加密及時間戳技術,借助區塊鏈的去中心化、分布式、不可篡改等特性,明晰區塊鏈上數據資源任意時刻的所有權歸屬[40]。
因此,在法學界對數據權屬主體尚未形成定論,而技術上已為數據溯源提供了多種解決方案的背景下,上文提到的區分數據所有權和控制權,并通過“數據代理”方式使數據交易成為可能的做法,不失為一種非常好的解決方案。
2.3.2
數據的可管控
數據一旦被明確其所有權之后,在進入交易之前,還需要是可被管理、控制的。樓何超[14]指出數據的管理權是指對本國數據跨境流通等數據行為進行調控并對數據糾紛行使管轄權,而數據控制權是指以保障國內數據安全性為前提,防止數據被侵犯。對于數據是可管理還是可控制,是以數據是否產生了跨境流動為區分點的。但這里主要聚焦解決數據可交易這一根本問題,因此,將其統稱為數據的可管控性。
對數據確權開展的第二類研究,從本質上來說就是從技術角度對數據全生命周期中的溯源,即,利用區塊鏈、密碼及加密等技術,基本可以做到對數據的管控。同時,上文所述文獻中僅討論了用軟件技術實現對于數據流程及行為的管控,隨著數據隱私保護越來越重要以及隱私計算的廣泛應用,Intel公司從基于x86架構的SGX(Software Guard Extension)以及ARM公司基于ARM架構的ARM TrustZone,從硬件層面開展了關于可信執行環境(TEE)的持續研發,這與從軟件層面對數據進行管控不同,是獨立于BIOS及操作系統之外的,可以簡單地認為是從硬件底層開始,對數據進行更純粹的保護與管控。
綜上所述,對于數據的可管控,無論是從區塊鏈技術這一軟件層面,還是從芯片架構的硬件層面,技術領域都在做著持續不斷的努力并取得了可喜的進展[41-44]。同時,這種從技術層面針對數據溯源的探索,可通過實現數據管控為后期數據治理打下了好的基礎,核心技術層面的突破或可為從溯源方向為數據確權與交易問題提供新的解決思路。
2.3.3
數據的可計量
交易本身是一種交換行為,中國古代的度量衡就是規范基本交換行為的前提并提供了相應的基準,商品在形成交易前,大多都需要有一個標準的計量單位。因此,也有學者嘗試提出數據要素的計量單位,如柳峰提出DRs的概念[45],1個DRs就是數據庫表結構中1個非空(非null值)的單元格,經過這樣確定計量單位后,數據交易中交易雙方就可以快速理解交易產品的“數據量”,達到規?;瘮祿灰椎哪康?,并提高交易效率。
這種方法通過對數據表中空值的去除,用技術手段巧妙給出了數據可計量問題的解決方案。但數據在可交易之前,可計量并不是最后一個問題。數據交易還與其是否具備規模化屬性相關,數據的強應用融合性體現為大多數的數據應用都是定制化、個性化的,丁曉東[46]指出,一般而言,交易品只有脫離了供給和需求方的個性及定制化需求,產生大規模流轉,價值保持相對穩定,才不會因產品的供給方和需求方的不同而不同。正是因為數據交易中有非常多的個性化及定制化需求,所以這種價值的不確定性使得即便解決了可計量的問題,數據本身也在成為可流轉的標準化商品時遇到了困難。同時,數據交易的產品并不只局限于數據集且數據集交易與數據質量嚴格相關。因此,盡管DRs是一個較為清晰的解決方案,但似乎依然無法完全解決數據可交易中遇到的問題。
2.3.4
數據的可交易
數據交易有其特殊性,從確權、管控、計量到交易的全流程綜合考量,從產品類型以及服務類型這兩個角度劃分數據交易的產品類型更具實際意義。
從數據產品的角度可將數據交易分為兩大類。
“
第一類是基于數據集的交易,這種針對數據集的再加工,可以是對結構化數據的清洗、去噪、標注,即對具有結構沖突或是噪聲數據的臟數據進行模式層清洗,以及對屬性錯誤、數值重復等臟數據進行實例層的清洗[47];也可以是對語音、圖像或是視頻等半結構化、非結構化的數據進行標注(自動駕駛以及醫療健康等應用的底層數據),這類數據通常是用于機器學習的訓練集數據[48]或是專家決策系統所依賴的底層數據,其交易標的物多以數據集和定制化API接口兩種方式呈現,這類產品具有規模化、勞動密集型、質量強相關、多次迭代等特點。
第二類是基于數據分析衍生品的交易,京東、淘寶這樣的平臺除了促成數以億計的線上交易外,還通過網站埋點來感知與采集數據,積累實時、細粒度的商品交易、用戶行為等海量數據,并在此基礎上進行人物、商品、行為多維度與關聯性分析,經過平臺長時間序列的數據積累,即可衍生出各類基于海量數據的涉及國計民生、各行各業的數據分析報告等,這類數據交易的產品具有規?;?、強衍生、多維度、隱蔽性等突出特點。
此外,從依托主體來劃分,數據交易主要有以下兩種類型:
“
一是基于平臺的數據交易(平臺經濟),其基本特征是依托電子平臺進行的各類數據交易及其產生的衍生品交易,國外如Facebook、Twitter、Amazon、Google等,國內如京東、淘寶、攜程、百度等,此類數據是通過平臺對用戶行為進行感知而產生的,因此數據具有原創及可實時更新的特點?;谄脚_的數據交易可以產出上述的數據集及數據分析衍生品兩類產品。
二是基于服務商的數據交易,國外如Statista、Clarivate等,這類數據交易基于服務商收集和整理多個數據源的數據,不像上述基于平臺的交易物,服務商本身并不產出原始數據,而是匯聚起來提供數據相關的服務產出。但與前者類似,此類交易同樣可以產出上述數據集及數據分析衍生品兩類產品。
綜上所述,數據要素市場化的核心問題可以歸結為:
“
數據的權屬問題,包括主體、客體及具體權利等問題。
數據本身及產品的復雜性使數據交易難以規?;c規范化。
數據與人類經濟、社會活動孿生的天然屬性,使得數據監管政出多門,技術與體制機制方面有待完善。
解決路徑分析
數字經濟發展的關鍵是數據要素市場化,數字交易的前提與基石是數據確權。但數字化使得目前已經清晰的權屬關系變得復雜,比如,道路等屬于公共基礎設施,但數字化后數據的所有權是否應該屬于高德地圖?房產等屬于個體財產,但數字化后數據的所有權是否應該屬于貝殼找房?論文、著作等涉及著作權,但數字化后數據的所有權是否應該屬于如萬方或知網?等一系列的問題。有學者總結出數據確權難主要有以下三個原因。
“
第一,數據確權需要在國家、社會和個體的多方權益中權衡,既要保障國家安全和國家網絡空間安全為核心的數據主權,又要避免公權越界侵占以個體、企業的合法權益為代表的私權。
第二,數據獨特復雜的自然屬性和社會屬性使得附著其上的權利屬性不明確。
第三,目前缺乏有效的技術手段實現數據確權[49]。
以DRs為基礎的方案只能解決標準化數據集的交易問題,大量有待糾錯、補漏、標準化、整合的非規范數據集,是無法通過可計量的方案去解決規模化交易以及可定價問題的。同時,數據應用本身特有的強定制化及個性化需求,使得數據交易難以規模化。數據及信息交易中存在的阿羅信息悖論,也使得數據交易的買方在交易前無法得知所交易標的的詳細情況。基于以上討論,從數據交易的特殊性入手,本文嘗試探索性地提出數據交易的兩種模式。
3.1 依托數據中介的交易模式
數據資源的“信息非對稱”特性是其高價值所在。而完成數據交易的邏輯本質就是將“信息非對稱”讓渡或轉化為“信息對稱”的過程。作為數據供需雙方的橋梁與紐帶,中介無疑可以發揮重要作用。
一方面,數據交易雙方天然存在著結構性矛盾,即買方事前對數據及其衍生信息價值有了解訴求而賣方無法直接向買方直接披露數據。正是由于數據交易具有買賣雙方必須背對背的特點,所以客觀需要也適合采用中介服務的方式進行交易。
另一方面,數據賣方希望買方在共享數據資源的同時也能夠嚴格遵守數據使用規則,在良性互動中形成對數據交易決策的正向反饋,這就需要一個類似于房產中介的相關服務提供者。
此外,數據中介的建立在一定程度上還可以降低供需雙方的搜尋成本,減少決策疲勞(decision fatigue)。事實上,數據中介遠不止于鏈接和暢通供需雙方買賣行為的作用,其背后所隱含的在交易過程中的資源配置、利益調節與秩序治理等方面發揮的作用同樣重要。因此,依托數據中介的交易模式需要著力解決好四方面問題:
(1)
規范中介利益分配機制
數據的市場價值是交易前提,而交換價值(參與主體的利益分配)才是交易得以完成的必要條件。從交易鏈條中所處位置角度看,中介的利益獲取點實際上由兩部分構成:撮合收益與加工收益。
“
其一,由于中介提供的是中間介紹、撮合性質的勞務服務,相應的經濟收益就是把非對稱信息轉化為對稱信息的撮合收益。
其二,零散的數據本身并沒有太大價值,數據之所以成為高附加值的流通產品,關鍵在于從數據中提取出了有用的信息,進而提煉成知識,相應的經濟收益就是中介把數據加工為知識的加工收益。
兩部分收益的合理分配需要建立規范的收益生成機制,同時有必要借助區塊鏈等技術形成去中心化的交易和決策過程,確保中立性和透明度,以維持數據中介模式的穩定性與可持續性。
(2)
強化中介信用保障作用
信任差距(trust gap)或信用赤字(trust deficit)是阻礙經濟可持續運轉的重要因素。在數據交易過程中,由于個體更多關注的是“個人信息”,而中介更多關注的是“專有信息”,故中介具備了“合成買賣雙方不信任”的必要條件和客觀優勢。事實上,任何市場活動中參與方建立起的信用關系并非默認狀態,需要其中一方主動構建信任體系并促進交易主體間的權利結構優化。因此,在發揮中介渠道價值的同時,應加強其信用保障功能,并最終促成交易市場的一般均衡狀態。
(3)
發揮中介杠桿調節作用
中介本身就是市場經濟的產物,具有維護市場秩序的作用。中介可以作為一種政策杠桿來撬動數據價值鏈中的主體積極性,提高交易效率,延緩數據使用生命周期,實現供需雙方更好的交互體驗。例如通過完善市場中介主體間的競爭秩序以及“信息溢出機制”來促使中介提供更高質量的服務,甚至是幫助或修復一些非法活動,預防數據交易中的道德風險和逆向選擇,進而形成一個逼近帕累托最優的過程。當然,數據中介的杠桿調節與優化治理作用有賴于良好的制度環境,為此需要政府職能部門創新更多衍生政策予以支持。
(4)
加大對中介監管力度
市場失靈的客觀存在需要配套監管跟進。為獲取更高的超額收益,中介也可能會出現泄露數據或將數據進行非正規途徑售賣等違規行為。例如2017年,Equifax公司宣布了一起數據泄露事件,涉及1.47億人的個人信息。雖然市場經濟具有自發調節功能,但理性人和完全競爭市場僅為理論假設,市場失靈現象不可避免。因此,必須依托政府的強監管進行市場的規范管理才能使數據中介這一交易模式得以持續健康的發展。
3.2 構建數據“指數化”交易模式
鑒于數據集質量良莠不齊,當前對于數據質量沒有且不大可能出臺統一的規范與標準(用DRs只能解決計量單位問題,并不能解決數據質量問題)。數據“指數化”(Indexation)即通過“一攬子”方式將原本零散和波動的個體指標進行優化整合,形成一種直接可視的、可量綱的綜合評價中樞,進而使標準化的數據交易成為可能。即強制性要求數據提供方將其所提供的產品以指數的形式提煉出來,而不再是數量眾多且質量不一的數據集形式,隱含了奧卡姆剃刀理論中“將復雜問題簡單化”的邏輯。理論上看,指數化因對變動的價值標準進行了矯正,不失為保證數據交易順利完成的有效方式。但實踐中,借助指數化手段抵消外部干擾以實現經濟中性的策略往往會因逆向反饋而帶來事與愿違的結果。如經濟學領域中對商品價格的指數化,本意是消除通貨膨脹干擾,但由于指數化建立在預期之上,在市場博弈過程中卻成為通貨膨脹的“元兇”,就好像是“馬戲團的獅子殺死了馴獸員”。因此,構建數據指數化交易模式需要解決好三個關鍵問題:
(1)
科學、清晰且可被監管的算法
算法是關乎數據指數化是否可以得到市場驗證并大規模運用至交易流程的關鍵。本質上看,算法是計算機在處理信息時使用的一套決策支持系統,通過一套復雜算法模型對海量數據進行統計和分析,進而獲得算法控制者所希望得到的結果。由于計算機執行命令是算法的基礎,因此保證算法科學性與清晰性尤為重要。可以在人工智能基礎上將量子計算中的一些概念和數學機制應用于已有算法進行優化,如量子蟻群算法?(Quantum Ant Colony Algorithm,QACA)、量子人工魚群算法(Quantum Artificial Fish School Algorithm,QAFSA)等。與此同時,隨著算法以及算法所掌控的生產性資源正在逐漸成為一個閉環的黑箱,對算法的監管和治理也變得越來越難,與金融科技(Financial Technology,FinTech)同樣重要的監管科技(Regulatory Technology,RegTech)亟待突破?;趯λ惴ǖ目茖W運用及約束規范,政府職能部門需要加快出臺相應政策以應對技術異化所帶來的算法權力失控。
(2)
強大的數據甄選和精細化配置能力
鑒于數據形態凌亂、結構化程度較差的特性,致使數據指數化在不同行業間很難進行直接移植。數據有效甄別以及可交易的邊界問題都對供應方提出了更高要求。此外,由于數據處理方式屬“機器學習”范疇,難免會出現信息丟失、損失等現象,需要供應方具備強大的數據處理能力,而且針對不同行業的數據需求異質性,供應方的精細化配置能力也不可或缺。基于此,供應方在對數據進行指數化加工的過程中不能僅停留于計算機科學,而是要一并將統計學、管理學等交叉學科納入,形成數據標準化生產的系統工程。
(3)
真實、可驗證、可持續產出
數據的生產場景
如同多數經濟指標的指數化,數據資源指數化同樣會存在預期問題。預期即涉及不確定性和場景差異,而不確定性的場景里預測不準一定是常態。這就需要一個真實、可驗證、可持續產出數據的生產場景做背書,以彌補指數化造成的不確定性缺憾。場景的重要性還體現在卡爾多-希克斯效率補償——具有好的場景,數據指數化收益大概率可抵消成本,否則可能不足以抵消成本而造成整體福利損失。因此,王漢生在《數據資產論》一書中提到“場景為王、數據次之、算法最后”。
在實際市場運作中,不管是采用數據中介還是數據指數的交易模式,其中最重要的媒介都是大數據交易所,自從2014年底國內第一所大數據交易所——貴州大數據交易所正式掛牌成立以來,據不完全統計,國內已相繼成立了30余家大數據交易所。以上兩種模式還有許多具體落地的實際操作問題有待于依托數據交易所作進一步的驗證。
數據要素市場的建立是一個涉及數據要素自身特點、技術、交易、管控、機制等多維度及多方參與的問題,本文從數據要素特點出發,從數據資源到數據交易需經過的可確權、可管控、可計量、可交易的四個環節出發,提出了先擱置數據確權的爭議,以符合數據自身特點的數據中介及數據指數兩種模式給出數據要素市場的解決路徑。下一步還將就兩種模式如何利用數據交易所這一媒介進行實際運作,以及如何與數據代理的方式相結合等做更進一步的深入思考與討論。