- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2024-05-07來源:差一點成熟瀏覽數:273次
公共數據開發利用是推進數據要素市場化配置改革的重要內容,而提高公共數據資源的供給水平是促進公共數據開發利用的起點。2023年國家數據局等部門印發的《“數據要素×”三年行動計劃( 2024—2026年)》,要求“加大公共數據資源供給”。目前,公共數據資源供給主要包括數據共享、開放和授權運營等方式。其中,數據共享主要是指公共數據在政府職能部門和公共管理及服務機構之間進行跨層級、跨部門和跨地域的流轉。然而,公共數據僅在政府體系內部進行共享,其所能釋放的價值是局部和有限的,只有使其能在市場和社會上得到充分供給和高效利用,才能最大程度地釋放出其價值紅利,全面賦能數字經濟和數字社會發展。本文將基于2023年7月以來在上海、浙江、山東、福建、貴州等地進行的調研和討論,對公共數據資源供給的路徑和目的進行一些初步探討。
公共數據開放這種數據供給方式是指公共部門向社會公開、公平、無償地提供具有原始性的、可機讀的公共數據,以供其進行再利用的行為。根據世界銀行的定義,開放數據是指“能被任何人出于任何目的不受限制地進行自由利用、再利用和分發,并最大程度保持其原始出處和開放性的數據”。其中,“開放性”應具備兩個維度的特性:一為技術性開放,即數據應為可機讀、非專屬性的電子格式,從而能被任何人通過通用、免費的軟件獲取和利用,數據還應被置于公共服務器上供公眾獲取,不設密碼和防火墻;二為法律性開放,即這些數據應被置于公共領域,或處于自由利用條款下,受到最低程度的限制[1]。紐約大學Gov Lab實驗室在對國際上具代表性的多個研究機構、評估指標、政府部門和咨詢公司界定的“開放數據”定義進行梳理后發現,最多被強調的開放數據標準包括免費、公開提供、非排他性、可利用結構、開放授權和可再利用等要方面。
近年來,我國已出臺多個重要文件對公共數據開放做出明確要求。2017年2月,中央全面深化改革領導小組第三十二次會議審議通過的《關于推進公共信息資源開放的若干意見》指出,要保證開放數據的“完整性、準確性、原始性、機器可讀性、非歧視性、及時性,方便公眾在線檢索、獲取和利用。” 2018年1月,中央網信辦、發展改革委以及工業和信息化部聯合印發《公共信息資源開放試點工作方案》要求試點地區“研究制定公共信息資源開放技術規范,明確開放數據的完整性、機器可讀性、格式通用性等要求。” 2020年4月,《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》提出要“推進政府數據開放共享,研究建立促進公共數據開放和數據資源有效流動的制度規范”。2021年3月,《國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》要求“擴大基礎公共信息數據安全有序開放,探索將公共數據服務納入公共服務體系,構建統一的國家公共數據開放平臺和開發利用端口,優先推動企業登記監管、衛生、交通、氣象等高價值數據集向社會開放。”2022年12月,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》提出“對各級黨政機關、企事業單位依法履職或提供公共服務過程中產生的公共數據,加強匯聚共享和開放開發。”
本質上,向社會開放公共數據是政府提供的一種公共服務,是一種基礎性均等化的公共數據供給方式。儲存在政府后臺的公共數據就像盛在茶壺里的茶水,如果政府部門只通過各種內部“通道”將公共數據提供給市場主體,就如同私下用茶壺給客人倒茶,不同客人喝到的茶可能會有濃有淡、有多有少,難免厚此薄彼。而如果先把茶倒進一個“公道杯”里,再將均勻過的茶湯公開公平地倒給客人,就能對每位客人做到一視同仁。公共數據開放平臺就像這樣一個“公道杯”,政府可以通過這個平臺將公共數據公開、公平、普惠、無歧視地開放給各個市場和社會主體。
近年來,我國公共數據開放平臺數量以及在這些平臺上開放的數量集總量都增長迅速。根據開放數林指數發布的數據,截至2023年8月,我國地級以上公共數據開放平臺的數量已從2017年的20個增加到2023年的226個(不含港澳臺),其中省級平臺26個,副省級與地級平臺200個[2]。
在開放數據集總數上,2017年,全國各地方平臺僅開放了8,000多個數據集,而到2023 年,這一數字已增長到34萬多個,是7年前的41倍[2]。
然而,目前我國公共數據開放仍存在“供應不充分”“供需難匹配”“利用欠成效”等問題。首先,各地數據開放平臺上已開放的數據集普遍存在數量少、質量差、顆粒度粗、更新不及時、內容碎片化等問題,高價值卻又具有一定敏感性的數據很少開放出來,而已經開放出來的數據卻往往利用價值不高,無法充分滿足市場和社會主體對公共數據的需求。其次,公共數據供需對接不暢,供方不清楚需方要什么數據,需方也不了解供方有什么數據,公共數據開放平臺的運營服務也大多缺乏專業性和穩定性,無法有效促成供需匹配,甚至隨時可能“斷供” 已開放的數據集。而且,許多已開放數據集未匹配必要的描述說明,缺少元數據和數據字典,可用性較低,難以被利用主體真正理解和有效利用。在以上這些因素的綜合影響下,目前基于開放數據形成的應用成果也數量較少、質量欠佳。
綜上所述,總體上目前我國公共數據的供給者和利用者之間尚未形成有實效、高質量、可持續的價值共創生態。主要原因在于,推進數據開放利用和供需對接都需要政府部門投入一定的財力人力精力,并對他們的運營服務能力提出了新的要求,但卻并不會為他們帶來直接的“收益”,反倒會讓他們為可能由此帶來的數據安全、個人信息保護和數據質量等方面的風險“背鍋”擔責。因此,對于這樣讓人既不“省心”也不“放心”、“成本收益”不成比例的工作,政府部門往往會抱著“多一事不如少一事”的態度,開放意愿不強、推進動力不足。
公共數據授權運營授權運營這種數據供給方式是指公共部門授權第三方對公共數據進行加工處理,將原始數據開發成數據產品和服務后再向社會提供的行為。《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》提出“開展政府數據授權運營試點,鼓勵第三方深化對公共數據的挖掘利用。”《中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(“數據二十條”)提出“鼓勵公共數據在保護個人隱私和確保公共安全的前提下,按照‘原始數據不出域,數據可用不可見’的要求,以模型、核驗等產品和服務等形式向社會提供。”2023年國家數據局等部門印發的《“數據要素×”三年行動計劃( 2024—2026年)》要求“在重點領域、相關區域組織開展公共數據授權運營。”
授權運營好比古人使用“溫碗”對酒進行加熱保溫的過程:先把熱水倒入一個溫碗,然后再將酒壺放入溫碗,這樣溫碗里的熱水會將熱量“賦能”給壺中的酒,卻并沒有把熱水本身倒出去,實現了“原始熱水不出碗,熱水可用不可得”。同理,政府可以通過運營主體――“溫碗”,將蘊藏著熱能的原始公共數據加工成產品和服務后再向市場和社會主體提供,在此過程中,雖然原始數據本身并沒有直接開放出去,但數據的能量和價值卻仍然實現了向外釋放。對于承載個人信息和直接開放可能會影響公共安全的公共數據,采用授權運營這種供給方式有助于突破數據開放這種方式在數據安全、數據質量和供需匹配等方面遇到的“瓶頸”,將公共數據開發利用工作向縱深推進。
目前,我國已有多個地方開始探索公共數據授權運營。截至到2024年3月,我國已有五十多個地方正式出臺了與公共數據授權運營相關的法規政策或發布了征求意見稿,并有多個地方建設了公共數據授權運營平臺或在數據開放平臺上開設了授權運營專區。
然而,本文在調研中也發現,授權運營雖被各界寄予厚望,但一些在數據開放過程中遇到的“老問題”在授權運營過程中也仍然存在。例如,授權運營這種形式雖然在一定程度上消減了數據提供部門的數據安全顧慮,但由于權責利不匹配、收支兩條線等原因,許多部門仍然認為開展授權運營的“風險大于收益”,對推進公共數據授權運營的動力依舊不足。此外,數據質量問題在授權運營過程中也依然存在。即使有了專業的運營機構對數據進行提質治理,許多公共數據畢竟是政府部門在履行行政職能的過程中出于滿足內部業務需要而采集和生成的,而并不是為了外部社會的復用需求而準備的,這些數據在顆粒度、時效性和豐富性等方面都不一定能充分、精準地滿足市場主體的各種應用要求。
調研發現,數據開放和授權運營這兩種公共數據供給方式各有其優勢和不足。數據開放這種方式雖然在安全性、可用性和可持續性等方面面臨挑戰,但其具有的普惠、便捷、公平、門檻低、創新空間大等特點也不應被忽視,而授權運營這種方式雖具有精準、安全、優質、可持續等優勢,卻也在公平性、便利性和創新潛力上存在局限性。
具體而言,數據開放這種方式的受益面更大,過程更為公平透明,市場和社會主體獲取數據的門檻和成本也相對更低;而通過授權運營這種方式獲取數據的門檻和成本相對較高,不僅可能會降低數據獲取的便利性,還可能會有損公共數據資源供給的公平性,最終造成只有國有企業或民營“大廠”才有權享用公共數據,而中小微型民營企業卻只能望“數”興嘆的結果。
同時,數據開放這種直接提供原始數據的方式具有更大的包容性和創新空間,真正的創新往往不是被預先設計出來的,只有容忍一定程度的“不確定性”,才有可能收獲預想不到的驚喜。而相較于原始數據,經過加工后的數據產品和服務在利用空間和創新潛力上相對受限,授權運營這種方式在提高了數據供給的安全性和“確定性”的同時,也降低了市場創新活動所必須的開放度和“容錯度”。為了有效推進公共數據開發利用,我們既不能只關注市場對數據進行創新利用的活力,而忽視了政府供給數據的動力,也不能只強調提高政府供給數據的動力,卻犧牲了市場利用數據的活力。
因此,數據開放和授權運營這兩種公共數據供給方式各有其適用的數據類型和應用場景,需要協同推進,發揮各自所長,而不應相互取代或擠壓空間。在擴大公共數據資源供給的過程中,可主要從安全性、公益性和成本收益等方面來綜合考慮某類數據適合選擇哪種數據供給方式,對于不承載個人信息和不影響公共安全的、主要依靠公共財政資金生成的、社會受益面較廣的、又不需要再投入較高成本就可向社會直接提供的公共數據,應優先選擇數據開放這種方式進行普惠供給,力求“應開盡開”;而對于承載個人信息和影響公共安全的、主要不是依靠公共財政資金生成的、受益面僅限于特定行業產業的、又需要投入較大成本對原始數據進行加工后才能向社會提供的公共數據(畢竟不能讓所有納稅人為少部分數據利用主體買單),則可以探索授權運營這種方式來進行有償供給。
在協同推進數據開放和授權運營的過程中,我們需要特別注意辨別以下兩種情況:第一,要分清有些數據是應該開放卻還沒有開放,還是確實不適合開放?有些地方明明還沒有把本可以開放的公共數據“應開盡開”,就宣稱這些數據不適合開放,只能通過“授權運營”來提供了。第二,要辨別“安全”是不能開放數據的真實原因,還是只是一個借口?有些部門不愿開放某類數據的真實原因可能是出于保護局部利益,但由于這些理由不便明說,就把“安全”拿來作為不開放數據的“擋箭牌”,然后再借道授權運營來“暗渡陳倉”。對于以上這類開放還“不充分”或把“安全”作為不開放的借口等情況,仍然需要加大力度推進數據開放。
公共數據開放和授權運營這兩種數據供給方式雖路徑不同,卻殊途同歸,都是為了擴大公共數據資源供給,釋放公共數據的價值。在協同推進這兩種公共數據供給方式的過程中,我們需要平衡好公平、效率和安全之間的關系,既不能局限于數據開放這一種方式,也要防止對所有的公共數據,特別是明顯不承載個人信息和不影響公共安全的公共數據,都只采用授權運營這一種方式來向社會提供,以“安全”之名將“不出域”“不可見”這種方式擴大化、極端化,這也會成造成一種事實上的“數據懶政”,不利于公共數據的普惠供給和數據經濟的高效發展。
《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》提出要“合理降低市場主體獲取數據的門檻,增強數據要素共享性、普惠性,激勵創新創業創造,強化反壟斷和反不正當競爭,形成依法規范、共同參與、各取所需、共享紅利的發展模式。”《“數據要素×”三年行動計劃( 2024—2026年)》在基本原則部分也提出要“充分發揮市場機制作用,強化企業主體地位,推動數據資源有效配置。更好發揮政府作用,擴大公共數據資源供給,維護公平正義,營造良好發展環境。”
因此,在推進公共數據開發利用的過程中,我們亟需厘清和明確擴大公共數據資源供給的最終目的,平衡好“市場化”和“公共性”之間的關系。一方面,公共數據資源供給需要在守住安全底線的前提下,充分引入市場機制來開發數據產品,促進供需對接,把不適合以原始形態直接開放的公共數據的價值釋放出來,從而提升公共數據資源供給的動力。考慮到對公共數據進行加工處理涉及到資金和人力投入,對此過程收取適當的費用有其合理性,有利于激勵數據運營主體持續開發優質的數據產品和服務。
《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》提出要“合理降低市場主體獲取數據的門檻,增強數據要素共享性、普惠性,激勵創新創業創造,強化反壟斷和反不正當競爭,形成依法規范、共同參與、各取所需、共享紅利的發展模式。”《“數據要素×”三年行動計劃( 2024—2026年)》在基本原則部分也提出要“充分發揮市場機制作用,強化企業主體地位,推動數據資源有效配置。更好發揮政府作用,擴大公共數據資源供給,維護公平正義,營造良好發展環境。”
因此,在推進公共數據開發利用的過程中,我們亟需厘清和明確擴大公共數據資源供給的最終目的,平衡好“市場化”和“公共性”之間的關系。一方面,公共數據資源供給需要在守住安全底線的前提下,充分引入市場機制來開發數據產品,促進供需對接,把不適合以原始形態直接開放的公共數據的價值釋放出來,從而提升公共數據資源供給的動力。考慮到對公共數據進行加工處理涉及到資金和人力投入,對此過程收取適當的費用有其合理性,有利于激勵數據運營主體持續開發優質的數據產品和服務。
但另一方面,也要防止增加了動力,卻走偏了方向。擴大公共數據資源供給的初心應該是增進而不是損害公共利益,在引入市場機制的過程中,要防止商業利益或部門利益“偷換”了公共利益。公共數據尤其是其中占主體的政府數據是公共部門在依法履職的過程中使用公共財政資金采集生成的,是全社會共有的005資源和財富,應“取之于民”“還之于民”“為民所用”,盡最大可能降低各類市場和社會主體獲取公共數據的成本和門檻,確保公共數據資源供給的共享性普惠性。在此過程中,要防止壟斷和不正當競爭,警惕將授權運營變為“私相授予”和“壟斷經營”, 將“有償使用”變為“坐地起價”,最終僅使少數主體“坐收紅利”,卻大大抬高了廣大的市場和社會主體獲取公共數據的門檻和成本。
在擴大公共數據資源供給的過程中,政府應該算“小賬”,還是算“大賬”?應著眼于公共數據在短期內和局部范圍內為地方或部門實現了多少利益“變現”,搞狹義的所謂“數據財政”?還是應著力使公共數據盡最大可能賦能于市場和社會,從而在推進產業發展、促進就業和提高居民收入等方面創造出更全面和長遠的價值,并在更高格局、更廣義的層面上實現政府財政收入的增加?要回答這些問題,都需要從根本上明確加大公共數據資源供給的最終目的究竟是為了謀取局部私利,還是為了增進公共利益?如果目的是后者,那以上這些問題的答案也就不言而喻了。
擴大公共數據資源供給好比“放水養魚”,其價值應來自于養出了多少“魚”,而不是賣出了多少“水”。在此過程中收取合理的“水費” 是手段,有助于提高供水的動力和質量,但不應將“收水費”本身當做了目的,否則如果因“水”價過高,而導致漁民養不起“魚”或不愿養“魚”了,就將“得”不償“失”,不利于數字經濟和數字社會的長遠發展。最終,檢驗一個地方公共數據資源供給水平的標準應該是這個地方的公共數據是否以更大范圍、更高品質、更低成本、更為安全、更可持續的方式賦能了數字經濟和數字社會的全面發展,實現了公共利益的最大化。
兩千多年前,都江堰工程打通了水資源的寶瓶口。然而,李冰父子千辛萬苦打通寶瓶口的目的并不是“把住”這個唯一的出水口,然后坐地起價“收水費”,最終讓李家的子子孫孫賺得盆滿缽滿。相反,他們將優質的水源通過“寶瓶口” 源源不斷地向社會釋放出去,流動起來,賦能于成都平原的千行百業和千家萬戶,造就了農業時代的“天府之國”。回望歷史,李冰父子之所以能千百年來被人民世世代代紀念,應該不僅在于他們從技術路徑上打通了“寶瓶口”,更在于他們在終極目的上選擇了讓水資源惠澤四方,而不是占為己有。
正如《老子》所言:“上善若水,水善利萬物而不爭”,“生而不有,為而不恃,功成而弗居。夫唯弗居,是以不去”。最高的善就像水一樣,滋養天下萬物,卻不與民爭利,也不居功自傲,但卻又恰恰因為不爭利不居功,其功績無處不在、永不泯滅。在數字時代,我們也應向古人學習,打通公共數據的“寶瓶口”,暢通公共數據資源的大循環,讓公共數據“供得出”“流得動”“用得好”,使之成為全社會可以共享共用的公共資源,發揮出其對數字經濟和社會的“灌溉”賦能作用和乘數效應,將整個中國打造成數字時代的“天府之國”。
來源:圖書情報知識
上一篇:人工智能與智能計算的發展...