日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據暴政與數據光明

時間:2022-06-07來源:萌噠噠瀏覽數:283

在人工智能時代,我們不可避免的要接觸到各種數據,借助這篇文章我們對數據算法有了一個基本了解,并意識到數據分析對現實生活和公共事務決策的重要性,但是數據算法的負面影響也不容忽視,只有不斷減小甚至消除數據算法的負面影響,才能避免數據暴政,走向依據數據算法的民主治理,這也需要我們法律人的共同努力。

現如今,空前且大規模的人類行為數據的可用性正在深刻地改變著我們所處的世界,經濟學、公共衛生學、醫學、生物學、城市科學等在這一趨勢中都受到影響。各個組織、公民個人正在積極嘗試、創新和改編算法決策工具以了解全球人類行為模式,并為解決社會重要性問題提供決策支持。

在這篇文章中,作者提出要在大數據背景下積極利用人類行為數據,通過分析人類行為數據,為公共衛生、災害管理、安全、經濟發展和國家統計等政策提供信息,解決社會重要問題。但作者也指明數據驅動的公共產品算法決策具有風險性,包括對隱私的侵犯,缺乏透明度,信息不對稱,社會排斥和歧視,如果不加重視會導致“數據暴政”的出現。因此作者在這篇文章中提出了三點建議,希望加強決策的民主化,發揮數據驅動型決策的積極作用而減小其負面影響。

作者將這篇文章分成四部分,首先指明數據驅動決策的意義和存在的問題,第二部分通過案例說明數據驅動算法有利于決策的優化,第三部分說明其存在缺陷,最后提出改善建議,希望發揮數據驅動算法的優勢以解決社會重要問題。


第一部分,數據驅動決策的重要性和存在的問題

人類行為數據已經從稀缺的資源發展成為大規模的實時流,作者強調了通過數據驅動的算法決策創造的積極機會:例如推斷社會經濟國家和個人的狀況和犯罪預測,測繪疾病的傳播,或了解自然災害的影響;同時也提醒從業者應該意識和解決的潛在負面后果,防止“數據暴政”的出現.作者在這篇文章中多次提到了黑匣子決策,即只能看到結果無法看到過程,黑匣子決策缺乏透明度和問責性,可能犧牲公民的個人權利,造成數據暴政,例如威廉?伊斯特利表示全球經濟發展和扶貧項目受到“專家專制”的支配,這些“專家”將諸如貧困或正義等多層面的社會現象縮減為一套技術解決方案,這些技術解決方案沒有公民參與,沒有對“專家”的問責,缺乏公平,易導致數據暴政。作者希望通過確保數據決策的透明度,實行問責制和保障公民參與,從而實現數據驅動的民主化決策。

第二部分,數據驅動算法有利于決策優化

作者建議利用大規模的相關數據流來挖掘和訓練算法,可以提高分析和技術能力,用基于機器學習的算法來處理人為決策極限的復雜問題。人類決策有明顯的局限性,例如腐敗、低效或不公正,向數據驅動算法的轉變反映了對客觀性,以證據為基礎的決策以及對資源和行為的更好理解的探索。

Diakopoulos 將算法的功能分為四大類:

(1)分類,根據信息的特征將信息分類為單獨的“類”?

(2)確定優先次序,強調和排列特定信息或結果的排名,以犧牲他人為基礎的預定義標準;?

(3)關聯性,確定實體之間的相關關系;和

(4)基于預定標準過濾,包含或排除信息。

功能

類型

示例

分類

聲譽系統,新聞評分,信用評分,社交評分

Ebay, Uber, Airbnb; Reddit, Digg; CreditKarma; Klout

優先級

一般搜索引擎,元搜索引擎,語義搜索引擎,問答服務

Google, Bing, Baidu; image search; social media; Quora; Ask.com

關聯性

預測發展和趨勢

ScoreAhit, Music Xray, Google Flu Trends

過濾

垃圾郵件過濾器,兒童保護過濾器,推薦系統,新聞聚合器

Norton; Net Nanny; Spotify, Netflix; Facebook Newsfeed

根據以上算法進行功能分析,可以計算出何為社會有益算法,即最能使公共產品決策和資源優化的算法,這些算法旨在分析來自各種來源的大量人類行為數據,然后根據預先確定的標準選擇與其預期目的最相關的信息。作者通過分析下列具體案例,強調了數據算法的積極作用:

第一,犯罪行為動態分析和預測性警務

首先,作者介紹了犯罪行為動態分析的兩種模式:1、是以人行為數據為中心的模式,主要用于個人或集體犯罪分析。Wang等人提出了一種名為“系列發現者”的機器學習方法,用于檢測同一罪犯或罪犯群體所犯罪行的具體模式;2、以地方為中心的警務實踐模式,對犯罪熱點檢測、分析和解釋。Toole等人提出了數學、物理和信號處理的定量工具的新穎應用,分析刑事犯罪記錄中的空間和時間模式。

其次是預測性警務的運用方法正從學術領域轉向警察部門。總的來說,目前正在使用四種主要的預測性警務方法:(1)預測犯罪地點和時間的方法;(2)檢測罪犯和標記將來有犯罪風險的人的方法;(3)確定犯罪者的方法;(4)確定群體或在某些情況下可能成為犯罪受害者的個人的方法。

第二,推斷國家和個人的社會經濟狀況

準確地衡量和監測關鍵的社會人口和經濟指標對于設計和實施公共政策至關重要。如今一些研究人員開始使用手機數據、社交媒體和衛星圖像來推斷個人用戶的貧困程度和財富狀況,以創建高分辨率的地圖財富和貧困的地理分布,這為政府用來決定如何分配稀缺資源,研究經濟增長的決定因素提供了基礎。

第三,數據驅動算法對公共衛生的意義

數據算法有利于研究流行病學、分析環境和緊急情況,以支持政府決策或評估政府措施,并能更加精準評估精神健康。例如Tizzoni和Wesolowski等將傳統的流動性調查與手機數據(呼叫詳細記錄或CDR)提供的信息進行了比較,對疾病的傳播進行建模,特別是在調查可用性非常有限的低收入經濟體中,能持續監測流動模式,以支持決策或評估政府措施的影響;且在心理健康領域,一些研究表明通過手機和社交媒體收集的行為數據可以被用來識別躁郁癥,情緒,人格和壓力,這些新的行為數據來源可以在臨床環境之外監測心理健康相關的行為和癥狀,而不必依靠自我報告的信息,提升決策準確性。

表格總結了本節回顧的文獻的主要觀點

關鍵區域

解決問題

參考

預測性警務

犯罪行為分析

Ratcliffe [67], Short et al. [72], Wang et al. [90]

犯罪熱點預測

Bogomolov et al. [10, 11], Ferguson

[32], Traunmueller et al. [85]

行為人/受害人身份證明

Perry et al. [64]

金融與經濟

財富與貧困的映射

Blumenstock et al. [8], Louail [49], Jean et al. [39], Soto et al. [76], Venerandi et al. [88]

消費行為分析

Singh et al. [73]

信用評分

San Pedro et al. [71], Singh et al. [74]

公共衛生

流行病學研究

Frias-Martinez et al. [35], Tizzoni et al. [82], Wesolowski et al. [94]

環境和緊急情況映射

Bengtsson et al. [4], Liu et al. [48], Lu et al. [50]

精神健康

Bogomolov et al. [9], De Choudhury [20], de Oliveira et al. [25], Faurholt-Jepsena et al. [30], Lepri et al. [46], LiKamWa et al. [47], Matic and Oliver [52],?Osmaniet al. [59]

第三部分,數據驅動算法的負面影響

大數據和機器學習方法對決策的潛在積極影響是巨大的,但作者也強調了數據驅動型決策的黑暗面。

第一,侵犯隱私

計算機濫用用戶披露的個人數據,以及作為數據代理的實體對來自不同來源的數據進行匯總,直接影響隱私。例如作者介紹的Kosinski等人最近的一項研究表明, 結合Facebook上的“喜歡”數據和有限的調查信息,能準確預測男性用戶的性取向,族裔出身,宗教和政治偏好,以及酒精,藥物和香煙的使用情況。

第二,信息不對稱,缺乏透明度

大規模積累和操縱客戶、公民的行為數據的能力,可能會使大公司或威權政府使用有力手段通過有針對性的營銷努力和社會控制策略來操縱人群中的部分人群。這會造成信息不對稱,在這種情況下,強大的少數人獲得和使用大多數人無法獲得的知識,從而導致或者加劇了國家或大公司與其他人之間現有的權力不對稱。此外,各種數據驅動的社會福利算法的性質和使用,缺乏公民參與,使得算法缺乏透明度,難以評估問責。

第三,社會排斥與歧視

算法決策程序可以再現現有的歧視模式,繼承先前決策者的偏見,或者簡單地反映社會上普遍存在的偏見,造成識別不公。識別不公平造成歧視性的結果不斷增長,但用于協助決策過程的黑匣子模型將呈指數級的復雜性。作者特別強調了需要透明和問責的機器學習模式,否則在機器驅動的決策嚴重影響人們的生活的情況下采用黑匣子方法可能導致形式上的算法污名,特別令人毛骨悚然的是那些被污名化的人可能永遠不會意識到這一點。

第四部分,提出建議以減小數據驅動算法的消極面

作者希望能夠發揮數據驅動型算法的積極作用,避免走向數據暴政,使算法功能強大并使其成為創造價值的工具,為此提出了三點建議:

第一,以用戶為中心的數據所有權和管理

作者提出建立以用戶為中心的個人數據管理模型,以使個人能夠更好地控制自己的數據。于是Enigma平臺基于個人數據生態系統(個人數據生態系統由個人數據的安全保管庫組成,完全由其所有者控制),利用最新的分散化技術,在密碼學和分散的計算機網絡創造了一種稱為區塊鏈的新技術,它以中間人的作用減少我們作為社會最重要的角色的影響 ,允許人們以安全、可靠和不可改變的方式將獨特的數字財產或數據傳輸給其他人,這種技術可以創建數字貨幣(比特幣),這些數字貨幣不受任何政府機構的支持。

第二,增加算法的透明度和責任

許多最先進的基于機器學習的模型(例如神經網絡)一旦部署就充當黑匣子,當這些模型被用于決策時,對于為什么以及如何做出決定缺乏解釋。為了解決這個局限性,最近在機器學習領域的研究工作已經提出了不同的方法來使算法更易于事前和事后檢查。例如,一些研究試圖通過引入識別的工具來解決算法中的歧視問題并糾正不必要的偏見。

第三,創建生活實驗室進行試驗

作者建議建立生活實驗室以便在現實生活中測試想法和假設。例如移動領土實驗室(MTL),一個意大利電信基金會,MIT媒體實驗室和西班牙電信發起的生活實驗室,通過多種渠道觀察了超過三年的100個家庭的生活,已經收集了來自多個來源的數據,包括智能手機,問卷調查,經驗抽樣調查等,并用于創建研究參與者生活的多層次視圖。尤其是,社交互動(例如,通話和短信通信),流動程序和消費模式等已被捕獲。?MTL的目標之一是設計個人數據存儲(PDS)技術共享個人數據的新方式,以促進更多的公民參與。

綜上所述,在人工智能時代,我們不可避免的要接觸到各種數據,借助這篇文章我們對數據算法有了一個基本了解,并意識到數據分析對現實生活和公共事務決策的重要性,但是數據算法的負面影響也不容忽視,只有不斷減小甚至消除數據算法的負面影響,才能避免數據暴政,走向依據數據算法的民主治理,這也需要我們法律人的共同努力。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢