日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

從圖譜構建到應用,企業關聯關系知識圖譜應用實例!

時間:2022-06-30來源:西瓜小姐瀏覽數:2638

知識圖譜的構建應是業務應用驅動的。本次的業務目標:通過構建企業知識圖譜,深入挖掘企業在生產經營過程中與其他企業之間產生的各類關聯關系,有效的實現企業的風險預警。這對企業降低資本成本、優化企業內部治理、提升企業價值具有實際意義。

前言

知識圖譜在金融科技時代發揮了巨大的價值,知識圖譜的推理能力和可解釋性,在金融場景中具有天然的優勢。利用知識圖譜等人工智能技術從數據中提煉出知識,并通過算法等方式建模服務于應用。知識圖譜憑借其強大的語義表達能力、存儲能力和推理能力,為互聯網時代的數據知識化組織和智能應用提供了有效的解決方案。小普今天分享一篇企業關聯關系知識圖譜構建與應用實踐,展示了從圖譜構建到應用的全流程?;谄髽I關聯關系知識圖譜,實現了關聯路徑查詢、企業實際控制人發現、企業集團發現等模型應用,為企業挖掘隱藏的企業關聯關系提供有效思路。

本文從數據挖掘業務的視角下,解答以下幾個問題,希望給予小伙伴一些新思路,一起往下看吧。

1、為什么需要企業關聯關系知識圖譜?

2、構建企業關聯關系知識圖譜需要哪些數據?

3、如何關聯實體、關系和屬性?

4、企業關聯關系應用實例

FLOW

企業關聯關系知識圖譜構建流程

一、前期準備:業務需求定位。

知識圖譜的構建應是業務應用驅動的。本次的業務目標:通過構建企業知識圖譜,深入挖掘企業在生產經營過程中與其他企業之間產生的各類關聯關系,有效的實現企業的風險預警。這對企業降低資本成本、優化企業內部治理、提升企業價值具有實際意義。

例如:某基金公司通過股權分析進行判斷,當市場出現波動時,某個企業是否與資本系大多數公司的行為一致,根據市場判斷,及時的進行內部調整。

做知識圖譜之前,我們考慮了投入產出比,明確需求,要解決什么樣的業務問題,以及評估技術的可行性。從具體業務出發,獲取的企業數據,一般僅僅用內部記錄的數據表格就可以看出直接關系,而關聯路徑查詢、企業實際控制人發現、企業集團發現等,需要基于構建好的企業大圖,進行復雜計算之后才能得到。

二、前期準備:數據預處理。

在這個步驟,我們需要解決的問題是:

??????? 我們已經有哪些數據?和有可能拿到哪些數據?

??????? 哪部分數據可以用來分析具體業務問題?

??????? 哪部分數據可以用來構建知識圖譜?哪些信息不需要放在知識圖譜中?

我們的技術專家與業務專家根據業務目標的設定進行深入溝通后,從金融機構獲得數據源,包括存儲在其內部關系數據庫中的相關表(公司注冊信息表、企業人員信息表、企業狀態信息表、關聯企業信息表)。我們首先將無用字段和一些存在較多空數據的字段去除掉。

公示平臺的數據包含企業公示的所有工商信息、人員信息和信用信息,因此其數據的完整性和可靠性能夠支撐本文的知識圖譜,能夠反映一段時間內企業關系網絡的真實狀態。此外,現實世界的企業之間還存在競爭、合作、上下游、家族企業等關系,本文暫且先不做闡述。

三、開始圖譜構建:本體模型定義。

在這個步驟,我們需要解決的問題是:

?? ?該業務場景需要哪些實體、關系和屬性?

現實世界的企業關系網絡遠遠非常龐大且復雜,建立一個包含大量企業關聯關系的知識庫也是十分具有挑戰性的。

通過對數據表的字段定義和它們之間關系的分析,從而確定了實體、關系和屬性。其中包含公司和個人兩種實體,公司之間的 4 種直接關系(股東、投資、擔保、分支),公司與個人之間的 5 種直接關系(股東、投資、擔保、高管、聯系人),如表 1 和表 2 所示。可實現對企業關聯關系的挖掘,得到企業實際控制人、企業所屬集團這兩種更深層的關聯關系。

表 1

表 2

然后我們將這些整理好的數據,導入到已經構建好的業務本體模型當中。圖 3 展示了知識圖譜本體模式層的一部分,包含代表公司和個人的節點,代表企業之間的分支、股東、擔保、投資等關系的邊,代表個人與公司之間的高管、股東、投資、聯系人、擔保等關系的邊,以及節點和邊中包含的部分屬性,其他大量屬性如企業工商信息、個人信息等出于簡潔的考慮,并未在圖 3 中顯示。

圖3

四、知識圖譜的模型應用:關聯關系挖掘。

關聯關系挖掘就是在現有知識圖譜上進行知識查詢與知識發現的過程,即結合實際應用場景,從現有實體的關聯關系中識別和推斷出新的關系。

由于構建好的知識圖譜,只是對現實世界的企業關系網絡的知識表示,其本身并不能直觀地反映企業之間存在的隱式關聯關系。因此需要基于現有的企業關聯關系,設置推理規則、指標和模型等。從而發現企業之間隱藏的關聯關系,最后構建了關聯路徑查詢、企業實際控制人發現、企業集團發現這三種關系挖掘模型。

場景應用:關聯路徑查詢

企業之間的直接關系能夠在知識圖譜中直觀表示出來,但是當一家企業與大量其他企業產生聯系時,間接的關聯關系廣泛存在卻難以被發現。如何對看似割裂、但實際存在間接關聯的兩個實體進行關聯關系挖掘,對于企業關系發現、風險傳播預測等有重要的意義。

如圖 4?所示,指定的個人節點 P1 與企業節點 D 之間是否存在路徑?需要找到源節點與目標節點之間的直接或間接路徑,即任意兩個節點之間的關聯路徑問題。

圖4 藍色代表公司,黃色代表人

兩個實體之間經過多個中間節點形成的關聯路徑,可以表示為它們之間的間接關聯關系。對于實現業務目標來說:關聯路徑查詢能夠發現企業知識圖譜中任意兩個實體之間存在的路徑,可以衡量企業之間聯系的密切程度,發現可能存在的風險問題。以圖 4 為例,查詢 P2 C 之間的關聯路徑,其查詢結果如圖 5 所示,可以看出 P2C 之間存在的聯系。關聯路徑查詢的算法如下所示。

圖5?藍色代表公司,黃色代表人

? 場景應用:企業實際控制人發現

資本成本是衡量企業是否要進行籌資以及如何進行籌資的標準。在現代企業體系下,由于企業的控制權受到股權、協議或者其他安排等因素的影響,導致公司的實際控制人很難被發現。并且,存在股東簽訂的協議或者其他安排導致公司控制權變更的情況,且相關數據獲取困難。因此,研究實際控制人的所有權比例、控制權比例以及兩權的分離度與企業資本成本之間產生的關系是有意義的。

如圖 6 所示,通過計算持股比例,判斷個人節點P1 是否實際控制了公司節點C ?需要判斷一家公司或者一個人是否通過多數的股權比例對另一家公司形成控制權,即公司實際控制人的發現問題。


圖6?藍色代表公司,黃色代表人

筆者在知識圖譜中采用圖的深度優先遍歷算法,基于股東關系,找到指定公司被持股的所有路徑。然后分別計算每一條路徑上的最上層的股東節點對其的持股比例,通過加法運算和比較,得到最終持股比例超過某個值 X 的最上層股東,即為該公司的實際控制人。

? 場景應用:企業所屬集團發現

企業集團整體的持股結構一般呈現金字塔式或者圍繞式的結構。在本文的企業知識圖譜中,企業之間的股東、分支關系,個人與企業之間的股東、高管和聯系人關系是組成企業集團的聯系。

圖7?藍色代表公司,黃色代表人

企業集團其緊密的組織結構和統一的管理模式,可以保證整個集團的規模經濟和整體競爭力。另一方面,存在以下幾種潛在威脅:

集團內部帶來了“牽一發而動全身”的潛在風險,增加經濟市場不穩定因素。

金融或監管機構失去對相互擔保、交叉持股等高風險行為的監管和判斷。

企業集團的邊界通常難以被界定,一些集團核心企業通過長投資、長控股鏈條以及外派高管、家族經營等方式控制外圍公司。這些公司很容易被認為是獨立運營的個體。

因此,找到企業的所屬集團,可以根據集團成員公司的生產經營狀態判斷整個集團的業務活動,或者根據集團核心企業的經營活動從而判斷其他企業成員的行為,這對及早地發現企業集團的潛在風險,對企業集團做出更有效的監管具有重要的意義。

通過算法,沿著一條股權控制路徑找到企業的實際控制人,然后通過實際控制人的所有股權控制路徑找到其他控股企業,形成一個股權控制骨架。在此過程中,當實際控制人控制的具有獨立法律地位的企業數量達到閾值時,則認為其可以構成企業集團。

圖8

如圖 8 ,是在知識圖譜中得到的部分企業集團概況,中間節點為公司,發散開的節點為個人,可以看出企業集團都是以某個公司或個人為核心形成的。通過企業所屬集團發現,可以快速定位企業所屬集團,以及該企業在集團內部的地位,這對分析企業風險傳播路徑、企業集團經營活動有很大的幫助。

CONCLUSION

總結

本次小普介紹了,基于現有的結構化數據,用自底向上的方式構建了一個企業關聯關系知識圖譜。并在此基礎上對企業之間的關聯關系進行挖掘分析,實現了關聯路徑查詢、企業實際控制人發現以及企業集團發現等模型應用。

在實際業務中可實現的關系還可以包括:企業的上下游關系、技術授權關系、產品銷售關系以及個人之間的夫妻、家族關系等,受到數據收集和處理難度的影響,并未加入到本文知識圖譜中。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢