日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

億信ABI

一站式數據分析平臺

ABI(ALL in one BI)是億信華辰歷經19年匠心打造的國產化BI工具,技術自主可控。它打通從數據接入、到數據建模與處理、再到數據分析與挖掘整個數據應用全鏈路,可滿足企業經營中各類復雜的分析需求,幫助企業實現高效數字化轉型。

億信ABI

一站式數據分析平臺

億信華辰深耕商業智能十多年,
打造一體化的填報、處理、可視化平臺。

圖形數據庫的優點:更簡單的數據建模和分析

時間:2019-02-27來源:億信華辰瀏覽數:1299

作為咨詢公司Booz Allen Hamilton首席數據科學家,Kirk Borne是從數據連接角度來看這個世界。Borne稱:“生活是關于,誰連接到誰,什么連接到什么。”他指出圖形數據庫和圖形分析應用程序是利用這種連接的新方法。

這是因為,圖形數據庫(NoSQL軟件的一種形式)記錄數據點之間連接的方式與主流關系數據庫完全不同。圖形系統不是將數據作為表格中的元素,而是作為節點,通過邊緣相互鏈接,其中有一組屬性表明節點之間關系。

因此,圖形數據庫的一個優點是,它們允許數據分析師瀏覽數據集,而無需創建和運行復雜查詢以將表組合在一起,正如在關系模型中那樣。

Borne說:“從數據發現的角度來看,圖形更具意義”。根據Borne和其他人的說法,當圖形算法和分析工具應用于數據集時,基本功能(例如聚類、分區、搜索和估計節點之間的最短路徑)會暴露數據中的模式。

圖形用例增加

Borne指出,圖表方法已成為部分主流在線應用的基礎。這包括谷歌搜索引擎及其Knowledge Graph中的頁面排名系統,Knowledge Graph匯集來自各種在線資源的事實數據。 Facebook和LinkedIn也在使用圖表來映射朋友圈和關系網。此外,圖形分析還用于在線推薦引擎。

在這些情況中,這些應用程序都沒有部署在圖形數據庫中;圖形可在各種平臺中構建、存儲和管理,包括關系型平臺。供應商和IT團隊對圖形數據庫技術的興趣日益濃厚,他們主要關注欺詐檢測、網絡安全、文本分析、數據目錄、數據管理以及科學研究等。

同時,大數據的崛起也在促使更多用戶考慮圖形數據庫和圖形數據建模方法,Borne稱:“現在,圖形工具還有更多豐富的數據可供發現。”

例如,德國慕尼黑糖尿病研究中心數據和知識管理負責人Alexander Jarasch指出,Neo4j Inc.的同名圖形數據庫為他們提供了一個平臺,可收集和分享各種基因數據和其他與糖尿病有關的信息。

Jarasch說,該中心以德語縮寫DZD被人們所熟知,該中心正在使用Neo4j努力為糖尿病患者創造新療法并找到預防該疾病的方法。他于2017年4月開始使用圖形數據庫進行腳本編寫和原型設計工作,去年他的另外兩名團隊成員也加入了這項工作。

圖形數據庫供應商Neo4j的Bloom數據探索軟件創建的可視化突出展現了公司、人員和城市之間的連接。

再見,數據連接

Jarasch從事生物信息學研究長達10多年,他對關系型數據庫產生了厭惡,或者說至少對數據連接產生厭惡,這通常是關系查詢的核心。他表示:“我討厭連接,當你的數據分散在表格中,并試圖尋找見解時,事情會變得很復雜。”

Jarasch和他的同事正在試圖使用Neo4j數據庫以便在DZD中更容易地共享各種數據。DZD由很多獨立的研究組織組成。根據Jarasch的說法,這些數據來自醫院、實驗室和其他來源。有些數據是關于人類的,還有的則是關于實驗動物。他指出:“每個人都有自己的數據,他們交換數據,但沒有任何主要方式來連接數據。”這就是他想通過圖形技術實現的目標。

首先的步驟側重于創建與原始數據相關的元數據,以便研究人員可看到可用于分析的內容。隨后再使用圖形分析應用程序。Jarasch表示,他預計今年可以為一兩個研究項目提供數據,其中包括一個將人類匿名數據與小老鼠和豬數據關聯的項目。

盡管部署Neo4j,但Jarasch認為在DZD仍然會需要使用關系數據庫。只是說,圖形數據庫軟件為研究科學家提供了“查看其數據的額外層”。

大量圖形選項

對于希望獲得圖形數據庫優勢的其他用戶來說,市面上有各種技術選項。除Neo4j之外,原生圖形數據庫供應商還包括Cambridge Semantics、Cray、Franz、Ontotext和TigerGraph。云平臺市場領導者AWS也提供圖形數據庫,名為Amazon Neptune,該數據庫已于2017年底推出。

其他云提供商也有圖形技術。例如微軟的Azure Cosmos DB多模型數據庫可用于存儲和管理圖形數據。IBM通過名為Compose for JanusGraph的托管服務在其云端支持JanusGraph開源數據庫。

此外,甲骨文數據庫和Microsoft SQL Server等關系數據庫也可進行圖形處理和分析。DataStax、MarkLogic、Redis等其他類型的NoSQL數據庫管理系統也支持圖形功能。同時,Apache Spark分析引擎支持并行圖形計算。

歷史上來看,圖形數據庫分為兩類。除那些支持具有節點和邊緣的屬性圖形之外,還有RDF數據庫,它是基于Resource Description Framework(資源描述框架),并且關注數據的語義方面,信息存儲在包含名詞、動詞和對象的三元組中。但隨著供應商開始支持這兩種類型,這種區別正在變得模糊。

通過圖形支持電網

劉光懿(Guangyi Liu,音譯)目前正在使用TigerGraph的大規模并行處理圖形數據庫,以構建可實時匹配電力供需的系統。

北美全球能源互聯研究所(GEIRINA)首席技術官劉光懿表示,在電力分配中部署實時分析性能一直是公用事業行業的夢想。GEIRINA是位于加利福尼亞州圣何塞的研發中心,隸屬于中國國家電網,這是一家位于北京的政府公用事業公司。

劉光懿的團隊正在試圖在拓撲上進行大規模線性方程處理,該拓撲代表來自電網中數百萬傳感器、執行器、繼電器和開關的信號。該項目始于2015年,他們最初測試了甲骨文的關系數據庫軟件。但是像Jarasch一樣,劉發現了關系方法的缺點。

他表示:“對于甲骨文數據庫,你需要將表格轉換為數據結構—體現系統拓撲。然而,對于TigerGraph,拓撲就在那里。”劉表示,圖形數據庫還可以并行運行數據搜索和計算。

Bloor Research公司分析師Philip Howard表示,他預計圖形技術的應用將繼續擴大范圍。特別是對于很多現代應用程序中大規模“誰知道誰?”問題,他指出了圖形數據庫相對于關系型軟件的優勢。

然而,圖形工具目前主要被用作關系數據庫或其他類型的NoSQL系統的附屬物。他指出,圖形可提供一種更自然的方式來建模和連接數據,但在評估和選擇數據管理平臺時,IT團隊仍然傾向于“在表格內”思考。


(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢