- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2019-12-05來源:億信華辰瀏覽數:705次
隨著大數據的不斷發展, BI從1.0報表時代,到注重可視化的2.0時代,再到降低數據分析門檻的智能BI 3.0時代,該領域為業務分析帶來了技術上的變革。
今年億信華辰發布的全新一代不用做表的智能BI——智問,是AI+BI最好的落地應用。你只需簡單地輸入或者語音提問一個問題,智問就會給你一個可視化的圖表答案。
比如:你想了解xx醫院今年的醫療收入,只需要對智問說 “xx醫院的醫療收入”,就會瞬間把醫院的數據呈現在你面前。
看起來好像很簡單,如果數據是公開的,似乎任何一個者搜索引擎都可以實現。但是,如果進一步提問醫療收入的具體收入構成及比重,如果沒有現成數據,搜索引擎是給不了答案的。如何解決這個問題,這時候就需要用到知識圖譜技術了。
知識圖譜作為AI技術最重要基礎設施之一,從概念上來說,知識圖譜(Knowledge Graph)又稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。簡單來說,知識圖譜反應了現實生活中各個知識體之間的聯系和關系。下圖是一個典型的知識圖譜:
一個知識圖譜通常來說由三個部分組成,包括實體、關系和三元組集合。其中實體定義的是自然界中真實存在的東西,關系定義實體與實體之間的聯系,三元組集合由多個三元組構成,三元組的基本形式主要包括實體1、關系、實體2和概念、屬性、屬性值等,實體是知識圖譜中的最基本元素,不同的實體間存在不同的關系。概念主要指集合、類別、對象類型、事物的種類,例如人物、地理等;屬性主要指對象可能具有的屬性、特征、特性、特點以及參數,例如國籍、生日等;屬性值主要指對象指定屬性的值,例如中國、1988-09-08等。
通過定義這些概念,我們就可以輕易地定義出各個實體之間的關系,并根據這些關系做出一些深入的分析。
還是之前的那個問題,在智問中,我們可以定義這樣一些三元組,將醫療收入相關的組成部分和醫療收入有機關聯起來。然后我們就可以根據定義的關系直接問出字段中隱含的業務知識。操作如下圖所示:
在這里我們定義了醫療收入由門診醫療收入和住院醫療收入兩部分組成,同時這兩個收入下面還包含了更多的子收入。這些三元關系定義完成之后,我們就可以像問一個熟練的業務人員一般輕松地問出“xx醫院的醫療收入情況怎么樣?”這樣的問題了。
不喜歡這種展現方式,也沒有關系,你也可以問“xx醫院的醫療收入占比“。
你可能會奇怪,明明醫療收入下只定義了兩個收入,為什么圖表中會多出一個其他來。這就是智問對于知識圖譜的優化了,除了傳統的定義圖譜方式,我們可以一鍵在醫療收入這個上級屬性中定義出需要顯示其他收入,這樣我們可以直觀地看出上級屬性和下級屬性之間的數據差異,方便排查數據和數據結構。
當然知識圖譜并不只是做了這一件事,對于其他方面,包括自然語言理解、輔助計算等也有很多重要的作用,更多信息請保持對我們的關注,我們會在后續的文章中逐步為大家解答。