日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

BI發展趨勢全景

時間:2022-04-29來源:仲夏夜瀏覽數:380

最近這段時間根據Gartner相關報告中涉及到了BI系統、數據分析的技術趨勢,進行了一些歸納總結,對于某些趨勢點,特意去找了現存的BI產品,讓我們腳踏實地的腦洞一下吧!

1

分析時刻

分析時刻是Gartner定義的一種數據分析流程,通過對數據進行可視化、探索和應用算法,支持業務成果的交付,從而做出更好或更快的決策,實現業務流程的自動化。

隨著數據使用門檻逐步降低,自助式、平臺式BI成為趨勢,數據分析的主動權會逐步轉移到業務人員手中,數據分析直接由遇到業務問題的業務人員發起,業務人員可以使用數據分析工具/平臺完成數據分析內容。

舉例:

當一名業務人員想知道某個商品的線上銷售預測,或者為什么購物車中的商品沒有被某些客戶轉化為購買,在過去,這名業務人員必須求助于IT部門的專業數據分析師(提取可能相關的數據,輸出特定分析報告)、數據科學家(建立預測模型),但是試想一下,如果BI系統中建立了常用的預測算法模型、歸因分析工具,可以方便的連接數據集,業務人員自主快速完成分析內容,他通過自助分析很快就知道了這幾個數據結論或者問題原因,從而做出業務上的反饋。

2

增強分析

增強分析主要是指以機器學習為基礎的數據分析和BI功能,通過機器學習、人工智能等技術的應用將常見通用的數據分析的場景沉淀為產品功能中,幫助普通用戶在沒有數據科學專家或 IT人員協助的情況下完成數據分析。

增強分析的底層理念是“簡單易用”,能夠支撐用戶在沒有專業知識背景下,完成數據的“收集-準備-整合和分析”全過程。

增強分析包含增強數據準備、增強機器學習、增強數據分析這些模塊。這里主要講在數據分析中的應用趨勢。

(1)NLP與NLG的應用

使用自然語言分析(NLP),通過語言和可視化來分析數據

舉例:ThoughtSpot使用搜索和NLP作為訪問數據的主要界面,用戶可以通過打字或者語音提出問題。

對話式數據分析的數據機器人

自然語言轉化成 SQL,再將 SQL 結果集轉化成可視化的圖形,形成了"NL2SQL2Graph"的完整鏈路。

舉例:阿里小蜜(入口:淘寶)

使用自然語言生成(NLG),將機器分析出的觀點結論以語言形式展現給用戶

舉例:tableau的explain Data功能,會自動針對所選值提供由 AI 驅動的解釋。此功能會在后臺檢查數百個可能的解釋,并呈現可能性最大的那些解釋。

這個功能是如何實現的?在tableau的2020.2 new feature網絡研討會上對explain data性能增強的介紹下讓我們可以大概知道運行原理:

當你點擊某個數據值進行explain data時,系統會自動對數據集的每一個維度、每一個度量都進行交叉計算,判斷需要解釋的數據值是高于還是低于預期(均值)。

以高于預期為例,explain data會嘗試做以下幾類解釋:

先去掃描所有的維度信息,看是否有顯著的維度(這個維度的值普遍偏高);

然后去考察記錄數(數據條數),是否是由于數據記錄數較高導致;

再次,考慮極端值的情況,是否是因為某個極端值造成了偏高。

在新版的explain data中,對計算的維度范圍進行了限制(不再對所有維度進行解析,有一些明顯值過多的維度、包含了平均值的維度都會默認被忽略),這能解決以前數據集較大或者維度偏多explain data會比較慢的問題。

(2)自動洞察和自動可視化

自動洞察( automated insights )

自動洞察是指機器自動地從數據中發現潛在信息和價值:發現數據之間的關聯、發現數據異常、自動進行聚類。

現在大部分的主流 BI 平臺都有自動洞察的相關功能推出。舉例:

微軟的 PowerBI 的Quick Insights 功能能夠自動對于源數據做出各種交叉的一階或者多階計算 ( 百分比,排序,同環比 ),從而挖掘數據內部各種趨勢。

自動可視化 ( automated visualization )

根據數據結果自動的選擇可視化的方式進行展示,以清晰的展現數據分析結果。

有2個方向:

自動選擇圖表:當查詢出數據集后,機器會根據數據特點,自動生成合適的圖表。圖表自動化現在主流的BI工具都已經支持了,比如tableau,選擇好數據集后第一眼看到的不是數據,而是自動的可視化圖表,而當維度變多后,會自動將現有圖表拆分成多個。

自動生成報告:比自動選擇圖表更高一層,自動生成報表布局、配置控件、圖表聯動等。

技術上有2種實現思路:

基于規則:預先設置好規則庫,根據規則生成圖表,規則庫的質量是關鍵。

基于模型:將問題轉化為分類或者排序問題,數據本身的特征與可視化圖表的特征是關鍵。

3

嵌入式分析

將特定的數據分析方法集成到業務系統中。

比如,BI系統的頁面可以用于嵌入到其他系統中,這樣對產品未來發展很有好處:

能夠擴大BI的適用范圍,也便于未來產品規劃的升級

業務人員在產生數據的系統內就能看到數據的分析結果,增加了體驗,并且使用起來流程、體驗都很順

預測和決策建議

通過大量人工業務分析總結出的業務經驗、再加上AI和機器學習技術的加持,讓機器一次性完成業務分析和行動建議。

比如:taobao的生意參謀,數據現象后面緊跟著操作建議、業務技巧。

這種功能如何實現呢?看起來很高大上,其實說起來也有簡單的方法:

首先提煉出數據表現背后代表的業務場景,根據數據表現判斷屬于哪一種業務場景,再推送出對應的解釋和建議,這種實現方式的特點是,業務已經比較成熟,能夠很好的抽象出業務上數據和策略的關系。實現上使用規則就可以很好的滿足初期的需求,是的,重點是梳理好對應的規則庫。

我個人比較推薦這種成本低的決策建議,在項目初始的短期內就能夠達到比較好的效果,給未來迭代升級提供很好的ROI支持。

參考資料:

《Quick Insights With Power BI》(Madan Bhintade,C#Corner)

《增強分析技術原理與實踐》(馬玥、丁建棟 阿里巴巴,DataFunTalk)

《Gartner對于建設數據中臺的建議》

Tableau中國官網

ThoughtSpot官網

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢