日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺

睿治作為國內(nèi)功能最全的數(shù)據(jù)治理產(chǎn)品之一,入選IDC企業(yè)數(shù)據(jù)治理實施部署指南。同時,在IDC發(fā)布的《中國數(shù)據(jù)治理市場份額》報告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場份額第一。

多樣性數(shù)據(jù)源報表如何做?

時間:2022-11-09來源:時光隊長瀏覽數(shù):193

現(xiàn)代應(yīng)用已經(jīng)進入多數(shù)據(jù)源階段了,不再是一個單一的數(shù)據(jù)庫包打天下,一個應(yīng)用中會涉及除關(guān)系數(shù)據(jù)庫外各種數(shù)據(jù)源,如文本文件類數(shù)據(jù)、NOSQL、多維數(shù)據(jù)庫、HTML Webservice 等等,即使是關(guān)系數(shù)據(jù)庫,也可能不止一個應(yīng)用這樣了,那么應(yīng)用中的報表自然也會涉及到多樣性的數(shù)據(jù)源了現(xiàn)在的報表,基本都是用報表工具來做,很多報表工具都號稱支持多數(shù)據(jù)源,是不是能解決這個問題呢?其實只能搞定一點點

報表工具能輕松搞定的多源數(shù)據(jù)長什么樣

簡單的說,來自關(guān)系數(shù)據(jù)庫的多源數(shù)據(jù)都比較好搞定,不管是多表,還是多庫,都很簡單,用 SQL 把各個來源的數(shù)據(jù)都取出來,放到報表中去關(guān)聯(lián)、計算、呈現(xiàn)就可以


這樣的多源數(shù)據(jù),好一點的報表工具都可以輕松應(yīng)對

報表工具不好搞定的多源數(shù)據(jù)長什么樣

也可以簡單的說,不是單純的關(guān)系數(shù)據(jù)庫的多源數(shù)據(jù),報表工具都不太好做進入大數(shù)據(jù)時代以來,數(shù)據(jù)不僅是大了,而且存儲的方式也多了,除了傳統(tǒng)的關(guān)系數(shù)據(jù)庫外,還有:

1. TXT/CSV、Excel、JSON/XML 等文件;

2. MongoDB、Cassandra、HBase、Redis 這些 NoSQL 數(shù)據(jù)庫;

3. HDFS 等分布式文件系統(tǒng);

4. webService;

5. ES、Kafka 等其他數(shù)據(jù)源形式


文件類的某些報表工具還能搞定,但也只限于讀,而不會算,只能先全部讀入到報表中,然后再利用報表的計算能力來計算處理,數(shù)據(jù)量大時,讀取的效率和空間容量都可能會成為問題,(極個別的工具可以邊讀邊匯總過濾,還能并行流式讀取,會好很多);其它類的數(shù)據(jù)源大部分報表工具就連讀都不會了,因為沒有標準,每家有各自的 API,想要讀取,大部分都得通過 JAVA 自定義數(shù)據(jù)集的方式了

讀取都比較費勁,而這些數(shù)據(jù)常常在業(yè)務(wù)邏輯上又有關(guān)聯(lián),做報表的時候大部分時候都會涉及到多個數(shù)據(jù)源之間的關(guān)聯(lián)混算,單憑報表工具提供的多源關(guān)聯(lián)能力處理起來就更困難了

報表工具解決不了只能硬編碼

報表工具解決不了,但也難不倒工程師,因為工程師會編碼,沒有什么是編碼解決不了的

工程師可以先把異構(gòu)的數(shù)據(jù)變成同構(gòu)的,比如把文件的數(shù)據(jù)先導(dǎo)入到 RDB 中,由 RDB 計算后再給報表用,而那些不會讀的,就只能再一次依靠所有報表工具都提供的所謂自定義數(shù)據(jù)原接口了,用 JAVA 讀入并處理好,再傳給報表。

項目中,很多困難的多源混算情況,都是這么處理的,都能搞定,但是這么做其實弊端很多

異構(gòu)變同構(gòu),其實大部分時候是把不同的數(shù)據(jù)強行裝入到常見關(guān)系數(shù)據(jù)庫中,然后再利用 SQL 的方式來處理計算,這樣做,首先得考慮數(shù)據(jù)庫本身的管理和壓力,管理上是否允許這樣操作,容量是否夠,每次遇到這樣的庫外數(shù)據(jù)都要往數(shù)據(jù)庫中放?

然后還得考慮時效,數(shù)據(jù)的導(dǎo)入都需要時間,量少的耗時短可能無所謂,量大的可能進度都被耽誤了,而且一般業(yè)務(wù)數(shù)據(jù)都是實時變動的,導(dǎo)入數(shù)據(jù)的方式也基本很難保證數(shù)據(jù)的實時性,還有些變不了或者變起來極困難的,像 json/xml 多層數(shù)據(jù)(mongodb 也是這種),要建很多表,想變都變不了

JAVA 處理的話,要好很多,不用考慮入庫的一系列問題,實時性也可以保證,但是開發(fā)成本高,還會破壞應(yīng)用架構(gòu)

JAVA 開發(fā)人員的成本本身就高,然后 JAVA 計算數(shù)據(jù)的能力還很弱,寫起來工作量很大,簡單做個求和運算都需要寫數(shù)行代碼的循環(huán)來實現(xiàn),更別說邏輯復(fù)雜的運算了,動輒幾百行的代碼,一個報表還可以承受,報表一多,就承受不了這樣的高成本了

另外 JAVA 代碼需要和項目應(yīng)用一起編譯,也會帶來報表和應(yīng)用高耦合的問題,還會影響報表本身熱切換的能力。

(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)
立即申請數(shù)據(jù)分析/數(shù)據(jù)治理產(chǎn)品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢