日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

億信ABI

一站式數(shù)據(jù)分析平臺

ABI(ALL in one BI)是億信華辰歷經19年匠心打造的國產化BI工具,技術自主可控。它打通從數(shù)據(jù)接入、到數(shù)據(jù)建模與處理、再到數(shù)據(jù)分析與挖掘整個數(shù)據(jù)應用全鏈路,可滿足企業(yè)經營中各類復雜的分析需求,幫助企業(yè)實現(xiàn)高效數(shù)字化轉型。

億信ABI

一站式數(shù)據(jù)分析平臺

億信華辰深耕商業(yè)智能十多年,
打造一體化的填報、處理、可視化平臺。

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

時間:2019-12-13來源:億信華辰瀏覽數(shù):816

數(shù)據(jù)的價值和作用在企業(yè)內受到了越來越多的關注,每個企業(yè)都可以嘗試構建自己的大數(shù)據(jù)平臺,積累數(shù)據(jù)資產。以 Hadoop、Spark 為代表的開源大數(shù)據(jù)處理框架發(fā)展日新月異。如何選擇最適合自己的大數(shù)據(jù)平臺組件,打造自己的大數(shù)據(jù)平臺已經成為企業(yè)的迫切需求。

億信華辰作為數(shù)據(jù)全生命周期產品廠商,數(shù)據(jù)分析數(shù)據(jù)治理產品獨領風騷,其在數(shù)據(jù)存儲領域也有一席之地。億信華辰旗下PetaBase-i是基于開源Hadoop 2.0 平臺基礎上開發(fā)的、具有軟件著作權的國產分布式實時大數(shù)據(jù)平臺產品,可為超大規(guī)模數(shù)據(jù)管理提供實時數(shù)據(jù)采集轉換和計算存儲的功能,用于支撐準實時數(shù)據(jù)倉庫系統(tǒng)、敏捷BI系統(tǒng),為用戶提供一套靈活易用的大數(shù)據(jù)平臺解決方案。

平臺架構

PetaBase-i實時計算平臺包含4層:

第一層是采集層,負責從外部數(shù)據(jù)源中攝取各類數(shù)據(jù),包括:結構化和半結構化數(shù)據(jù),數(shù)據(jù)的接入方式既支持通過sqoop等ETL工具跑批也支持通過Flume實時采集。

第二層是數(shù)據(jù)存儲層,負責整個平臺的非結構化/半結構化數(shù)據(jù)和結構化數(shù)據(jù)存儲。其中,hdfs負責存儲歸檔的海量歷史數(shù)據(jù),使用數(shù)倉模型進行組織,形成面向主題的、集成的、穩(wěn)定的且隨時間不斷變化的數(shù)據(jù)集合。為其上計算層提供數(shù)據(jù)支持。PetaBase-i使用了一種嵌套的列式存儲和高效壓縮技術,顯著降低了存儲空間的要求。近實時數(shù)據(jù)統(tǒng)一存儲在kudu中,以兼顧隨機查詢和實時更新的混合需求。

第三層是計算層,融合了MapReduce、spark、impala等分布式計算框架,提供實時和離線混合計算模型。

第四層是服務層,包括:數(shù)據(jù)存儲、數(shù)據(jù)ETL、數(shù)據(jù)檢索、實時計算、流數(shù)據(jù)采集等,為應用層提供計算訪問接口和服務。

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

架構圖

PetaBase-i整套軟件是構建在Hadoop軟件棧之上的,具體包括:

  • Apache Hadoop,提供分布式文件存儲系統(tǒng)(即HDFS),PetaBase-i的數(shù)據(jù)文件存儲在HDFS中。支持CSV、RCF、Parquet、Avro、Sequence File等多種數(shù)據(jù)文件格式;
  • Apache Zookeeper,提供高可用的集群資源管理、調度;
  • Apache Hive,原本是數(shù)據(jù)倉庫管理查詢工具,在PetaBase-i中,Hive提供元數(shù)據(jù)存儲、管理等功能;
  • Impala,分布式、高性能、支持SQL的大數(shù)據(jù)并行查詢引擎。主要由數(shù)據(jù)庫目錄服務、集群狀態(tài)服務、查詢計劃引擎、分布式執(zhí)行引擎四大服務組件組成。
  • MapReduce,用于大規(guī)模數(shù)據(jù)的并行運算框架,具有易于編程、良好的擴展性和高容錯性等優(yōu)點,適合PB級以上海量數(shù)據(jù)的離線處理。
  • Spark,為大規(guī)模數(shù)據(jù)處理而設計的快速通用的、基于內存的、分布式的計算引擎,包含機器學習(MLib)功能的程序庫、Spark Streaming流式計算引擎、Graphx圖處理框架,PetaBase-i使用Spark 提供的Spark Streaming 對實時數(shù)據(jù)進行流式計算。
  • HBase,是一個分布式的、面向列的NoSQL數(shù)據(jù)庫,主要應用于高并發(fā)、海量數(shù)據(jù)的快速寫入和查詢場景。
  • Kudu,一個全新的存儲系統(tǒng),定位于提供在更新更及時的數(shù)據(jù)上做更快的分析。彌補hdfs存在不支持單條記錄級別的update操作,隨機讀寫性能差的不足。

功能特點

1、定位混合計算場景

集成MapReduce、Spark、impala等多種計算框架,利用YARN資源管理做統(tǒng)一管理,可在海量數(shù)據(jù)集上同時進行離線計算和流式處理。滿足高吞吐、大數(shù)據(jù)量和低時延實時處理等多方面的數(shù)據(jù)計算要求。

2、實時/離線一體化處理

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i借鑒了目前影響最深刻的大數(shù)據(jù)處理架構Lambda,將變化的數(shù)據(jù)并行寫到批和流處理系統(tǒng)內,將不同的計算邏輯分別在流和批系統(tǒng)中實現(xiàn),并且在查詢階段合并流和批的計算視圖并展示給用戶。

3、彈性擴展

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i很好的繼承了Hadoop可擴展性的優(yōu)點,隨著集群節(jié)點數(shù)的擴充,其查詢并發(fā)能力將隨節(jié)點數(shù)增加而增大。而查詢的響應時間,也會隨著節(jié)點數(shù)的增多而縮短。

4、高可用和高容錯性

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i可配置為高可用的部署模式,即架設兩臺管理節(jié)點,一臺處于活動狀態(tài),別一臺處于待命狀態(tài)。待命主節(jié)點實時監(jiān)聽活動主節(jié)點,當活動主節(jié)點失效時,系統(tǒng)即時將備用主節(jié)點切換為活動主節(jié)點,達到整個系統(tǒng)高可用的目的。容錯性方面,基于HDFS文件數(shù)據(jù)塊多副本分布存儲的特性,同一個數(shù)據(jù)塊有多個副本存放到不同的數(shù)據(jù)節(jié)點上,保證某個數(shù)據(jù)節(jié)點失效的情況下,其它數(shù)據(jù)節(jié)點上仍然有可用的數(shù)據(jù)塊。PetaBase-i還提供查詢負載均衡功能,可以將查詢請求分攤到不同的集群節(jié)點上執(zhí)行,從而使不同的客戶端訪問不同的集群節(jié)點,達到負載均衡的目的。

5、高效的數(shù)據(jù)壓縮與存儲

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i支持一種嵌套的列式數(shù)據(jù)存儲模型。列式存儲和行式存儲相比具有以下優(yōu)勢:

  • 可以跳過不符合條件的數(shù)據(jù),只讀取需要的數(shù)據(jù),降低IO數(shù)據(jù)量。
  • 壓縮編碼可以降低磁盤存儲空間。由于同一列的數(shù)據(jù)類型是一樣的,可以使用更高效的壓縮編碼(例如Run Length Encoding和Delta Encoding)進一步節(jié)約存儲空間。
  • 只讀取需要的列,支持向量運算,能夠獲取更好的掃描性能。

6、高性能分布式計算框架

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i使用了與傳統(tǒng)并行計算系統(tǒng)不一樣的分布式計算架構,具有更優(yōu)異的計算性能。提交到PetaBase-i的SQL查詢由查詢計劃器進行解析,生成執(zhí)行計劃樹,執(zhí)行計劃樹由若干計劃任務分片節(jié)點組成。每個計劃分片節(jié)點代表一個執(zhí)行節(jié)點以及相關的操作(比如:聚集、數(shù)據(jù)交換、數(shù)據(jù)掃描、Join、合并、排序等操作),并被分發(fā)到任務分片對應的PetaBase-i數(shù)據(jù)節(jié)點上并行執(zhí)行。

7、豐富的數(shù)據(jù)訪問接口

PetaBase-i提供多種應用程序接口,包括JDBC、ODBC、CLI、Thrift等。PetaBase-i除了兼容SQL-99標準,還支持大部分SQL-2003標準。PetaBase-i的SQL語法基本同Hive SQL兼容,語法上同其它數(shù)據(jù)庫SQL語法大體一致,其它數(shù)據(jù)庫的從業(yè)人員可以平滑的過渡到PetaBase-i上進行數(shù)據(jù)分析工作。

8、靈活的數(shù)據(jù)采集方式

PetaBase-i提供了一個產品化的實時流數(shù)據(jù)集成加工套件。這個工具提供豐富的通信協(xié)議接口 ,最大化地簡化采集作業(yè),對實時流數(shù)據(jù)的數(shù)據(jù)集成和數(shù)據(jù)加工處理可快速實施,無需寫代碼,通過可視化配置執(zhí)行流處理作業(yè)。PetaBase-i還提供了JDBC/ODBC接口,能支持幾乎所有的通用ETL工具產品。

9、便捷的可視化運維管理

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i提供基于Web的控制臺界面,以監(jiān)控儀表盤形式,對PetaBase-i數(shù)據(jù)庫信息、集群CPU、內存、磁盤空間、數(shù)據(jù)庫會話以及節(jié)點狀態(tài)進行實時監(jiān)控。

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i Web控制臺提供Hadoop集群及PetaBase-i集群節(jié)點管理功能,可以集中的對數(shù)據(jù)庫集群進行整體控制,資源監(jiān)控,也可以對單個節(jié)點進行管理,了解各節(jié)點資源使用情況,進行會話管理等。

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i Web控制臺提供類PL/SQL Developer IDE的數(shù)據(jù)庫管理功能,可以在Web界面上完成在命令行界面進行的大部分操作,還提供一些額外的高級特性,包括建庫、建表、SQL查詢編輯器、執(zhí)行計劃、導入、導出、數(shù)據(jù)復制等。

10、超強的查詢性能

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i架構于Hadoop之上,采用MPP架構,及優(yōu)化的列存儲格式,結合存儲分區(qū)、分布式緩存等技術,并針對特定SQL和函數(shù)進行性能優(yōu)化,充分利用集群多節(jié)點的計算能力和內存,能支持復雜的多表JOIN,總體性能相比Hive有數(shù)倍甚至上百倍提升。

11、高度集成的工程化產品

快用這個神器打造實時大數(shù)據(jù)平臺,10大功能助力數(shù)字化轉型

PetaBase-i具有更高的軟件集成度,集成了Hadoop生態(tài)系統(tǒng)的多種基礎軟件,無需額外安裝。這些集成化的組件和功能,從整體上節(jié)省軟件開銷,降低使用和運維門檻,方便、有效的保證大數(shù)據(jù)庫系統(tǒng)的落地部署,工程化實施。

結語:作為具有創(chuàng)新性的實時大數(shù)據(jù)平臺,PetaBase-i能夠幫助各個行業(yè)的企業(yè)在海量的數(shù)據(jù)中洞察更多隱藏的商業(yè)價值。億信華辰作為大數(shù)據(jù)時代的參與者、助力者,會持續(xù)在數(shù)字化轉型的道路上為企業(yè)披荊斬棘、保駕護航。

(部分內容來源網絡,如有侵權請聯(lián)系刪除)
立即申請數(shù)據(jù)分析/數(shù)據(jù)治理產品免費試用 我要試用
產品功能
數(shù)據(jù)填報

對分析表中的數(shù)據(jù)進行補錄或修改

數(shù)據(jù)處理

在可視化建模的同時同步完成ETL流程設計

大屏可視化

可任意制作酷炫靈動的圖標和大屏

自助式分析

只需簡單拖拽維度和指標即可生成相應的分析圖表

預測挖掘

讓繁瑣復雜的數(shù)據(jù)挖掘過程變得簡單易用

customer

在線咨詢

在線咨詢

點擊進入在線咨詢