1.什么是商業(yè)智能?
術(shù)語商業(yè)智能統(tǒng)稱為用于數(shù)據(jù)收集,集成,分析和可視化的工具和技術(shù)。我們從不同數(shù)據(jù)源收集的原始數(shù)據(jù)使用BI技術(shù)轉(zhuǎn)換為可理解的數(shù)據(jù)或有意義的信息。該信息通過查找趨勢和模式進(jìn)行戰(zhàn)略性解釋,以便通過分析數(shù)據(jù)揭示的事實(shí)支持業(yè)務(wù)決策。
為簡化概念,我們從各種來源收集原始數(shù)據(jù),并在商業(yè)智能工具的幫助下將其轉(zhuǎn)換為有意義的信息。我們可以將這些數(shù)據(jù)存儲在特定數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)文件,數(shù)據(jù)庫,數(shù)據(jù)倉庫或數(shù)據(jù)湖中。從數(shù)據(jù)倉庫,我們可以以報表,查詢的形式檢索存儲的數(shù)據(jù),制作儀表板進(jìn)行數(shù)據(jù)分析。我們使用稱為ETL(Extract,Transform,Load)的過程來完成此操作。因此,企業(yè)高管可以在不同級別上使用提取,轉(zhuǎn)換和加載的數(shù)據(jù)。他利用這一點(diǎn)通過分析數(shù)據(jù)揭示的有用見解來吸取見解并為決策提供動力。
2.什么是數(shù)據(jù)倉庫?
數(shù)據(jù)倉庫是將數(shù)據(jù)存儲在數(shù)據(jù)倉庫中的過程,數(shù)據(jù)倉庫是遵循關(guān)系數(shù)據(jù)庫模型的數(shù)據(jù)庫。從不同的數(shù)據(jù)源中選擇數(shù)據(jù),進(jìn)行匯總,組織和管理,以便為分析和查詢提供有意義的數(shù)據(jù)洞察。處理和管理我們在企業(yè)級別使用的大量數(shù)據(jù)的整體方法。在這種有益健康的方法中,數(shù)據(jù)不僅僅是從數(shù)據(jù)源中獲取操作或事務(wù)任務(wù),而是以我們用于分析和比較目的的某種方式進(jìn)行轉(zhuǎn)換。
數(shù)據(jù)倉庫由其他幾個術(shù)語所知,如決策支持系統(tǒng)(DSS),執(zhí)行信息系統(tǒng),管理信息系統(tǒng),商業(yè)智能解決方案,分析應(yīng)用程序。我們將其稱為決策支持系統(tǒng),因?yàn)樗峁┝擞杏玫囊娊夂湍J剑@些數(shù)據(jù)通過分析得出數(shù)據(jù),從而使業(yè)務(wù)中的重要決策變得簡單和安全。因此,在幾乎所有企業(yè)中,數(shù)據(jù)倉庫都與操作數(shù)據(jù)庫分開維護(hù)。我們僅將其用于交易目的,這在目的上更客觀。
3.數(shù)據(jù)倉庫如何運(yùn)作?
在正常操作數(shù)據(jù)庫中是完全標(biāo)準(zhǔn)化的數(shù)據(jù)或處于第三范式(3NF)。在3NF狀態(tài)中,數(shù)據(jù)庫中表的每個字段在功能上僅依賴于主鍵,并且不包含任何間接關(guān)聯(lián)。這意味著高度分支數(shù)據(jù),因此在這種情況下獲取數(shù)據(jù)是一個緩慢的過程。在數(shù)據(jù)倉庫中,數(shù)據(jù)被去標(biāo)準(zhǔn)化,即它從3NF轉(zhuǎn)換為2NF,因此被稱為大數(shù)據(jù)。我們稱之為大數(shù)據(jù),因?yàn)閿?shù)據(jù)冗余增加,因此數(shù)據(jù)大小增加。創(chuàng)建數(shù)據(jù)倉庫的唯一目的是快速檢索已處理的數(shù)據(jù)。此外,提供總計(jì)數(shù)據(jù),如總數(shù),平均數(shù),一般趨勢等,供企業(yè)分析和制定有利于其業(yè)務(wù)和行業(yè)運(yùn)作的決策。
4.數(shù)據(jù)倉庫的組件
數(shù)據(jù)倉庫有幾個組件協(xié)同工作,使數(shù)據(jù)倉庫成為可能。
運(yùn)營系統(tǒng):這些是企業(yè)中不同的運(yùn)營領(lǐng)域,它們有著獨(dú)特的目的,并為企業(yè)的正常運(yùn)作做出貢獻(xiàn)。不同的操作系統(tǒng)可以是營銷,銷售,企業(yè)資源規(guī)劃(ERP)等。所有這些系統(tǒng)都有自己的規(guī)范化數(shù)據(jù)庫。
集成層:不得操縱操作系統(tǒng)中存在的規(guī)范化數(shù)據(jù)。相反,我們將數(shù)據(jù)復(fù)制到集成層暫存區(qū)域,在該區(qū)域中以特定方式操作和轉(zhuǎn)換它。完成的一項(xiàng)基本操作是將復(fù)制的數(shù)據(jù)轉(zhuǎn)換為單一的標(biāo)準(zhǔn)化格式,因?yàn)樵诓僮飨到y(tǒng)中,數(shù)據(jù)不以相同的格式存在。例如,在數(shù)據(jù)字段中,數(shù)據(jù)可以在一個表中以磅為單位,在另一個表中以美元為單位。
數(shù)據(jù)倉庫:轉(zhuǎn)換后的標(biāo)準(zhǔn)化數(shù)據(jù)流入下一個元素,稱為數(shù)據(jù)倉庫,這是一個非常大的數(shù)據(jù)庫。因此,來自整個企業(yè)的數(shù)據(jù)存儲在該數(shù)據(jù)庫中以第二范式具有一定的統(tǒng)一格式和結(jié)構(gòu)。
數(shù)據(jù)集市:這些是數(shù)據(jù)倉庫中特定于目的的子數(shù)據(jù)庫,僅包含整個大數(shù)據(jù)的某些部分。在每個數(shù)據(jù)集市中,只有那些對特定用途有用的數(shù)據(jù)可用,就像有不同的數(shù)據(jù)集市用于與營銷,財(cái)務(wù),管理等相關(guān)的分析。這些數(shù)據(jù)庫中的每一個都不會彼此重合或共享他們的數(shù)據(jù)。在每個中執(zhí)行的操作不會影響另一個。這使得從數(shù)據(jù)集市中獲取數(shù)據(jù)比從更大的數(shù)據(jù)倉庫中獲取數(shù)據(jù)要快得多。
數(shù)據(jù)倉庫中的數(shù)據(jù)集市
數(shù)據(jù)倉庫是一個綜合數(shù)據(jù)庫,因?yàn)樗幚磉^的數(shù)據(jù)信息,可以直接由BI工具進(jìn)行分析。與此相反,如果直接從數(shù)據(jù)源獲取原始數(shù)據(jù),則可能會遇到數(shù)據(jù)格式不均勻,數(shù)據(jù)未結(jié)構(gòu)化且未排序等問題。為了防止所有這些發(fā)生,數(shù)據(jù)倉庫充當(dāng)原始數(shù)據(jù)庫和BI工具之間的中間數(shù)據(jù)源。數(shù)據(jù)倉庫合并從不同來源獲取的數(shù)據(jù),并為分析提供結(jié)構(gòu)和含義。它還有助于進(jìn)行數(shù)據(jù)挖掘,即在給定數(shù)據(jù)中查找模式。
5.商業(yè)智能和數(shù)據(jù)倉庫
數(shù)據(jù)倉庫和商業(yè)智能通常齊頭并進(jìn),因?yàn)閿?shù)據(jù)倉庫中提供的數(shù)據(jù)是商業(yè)智能工具使用的核心。億信BI,華為,Chartio,Looker等BI工具使用來自數(shù)據(jù)倉庫的數(shù)據(jù),用于查詢,報告,分析和數(shù)據(jù)挖掘等目的。
在任何企業(yè)中,商業(yè)智能在其順利和具有成本效益的運(yùn)作中發(fā)揮著核心作用。因此,BI有助于提高運(yùn)營效率,包括ERP報告,KPI跟蹤,風(fēng)險管理,產(chǎn)品盈利能力,成本核算,物流等。還有助于客戶互動,包括銷售分析,銷售預(yù)測,細(xì)分,活動策劃,客戶盈利能力等等
當(dāng)用戶需要與查詢相關(guān)的數(shù)據(jù)時,例如訂單何時發(fā)貨?本月有多少產(chǎn)品X商品已售出?等等。使用在線事務(wù)處理從傳統(tǒng)數(shù)據(jù)庫中獲取數(shù)據(jù)使用(OLTP)。也就是說,當(dāng)您需要數(shù)據(jù)作為直接問題或查詢的答案時,就會完成此類數(shù)據(jù)檢索。然而,如果您需要更多主觀和整體查詢的數(shù)據(jù),例如影響訂單處理時間的因素,每個產(chǎn)品線對毛利等的貢獻(xiàn),則使用數(shù)據(jù)倉庫。從我們之前的討論中,我們知道數(shù)據(jù)倉庫存儲已處理和聚合的數(shù)據(jù),這些數(shù)據(jù)最適合用作上述主觀查詢的答案。商業(yè)智能工具需要來自數(shù)據(jù)倉庫的此類數(shù)據(jù)。數(shù)據(jù)通過在線分析處理(OLAP)傳輸。事實(shí)證明,數(shù)據(jù)倉庫和OLAP是使用OLTP的舊決策應(yīng)用程序急需的跳轉(zhuǎn)。截至當(dāng)時,數(shù)據(jù)質(zhì)量較差,而非標(biāo)準(zhǔn)化格式的非結(jié)構(gòu)化數(shù)據(jù)。也,分散的數(shù)據(jù)和從源頭檢索數(shù)據(jù)是一個緩慢的過程。因此,幾乎所有企業(yè)都轉(zhuǎn)而使用OLAP和數(shù)據(jù)倉庫模型。
6. 商業(yè)智能與數(shù)據(jù)倉庫的相關(guān)性
數(shù)據(jù)倉庫和BI的體系結(jié)構(gòu)
第1步:從傳統(tǒng)數(shù)據(jù),工作簿,Excel文件等數(shù)據(jù)源中提取原始數(shù)據(jù)。
步驟2?:合并并集成從不同數(shù)據(jù)源收集的原始數(shù)據(jù),以存儲在稱為數(shù)據(jù)倉庫的特殊數(shù)據(jù)庫中。數(shù)據(jù)倉庫在概念上是一個數(shù)據(jù)庫,但實(shí)際上它是一個技術(shù)驅(qū)動的系統(tǒng),它包含已處理的數(shù)據(jù),元數(shù)據(jù)存儲庫等。我們從源獲取數(shù)據(jù)到數(shù)據(jù)倉庫的過程是ETL(Extract,Transform,加載)。這將從原始源中提取原始數(shù)據(jù),以不同方式轉(zhuǎn)換或操作它,并將其加載到數(shù)據(jù)倉庫中。
步驟3?:如果您希望將數(shù)據(jù)倉庫中的數(shù)據(jù)用于特定目的(如市場營銷分析,財(cái)務(wù)分析等),則會創(chuàng)建數(shù)據(jù)倉庫的子集,稱為數(shù)據(jù)集市和數(shù)據(jù)立方體。從數(shù)據(jù)倉庫到數(shù)據(jù)集市的數(shù)據(jù)也通過ETL。
步驟4?:從數(shù)據(jù)倉庫和數(shù)據(jù)集市,數(shù)據(jù)被重定向到數(shù)據(jù)或OLAP多維數(shù)據(jù)集,這些多維數(shù)據(jù)集的數(shù)據(jù)已準(zhǔn)備好供前端BI工具或客戶端使用。在前端,存在BI工具,例如查詢工具,報告,分析和數(shù)據(jù)挖掘。這些BI工具從OLAP多維數(shù)據(jù)集中查詢數(shù)據(jù)并將其用于分析。
7.當(dāng)前的商業(yè)智能和數(shù)據(jù)倉庫方案
隨著技術(shù)的變化和隨著時間的推移而變得越來越好,數(shù)據(jù)倉庫的替代品也被引入市場。它們是數(shù)據(jù)湖,ELT流程和自動化數(shù)據(jù)倉庫,可以加快數(shù)據(jù)處理和分析速度。像Hadoop這樣的數(shù)據(jù)湖和技術(shù)遵循Extract-Load-Transform,它比ETL更靈活。每當(dāng)BI工具需要數(shù)據(jù)時,我們從數(shù)據(jù)湖中獲取數(shù)據(jù)并相應(yīng)地進(jìn)行轉(zhuǎn)換以進(jìn)行分析。但是,企業(yè)仍然需要數(shù)據(jù)倉庫進(jìn)行分析,這需要結(jié)構(gòu)化和處理過的數(shù)據(jù)。
所以,這就是商業(yè)智能和數(shù)據(jù)倉庫。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)