商業(yè)智能不是什么新技術(shù),它只是OLAP和數(shù)據(jù)挖掘,數(shù)據(jù)倉庫等技術(shù)的綜合運用。下面分別介紹一下商業(yè)智能BI、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘DM的概念。
商業(yè)智能BI
商務(wù)智能(BI),用來幫助企業(yè)更好地利用數(shù)據(jù)提高決策質(zhì)量的技術(shù)集合,是利用現(xiàn)代信息技術(shù)收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的業(yè)務(wù)數(shù)據(jù)和信息,創(chuàng)造和積累業(yè)務(wù)知識,并改進(jìn)業(yè)務(wù)決策的過程。簡單講就是業(yè)務(wù)、數(shù)據(jù)、數(shù)據(jù)價值應(yīng)用的過程。換句話來說,BI是一套完整的解決方案,可以將來自企業(yè)的不同業(yè)務(wù)系統(tǒng)(如ERP、CRM、OA、BPM等,包括自己開發(fā)的業(yè)務(wù)系統(tǒng)軟件)的數(shù)據(jù),提取出有用的數(shù)據(jù)進(jìn)行整合清洗,在保證數(shù)據(jù)正確性的同時,進(jìn)行數(shù)據(jù)分析和處理,并利用合適的查詢和分析工具快速、準(zhǔn)確地為企業(yè)提供報表展現(xiàn)與分析,為企業(yè)提供決策支持。簡單概括這個過程所體現(xiàn)的三個大的部分就是:數(shù)據(jù)源收集,數(shù)據(jù)倉庫的數(shù)據(jù)準(zhǔn)備,可視化報表展現(xiàn)和數(shù)據(jù)分析。
數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化的、但信息本身相對穩(wěn)定的數(shù)據(jù)集合,用于對管理決策過程的支持。也就是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。目的是為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時間、成本、質(zhì)量以及控制。數(shù)據(jù)倉庫具備以下四個特點:
面向主題:數(shù)據(jù)倉庫都是基于某個明確主題,僅需要與該主題相關(guān)的數(shù)據(jù),其他的無關(guān)細(xì)節(jié)數(shù)據(jù)將被排除掉
集成的:從不同的數(shù)據(jù)源采集數(shù)據(jù)到同一個數(shù)據(jù)源,此過程會有一些ETL操作
隨時間變化:關(guān)鍵數(shù)據(jù)隱式或顯式的基于時間變化
數(shù)據(jù)倉庫的數(shù)據(jù)是不可更新的:數(shù)據(jù)裝入以后一般只進(jìn)行查詢操作,沒有傳統(tǒng)數(shù)據(jù)庫的增刪改操作。數(shù)據(jù)倉庫的數(shù)據(jù)反映的是一段相當(dāng)長的時間內(nèi)歷史數(shù)據(jù)的內(nèi)容,是不同時點的數(shù)據(jù)庫快照的集合,以及基于這些快照進(jìn)行統(tǒng)計、綜合和重組的導(dǎo)出數(shù)據(jù),而不是聯(lián)機處理的數(shù)據(jù)。
數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(DM),它的作用是采用數(shù)學(xué)、統(tǒng)計、人工智能和機器學(xué)習(xí)等領(lǐng)域的科學(xué)方法,從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中描述過去,預(yù)測未來,評估未來。它是商業(yè)智能(BI)的一個重要應(yīng)用方向。數(shù)據(jù)挖掘是從未處理的數(shù)據(jù)中提取信息的過程,其重點是發(fā)現(xiàn)相關(guān)性和模式分析。它可以幫助公司預(yù)測未來發(fā)生的事情,預(yù)測和評估風(fēng)險。還需要統(tǒng)計分析功能來幫助分析客戶細(xì)分、預(yù)測客戶行為、預(yù)測客戶業(yè)務(wù)趨勢、識別欺詐等等。數(shù)據(jù)挖掘的一般功能包括分類、估計、預(yù)測、關(guān)聯(lián)分類和聚類。
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析方法(查詢、報表、統(tǒng)計和聯(lián)機分析處理(OLAP))的本質(zhì)區(qū)別是數(shù)據(jù)挖掘在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘得到的模式具有隱含性、未預(yù)期性、有潛在價值性3個特征。
商業(yè)智能BI、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘DM的關(guān)系
從技術(shù)角度看.商務(wù)智能的過程是企業(yè)的決策人員以企業(yè)中的數(shù)據(jù)倉庫為基礎(chǔ)。經(jīng)由聯(lián) 機分析處理工具、數(shù)據(jù)挖掘工具加上決策規(guī)劃人員的專業(yè)知識從數(shù)據(jù)中獲得有用的信息和 知識,幫助企業(yè)獲取利潤 。
從應(yīng)用角度看商務(wù)智能幫助用戶對商業(yè)數(shù)據(jù)進(jìn)行聯(lián)機分析處理和數(shù)據(jù)挖掘,例如預(yù)測 發(fā)展趨勢.輔助決策對客戶進(jìn)行分類 、挖掘潛在客戶等等 。
從數(shù)據(jù)角度看。商務(wù)智能使得很多事務(wù)性的數(shù)據(jù)經(jīng)過抽取、轉(zhuǎn)換之后存入數(shù)據(jù)倉庫 ,經(jīng)過聚集、切片或者分類等操作之后形成有用的信息、規(guī)則 ,來幫助企業(yè)的決策者進(jìn)行正 確的決策。
總而言之,數(shù)據(jù)倉庫是商務(wù)智能的基礎(chǔ)。數(shù)據(jù)倉庫是一個用以更好地支持企業(yè)或組織的 決策分析處理的數(shù)據(jù)集合。數(shù)據(jù)挖掘從海量數(shù)據(jù)中。提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識是數(shù)據(jù)倉庫之上的增值技術(shù)。
國內(nèi)數(shù)據(jù)倉庫應(yīng)用剛剛起步,電信、金融、證券、稅務(wù)、零售業(yè)等已有大量操作型數(shù)據(jù)積累 的企業(yè)都出現(xiàn)了迫切的應(yīng)用需求。可以預(yù)計商務(wù)智能在中國同樣會有廣闊的應(yīng)用前景。所以,以國內(nèi)目前環(huán)境來看,一款好的商業(yè)BI根據(jù)至關(guān)重要。這里,給大家推薦億信華辰的億信ABI一站式數(shù)據(jù)分析平臺。它是億信華辰歷經(jīng)十五年匠心打造的國產(chǎn)化BI工具,技術(shù)自主可控。它打通從數(shù)據(jù)接入、到數(shù)據(jù)建模與處理、再到數(shù)據(jù)分析與挖掘整個數(shù)據(jù)應(yīng)用全鏈路,可滿足企業(yè)經(jīng)營中各類復(fù)雜的分析需求,幫助企業(yè)實現(xiàn)高效數(shù)字化轉(zhuǎn)型。