
就在本月,烏克蘭副總理兼數(shù)字化轉(zhuǎn)型部長(zhǎng)Mykhailo Fedorov在推特上曬出了兩封信,希望其終止與俄羅斯的商業(yè)關(guān)系。Oracle隨后發(fā)推文稱:“為了Oracle在全球各地的150000名員工的利益,為了支持烏克蘭民選政府和烏克蘭人民,Oracle公司已經(jīng)暫停了在俄羅斯聯(lián)邦的所有業(yè)務(wù)。”
俄羅斯的遭遇給了中國很大警示,在當(dāng)前國際貿(mào)易摩擦加劇、國際局勢(shì)多變的情況下,數(shù)據(jù)庫軟件作為最重要的IT基礎(chǔ)設(shè)施之一,中國必須實(shí)現(xiàn)國產(chǎn)化和自主可控,由此也引發(fā)了近年來國產(chǎn)數(shù)據(jù)庫的創(chuàng)業(yè)投資浪潮。
作者丨王圓珍
核心結(jié)論匯總
(1)數(shù)據(jù)庫行業(yè)云化趨勢(shì)顯著,所有數(shù)據(jù)庫都可直接上云,云原生架構(gòu)最具優(yōu)勢(shì)。Gartner預(yù)計(jì),到2021年,云數(shù)據(jù)庫在整個(gè)數(shù)據(jù)庫市場(chǎng)中的占比將首次達(dá)到50%;而到2023年,75%的數(shù)據(jù)庫要跑在云平臺(tái)之上。
(2)國產(chǎn)數(shù)據(jù)庫存在廣泛替代空間。目前,國產(chǎn)數(shù)據(jù)庫主要應(yīng)用還是在黨政軍領(lǐng)域。國產(chǎn)數(shù)據(jù)庫長(zhǎng)期被Oracle、MySQL這類產(chǎn)品擠壓,隨著中美貿(mào)易戰(zhàn)的升級(jí)、國家鼓勵(lì)軟件國產(chǎn)化,國產(chǎn)軟件將會(huì)越來越被重視,這將是一大轉(zhuǎn)變契機(jī)。
(3)我國公有云、私有云、混合云將長(zhǎng)期共存,云數(shù)據(jù)庫作為基礎(chǔ)性產(chǎn)品,需要支持跨云、多云、混合云。初創(chuàng)廠商具備云中立優(yōu)勢(shì),可以避免客戶被過度綁定,提供多云支持,拉動(dòng)客戶增長(zhǎng);很多公司并未采用單一的云廠商,他們的大多數(shù)業(yè)務(wù)都運(yùn)行在混合環(huán)境和多云環(huán)境中。
(4)湖倉一體成為發(fā)展熱點(diǎn)。「湖倉一體」是一種新型開放式架構(gòu),將數(shù)據(jù)湖極低成本存儲(chǔ)大量數(shù)據(jù)和數(shù)據(jù)倉庫高性能進(jìn)行大量數(shù)據(jù)處理的優(yōu)勢(shì)充分結(jié)合,通過一套架構(gòu)、一個(gè)集群、一份數(shù)據(jù),真正消除數(shù)據(jù)孤島。
(5)大數(shù)據(jù)與數(shù)據(jù)庫一體化趨勢(shì)明顯。用戶可直接用SQL處理海量數(shù)據(jù)對(duì)廠商有以下需求:1.內(nèi)核引擎強(qiáng)勁,一定性價(jià)比對(duì)外輸出海量數(shù)據(jù)分析處理能力;2.生態(tài)工具要完善。
(6)場(chǎng)景端時(shí)效性要求倒逼數(shù)據(jù)庫廠商提升產(chǎn)品性能,產(chǎn)品性能持續(xù)領(lǐng)先是決勝要素之一。產(chǎn)品硬核實(shí)力及成熟度是決定營收規(guī)模及增長(zhǎng)的主要因素。
(7)分布式數(shù)據(jù)庫快速發(fā)展。分布式數(shù)據(jù)庫物理上更貼近業(yè)務(wù)部門,可以降低通信成本;同時(shí)增加數(shù)據(jù)的適當(dāng)冗余,因?yàn)橐粋€(gè)地方出了故障不會(huì)引起整個(gè)系統(tǒng)崩潰。
(8)智能化運(yùn)維助力數(shù)據(jù)庫智能調(diào)優(yōu)。啟發(fā)式機(jī)器學(xué)習(xí)技術(shù)給予海量運(yùn)行數(shù)據(jù)形成智能運(yùn)維模型,自動(dòng)化處理各項(xiàng)任務(wù),例如自動(dòng)管理計(jì)算與存儲(chǔ)資源、自動(dòng)防范惡意訪問與攻擊、主動(dòng)實(shí)現(xiàn)數(shù)據(jù)庫智能調(diào)優(yōu)。
(9)開源策略成為部分廠商吸引用戶、盤活生態(tài)和促進(jìn)技術(shù)發(fā)展的重要手段。通過將底層技術(shù)開源,可以吸引更多人開發(fā)、測(cè)試、維護(hù),不僅可以降低廠商售后和服務(wù)的成本,還可以進(jìn)一步提高軟件質(zhì)量,同時(shí)有利于構(gòu)建生態(tài)。

(10)One size cannot fit all。雖然混合事務(wù)分析HTAP在中等規(guī)模客戶的應(yīng)用已成為熱點(diǎn)研究方向。但HTAP價(jià)值在于更加簡(jiǎn)單通用,對(duì)于中等數(shù)據(jù)量規(guī)模用戶可滿足需求,對(duì)于超大型企業(yè)數(shù)據(jù)分析性能可能不如OLAP。
(11)更多利用硬件發(fā)展紅利是必然趨勢(shì)。計(jì)算需要GPU加速,存儲(chǔ)方面持久存儲(chǔ)(NVM)代替硬盤存儲(chǔ),需要重新設(shè)計(jì)架構(gòu)利用特性;存算分離執(zhí)行路徑變長(zhǎng),數(shù)據(jù)庫需采用高性能網(wǎng)絡(luò)等。
(12)其他:OLAP和NoSQL將是主要的創(chuàng)業(yè)和投資方向。在國產(chǎn)數(shù)據(jù)庫的OLTP領(lǐng)域,華為、阿里、騰訊等廠商有技術(shù)優(yōu)勢(shì)和資金優(yōu)勢(shì),同時(shí)也有生態(tài)和渠道的優(yōu)勢(shì),創(chuàng)業(yè)公司進(jìn)入OLTP領(lǐng)域門檻非常高,而在 OLAP領(lǐng)域,建立新一代數(shù)據(jù)倉庫以及NoSQL數(shù)據(jù)庫方面,未來會(huì)涌現(xiàn)更多的創(chuàng)業(yè)公司,這塊可能是很多投資機(jī)構(gòu)接下來要重點(diǎn)關(guān)注的方向。
市場(chǎng)環(huán)境
1. 數(shù)據(jù)庫的定義及邊界
數(shù)據(jù)庫管理系統(tǒng)是各類信息系統(tǒng)不可或缺的基礎(chǔ)性平臺(tái),主要任務(wù)是對(duì)數(shù)據(jù)的歸集、分類、組織、處理、存儲(chǔ)、分析、應(yīng)用的全生命周期提供共性技術(shù)支撐。
數(shù)據(jù)庫大致可以由內(nèi)核組件集與外部組件集共同組成,其中外部組件集以數(shù)據(jù)庫配套的獨(dú)立支撐軟件為主,例如數(shù)據(jù)庫驅(qū)動(dòng)。內(nèi)核組件集則一般可以分為管理、網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)四大模塊。

(1)存儲(chǔ)組件:負(fù)責(zé)數(shù)據(jù)持久化存儲(chǔ)的組件,對(duì)數(shù)據(jù)庫的日志、索引、堆數(shù)據(jù)等內(nèi)容進(jìn)行管理;
(2)計(jì)算組件:又可以稱為協(xié)調(diào)組件、服務(wù)組件,負(fù)責(zé)響應(yīng)數(shù)據(jù)庫訪問請(qǐng)求,并將SQL語言解析成為數(shù)據(jù)庫對(duì)應(yīng)的內(nèi)部任務(wù)。計(jì)算組件在分布式、集群等架構(gòu)下也承接大部分的計(jì)算任務(wù),例如排序、聯(lián)接等;
(3)管理組件:公共組件部分,用于對(duì)數(shù)據(jù)庫全生命狀態(tài)的管理,例如心跳管理、集群管理等,以及各類中心化任務(wù)承接,如死鎖仲裁、存儲(chǔ)映射管理、元數(shù)據(jù)管理、事務(wù)號(hào)管理等;
(4)網(wǎng)絡(luò)組件:管理整個(gè)數(shù)據(jù)庫管理系統(tǒng)的網(wǎng)絡(luò)通訊的組件。數(shù)據(jù)庫的網(wǎng)絡(luò)通訊有內(nèi)部和外部之分。內(nèi)部一般指在集群環(huán)境或者分布式環(huán)境下的各節(jié)點(diǎn)之間的高速數(shù)據(jù)交換。外部一般指的是各個(gè)數(shù)據(jù)庫通過對(duì)外訪問協(xié)議與存在于客戶端的驅(qū)動(dòng)進(jìn)行互聯(lián)的網(wǎng)絡(luò)交換;
(5)驅(qū)動(dòng)組件:支撐數(shù)據(jù)庫能正常提供服務(wù)的配套獨(dú)立組件,數(shù)據(jù)庫管理系統(tǒng)基于其通用特性,往往可以對(duì)不同語言開發(fā)的軟件提供數(shù)據(jù)服務(wù)。但是由于數(shù)據(jù)庫本身只對(duì)外提供網(wǎng)絡(luò)通訊協(xié)議,對(duì)協(xié)議的封裝則由客戶端側(cè)的不同驅(qū)動(dòng)組件完成。通常有支持JAVA 語言的JDBC 接口、支持C 語言的ODBC 接口和C-API 接口等。
2. 行業(yè)常見名詞釋義
(1)關(guān)系型數(shù)據(jù)庫:采用了關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫,其以行和列的形式存儲(chǔ)數(shù)據(jù),以便于用戶理解,關(guān)系型數(shù)據(jù)庫這一系列的行和列被稱為表,一組表組成了數(shù)據(jù)庫。用戶通過查詢來檢索數(shù)據(jù)庫中的數(shù)據(jù),而查詢是一個(gè)用于限定數(shù)據(jù)庫中某些區(qū)域的執(zhí)行代碼。關(guān)系模型可以簡(jiǎn)單理解為二維表格模型,而一個(gè)關(guān)系型數(shù)據(jù)庫就是由二維表及其之間的關(guān)系組成的一個(gè)數(shù)據(jù)組織。
(2)非關(guān)系型數(shù)據(jù)庫:對(duì)于NoSQL并沒有一個(gè)明確的范圍和定義,一個(gè)共同的特點(diǎn)都是去掉關(guān)系數(shù)據(jù)庫的關(guān)系型特性。
(3)數(shù)據(jù)湖:是一個(gè)集中式的存儲(chǔ),允許以任意規(guī)模存儲(chǔ)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。可以存儲(chǔ)原始數(shù)據(jù),而不需要先轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),基于數(shù)據(jù)湖之上可以運(yùn)行多種類型的分析。
(4)數(shù)據(jù)倉庫:是處理過后的結(jié)構(gòu)化或者半結(jié)構(gòu)化數(shù)據(jù),更加靠近數(shù)據(jù)的消費(fèi)端。
(5)湖倉一體:使用一套技術(shù)去實(shí)現(xiàn)數(shù)據(jù)湖和數(shù)據(jù)倉庫的能力,類似多模的概念。
3. 行業(yè)歷史及階段
數(shù)據(jù)庫發(fā)展經(jīng)歷萌芽-商業(yè)化起步-發(fā)展成熟階段。

(1)萌芽階段:1960年,GE發(fā)布IDS數(shù)據(jù)庫系統(tǒng)(Integrated DataBase System),制定網(wǎng)狀模型語言標(biāo)準(zhǔn),1969年,IMS數(shù)據(jù)庫系統(tǒng)(Information Mangement System)發(fā)布,使用層次模型。解決了數(shù)據(jù)集中和共享問題,用戶在對(duì)兩種數(shù)據(jù)庫進(jìn)行存取時(shí),需要指出存儲(chǔ)方法和路徑,易用性較差,沒有應(yīng)用起來。
(2)商業(yè)化起步:1970年-1980年,關(guān)系模型提出,關(guān)系型數(shù)據(jù)庫System R被開發(fā)出來,與之相適配的結(jié)構(gòu)化查詢語言SQL。70年代末,關(guān)系型數(shù)據(jù)庫在Oracle和DB2中得到發(fā)展和商業(yè)化,SQL不關(guān)注獲取數(shù)據(jù)的具體過程,把用戶從數(shù)據(jù)操作細(xì)節(jié)中解脫出來,只描述想要的數(shù)據(jù)即可,成為關(guān)系型數(shù)據(jù)庫得以成功的關(guān)鍵。

(3)發(fā)展成熟(1980-1990):主要表現(xiàn)為 1、數(shù)據(jù)庫生態(tài)逐步完善,與程序設(shè)計(jì)語言、軟件工程、信息系統(tǒng)設(shè)計(jì)等技術(shù)互相影響;2、開源數(shù)據(jù)庫發(fā)展,當(dāng)前2大開源數(shù)據(jù)庫系統(tǒng)——MySQL和PostgreSQL誕生。3、OLAP開始發(fā)展。早期數(shù)據(jù)庫處理在線交易業(yè)務(wù),被稱為OLTP(On-Line Transaction Processing);業(yè)務(wù)數(shù)據(jù)積累,OLAP出現(xiàn)(On-Line Analytical Processing);4、數(shù)倉概念(Data Warehouse)提出。單機(jī)難以應(yīng)對(duì)爆發(fā)數(shù)據(jù)增長(zhǎng),分布式技術(shù)走上舞臺(tái)。
(4)云數(shù)據(jù)庫時(shí)代(1990-):云計(jì)算的發(fā)展帶動(dòng)各類基礎(chǔ)軟件開始云化轉(zhuǎn)型,云原生數(shù)據(jù)庫天然具備云上的彈性、靈活性、高可用等特點(diǎn),實(shí)現(xiàn)了存儲(chǔ)和計(jì)算完全解耦,作為服務(wù)整體交付,節(jié)約了用戶管理基礎(chǔ)架構(gòu)所需的成本、時(shí)間和資源,能夠提供豐富的產(chǎn)品體系,經(jīng)濟(jì)高效的部署方式、按需付費(fèi)的支付模式。
數(shù)據(jù)庫的云化經(jīng)歷了2個(gè)階段:一是云托管,將原有數(shù)據(jù)庫系統(tǒng)部署在云平臺(tái),將數(shù)據(jù)庫服務(wù)化,按需購買,用戶自行負(fù)責(zé)整個(gè)數(shù)據(jù)庫系統(tǒng)的可用性、安全性和性能,有自己的IT運(yùn)維團(tuán)隊(duì),有自己的數(shù)據(jù)庫管理團(tuán)隊(duì),能力要求高,人力成本投入大;二是云原生,利用云化的資源池特點(diǎn)完全重構(gòu)數(shù)據(jù)庫的層次結(jié)構(gòu),使計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源徹底解耦,更充分靈活利用資源池的彈性。后一階段對(duì)數(shù)據(jù)庫的改造更為徹底。
云原生數(shù)據(jù)庫的特點(diǎn):
a. 存算分離,計(jì)算層解析SQL,并轉(zhuǎn)為物理執(zhí)行計(jì)劃,存儲(chǔ)層負(fù)責(zé)數(shù)據(jù)緩存與事務(wù)處理;資源解耦與池化,目前進(jìn)展是CPU和內(nèi)存綁在一起,和SSD持久化存儲(chǔ)分開。下一步隨著非易失性存儲(chǔ)和RDMA技術(shù)的成熟,會(huì)將CPU和內(nèi)存隔離,內(nèi)存再進(jìn)行池化,三層池化有利于客戶按需取用;
b. 執(zhí)行引擎的完全彈性,云原生架構(gòu),下層是分布式共享存儲(chǔ),上層是分布式共享計(jì)算,中間用于計(jì)算存儲(chǔ)解耦,提供彈性能力;
c. 高可用與數(shù)據(jù)一致性,可用性是指集群的部分節(jié)點(diǎn)發(fā)生故障時(shí),系統(tǒng)可以在正常響應(yīng)時(shí)間內(nèi)對(duì)外提供服務(wù);一致性是指更新操作完成后,各個(gè)節(jié)點(diǎn)可以同時(shí)看到數(shù)據(jù)的最新版本,分布式系統(tǒng)存在網(wǎng)絡(luò)分區(qū),需要在一致性和可用性之間做出權(quán)衡;
d. 多租戶與資源隔離,傳統(tǒng)做法是一租戶一數(shù)據(jù)庫系統(tǒng),或者多租戶共享同一個(gè)數(shù)據(jù)庫系統(tǒng),運(yùn)維管理復(fù)雜,避免某個(gè)租戶“吃掉”系統(tǒng)資源,云原生場(chǎng)景下,數(shù)據(jù)庫可以為不同的租戶綁定相應(yīng)的計(jì)算和存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)資源隔離;
e. 智能化運(yùn)維,比如自定義備份策略、自動(dòng)在線升級(jí)修復(fù)BUG,監(jiān)控自定義報(bào)警燈。
以AP為例,OLAP從最早的數(shù)據(jù)庫一體機(jī),逐漸演變到MPP數(shù)據(jù)庫和Hadoop數(shù)據(jù)庫,再到云原生架構(gòu)的數(shù)據(jù)庫,數(shù)據(jù)庫一體機(jī)價(jià)格非常昂貴。最新一代為云原生,具備檢具擴(kuò)展、存算分離、彈性擴(kuò)容等特點(diǎn)。
4.市場(chǎng)需求及價(jià)值
(1)數(shù)據(jù)庫分類-按應(yīng)用方向
按應(yīng)用方向不同,關(guān)系型數(shù)據(jù)庫又可分為交易型數(shù)據(jù)庫(OLTP)和分析型數(shù)據(jù)庫(OLAP):交易型數(shù)據(jù)庫主要面對(duì)與企業(yè)業(yè)務(wù)數(shù)據(jù)相關(guān)性強(qiáng)的事務(wù)場(chǎng)景,例如銀行轉(zhuǎn)賬,電子商務(wù)等,涉及高并發(fā)數(shù)據(jù)的“增、刪、改、查”;分析型數(shù)據(jù)庫對(duì)來自交易型數(shù)據(jù)庫和其他數(shù)據(jù)源的歷史數(shù)據(jù)進(jìn)行大批查詢,應(yīng)用在海量、復(fù)雜數(shù)據(jù)環(huán)境下為企業(yè)決策提供數(shù)據(jù)分析。

(2)數(shù)據(jù)庫分類-按數(shù)據(jù)組織形式
按照數(shù)據(jù)組織形式,數(shù)據(jù)庫可以分為關(guān)系型和非關(guān)系型(NoSQL)數(shù)據(jù)庫。
關(guān)系型數(shù)據(jù)庫的核心是數(shù)據(jù)表(行、列數(shù)據(jù))、表內(nèi)結(jié)構(gòu)和表間關(guān)系。非關(guān)系型是一種新型的數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)方法的集合,適用于各種非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),能夠很好地滿足海量數(shù)據(jù)的高并發(fā)讀寫需求。典型的NoSQL數(shù)據(jù)庫包括鍵值數(shù)據(jù)庫,列存儲(chǔ)數(shù)據(jù)庫、文檔型數(shù)據(jù)庫、圖數(shù)據(jù)庫,其中,根據(jù)DB-engines排名,以圖數(shù)據(jù)庫受歡迎度最高。

部分非關(guān)系型模型示意圖:

圖數(shù)據(jù)庫(GDB-Graph Database),是一個(gè)使用圖結(jié)構(gòu)進(jìn)行語義查詢的數(shù)據(jù)庫,它使用節(jié)點(diǎn)、邊和屬性來表示和存儲(chǔ)數(shù)據(jù)。?目前主流的圖數(shù)據(jù)庫選擇的圖模型是屬性圖。屬性圖由點(diǎn)、邊、標(biāo)簽和屬性組成。
關(guān)于圖數(shù)據(jù)庫的實(shí)例:

圖數(shù)據(jù)庫直觀表示關(guān)系,對(duì)于高度互聯(lián)數(shù)據(jù)非常有用(數(shù)據(jù)量越大,越復(fù)雜的關(guān)聯(lián),優(yōu)勢(shì)明顯)。

應(yīng)用場(chǎng)景來看,圖數(shù)據(jù)庫還是針對(duì)用大量數(shù)據(jù)并且需要多維處理或者多層滲透的環(huán)節(jié),因此金融、電商、社交等領(lǐng)域中使用比較多,且場(chǎng)景的針對(duì)性較強(qiáng)。

社交領(lǐng)域:Facebook, Twitter,Linkedin用它來管理社交關(guān)系,實(shí)現(xiàn)好友推薦;
零售領(lǐng)域:eBay,沃爾瑪使用它實(shí)現(xiàn)商品實(shí)時(shí)推薦,給買家更好的購物體驗(yàn);
金融領(lǐng)域:摩根大通,花旗和瑞銀等銀行在用圖數(shù)據(jù)庫做風(fēng)控處理;
汽車制造領(lǐng)域:沃爾沃,戴姆勒和豐田等頂級(jí)汽車制造商依靠圖數(shù)據(jù)庫推動(dòng)創(chuàng)新制造解決方案;
電信領(lǐng)域:Verizon, Orange和AT&T 等電信公司依靠圖數(shù)據(jù)庫來管理網(wǎng)絡(luò),控制訪問并支持客戶360;
酒店領(lǐng)域:萬豪和雅高酒店等頂級(jí)酒店公司依使用圖數(shù)據(jù)庫來管理復(fù)雜且快速變化的庫存。
圖數(shù)據(jù)庫一大想象空間來源于與AI的結(jié)合。圖數(shù)據(jù)庫的數(shù)據(jù)存儲(chǔ)模型其實(shí)特別適合機(jī)器學(xué)習(xí)計(jì)算,因此,不少人會(huì)直接選擇直接在圖數(shù)據(jù)庫上跑機(jī)器學(xué)習(xí)算法。近年來,隨著深度學(xué)習(xí)的興起,有了在圖數(shù)據(jù)庫上做圖神經(jīng)網(wǎng)絡(luò)(GNN)的案例。
5. 市場(chǎng)規(guī)模及增速
(1)全球市場(chǎng)規(guī)模及增速
Gartner報(bào)告顯示,2020年全球數(shù)據(jù)庫市場(chǎng)規(guī)模為648億美元,占基礎(chǔ)軟件支出最大構(gòu)成。未來,數(shù)據(jù)庫市場(chǎng)的規(guī)模還將繼續(xù)增長(zhǎng),預(yù)計(jì)到2024年,全球數(shù)據(jù)庫市場(chǎng)規(guī)模將達(dá)到1000億美元。

云數(shù)據(jù)庫是未來趨勢(shì):云原生數(shù)據(jù)庫正在成為一種重要的數(shù)據(jù)庫新形態(tài),根據(jù)Gartner數(shù)據(jù),2020年云數(shù)據(jù)庫已占據(jù)整體數(shù)據(jù)庫市場(chǎng)份額的40%,且貢獻(xiàn)了增長(zhǎng)市場(chǎng)的9成以上份額,據(jù)Gartner預(yù)測(cè),到2023年75%的數(shù)據(jù)庫會(huì)被直接部署或者向云上遷移,營收數(shù)據(jù)將占據(jù)數(shù)據(jù)庫整體市場(chǎng)的半數(shù)以上。
Gartner對(duì)數(shù)據(jù)庫細(xì)分市場(chǎng)的規(guī)模統(tǒng)計(jì),2020年關(guān)系型數(shù)據(jù)庫全球市場(chǎng)規(guī)模為531億美元,占比83.3%。
根據(jù)Gartner,2020年非關(guān)系型數(shù)據(jù)庫市場(chǎng)增速34.5%,關(guān)系型數(shù)據(jù)庫市場(chǎng)增速15.2%。全球非關(guān)系型數(shù)據(jù)庫(NoSQL)在 2020~2022年市場(chǎng)增速30%左右,遠(yuǎn)高于數(shù)據(jù)庫市場(chǎng)整體增速。
(2)中國市場(chǎng)規(guī)模及增速
數(shù)據(jù)規(guī)模爆炸性增長(zhǎng),數(shù)據(jù)應(yīng)用快速深化,疊加網(wǎng)信產(chǎn)業(yè)的快速發(fā)展和新基建的深度布局,我國數(shù)據(jù)庫產(chǎn)業(yè)進(jìn)入重大發(fā)展機(jī)遇期。據(jù)中國信通院測(cè)算,2020年中國數(shù)據(jù)庫市場(chǎng)規(guī)模約241億元。預(yù)計(jì)到2025年,中國數(shù)據(jù)庫市場(chǎng)規(guī)模將達(dá)688億元,年復(fù)合增長(zhǎng)率為23.4%。
我國數(shù)據(jù)庫市場(chǎng)規(guī)模在全球占比約5.2%,而同期我國IT支出在全球占比約12%。
2020年我國數(shù)據(jù)庫市場(chǎng)規(guī)模在國內(nèi)IT支出占比約0.9%,而全球這一比例則達(dá)1.9%。兩組數(shù)據(jù)都表明,我國數(shù)據(jù)庫市場(chǎng)增長(zhǎng)潛力巨大。
伴隨云計(jì)算底層設(shè)施成熟,云端數(shù)據(jù)庫市場(chǎng)份額迅速擴(kuò)大。中國信通院報(bào)告顯示,2020年我國公有云數(shù)據(jù)庫市場(chǎng)規(guī)模為107.68億元,占我國數(shù)據(jù)庫規(guī)模45%,未來5年復(fù)合增長(zhǎng)率36.1%,預(yù)計(jì)到2025年公有云數(shù)據(jù)庫市場(chǎng)規(guī)模將超過500億元。
中國關(guān)系型數(shù)據(jù)庫規(guī)模為31億美元,占比76%。由此可見,關(guān)系型數(shù)據(jù)庫在國內(nèi)外無疑都是數(shù)據(jù)庫中的絕對(duì)主流。
6.?市場(chǎng)增長(zhǎng)的驅(qū)動(dòng)因素
互聯(lián)網(wǎng)大規(guī)模商用,加速數(shù)據(jù)的產(chǎn)生、流通和融合,海量數(shù)據(jù)規(guī)模和復(fù)雜數(shù)據(jù)結(jié)構(gòu)驅(qū)動(dòng)數(shù)據(jù)庫市場(chǎng)穩(wěn)定增長(zhǎng)。IDC和Ovum 預(yù)計(jì)2024 年全球數(shù)據(jù)總量和流量將分別保持4 年CAGR 28.1%和27.6%的強(qiáng)勁速度,更大的數(shù)據(jù)量級(jí)對(duì)數(shù)據(jù)庫的擴(kuò)容、性能、功能提出了新的需求。
此外,人工智能、機(jī)器學(xué)習(xí)、語義分析、圖像識(shí)別等技術(shù)則需要大量的非結(jié)構(gòu)化數(shù)據(jù)來開展工作,NoSql存在發(fā)展機(jī)遇。根據(jù)IDC 數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)占整體數(shù)據(jù)量比重高達(dá)80%以上,這意味著絕大部分非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值還未被充分發(fā)掘。

企業(yè)上云趨勢(shì)明顯,數(shù)據(jù)庫成為連接IaaS到應(yīng)用的關(guān)鍵環(huán)節(jié)。數(shù)據(jù)顯示,在過去十年,企業(yè)上云的意愿從3%上升到了84%;2020年我國已經(jīng)應(yīng)用云計(jì)算的企業(yè)占比達(dá)到72.1%,較2019年上升了6%。伴隨著企業(yè)上云進(jìn)程的不斷深入,企業(yè)上云從資源上云逐步進(jìn)入到應(yīng)用上云,數(shù)據(jù)庫作為PaaS層產(chǎn)品,成為關(guān)鍵環(huán)節(jié)。
政策利好本土廠商,「信創(chuàng)」風(fēng)口,國產(chǎn)數(shù)據(jù)庫的新機(jī)遇。2020-2022 三年時(shí)間,信創(chuàng)產(chǎn)業(yè)進(jìn)入好用階段,將在黨政軍和八大核心行業(yè)(金融、電信、能源、電力、醫(yī)療、教育、交通、公共事業(yè))鋪開。云數(shù)據(jù)庫廠商、本土數(shù)據(jù)庫廠商份額持續(xù)增長(zhǎng),國際數(shù)據(jù)庫品牌份額下降。
信創(chuàng)指硬件和軟件的一系列信息化創(chuàng)新技術(shù),可理解為數(shù)字基建,是新基建最底層的一環(huán),主要包括核心芯片、基礎(chǔ)硬件、操作系統(tǒng)、中間件和數(shù)據(jù)服務(wù)器等領(lǐng)域。信創(chuàng)產(chǎn)業(yè)是數(shù)據(jù)安全、網(wǎng)絡(luò)安全的基礎(chǔ),也是「新基建」的重要內(nèi)容,將成為拉動(dòng)經(jīng)濟(jì)發(fā)展的重要抓手之一。
從信息基礎(chǔ)設(shè)施國產(chǎn)化程度來看,目前國內(nèi)重要信息系統(tǒng)、關(guān)鍵基礎(chǔ)設(shè)施中使用的核心信息技術(shù)產(chǎn)品和關(guān)鍵服務(wù)大多依賴國外。例如中美貿(mào)易戰(zhàn),Oracle停止美國敵對(duì)國家的數(shù)據(jù)庫服務(wù)后,導(dǎo)致數(shù)據(jù)庫功能缺失,促使數(shù)據(jù)庫加快國產(chǎn)替代。
產(chǎn)業(yè)鏈與行業(yè)格局
1. 產(chǎn)業(yè)鏈及行業(yè)圖譜
數(shù)據(jù)庫與芯片、操作系統(tǒng)并列為全球技術(shù)三大件,也是企業(yè)IT系統(tǒng)必不可少的核心技術(shù)。在數(shù)據(jù)庫軟件產(chǎn)業(yè)鏈中,上游多是以服務(wù)器廠商、芯片廠商組成的網(wǎng)絡(luò)和硬件廠商;中游由數(shù)據(jù)庫、操作系統(tǒng)和中間件等基礎(chǔ)軟件廠商組成;下游主要是各行業(yè)的應(yīng)用開發(fā)商。

數(shù)據(jù)庫管理系統(tǒng)在企業(yè)數(shù)據(jù)流管理體系中處于核心位置。業(yè)務(wù)行為相關(guān)的數(shù)據(jù)首先在不同的操作型數(shù)據(jù)庫中進(jìn)行事務(wù)處理OLTP,然后通過ETL工具(提取、轉(zhuǎn)換、加載)匯聚整合成面向主題的、全局的一致數(shù)據(jù)集合,存儲(chǔ)在業(yè)務(wù)數(shù)據(jù)臨時(shí)存儲(chǔ)系統(tǒng)ODS中。ODS的數(shù)據(jù)再次通過ETL工具轉(zhuǎn)換集成為結(jié)構(gòu)化數(shù)據(jù)進(jìn)入企業(yè)統(tǒng)一的數(shù)據(jù)倉庫。數(shù)倉數(shù)據(jù)針對(duì)某個(gè)特定主題分類,進(jìn)入到從屬型數(shù)據(jù)集市。根據(jù)企業(yè)需要,基于操作型數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)集市也能夠構(gòu)建企業(yè)數(shù)據(jù)湖,存儲(chǔ)著包括原始數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù)在內(nèi)的各種結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的集中式管理。經(jīng)過匯總后的數(shù)據(jù)通過OLAP 操作分析處理,并通過BI 工具以體系化、可視化的方式直接呈現(xiàn)在決策者面前,為業(yè)務(wù)提供數(shù)據(jù)支撐。

2.?行業(yè)集中度
從全球范圍來看,微軟、Oracle、亞馬遜為前三大廠商,占據(jù)全球市場(chǎng)接近70%市場(chǎng)份額。2020年微軟同比增長(zhǎng)超17%,規(guī)模首次超過Oracle,主要來自于云數(shù)據(jù)庫的增長(zhǎng)。


國內(nèi):海外巨頭占據(jù)市場(chǎng)主要份額,云化和國產(chǎn)替代趨勢(shì)下海外廠商份額不斷下降。2020年國外廠商仍占據(jù)我國數(shù)據(jù)庫市場(chǎng)80%以上份額,并已形成較為完善的數(shù)據(jù)庫生態(tài),國產(chǎn)替代安全自主可控下的國產(chǎn)數(shù)據(jù)庫在未來將有很大的市場(chǎng)空間。
中國市場(chǎng)分應(yīng)用來看,OLTP仍是國外廠商占據(jù)最大市場(chǎng)份額,OLAP和非關(guān)系型數(shù)據(jù)庫中國廠商具備一定商業(yè)基礎(chǔ)。分行業(yè)來看,金融、電信、政府、制造、交通五大行業(yè)占據(jù)數(shù)據(jù)庫服務(wù)市場(chǎng)份額超80%。各行業(yè)的數(shù)據(jù)庫服務(wù)市場(chǎng)份額比例分別為金融22.3%、電信18.9%、政府16.4%、制造13.3%、交通9.6%(中國信通院統(tǒng)計(jì))。
公有云數(shù)據(jù)庫部分,云廠商份額超70%。2020年,阿里云、騰訊云、華為云等公有云數(shù)據(jù)庫約占國內(nèi)市場(chǎng)份額75.5%。以電商、游戲、短視頻等為主營業(yè)務(wù)的互聯(lián)網(wǎng)公司是線上數(shù)據(jù)庫的服務(wù)對(duì)象。
3. 競(jìng)爭(zhēng)分析
整體競(jìng)爭(zhēng)格局

目前我國本土數(shù)據(jù)庫企業(yè)類型主要分為四大類,分別是傳統(tǒng)廠商、跨界廠商、云廠商以及初創(chuàng)廠商。國內(nèi)市場(chǎng)主要參與者為海外巨頭(Oracle、Microsoft、AWS 等),國內(nèi)公有云廠商(阿里云、騰訊云);跨界廠商主要是設(shè)備商(華為、中興通訊);以及新興數(shù)據(jù)庫廠商。其中,初創(chuàng)廠商主要是最新一代的面向云原生架構(gòu)的數(shù)據(jù)庫,架構(gòu)優(yōu)勢(shì)更為明顯。
4.?行業(yè)的決勝要素
數(shù)據(jù)庫公司的發(fā)展遵循內(nèi)核-外殼-生態(tài)的主要路徑:內(nèi)核組件和底層能力為基礎(chǔ),外部組件為支撐,生態(tài)為商業(yè)化及產(chǎn)品迭代重要路徑。
內(nèi)核層面:底層能力+性能表現(xiàn)為基礎(chǔ)。
底層代碼積累與產(chǎn)品迭代需要與具體業(yè)務(wù)場(chǎng)景深度融合。國內(nèi)廠商誕生之初就面對(duì)Oracle 的激烈競(jìng)爭(zhēng),難以擁有接觸客戶核心業(yè)務(wù)場(chǎng)景的機(jī)會(huì),目前國家要求金融行業(yè)全替換,也是針對(duì)辦公系統(tǒng)的數(shù)據(jù)庫全替換,在業(yè)務(wù)系統(tǒng)層面更多的是在小業(yè)務(wù)系統(tǒng)上做實(shí)驗(yàn),現(xiàn)在去談核心業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫國產(chǎn)化還為時(shí)尚早。阿里、騰訊的數(shù)據(jù)庫產(chǎn)品之所以能夠成為國內(nèi)代表,依靠的是與自身電商、支付、社交等核心業(yè)務(wù)場(chǎng)景的不斷打磨,而其他數(shù)據(jù)庫公司之前難以擁有這樣的機(jī)會(huì)。因此,廠商要先爭(zhēng)取拿到小業(yè)務(wù)系統(tǒng)的備份系統(tǒng)機(jī)會(huì)。

大廠拼綜合實(shí)力,創(chuàng)業(yè)公司拼技術(shù),創(chuàng)業(yè)公司勝出的要素是產(chǎn)品過硬。數(shù)據(jù)庫云化是關(guān)于部署形態(tài)、架構(gòu)形態(tài)的問題,但是對(duì)底層技術(shù)能力的掌握和提升仍然重要。數(shù)據(jù)庫包括數(shù)據(jù)庫內(nèi)核、分布式組件和接口驅(qū)動(dòng),SQL引擎、事務(wù)引擎和存儲(chǔ)引擎,是否支持多副本、分布式事務(wù)、高性能、擴(kuò)展能力、故障恢復(fù)、優(yōu)化器、多活容災(zāi)、語法兼容等核心技術(shù)。
數(shù)據(jù)庫性能優(yōu)勢(shì)也是要素之一。AP場(chǎng)景天然有很多復(fù)雜的用戶查詢,具體到SQL語句上就是大量的多表連接、復(fù)雜的表達(dá)式計(jì)算、多層嵌套的子查詢、聚合函數(shù)等等,這些對(duì)引擎的查詢優(yōu)化能力要求門檻極高。數(shù)據(jù)分析型基準(zhǔn)測(cè)試(TPC-H)是公認(rèn)的衡量數(shù)據(jù)庫數(shù)據(jù)分析能力的權(quán)威標(biāo)準(zhǔn)之一,因此TPC-H測(cè)試結(jié)果也被作為數(shù)據(jù)庫性能的衡量標(biāo)準(zhǔn)之一。
外殼層面,大數(shù)據(jù)與數(shù)據(jù)庫一體化趨勢(shì)明顯,需要完善外部組件部分:自研或兼容主流生態(tài)組件,完善產(chǎn)品力為進(jìn)一步發(fā)展支撐。
大數(shù)據(jù)生態(tài)中的組件羅列:

生態(tài)重要性凸顯
國產(chǎn)數(shù)據(jù)庫公司發(fā)展的戰(zhàn)略重點(diǎn)在生態(tài)擴(kuò)展。做數(shù)據(jù)庫一定要有一個(gè)生態(tài),自從X86替換小型機(jī),DB2的市場(chǎng)份額逐漸下降;軟硬件分離的趨勢(shì),導(dǎo)致Intel、微軟的操作系統(tǒng)得以普遍應(yīng)用,在此生態(tài)下才有Oracle、MySQL發(fā)展壯大的機(jī)會(huì)。不同客戶核心架構(gòu)系統(tǒng)不同,存在不同程度的定制化開發(fā)訴求。數(shù)據(jù)庫作為基礎(chǔ)軟件,需要完成芯片、服務(wù)器、操作系統(tǒng)、中間件的適配工作,集成商、二次開發(fā)商、IT 咨詢公司都是數(shù)據(jù)庫廠商生態(tài)伙伴體系中的重要參與者,自建生態(tài)難度較大,兼容生態(tài)為主要選擇。生態(tài)伙伴賦能企業(yè)在快速實(shí)現(xiàn)業(yè)務(wù)擴(kuò)張的同時(shí)最大程度減少成本增長(zhǎng),使得企業(yè)能將有限的人員和資金投入到核心技術(shù)和核心產(chǎn)品。合作伙伴生態(tài)是Oracle早期占領(lǐng)中國市場(chǎng)的核心要素之一,早期Oracle中國區(qū)90%以上收入來自2000多個(gè)合作伙伴。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)