相关动态
数据库:行业景气百舸争流千帆竞,细分赛道长坡厚雪奋者先
2024-11-10 21:20

报告出品方:方正证券

数据库:行业景气百舸争流千帆竞,细分赛道长坡厚雪奋者先

以下为报告原文节选

------

1数据库是信息化核心环节,产品种类丰富多样

广义数据库即指数据库系统(DBS),由数据库和数据库管理系统构成。数据库(Database,DB)指按照数据结构来组织、存储、管理数据的仓库,是信息系统的核心及数据有效利用的前提;数据管理系统(DatabaseManagementSystem,DBMS)是指对数据库进行统一管理及操控的大型系统软件,负责建立、使用及维护数据库。

常见分类标准为数据模型、设计架构、部署方式及应用场景。1)按数据结构:分为关系型数据库、非关系型数据库(NoSQL,包括键值型、文档型、图、对象型等);2)按设计架构:分为集中式数据库、分布式数据库;3)按部署模式:分为本地数据库和云数据库;4)按业务负载特征:分为 OLTP 事务型数据库、OLAP 分析型数据库、HTAP 混合型数据库。

按数据结构:可分为 SQL 关系型、NoSQL 非关系型及 NewSQL

关系型数据库是指以行和列的形式存储数据,采用了关系模型来组织数据的数据库。数据关系可理解为一张二维表,关系型数据库就是由二维表及其之间的联系所组成的数据组织关系。关系型数据库采用通用的 SQL 语言,开发流程完善、使用便捷,具备规范化存储要求和完整的生态体系,为当前的行业主流。根据慧博投研统计,2021 年关系型数据库占市场比约 80%。但传统关系数据库在应对海量数据处理及高并发读写状态时,存在低效率、扩展难等问题,非关系型数据库应运而生。非关系数据库采用分布式架构,实现对关系型数据库的短板补齐。NoSQL最初由 Carlo Strozzi 在 1998 年提出,原始定义为去 SQL 功能、轻量且开源的关系型数据库系统。2009 年,在 Johan Oskarsson 所举办的分布式开源数据库讨论会上,将其重新定义为非关系型、分布式、不保证 ACID特性的数据存储系统,该定义一直沿用至今。相较于关系型数据库,非关系型数据库解决了非结构化数据处理问题,且实现了数据存储的横向扩展。叠加分布式架构可使数据实现节点处理,分布式数据库在面对海量数据时仍可保持高效的读写能力,较多适用于网络级公司。但由于其缺乏表数据链接能力,目前仅适合存储逻辑关系简单的数据集。在应对复杂数据查询需求时,目前仍以关系型数据库为主。此外,非关系型数据库是对标关系型数据库的统称,具体又可细分为键值数据库、图形数据库、文件数据库、时序数据库、向量数据库等。

NewSQL 实现两大数据库优势结合,但技术仍处于发展早期。NewSQL 数据由传统关系型数据库发展而来,本质仍然为 SQL 数据库。其核心特点为在不放弃 ACID 事务特性下,实现类似 NoSQL 的数据存储、处理及扩展能力。

但由于其架构更接近于传统关系型数据库,因而开发团队需要掌握较为复杂的开发方式、存储管理和系统监控,学习成本相对 NoSQL 较高。且由于技术仍然处于发展早期,在数据协作等实际运用场景下存在局限性,未来产品落地、生态完善仍然需要时间。

按业务负载特征可分为 OLTP、OLAP 及 HTAP。OLTP 指能够提供实时在线处理事务,同时可确保实时强一致性的关系型数据库;OLAP 是指支持对大规模数据进行较为复杂的联机分析处理的关系型数据库;HTAP 是指能够同时支持在线事务处理和复杂数据分析的关系型数据库。广义的 HTAP 指的是同时支持 OLTP和 OLAP 查询的数据库,狭义的 HTAP 指同时支持行存、列存以支持 OLTP 和 OLAP查询的数据库。

按系统架构可分为集中式数据库、分布式数据库。集中式数据库中的数据存储于特定的中心节点,系统的所有业务单元、功能均集中部署于中心点上。其下游每个终端、客户端仅负责数据读写,而数据存储、控制均由主机完成。由于其数据集中存储于特定设备中,其部署结构简单,无需考虑负载均衡等问题。

集中式数据库已发展近 40 年,拥有大量的应用开发商和技术开发者,技术生态、产业生态和人才生态已高度完善。但由于单点高端硬件架构设计,其部署、运维成本均较高。且性能及容量难以实现弹性扩展,无法应对业务流量、数据量扩张的问题;区别于集中部署架构,分布式数据库的数据存储分布在多个位置,各数据库管理系统通过网络互相连接,共同组成一个逻辑上集中、物理上分散的大型数据库。相较于集中式数据库,分布式数据库在平滑扩展、性能、可靠性、成本等环节存在显著优势。

2 行业进入新发展阶段,竞争格局蓄势革新

2.1 数据库行业发展史:前关系型、关系型

和后关系型数据库行业的发展史可以分为三个阶段:前关系型、关系型和后关系型。当前行业整体趋势已进入后关系时代,具体来看:

前关系型阶段(1960-1970):实现数据独立存储,存写分离。1963 年,通用电气公司为解决复杂层次结构无法建模的相关技术痛点,研发出第一个网状数据库管理系统。随后北美航空公司为应对登月计划中海量数据的处理需求,开发出 GUAM(Generalized Update Access Method)软件,并于1968 年联合 IBM 实现商业化产品落地(IMS 系统)。两大系统共同促成数据库产品的诞生。但由于彼时数据库缺乏充分的理论基础及编写复杂等问题,初期产品未实现规模化推广。关系型阶段(1970-2008):理论逐步完善,实现规模化推广。1970 年,IBM 实验室的 Edgar Frank Codd 提出了基于集合论及谓词逻辑的关系模型,为关系型数据库的出现提供了理论支撑。1974 年,IBM 在经过相关论证后(关系型数据库原研项目:System R)后,推出了首个关系型数据库原型 Ingres,其为后期的 PostgreSQL、Sybase、Informix 等知名产品提供了大量源码支撑。随后,依托 1980 年 Ingres 的商业化落地,关系型数据库产品大量涌现,行业正式进入商业化发展阶段。截至目前,关系型数据库仍为行业核心产品之一,相关产品仍处于持续研发、迭代的过程中。后关系阶段(2008-至今):实现模型拓展与架构解耦并存。2000 年后,基于信息技术的迅猛发展,数据量呈现出高速增长态势。传统关系型数据库(集中式)无法满足企业存储扩展等需求,其架构也无法应对业务瞬时高峰的数据处理问题。叠加 web 2.0 等技术出现对高并发读写、数据实时分析需求的催化,分布式数据库、非关系数据库相继出现。行业自此迈入品类丰富化、技术多元化的协同发展新阶段。

2.2 行业仍处高速发展期,云化趋势打破既有格局

全球数据库市场规模庞大,未来仍具备高增基础。根据 Gartner 数据,2022 年全球数据库市场规模为 910 亿美元,同比增长 14%。2022 年增速回落主要系全球宏观经济走弱,行业需求短期承压。长期来看,根据 PXR 预测, 2025 年全球数据量预计达到 181ZB(2022 年 64.2ZB),数据量的高速增长将为行业延续高增提供稳定支撑。

云化趋势打破既有市场格局,云厂商异军突起。伴随全球数字化持续推进&云计算技术迭代,数据库上云趋势明显。根据 Gartner 统计,2022 年云部署数据库对整体收入增长份额贡献率达到 98%,当前已成长为行业的主要驱动力。分厂商来看,Oracle、IBM 等传统数据库龙头市场份额持续下滑,2022 年老牌龙头Oracle 占比滑落至 20.27%(较 2017 年下滑 15.83pct)。AWS、微软等云服务商市场份额提升明显。后续伴随云部署深化发展,传统数据库龙头厂商份额或将持续走跌。

3 国内市场现状:行业结构重塑,国产迎来蓬勃发展期

3.1 行业规模持续高增,国产化率稳步攀升

市场规模持续扩张,有望受益数据需求高速增长。根据信通院数据显示,2022年我国数据库整体市场规模为 403.6 亿元,预计 2027 年将达 1276.8 亿元,23-27 CAGR 有望超 23%,行业仍然处于快速发展期。此外,根据《2022 数字中国白皮书》显示,2022 年我国数据产量达到 8.1ZB,占全球比重为 10.50%。而同期数据库产业规模目前仅占全球 7.17%。据我们测算,仅 2022 年我国数据库产业仍有约 187.7 亿元的潜在价值未得到有效释放,后续伴随数据量的持续高速增长,行业有望实现超预期增长。

老牌龙头优势走弱,云化趋势助推国产市占率稳步提升。根据 IDC 统计,2022年国内关系型数据库市场规模 34.3 亿美元,其中本地部署关系型数据库市场规模份额约 13.6 亿元,占比为 39.5%(同比-4.9%);公有云关系型数据库约 20.8亿元,占比为 60.5%(同比+4.9%)。本地部署模式下,受国产替代、本土新兴厂商持续入局影响,市场集中度持续下降,2022 年前五名厂商市场份额已跌至53.6%(较 2021H1 下跌 9.6pct);公有云部署模式下,阿里、腾讯等国产云厂商已占据绝对优势,2022 年二者市场份额总计超 50%,未来优势有望进一步深化。总体来看,本土数据库产品体系已逐渐成熟,2022 年前五大本土厂商市场份额已达 55.4%(较 2018 年提升 28.3pct)。未来在云化趋势及生态体系完善的双重催化下,有望进一步实现市场份额提升。

3.2 模式百花齐放,开源加速国产产品落地

国产数据库市场参与者主要由传统厂商、云厂商、新兴厂商及跨界厂商构成。其中,传统厂商主要分为达梦数据、人大金仓、神舟通用等专注于传统数据库领域的数据库企业,其背靠信创赛道且具备国有资源优势;云厂商主要由阿里云、百度等传统互联网大厂构成。其具备成熟云计算技术及生态体系,在云数据库领域存在明显优势;新兴厂商主要由海量数据、PingCAP 构成,其依托开源技术或细分领域技术优势,近年已逐步打开市场空间;跨界厂商主要由中兴、浪潮等传统 IT 企业构成,其依托海量既有客户资源,通过定制化服务等方式较好的实现了数据库产品落地。

发展路线多样,多技术路径共促发展。我国早期数据库主要以闭源自研为主。但根据金融信息化研究所统计,以多年发展结果来看,仅依靠自研在初期市场规模拓展和技术迭代上存在一定制约。目前主流的技术路线包括:

闭源自研:通过确定的开发主体和服务提供者,实现软件迭代升级的自主把控。优势在于数据库开发者完全主导和决策产品的研发方向,可对特定行业和客户提供定制版本,代表产品为武汉达梦数据库。基于开源代码研发:通过汲取成熟的开源的技术和商业模式,实现产品快速落地,是早期头部企业及当前国内初创厂商的主流发展路径,但由于地缘政治等因素影响,存在较高断供风险。目前来看,采用开源路径的企业较多集中于头部云厂商及跨界厂商。根据墨天轮统计,几乎所有的云厂商都有基于 MySQL 的 RDS 提供,头部 IT 厂商的独立解决方案或产品也几乎都基于 MySQL 发展而来。收购商业源码:该种模式在继承了国外开源数据库的技术和生态优势上,极大地增加了企业的自主可控性。但由于开源协议具备隐含法律风险,如果不具备形成分支技术的能力,未来同样面临断供风险,目前部分厂商已在积极转型。以南大通用为例,旗下初代产品 Gbase 8t 早期主要基于Informix 技术授权打造。后续通过对核心代码的吸收理解,在源代码上持续创新升级,目前产品已替换为自主可控的安全数据库 Gbase 8s。

行业开源加速,技术共享推动国产产品百花齐放。根据 DB-enginees 显示,自2021 年起,开源数据库热度持续高于商业闭源版,行业开源趋势已成为业内共识。受益于技术共享,我国数据库产业也实现了快速发展。据信通院统计分析,截止 2021 年 6 月我国关系型数据库中基于开源数据库 MySQL 和 PostgreSQL 进行二次开发的个数分别为 23 和 24 个,依次占关系型数据库比例为 28.40%和29.63%,总计占 58.03%。

采用开源本质为实现产品快速落地、补齐产品矩阵,未来部分厂商有望向自主可控转型。短期来看,开源可以显著降低厂商学习(特别是数据库核心技术)成本,推动国产产品的快速落地,实现市场份额获取。同时开源具备生态共建属性,其产品已具备丰富的工程实践测试场景,短期内可保障国产产品性能。长期来看,部分头部企业趋向于首先采用开源技术,后期通过代码自研替代实现产品换代,采用开源技术仅为支撑产品过度。目前华为 GaussDB(早期基于PostgreSQL)、阿里巴巴 Oceanbase(早期基于 MySQL)在该条路径下都已实现了完全的代码自主可控。3.3 产品结构多元,分布式、非关系型有望实现弯道超车

3.3.1 集中式仍为行业主流,分布式赛道长坡厚雪

短期集中式数据库仍为主导,占比超 80%。根据艾瑞咨询的研究数据显示,剔除数据仓库后,2022 年集中式数据库市场份额仍占据约 80%的比重,分布式部署则不到 20%。主要系实际下游使用场景中,目前绝大多数业务并未达到必须采用分布式架构的数据规模。以金融行业(2021 年需求份额占比约 22.3%,为数据库主要需求端)为例,根据信通院统计,目前集中式数据库在金融业总体占比仍达 89%(其中银行 80%,证券和保险业占比超过 90%)。长期分布式优势凸显,国产具备弯道超车潜能。长期来看,集中式数据库缺乏可扩容性及高并发处理能力。而数据量的持续增长为确定性预期,扩展弹性更强的分布式数据库将逐步成长为行业主流。我们认为,当前以 Oracle 为代表的老牌数据库企业优势侧重于集中架构,分布式有望成为国产数据库实现弯道超车的核心催化剂之一。

3.3.2 数据结构日新月异,非关系型逐步崛起

数据结构持续变革,非关系型数据库存在需求缺口。根据 IDC 预测,2025 年179.6ZB 数据中的 144.3ZB 将为非结构化数据(占比 80.35%)。结合 IDC、信通院及新浪财经汇率数据,据我们测算,2022 年我国非关系型数据库市场规模占比仅约 41%,存在明显需求缺口。

产品结构仍以关系型为主,非关系型潜心蓄势。从产品数量来看,根据信通院统计,截止 2023 年 6 月,我国关系型数据库共计 156 个(占比 65.5%),非关系型数据库 82 个(34.5%)。短期来看,市场格局仍由技术完善的关系型产品把控。长期来看,目前非关系型研究方向已成为行业新热点,非关系型产品有望依托高研发实现性能提升。以 SIGMOD 为例,2020-2022 年,非关系型数据库论文占三年论文总数量已达 17%,其研究总量已与体系成熟的关系型数据库论文数量相当。后续伴随相应研发的技术落地,有望推动国产非关系数据库实现快速扩张。

4 未来展望:短期看信创、长期看生态、新兴看趋势

数据库细分赛道众多,产品落地战略存在差异。由于数据库自身品类丰富,且下游需求多样,各细分赛道存在一定差异性,总体数据库市场份额并不能充分反映行业的竞争格局。按照不同下游特点、需求,经过我们梳理,将数据库行业重新分为以下三条赛道(需注意各赛道间存在业务交融,各厂商间存在跨领域布局。梳理主要基于其在特定领域的比较优势):1)信创必选替换赛道,其对应需求端主要为以金融、电信、央国企、政府等为代表的核心产业,核心诉求在于技术的安全可控。产品力达到“好用”阶段,即可实现规模化落地。短期内,具备自研属性、已深度嵌入信创体系中的厂商有望道进一步扩大自身优势。代表企业主要为达梦数据、人大金仓(太极股份)等数据库厂商;2)商业可选赛道,主要对应核心产业的非安全类信息存储及以中小型民企为代表的非核心产业存储需求。较头部央国企而言,普通民企业务较少涉及国家安全层面,短期内无需在既有产品稳定运行基础上进行国产替换。其未来长期的采购驱动将主要基于国产产品的性能、价格及是否能兼容企业所使用的其他数字化产品。故而我们认为,具备生态体系支撑、产品可充分适配既有数字化体系的厂商有望在该领域深化其竞争优势。代表企业主要为海量数据(OpenGauss 核心战略伙伴);3)新兴产品赛道,以图数据库、向量数据库等为代表的新兴产业基础存储业务。由于下游需求端目前普遍处于萌芽期到成长期阶段,市场格局暂未形成,但相应产品未来需求已具备确定性,我们认为,目前已形成技术领先、具备确定性产品落地预期的的厂商未来有望领跑对应赛道,代表企业主要为星环科技。4.1 短期确定性需求看信创,产品可用即可规模化推广信创产品进入“好用”阶段,已进入应用落地新阶段。自 2020 年信创启动至今,我国信创相关产业持续蓬勃发展,当前已形成了全链条、全体系的信创产业支撑,产品也逐步从“可用”向“好用”实现转型。叠加 2022 年以来,“科技创新”和“信息安全”等领域相关政策的密集出台,各行业信创项目已步入稳步推进阶段。

新一轮信创浪潮核心,数据库必选需求空间广阔。 2022 年 9 月底,国资委下发了重要的《国资委 79 号文》,全面指导并要求国央企落实信息化系统的信创国产化改造。其中,明确要求到 2027 年底前,实现所有中央企业的信息化系统国产化替代。但由于技术壁垒、生态完善程度等因素,信创细分领域的国产替代周期存在较大差异,以工业软件(GIS)、中间件等技术成熟、生态完善的产业或已逐步实现国产替代,产业进入落地尾声。而以数据库为代表的技术相对成熟、生态体系进入逐步完善阶段的基础软件有望在新一轮信创浪潮中实现牵头落地。根据亿欧智库统计,预计到 2027 年,信创数据库规模占行业整体比例将达 29.60%(较 2021 年提升 9.53pct)。

信创核心看安全,技术自主可控&国资背景构成核心竞争力。信创产品落地主要分为行政驱动及产品驱动,以芯片、服务器、操作系统、数据库、中间件为代表的核心产品,落地主要依靠行政驱动力,而行政侧的采购诉求侧重于“技术自主可控”,产品只要达到“能用”级别便足以打开市场。叠加安全需求加持,我们认为,在信创细分赛道中,具备安全保障、国资背景及技术自主可控的企业有望实现市占率的持续提升。4.2 长期选择性需求看产品+生态,多类产品已具备国际竞争力

4.2.1 未来行业或将形成生态主导,具备体系支撑的厂商或将受益

异构环境催生技术互联,生态体系支撑或成潜在优势。由于早期企业整体数字化水平较低,采用的数字产品也较为单一,数据库的核心价值在于对事务数据的存储,产业相对独立。对于数据库厂商而言,无需过多考虑对上下游的适配兼容问题,只需侧重于打磨自身产品性能,形成产品差异化优势即可实现市场份额的拓宽。而当前伴随数字化产品的持续丰富叠加上下游产业的逐步分散,兼容性问题对数据库厂商而言日趋重要。我们认为,具备生态体系支撑、可实现广泛兼容的产品有望率先在可选领域受益。信息产业已涌现多个生态体系,生态嵌入型厂商或将持续受益。当前我国信息化产业中已形成多个生态群,例如华为、中国电科、中国电子等。以华为为例,其产业已涉及芯片、云计算、服务器、整机、操作系统等多个领域,实现了从硬到软的全方位覆盖。而作为华为开源数据库社区(openGauss)第一大商业发行版厂商与第二大代码贡献者的海量数据,未来有望依托华为生态价值的整体提升实现业绩扩张。4.2.2 部分产品力已处世界领先水平,开源有望加固既有竞争优势

部分国产产品性能已达行业前列,可选需求有望实现放量。数据分析型基准测试自 2006 年公布以来很快被业界认可,是公认的衡量数据库数据分析能力的权威标准之一。对于数据库企业而言,TPC-C 测评类似于处理器厂商的 SPEC,可让用户直观感受到产品的实际水平。据 TPC 官网最新数据显示,腾讯 TDSQL、阿里巴巴的 Hologres(一站式实时数据仓库引擎)分别位列事务处理型基准测试(TPC-C)及数据分析型基准测试(TPC-H,30,000GB)榜首。在剔除信创的刚性替换需求下,我国数据库产品力自身已实现了大幅提升,后续有望在可选产品领域里实现放量增长。结合亿欧智库统计数据来看,我们预计 2027 年国产市占率将达到 45.40%(剔除信创)。

头部国产厂商逐步开源,体系共建有望加速产品力提升。产品开源有助于通过共建方式加快产品迭代,实现产品力的快速提升。以当前开源活跃度排名第一的 TiDB 为例,目前仅需 2~3 年即可完成软件重构。但由于我国数据库开源时间较短,还未形成足够多的开发者社区和服务者群体,生态圈仍处建立阶段。未来伴随市场信任加固、生态体系成熟,我国开源产品活跃度有望持续提升。

4.3 新赛道发展方向多元,细分领域已出现新兴企业领跑

新赛道格局仍然分散,技术领先企业均有望实现行业领跑。传统老牌厂商经过多年发展,与上下游已形成显著的合作粘性。其已具备成熟的生态体系。新参与者由于缺乏与上下游其他产品的兼容能力,即便产品具备成熟技术也较难参与其中。而对于新兴领域,由于同时缺乏有效的供给、需求,行业格局、上下游生态均未形成,传统头部厂商的生态优势难以发挥。我们认为,当前各厂商均处于同一起跑线,如若自身技术、产品能契合行业发展趋势、实现先发落地,未来均有机会实现行业领先。因而从投资角度来看,对未来行业趋势的正确把控尤为关键。经过我们梳理,认为行业未来大发展趋势主要可分为湖仓一体、AI 配套数据库两大主线。4.3.1 趋势 1:湖仓一体加速发展,具备技术稀缺性有望实现业绩提速。湖仓技术处于萌芽末期,产品有望加速落地。从定义来看,湖仓一体是一种开放式的数据架构,其结合了数据湖的灵活性和可扩展性,以及数据仓库的数据结构和数据管理功能。根据 Grater 技术曲线显示,目前数据湖仓技术已处于技术萌芽末期,短期内有望实现技术向产品的规模落地转化。

--- 报告摘录结束 更多内容请阅读报告原文 ---

报告合集专题一览 X 由【报告派】定期整理更新

(特别说明:本文来源于公开资料,摘录内容仅供参考,不构成任何投资建议,如需使用请参阅报告原文。)

科技 / 电子 / 半导体 /

人工智能 | Ai产业 | Ai芯片 | 智能家居 | 智能音箱 | 智能语音 | 智能家电 | 智能照明 | 智能马桶 | 智能终端 | 智能门锁 | 智能手机 | 可穿戴设备 |半导体 | 芯片产业 | 第三代半导体 | 蓝牙 | 晶圆 | 功率半导体 | 5G | GA射频 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圆 | 封装封测 | 显示器 | LED | OLED | LED封装 | LED芯片 | LED照明 | 柔性折叠屏 | 电子元器件 | 光电子 | 消费电子 | 电子FPC | 电路板 | 集成电路 | 元宇宙 | 区块链 | NFT数字藏品 | 虚拟货币 | 比特币 | 数字货币 | 资产管理 | 保险行业 | 保险科技 | 财产保险 |

    以上就是本篇文章【数据库:行业景气百舸争流千帆竞,细分赛道长坡厚雪奋者先】的全部内容了,欢迎阅览 ! 文章地址:http://yejunbin01.xhstdz.com/quote/66249.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://yejunbin01.xhstdz.com/mobile/ , 查看更多   
发表评论
0评