什么是数据库?
参考Gartner对数据库的定义,数据库是一种用于存储和管理拥有固定格式和结构数据的仓库型数据管理系统。某种意义上,数据库会因为对于数据调度使用方式、基础格式之间的差异而被划分为不同的种类。在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。数据库与操作系统、中间件同为三大基础软件之一。
成长到繁荣,新兴数据库兴起
数据库这一行业技术发源并兴起于美国,如今已经广泛应用于全世界各企业之中。这一产业从诞生到日趋成熟总共经历了三个发展阶段。
萌芽期——从卡片储存方式到网状、层次型数据库
上世纪早期,数据收集与储存工作仍需借助机器制成的穿孔卡片,直到六十年代,磁带与硬盘技术应用普及才使得数据的读取和储存更为方便,世界上第一款网状数据库与商业层次型数据库也在这段时间出现。
成长期——关系型数据库的普及与发展
年,IBM公司研究员埃德加·科德提出了“关系型数据库”这一概念,他的理论有严密的逻辑且简单清晰,启发了IBM团队创建了关系型数据库的原型R系统与结构化查询语言SQL。这一套成熟的系统和理论在之后被IBM与Oracle公司接纳并开发出了如DB2、RDMBS等关系型数据库。然而随着关系型数据库的普及,这一种数据库的局限性也日趋明显。
八十年代,为进一步解决关系型数据库存在的问题,诸如面向对象型数据库、内存数据库的新概念不断被提出。由于这些针对关系型数据库的优化程式技术不断成熟,到了上世纪九十年代时,基于RDBMS类的数据库产品已经基本完成商业化,并通过可扩展标记语言(XML)运用到互联网产业当中。
繁荣期——非关系型(NoSQL)数据库的流行、数据云存储
随着互联网的发展,数据库使用者往往需要建立复杂难控的模型去处理巨量且冗杂的流量数据。年,Facebook公司发布了开源的Hives与Cassandra数据库,这一举动带动了数据库产业技术上的变动,非关系型数据库这一新型的数据库也逐渐普及。相比于传统的关系型数据库,这一新型数据库极大地增加了处理数据的总量,通过更为方便的模型大大地节省了开发与维护成本。
同时,基于“云计算”技术的新型数据存储方式也逐步兴起,并广泛应用于数据库行业之中。截至年,全球数据仓库市场已经形成了较为成熟的底层由私有云、公有云计算存储技术构成,上层由关系型数据库与非关系型数据库管理的“数据上云”模式。
两大类型为主,新兴数据库种类渐多
现有的数据库种类大致可以分为两大类,分别是较为传统的关系型数据库与刚刚兴起的非关系型数据库。
关系型数据库
关系型数据库的基层单位是由二维的行列分部组成的表格,一个关系型数据库往往可以涵盖多个行列分部表格。表格中每一行分布代表了一条独特的数据记录,而各列则代表了同一数据记录的不同特性。通过多种来源获取的数据最后会通过抽取、转化、加载后整合进一个数据仓库之中。关系型数据库根据其数据处理技术的不同又可以分为联机事务型数据库与联机分析型数据库。
非关系型数据库
非关系型数据库是一个用于概括一切可供替代传统关系型数据库的开放式术语。虽然以“非关系”这一名称命名,但这一类数据库同样也可以通过嵌套类的方式将互有关系的数据存储在同一结构当中。
非关系型数据库采用了更为灵活的数据结构,并且可以横向到达多个处理器,这吸引了更多需要处理超过单一服务器数据流量的厂家。以功能划分,非关系型数据库可以分为文档型数据库、键值型数据库、列存储数据库、图形数据库四种。
对标海外:空间广阔,开源和云兴起
市场空间:全球数据库市场空间广阔
依据Gartner数据,全球数据库行业年市场规模为亿美元,较年增长18.4%。其中非关系型数据库的市场规模约为24.1亿美元,远远少于关系型数据库的规模,但这一部分在未来几年有望保持31.4%的年复合增长率。
从地理分部维度来看,目前全球数据库市场中呈现着以北美与欧洲地区占多数,亚太地区与拉丁美洲作为新兴市场的整体地理分部趋势。海外市场中,尚未高度成熟的国家与地区在未来仍然有潜在的较快的成长趋势。
根据美国ExpertMarketResearch公司(EMR)今年发布的市场调查,年全球数据库行业市场规模已达到亿美元。未来五年,全球数据库市场可以继续保持复合年增长率13.81%的高速增长趋势,年市场规模将达到约亿美元。
可以看到,虽然不同数据源统计的行业数据有一定差异,但整体上年全球数据库市场空间在-亿美元之间,且保持10%以上的快速增长。
竞争格局:传统巨头占优,新兴厂商崛起
国外权威的数据库评分网站DB-Engines排名显示,最受用户与开发人员欢迎的技术得分较为稳定,分别是甲骨文公司的Oracle系统、MySQL、MicrosoftSQLServer三项较传统的关系型数据库技术,而非关系型数据库则是MongoDB得分最多。
除这几款数据库技术之外,其余得分较低的数据库产品仅占行业较小份额。虽然行业市场已由Microsoft、Oracle、SAP、IBM通过多种不同产品占据了近六成的份额,但这四大龙头企业之间竞争依然激烈。例如,Microsoft曾为争夺市场份额,对将数据从Oracle数据库迁徙至微软数据库的用户提供免费的授权许可。
发展趋势:开源和云兴起
数据库开源化
开源数据库系统特指源码可供免费获取,并在符合特定授权模式的情况下可使用的数据库系统。截至年8月,全球共有款不同的数据库产品,其中开源型数据库有种,约占一半的比例。
参考DB-Engine的统计数据,开源数据库受欢迎程度持续提升。近年,数据库行业中商业数据库的受欢迎程度已从年年初的64.47%逐步下降到了年八月的50.5%,而这一时段内开源数据库的受欢迎程度则从35.53%上涨到49.5%。
同时,目前数据库行业不同的数据库之间喜好的比例也不相同。相比于传统商业数据库的主要类型稳定,在开源数据库中新兴数据库类型更受欢迎。这一整体趋势说明全球数据库这一市场已经从传统的商业数据库为主的格局逐步转向商业与开源数据库混合的态势。
云数据库占比提升
根据Gartner公司年发布的市场预测,随着数据库中数据分析和SaaS模式等趋势的带动,预计到年时,全球数据库市场中75%的数据库将完成到云平台的迁徙,仅有5%的数据保持在原本的本地模式当中。
在年至年的全球数据库产业总营业额的18.4%增长中,云数据库管理产品的营业额占到68%,而Microsoft与亚马逊的AWS占到总增长的75.5%。说明云数据平台的提供基础设施与云上服务已经逐渐发展成为了新型数据平台。未来,数据库产业将建立不同于以往本地模式的基于云服务的新型生态系统。
国内市场机会:国产替代、新兴崛起
国产数据库市场持续快速增长
中国数据库产业虽然较国际市场起步晚,但是经过三十多年的发展,也逐步成熟。中国国产数据库产业已经基本应用在了政府、军队、金融、交通、科技等多个领域。目前数据库软件的上游主要由计算机硬件设备组成,而该行业的下游需求市场主要体现在消费品、装备、政府采购领域。年,相较上一年全数据库软件应用领域的平均增长达到18.91%。
参考智研咨询的数据,截止至年,中国数据库市场共有.59亿元市场规模,其中.25亿元为数据库软件市场,其余为数据库服务市场。
中国数据库市场持续增长,云数据库占比将提升。根据IDC在年发布的市场预测,年中国关系型数据库软件市场有望达到13.4亿美元,传统本地模式为7.9亿美元,公有云模式5.5亿美元。预计到年,整体市场规模将达到38.2亿美元,5年整体市场年复合增长率(CAGR)为23.3%。其中公有云关系型数据库软件市场将保持35.5%复合年增长率,到年中国公有云关系型数据库软件市场将达到25.1亿美元。
海外厂商占优,国产替代有望加速
目前的数据库市场由于技术门槛较高,且长期被国外企业垄断大多数市场,因此国内厂商的市场份额较少。以年市场数据来看,中国数据库市场主要由四家外国企业占据最多市场份额,分别为Oracle、IBM、Microsoft、SAP,四家合计市场份额高达64.8%。
随着数据系统市场的不断发展深化,用户需要处理的业务、用户数据的增加,传统的小型机服务器系统瓶颈日益突显,性能优化需求已是大势所趋。同时,对于国外系统在中国各领域的应用隐含的信息安全问题也加深了用户对自主、安全、可控的国产数据库产业的需求。此外,X86服务器与储存性大幅提升,系统交互日益成熟。这三点因素进一步推动了各中国公司信息自主化、扶持自主信息产业替代国外商用数据库、实现安全可主要目的的“去IOE”的进程。
目前为止,替代占据主要市场的国外商用的进程总体上已经稳步推进。如阿里、华为等厂商逐步开发了更安全、自主、可用的云平台产品用于数据迁移和更为节约成本的数据计算技术。从年国内“去IOE”进程开始到年期间,国产数据库产品占国内数据库市场的份额正在飞速提升。尤其在年至年间,年增长率高达36.33%,远超同期国外数据库产业在国内市场15.98%的增速。预计未来,随着“去IOE”进程的全面化,这一占比将继续提升。
新兴数据库趋势:多技术融合
根据Statista统计报告,全球每年产生的数据量值近年来正呈现飞速增长态势。预计到年,全球每年产生的数量将达到50.5ZB。自年以来,每年中国市场产生的数据量增长率都在50%左右。这预示着未来数据库产业的产品将