广义的数据库通常指数据库系统(DBS),其包含数据库与数据库管理系统两部分,向上通过数据库管理系统支撑应用引擎,向下以数据库承接文本、图像、声音等数据源,调动计算、网络、存储等基础资源。
数据库(Database,DB)是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合,是按照一定的逻辑结构组织、存储、管理数据的大容量电子文件柜。
数据库管理系统(DatabaseManagementSystem,DBMS)是对数据库进行统一管理和控制的大型软件,主要由内核组件集和驱动组件构成,其中内核组件集按照功能模块划分为管理组件、存储组件、计算组件和网络组件。
国产数据库行业是指从事国产数据库相关性质的生产、服务的单位或者个体的组织结构体系的总称。
数据库国产化任重道远。当今世界信息技术成为国际竞争的工具,信息战极大的促进了国家信息产业的发展。数据库系统作为现代信息系统中最复杂、最关键的基础软件之一,是信息技术的关键一环,需要单独发展一个完整的信息产业链,实现自主创新,不受制于人。故全球形势驱动软件自主可控,数据库是其中的关键环节。国家政策已经将信息安全提升到国家战略层面。
其次,安全、稳定、高效运行的数据库系统对于政企业务的运转至关重要。当规模扩张、业务拓广、服务多元化后,有效的数据管理是政府与企业持续发展的保证。
当前,国内数据库产业呈现出百花争鸣、百花齐放的大繁荣大发展的局面,下面通过国产数据库的发展、类别、品牌来简单介绍国产数据库。
1.国产数据库的发展
从种子萌芽到百花齐放,国产数据库的发展经历了从探索期到萌芽期、成长期,最后到发展期的过程。
具体表现以下四个发展阶段:
第一阶段为探索期(-),其主要包括理论探索与原型研究。也就是改革开放初期,萨师煊教授和王珊教授推开了中国数据库领域的大门,培养了中国数据库的第一代人才。正是初期这些高校及科研机构的自发探索为后续国产数据库的发展埋下了一颗种子。
第二阶段萌芽期(-),其主要包括原型研发与产品开发。此时Oracle席卷中国,占据了中国很大的市场,但是为了国产数据库的发展,国家计划设立了“数据库重大专项”、“”等计划,为高校的数据库研究提供经费支持。中国高校以及科研机构进行了原型研发与产品开发,从而也有了第一代原型数据库,比如东软的Openbase、中软的Cobase和华科的DMDatabase。
第三阶段成长期(-),其主要包括产品研发与应用示范。此阶段国家“十一五”规划发布,称要以信息化带动工业化,以及年国产数据库参加“核高基”重大科研专项。有了国家政策的扶持与吸引,达梦数据库、人大金仓、南大通用和航天神舟等公司开始发展。年阿里喊出了“去IOE”的口号,年后的云计算时代和开源社区兴起,国产数据库开始了弯道超车,国产数据库领域才真正进入到了茁壮成长、蓬勃发展的时代。
第四阶段是发展期(--),其主要包括技术爆炸以及市场运作。在大数据与互联网等的发展推动下,现有数据库技术无法满足国内企业应用场景的规模和性能等需求,国内技术人员对数据库内核相关技术掌握越来越深入和全面,市场化竞争越来越剧烈,一批新兴国产数据库厂家开始涌现。一些云计算厂商以及部分数据库厂商,也基于MySQL、PostgreSQL等开源数据库做了一些改造。目前中国数据库行业进入百花齐放、百家争鸣的阶段,截至目前国产数据库的厂商数量已经超过家。
图1国产数据库发展阶段2.国产数据库类别
国产数据的分类形式也多种多样,这里以墨天轮对国产数据库进行分类统计时所使用的分类方法作为参考,将国产数据库分为了关系型、非关系型、混合型及其他。
图2国产数据库分类2.1关系型数据库(SQL)
关系型数据库的基础是关系数据模型,由关系数据集、完整性约束规则和关系运算三部分构成。通常情况下,关系数据集用多个表格作为数据结构来表示。用户可以定义表之间的关联。表中的列可以进行连接、并、交、差等关系代数运算。
按业务负载特征进行分类,关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足处理在线的实时交易事务场景,而分析型数据库满足分析业务场景,混合负载数据库目标是同时处理简单交易和复杂分析场景。
表2-1业务负载特征进行分类
按照当前部署形态主要分为两种,分别是本地部署和云原生数据库。本地部署按照架构分类主要有三类:单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛