报告编委
爱分析
黄勇合伙人首席分析师
张扬合伙人首席分析师
洪逸群高级分析师
任理分析师
中国信通院云大所
魏凯中国信通院云计算与大数据研究所副所长
序言
数字化时代,数据使用场景呈现多元化趋势,数据规模也随之爆发式增长。海量异构数据的爆发式增长,对数据库的存储和计算能力提出了更高的要求。分析型数据库因其在处理海量实时数据时具有优秀的存算和管理能力,近年来赢得了市场的青睐。
分析型数据库最早的定义是指从分散的数据源中抽取、清理和汇集各类结构化数据,形成面向特定分析主题的、相对稳定且能反映历史变化的数据集合,并通过OLAP(联机分析处理引擎)来对这些数据进行分析,即通常意义的数据仓库。其中OLAP数据库概念最早由关系型数据库之父E.F.Codd于年首次提出,他认为用户的决策分析需要对关系型数据库进行大量计算才能得到结果,OLTP(联机事务处理)已经不能满足终端用户对数据库查询分析的需要,因此,E.F.Codd提出了多维数据库和多维分析的概念。OLAP数据库的提出引起了很大的反响,OLAP数据库作为一类产品同OLTP数据库明显区分开来。
在此后近30年的演进中,分析型数据库先后出现了共享存储架构数仓、大规模并行处理(MPP)架构数据仓库以及数据湖等技术架构。近年来,随着企业数据分析需求的不断提升,具有流批一体和存算分离,能通过元数据层在数据湖上实现数据管理功能的智能湖仓受到了更多