迎接大数据分析时代 金仓推出分析型数据库
随着政府、金融、电信、能源等各企事业单位数据中心建设和运营的逐步深入,TB甚至PB级运营数据已经屡见不鲜,数据计算全面进入大数据时代。另一方面,除了数据存储、数据管理等典型业务需求外,数据中心管理者更需要数据挖掘和决策分析等一整套解决方案。大数据分析已经成为当前典型迫切的业务需求。
作为国产数据库领军企业的人大金仓,积极迎接大数据时代对海量数据分析提出的技术挑战,继发布金仓数据库KingbaseES V7和金仓商业智能统一平台Kingbase SmartBI V2之后,全新推出面向商业智能和在线数据分析应用领域的高性能10TB级海量数据库管理系统:金仓分析型数据库—KingbaseES V7分析版。KingbaseES V7分析版内置行存储和列存储两大数据存储和执行引擎,提供高效的透明数据压缩和并行数据装载能力,集成高性能并行处理技术和丰富的OLAP优化手段。能够灵活应对各种纷繁复杂的业务场景,是现代数据中心构建在线事务处理和商业数据分析混合业务应用的非常好的选择。
KingbaseES 分析版的技术架构如下图表示:
Kingbase ES 分析版从架构上可以分为三层。最底层是数据存储层,主要完成存储管理、封锁、并发控制、事务管理、日志管理等。第二层是执行引擎层,主要完成SQL 接口底层实现、解析、优化和并行处理等。最上层是接口层,主要包括各种数据库访问接口,以及数据库管理工具和开发工具的支持。
可以看到,Kingbase ES 分析版被设计为行列两个存储引擎和执行引擎。使得KingbaseES数据库可以从容应对各种OLTP和OLAP混合业务场景,满足企业复杂业务场景对数据库系统的综合性技术要求。
金仓分析型数据库—Kingbase ES 分析版的总体技术特性如下:
· 双重引擎,深度加速
KingbaseES分析版内置行、列两大数据存储和执行引擎,可以灵活应对OLAP+OLTP混合业务场景。按列存储有效适应海量数据分析应用对数据列敏感的业务场景,将对列的聚集操作和更新等操作,分别转化为对磁盘的顺序读和顺序写, 从而从核心层面有效降低数据I/O,加速数据查询处理性能。同时,按列存储可以获得10-40倍以上的高效透明的垂直数据压缩能力,有效降低数据存储开销,减少数据装载和I/O的时间,从而降低现代企业数据中心的总体构建和运维成本,提升业务运行效率。
· 智能索引,多重优化
索引在传统数据库中的维护带来了较大的维护开销,尤其数据量持续增长后表现非常明显。KingbaseES分析版的列存储引擎采用被称作自适应优化器的极小的元数据层来替换常规的索引,自动为每列数据维护粗粒度的索引而不需要用户手动维护。同时,列存储引擎还内置分段统计、扫描结点的物化推迟等多重优化技术,大幅提升OLAP查询性能。
· 快速装载,并行计算
分析型业务场景往往伴随着海量历史数据,从而对数据加载、处理时效和数据管理的可扩展能力有着更高的能力要求。KingbaseES分析版通过对数据装载功能进行了并行优化,充分调度现代多核CPU处理能力,提供单表300GB/小时、多表500GB/小时的高速数据装载速度。同时,KingbaseES分析版还内置高效的并行SQL 执行方法,并支持与金仓云数据集群架构整合,提供基于大规模并行处理(MPP)架构的PB级数据管理线性扩展能力。
· 接口丰富,使用便捷
金仓分析型数据库有效继承金仓通用数据库在数据类型、函数、SQL以及与第三方数据库兼容性上的丰富支持能力,提供统一一致的开发接口和管理界面,有效降低学习、开发和维护成本,保证业务应用的平滑迁移。
1秒 PK 数月时间
我们来看下应用了大数据分析型数据库后能给客户带来哪些好处?
据专家分析:在利用大数据的过程中,数据的分析处理速度往往决定了数据应用的成败,用户很难接受一个长达数月的分析。分析型数据库替代传统行存数据库解决了用户海量历史数据的存储和I/O开销过大、加载时间过长、无法有效结合业务场景提升数据查询效率等问题。而分析型数据库与实时商业智能分析技术的综合运用可以将分析的响应速度提高到秒级,完全可以满足用户的业务要求,使用户获得良好的应用体验。
谁会用到金仓分析型数据库?我们来看两个大数据分析应用的案例:
① 沃尔玛是最早通过利用大数据而受益的美国企业之一,拥有世界上最大的数据仓库系统。通过对消费者的购物行为等海量数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。② 3月11日日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警。随即,NOAA通过对海洋传感器获得的实时数据进行计算机模拟,制作的海啸影响模型出现在YouTube等网站。
大数据分析已经不再局限于互联网的范畴和IT领域,有大量数据生成的用户数据掘金都有可能用到:例如银行、公共事业部门、科学、制造以及气象等众多行业,都出现海量的数据应用,如果能应用金仓分析型数据库及商业智能平台等合理的管理、挖掘这些数据资源,对所在行业的发展将带来不可估量的巨大推动作用。
人大金仓总裁任永杰博士表示:“在大数据时代,用户的需求不仅仅局限于数据存储,更向数据管理、分析、展现、挖掘、保护及相关服务等多元化方向发展。人大金仓将立足基础、融合吸收、重点突破,金仓分析型数据库、商业智能平台等只是金仓应对大数据挑战推出的部分解决方案,我们计划用3-5年的时间,将人大金仓打造成为国产大数据中心一站式解决方案提供商,迎接大数据、大应用、大服务的时代。”
人大金仓分析型数据库的推出,顺应了大数据分析时代的市场趋势,丰富了金仓大数据中心一站式服务的产品线,为用户进一步高效挖掘数据价值、提高社会效益和经济效益贡献了一份力量。人大金仓分析型数据库的推出必将引发新一轮基于国产数据库大数据分析的应用高潮,对推进大数据时代我国信息化建设带来深远而积极的影响。