优质产品推荐系列之华为云GaussDB(for openGauss)数据库
近期由于项目需求,对国产化数据库产品进行详细了解,对其中的优质产品做内部推荐,本期关注华为云GaussDB数据库。
GaussDB基于统一架构,支持关系型与非关系型数据库引擎,满足政企全场景的数据智能管理需求,开启数据库极速与融合时代,加速政企智能升级。
GaussDB是华为自研数据库品牌,是华为基于外部电信与金融政企经验、华为内部流程IT与云底座深耕10年以上的数据库内核研发优化能力,从客户对高可用、高性能、安全可靠等诉求出发,结合云的技术倾力打造的企业级分布式数据库。
GaussDB是一个产品系列,在整体架构设计上,底层是分布式存储,中间是每个DB特有的数据结构,最外层则是各个生态的接口,体现了多模的设计理念。
GaussDB(for openGauss)是基于华为主导的openGauss生态推出的企业级分布式关系型数据库。该产品具备企业级复杂事务混合负载能力,同时支持分布式事务,同城跨AZ部署,数据0丢失,支持1000+的扩展能力,PB级海量存储。同时拥有云上高可用,高可靠,高安全,弹性伸缩,一键部署,快速备份恢复,监控告警等关键能力,能为企业提供功能全面,稳定可靠,扩展性强,性能优越的企业级数据库服务。
具体产品
关系型数据库
■ 基于openGauss生态的分布式数据库GaussDB(for openGauss);
■ 基于MySQL生态的分布式数据库GaussDB(for MySQL),100%兼容MySQL。
非关系型数据库
■ 基于文档的分布式数据库GaussDB(for Mongo),100%兼容MongoDB的接口,解决了开源的协议风险,用3副本解决9副本的可靠性;
■ 基于时序协议的分布式数据库GaussDB(for Influx),解决了开源主备的容量问题;
■ 基于宽表Cassandra的GaussDB(for Cassandra),解决了Java方案的GC抖动的严重问题,数据强一致;
■ 基于KV接口GaussDB(for Redis), 当前100%兼容Redis,未来可以兼容更多的KV协议,数据强一致,超大容量10T+,解决了开源主备脱节等问题。
数据库工具及中间件
■ 数据迁移 — DRS (Data Replication Service,简称为DRS);
■ 应用结构转换 — UGO (Database and Application Migration UGO,简称UGO);
■ 分布式数据库中间件 — DDM (Distributed Database Middleware, 简称DDM)。
关键技术方案
高性能——分布式并行执行框架
分布式执行框架会根据业务SQL生成最优执行计划,通过算子下推、并行执行等技术,提升分布式执行效率。
算子下推:完美sharding的单节点执行、点查等不需要DN间数据交互的场景下,CN将SQL直接下发至DN执行;跨节点分布式执行、关联查询等需要DN间数据交互的场景下,CN将执行计划下发给DN,DN间通过Streaming算子完成数据聚合。
并行执行:节点间支持DDL、DML等SQL语句并行执行;节点内支持基于数据页的并行查询。
高性能——分布式事务处理性能,GTM-Lite技术
GTM-Lite技术,在保证事务全局强一致的同时,提供高性能的事务处理能力,避免了单GTM的性能瓶颈。
CSN提交序列号代替活跃事务列表进行可见性判断,无需遍历事务列表,提升了事务可见性判断效率。
事务管理节点GTM,通过无锁原子操作提供CSN序号,不存全局单点瓶颈。节点间事务交互仅需要一个CSN,大大降低各节点间事务状态同步的网络开销。
全局数据结构NUMA化改造。通过工作进程NUMA绑核、全局数据结构NUMA分区化改造,减少跨核、跨处理器竞争冲突。
多核原生指令级优化。将多个指令汇聚成1个指令,提升指令效率。
并行回放实现极致RTO。通过日志流水线、批量回放和Block级物理并行恢复等关键技术,日志回放效率大幅提升,实现大压力下RTO<10s的极致高可靠。
多层级冗余无单点故障。所有故障场景可检测、可恢复,通过硬件冗余、实例冗余、数据冗余,实现整个系统无单点故障。
同城跨AZ双活:实现同城部署,应用分担,近实时故障切换;可配置不同的逻辑单元,实现应用层的就近数据访问。
两地三中心:通过AB数据中心同城双活,C数据中心异地容灾,使用跨Region的容灾能力。
异地多活:支持多中心统一查询及全局一致读,整体资源利用率高;通过配置多副本,可以实现DC,AZ,Region级高可用容灾策略,实现灵活的高可用方案;同时可以实现故障的无缝切换。
在线扩容。通过hashbucket聚集存储和多轮追增等技术,减少锁表时间,实现应用无感知的在线扩容。
通过增加服务器,实现系容量和性能的线性Scale Out。支持1000+超大分布式集群的能力,可以轻松应对海量高并发数据处理和复杂查询场景的考验。
产品优势
GaussDB汇聚全球资源,全球7个区域、2000+数据库/数据仓库/大数据的高级内核引擎、算法、性能等专家与专业人才,持续战略投入10多年。在金融政企市场,GaussDB本地部署(Huawei Cloud Stack方案)取得国产数据库第一的市场份额;在泛互联网市场,公有云增速第一(来源:2020下半年IDC中国关系型数据库软件市场数据跟踪报告);同时,全球DBMS市场份额进入了前十名(来源:Gartner Market Share Analysis: Database Management Systems, Worldwide, 2020);在1500+金融政企与泛互联网大客户取得规模商用;与100+伙伴建立合作关系,共享市场机会;并积极投入高校合作和开发者生态,累计赋能15万以上开发者。
GaussDB全栈产品和解决方案,让客户
■ 选型安心:自主生态+开源生态,SQL+NoSQL,分布式统一的架构,性能卓越,安全可靠;
■ 迁移放心:从数据的在线迁移到应用的结构转换,迁移无忧;
■ 生态无忧:支持开源与自主双生态。
GaussDB(for openGauss)的优势有:
■ 高可用:同城AZ内节点故障,RPO=0,RTO<10s;同城跨AZ级故障,RPO=0、RTO<60s;保证数据0丢失。两地三中心异地容灾方案,跨Region数据实时灾备;
■ 混合负载高性能:支持高吞吐强一致性事务能力,鲲鹏2路服务器,32节点1500万tpmC;
■ 高扩展性:GTM-Lite技术打破传统分布式性能瓶颈,计算与存储可自由水平扩展,支持1000+计算节点在线扩展,性能随扩展准线性增长,具备卓越线性比;
■ 高安全:业界首个纯软全密态数据库技术,实现数据从传输、计算到存储的全程加密;
■ 卓越性能:分布式优化器+Numa-Aware技术加持,提供极致的性能。支持PB级海量存储,在TPC-C、TPC-H等多种企业级负载下性能卓越;
■ 丰富的企业级特性:支持分布式存储过程,分布式触发器,外部表,透明加密,全密态,防篡改,WDR诊断报告,智能诊断,索引推荐等丰富的企业级特性,有效提升客户开发运维效率;
■ 安全可信:基于数据库领域10年+积累,自主研发的新一代企业级分布式关系型数据库;核心代码拥有100%知识产权,对产品的所有模块都具备代码级的问题修复及架构优化能力;
■ 全栈软硬自研可控,生态可控:业界领先的存储+网络+计算+openGauss自研开放生态。
应用场景
适用于政企OA办公、ERP CRM等应用场景,1500+金融政企行业标杆大客户选择GaussDB。
职业认证
华为云职业认证含HCIA(工程师)、HCIP(高级工程师)、HCIE(专家)三个级别,GaussDB数据库认证已上线和发布。
■ HCIA-GaussDB V1.5
■ HCIP-GaussDB-OLTP V1.5
■ HCIP-GaussDB-OLAP V1.5
华为云学院职业认证:https://edu.huaweicloud.com/training