文|光锥智能,作者|刘雨琦
【资料图】
2020年,据数据统计,以Oracle为代表的国外厂商仍占据我国数据库市场80%以上份额,国内厂商仅占20%,时至今日,国内数据库厂商已经“夺回”47.4%的市场份额。
国产数据库崛起的第一阶段,“去O”(Oracle)是最核心的关键词。国产数据库想要求生存,就必须在存量市场中,面临Oracle的绝对统治地位,在统治下摸爬出一片天地。
6月7日,在华为全球智慧金融峰会2023上,中国信通院云计算与大数据研究所所长何宝宏强调,国产数据库正进入一个新阶段。在存量市场进行高质量替代,标杆案例正在加速出现,供给侧开始收敛。同时,在增量市场,新的理念、新的需求产生了新的产品,和新的市场增量。
而华为副董事长、轮值董事长、CFO孟晚舟的出席,更说明了云数据库是华为推动整个数字经济发展的重要抓手。
华为轮值董事长孟晚舟
过去两年,在信创风口下,“去O”的速度比想象中的更快。据亿欧智库统计,截至2021年H2,Oracle、Microsoft、SAP、IBM四家在本地部署关系型数据库市场下占据43.9%的市场份额。
当然,份额争夺战的背后是国内厂商对数据库的长期自研。2017年,阿里云发布了全新一代云数据库产品PolaDB;2018年,腾讯云第一款自研的云数据库产品CynosDB面世;2019年,华为云将自研云数据库GaussDB向市场化推出。
更重要的是,云原生2.0时代,带动国产数据库快速来到增量市场。云部署和云原生数据库的快速发展,让云数据库领域国内云厂商优势显著,据统计,云数据库海外巨头份额合计仅为18.4%。
2023年-2025年,是国产数据库发展的下一个关键阶段。一方面,要继续在存量市场完成更全面的“去O”;另一方面,面对全新的技术,数据库也发展出了更多类型,为了降本的交易分析一体化的HTAP数据库、图数据、时序数据库,以及为了适应大模型时代的向量数据库应运而生。
下个阶段,国产数据库们将面临基础性能和创新性能等更为全面的考验。
01金融行业:数据库的大炼炉
“没有在金融行业历练过的数据库,不算合格的数据库。”
这句在数据库行业流行的名言,背后是一个公认的行业共识:金融行业庞大的数据量,对数据库稳定性、一致性、可用性的高要求,是考验一款数据库是否合格的标准。
国内核心的数据库,无一例外都是从金融场景诞生和成长。
阿里云PolarDB诞生于阿里云内部金融场景;OceanBase最早服务于淘宝和支付宝;腾讯云TDSQL2014年支持微众银行从0-1的打造;华为云GaussDB在外部与近10家核心银行共同打造场景化解决方案,才开始大规模面向市场。
从华为GaussDB的磨练历程就能看出,“内部没有金融场景,创造场景也要上”。华为全球智慧金融峰会2023上,华为常务董事、华为云CEO张平安表示:“GaussDB将深耕金融场景,通过全面创新,成为金融客户数据库更优的选择;并从金融行业走向其他对数据库有高要求的行业,从中国的创新场景走向全球的客户。”
之所以金融场景能够成为“磨刀石”,华为云数据库服务产品部总经理苏光牛讲到了几个关键原因。
“我们谈‘去O’,最难的有两个问题:一是替换时的成本问题,数据切换时不能宕机、前端不能抖动,要进行无感切换;二是在还没替换前,如何证明替换后的效果,得给客户一个切换的理由。”苏光牛讲道。
一位数据库技术人员告诉光锥智能:“MySQL数据库在原理上,也可以做到从单机到分布式,但是过程很长,且需要将数据库暂停运行,单独部署。短则几小时,长则几天。”
若数据库暂停才能进行切换和调试,在实际操作中可能性几乎为0。“迁不了、移不动、高成本”是企业替换数据库最大的拦路虎。
那么,华为GaussDB如何做到“无感切换”?华为云提出一套基于存算分离的“双集群强一致”的解决方案,由GaussDB数据库、数据库和应用迁移UGO、数据复制服务DRS共同组成。
简单的说,传统的迁移方案是一套数据的逐个迁移,而华为云则有一套集成工具,通过Paxos分布式协议保证数据多副本的强一致性,在GaussDB中复制一套一模一样的数据,如此,企业服务器并不需要关停,同时也能保证完整迁移。
这样的方案,逻辑简单,但执行落地却相当困难,考验的是数据库工具的全方位性能。这意味着把一份工作变成两份,方法虽然“笨”,但可以达到目标。数据的安全与便捷之中,永远都需要平衡。
腾讯云副总裁李纲就曾坦言:“腾讯云对金融行业也研究了很久,深知要说服银行使用自己的产品,难度很大。因为对银行来说,其系统的稳定性直接影响到各项金融业务,一旦出现问题,哪怕是短时间的宕机,也十分严重。”
2022年,GaussDB上线了跨中心多集群方案,同城两个数据中心部署两套独立的数据库集群软件,实现软硬件故障分离,支持版本的软硬化、应用的灰度升级,在架构上实现了7×24小时服务不间断。以中国工商银行5A级信贷核心系统为例,该行采用GaussDB的双集群双活方案,不仅可以保证集群切换时数据的零丢失,实测故障恢复时间只需2分钟,仅为原来的十分之一。
在安全性方面,光锥智能曾探访过多位代理商和商家,在企业的认知中,无论是出于华为云的品牌背书还是华为云的性能,它和安全就是紧紧绑定的。
这来源于华为云在数据库安全高度重视和探索。
这种探索集中体现在了GaussDB的全密态数据库技术中。数据加密是个老生常谈的话题,没有全密态时,传统的加密在应用层,企业要做大量的应用改造,而且应用加密后,数据库只能做单纯的存储,无法进行数据查询和处理,需要为了安全“断臂”。
而全密态数据库支持数据端到端的加密技术,也就是从源头加密。在数据流动的整个过程中,做到数据的完全机密性,从而避免数据泄露和数据篡改的风险。全密态数据库额外对数据进行加密保护,用户掌握数据加解密密钥,加解密过程仅在客户侧完成,其他查询运算在服务端完成,从源头开始直对数据上了锁,所以数据在整个流程中都是以密文的形态存在,环节多也不怕泄露。
同时,保障了跨地域数据的可信流动。尤其在金融领域的具体应用场景中,很多项目都要跨地域、跨企业运行,比如最大规模的东数西算,数据存储和结果在不同地域,全密态相当于从源头就加上了一层带密码的保护罩,保障数据的自由流动。
今年4月,阿里云的部分数据库也通过了信通院的“全密态数据库”产品能力评测,相比之下,GaussDB 100%全量通过评测,且完全摆脱了加密硬件的依赖(比如银行的数字钥匙,K宝等硬件钥匙),支持纯软件方案加密方案。
从金融场景中磨练出的稳定性和安全性,保障了GaussDB的基本盘。
张平安讲道:“目前GaussDB 已支撑了中国工商银行、中国邮政储蓄银行、中国建设银行、中国农业银行等国有大行的核心业务。”
在经受了最严苛的产品质量考验之后,摆在GaussDB面前的,是千行百业的应用场景和市场的新挑战。
不得不承认的是,相较于阿里云、腾讯云已经跨不同行业的产品,华为云GaussDB目前刚刚从金融行业迈出第一步,在市场化的进程上,仍然处于早期。
02华为云增厚PaaS层,自研版图又下一城
数据库是云厂商必须拿下的一块儿重地。
在峰会中,张平安不停地强调:“数据库是行业数字化转型、数智融合创新的关键根技术之一。”
“华为早在2001年就开始了数据库的研发,包括嵌入式数据库、内存数据库、分析型数据库、交易型数据库,这些数据库广泛应用于华为通信领域的各个产品中。”张平安在演讲中介绍。
“不仅仅要替代,更要超越。”华为云副总裁、战略与产业发展部总裁黄瑾强调。
黄瑾认为,数据库的应用除了技术创新,更多需要的是工程化的打磨,数据库作为全场景的软件,海量场景是它的“磨刀石”。
如何超越?华为云GaussDB的解题思路是:共创。
这里的共创,首先是与客户共创。和其他云厂商不同的是,华为云每一款数据库产品,除了在集团内部场景打磨,也都在客户的场景中“滚”过几轮才得以上线。
工商银行软件开发中心刘承岩曾讲到:“华为云GaussDB支撑了工行企业级数据湖、数据仓库、集团信息库一湖两库建设,同时基于华为云Stack,全面支撑数据中台的生态化建设,更好的服务于‘数字工行’转型。”
基于基础的合作,华为云数仓产品为了适应金融场景有着高并发、高变化、高峰值等特点,GaussDB与工商银行共同建设了全球最大的金融数仓,支持13000位分析师同时在线,数据查询平均等待时长由300分钟降低至90秒。
类似的案例还有很多,建设银行依托于GaussDB,为信用卡核心系统提高性能和安全可靠的表现;招商银行与华为云进行联合创新Ustore存储引擎和机遇Paxos协议的高可用DCF组件,提升查询时延和性能效率;跨国际交易的华夏银行,通过同城双活技术,保证跨过交易数据0丢失。
一边与客户共创产品,另一边与合作伙伴共建生态。
对于当下中国软件市场的现状,依然存在着“重应用、轻基础”、“软件卖不上价格”、“大而不强”等问题,基础软件的商业化环境不良性,甚至软件经常是最低价中标,1块钱都能中软件数据库标的。
中国软件产业规模位居全球第三,但在基础软件(操作系统、数据库、中间件)领域,美国收入规模为8100亿美元,占全球该领域业务收入60%以上。欧洲2100亿美元、日本700亿美元、韩国450亿美元、俄罗斯450亿美元,中国仅为360亿美元。
想要改变这样的现状,张平安认为,数据生态链上的环节应该互相支持和成就。企业端应该更开放,愿意将核心的业务场景开放给国产数据库进行替代,生态则需要软件平台,串联起从软件开发商、集成商、服务商、到终端客户,共建数据生态繁荣。
2022年以来,华为云不停地通过数据库、中间件、自研系统转向对外服务,不断加强PaaS层的产品能力。
新一代数据库的发布,也代表了华为在自研软件方向又有了一大进步。而自研软件业务是华为2023年的重点突破方向之一。
今年3月19日,华为创始人任正非提到:“目前,华为用全自研的操作系统、数据库、编译器和语言,做出了自己的管理系统MetaERP软件。MetaERP是华为内部业务资源管理软件,经历了华为全球各部门的应用实战、公司总账使用年度结算的考验。”
这个全自研,并不仅仅是软件的全自研,还包括了硬件的全自研。
黄铁牛透露到,MetalERP上线前,华为在三年间完成了13000+颗器件的替代开发、4000+电路板的反复换板开发,以克服断供带来的生存问题。ERP是华为内部考验最大的平台级系统,每个月末、季末、年末整个集团都会进行盘点,MetaERP将基础性能做到了20倍以上适应高峰值,GaussDB支持访问量的弹性伸缩后,才得以上线。
03结语
全栈自研的华为,犹如一条鲶鱼,搅动着整个云市场。
仍然以数据库为例,全自研的价值不言而喻。一个最为核心的竞争力是,GaussDB拥有全栈可信、自主可控的开发工具链,可以做到运营可信、过程可信、开源可信等功能;其次端到端的工具链,能够实现软件开发工具的安全可靠,实现从过程可信到结果可信;最后,全栈自研的灵活性、创新空间都要比封闭性的模块化系统更高,可操作性更强。
正如同GPU和AI芯片等硬件固然是英伟达核心竞争力,但在此基础之上的芯片开发平台CUDA,在AI 发展的数十年间,英伟达通过对 CUDA 开发和社区的持续投入,让CUDA和各类AI框架深度绑定,形成了更强的生态壁垒。苹果和ios生态的逻辑也如出一辙。
这也就不难理解,为何华为云要联合多所高校培养基于GaussDB开发系统的人才培训体系,本质上将云厂商的价值向后端转移,通过培养人才塑造更强的竞争能力,也就建立了更固若金汤的护城河。
相比之下,在IaaS逐步走向规模化后,云厂商也迅速来到了PaaS和MaaS的赛场,胜负尚未见分晓,华为云已经亮剑。
原文标题 : 孟晚舟站台华为云,国产数据库搏杀升级
关键词: