在3月20日的2024 OceanBase数据库城市行的活动中,安保险信息科技部总经理王在平发表了以“保险行业核心业务系统分布式架构实践”为主题的演讲。本文为该演讲的精彩回顾。
早在2019年,华安保险便开始与OceanBase接触,并着手进行数据库的升级选型工作。到了2023年,华安保险的新一代分布式核心系统正式搭载OceanBase分布式数据库,车险承保、非车险承保、意健险理赔等业务模块相继成功上线。预计这一变革将带来保费规模处理能力的显著提升,达到2至3倍的增长,同时实现硬件成本降低50%的显著成效。正如俗语所说,“一个好汉三个帮”,挖掘数据库的潜力需要综合考虑整个系统的优化和协同。
一、保险系统 IT 架构迎来新的挑战
数字化时代,客户行为的变化对保险公司经营和 IT 架构带来新的挑战。过去十年,以云计算、大数据、区块链、移动互联、物联网、人工智能为代表的“IMABCD”新技术突飞猛进,为数字经济推波助澜,重塑了很多业态,深刻影响用户工作以及行为方式。
为了顺应数字化时代的发展,国家以及行业颁布了诸多政策文件,鼓励企业抓住数字化技术的先机。新型数字化基建已经成为驱动行业转型的核心力量,传统 IT 架构无法应对业务变化挑战,迫切需要转型。
该往哪里转?互联网先行者已经为我们趟出了一条路。互联网技术蕴含的设计理念,为新一代保险系统 IT 架构提供了重要参考,引入分布式技术,利用新的技术特性,可化解大容量、低成本、高可用的“不可能三角”。
新一代保险 IT 架构具有以下特点:
○ 标准化高:自动化运维、规模化管理
○ 成本低:低端计算资源、开源技术
○ 风险影响小:分布式、隔离
○ 可用性高:冗余、多活
○ 数据量大:可支撑千万级日交易量、千万级客户数
○ 拓展能力强:横向、纵向扩展均可
二、华安保险 IT 架构,探索历程与应用成效
意识到技术转型的紧迫性以及重要性,华安保险多年前就开始主动进行技术架构的转型探索,以云原生分布式技术为目标,IT 架构从封闭走向开放,逐步迭代成型。
2018 年以前,华安保险采取的是金融行业传统的集中式架构。
2018 年到 2022 年,核心系统从小型机转向一体机,开始在增量项目推广分布式技术,逐步从集中式向混合式架构过渡,并不断积累经验。2021 年,华安保险主动把握机遇,推进基础设施的升级工作。
经过多年的磨炼,到 2023 年,华安保险核心系统实现关键突破,主要系统已经转向分布式架构。主要有以下三点应用成效:
第一,关键基础设施“一底双栈”,灵活适配多种业务场景。创新“一底双栈”实施方案,采用国产通用底座,从硬件到数据库软件全是统一的,应用层按需搭配国产全栈、开源组件两种路线,技术选型兼顾稳定可靠与成本可控,具备长期演进能力。
第二,以 XC 为底座的新一代分布式核心系统取得关键突破,预计保费规模处理能力提升 2-3 倍。2022 年,华安保险开始自研以 XC 为底座的新一代分布式核心业务系统,意健险理赔系统当年成功上线。2023 年,非常关键的车险承保核心系统、非车险承保核心系统相继投产,运行一直很平稳,标志以 XC 为代表的核心技术实现重大突破。预计 2025 年,基本实现保险核心系统基于 OceanBase 数据库的全量分布式升级。
上线以后,整体应用成效非常明显。从以前的一体机,转向三节点的服务器,整体硬件成本预计降低 50%;得益于 OceanBase 的高级数据压缩技术,节省 75% 的存储空间。此外,得益于其他技术的综合应用,在业务处理的主要关键环节处理耗时下降 32.1%,预计可支持 2-3 倍的保费规模处理能力。
第三,形成一套低成本、高复用、可推广的示范案例。在实践中不断积累,我们把经验总结为“四化”:策略标准化、方案体系化、成本最小化、工具链条化。整体考虑,分步实施,技术成熟可靠,降低了落地风险,对其他中小公司有比较好的借鉴意义。
三、架构设计实践
华安保险的设计理念是面向业务,立体发展,体系化构建可持续演进的 IT 架构。
总的来说,我们归结为两个升级:一个业务升级,一个技术升级。业务层面,希望数字原生理念去解构、重构业务模式,提出了四个在线的设计理念,作为系统灵魂。技术层面,除了注重以往的单品能力提升外,更强调整体平衡,通过集成式创新实现整个技术的突破。
(一)分布式架构解决开发层面的问题
首先,基于微服务体系,构建 DevOps 交付流水线,实现程序开发快。华安保险封装微服务框架,自研天枢容器平台,以此为基础,将代码仓库 GitLab、CI/CD 流水线 Jenkins 等第三方工具进行系统性整合,构建了完善的 DevOps 体系,快速响应业务需求。
其次,“开源”+“扩展”相结合,利用分布式中间件,做到系统运行稳。2017 年,我们就引入了消息队列、缓存等中间件技术,实现系统之间的解耦。近几年,完善任务调度平台及监控能力,不断补充短板、扩展管理功能,中间件能力得到进一步提升,满足系统容灾与高可靠方面的需要。
再次,沉淀中台能力,模块化快速装配,支持应用集成精。华安保险应用“中台”概念,通过多年的积累,沉淀了不少通用性业务组件,搭建系统时可快速装配,不重复造轮子,综合产品力不断提升。
最后,改变编程思路,分层均衡处理,力求代码质量高。编程方面从规范、设计理念上,我们做出了一列改变,从以往过于注重底层数据库的能力,把业务逻辑上移,实现前台、中台以及数据库底层的平衡,通过多层均衡布局,化解系统运行中的不确定性问题。
(二)数据库是 IT 架构升级的关键
第一,引入 OceanBase 分布式数据库,建立租户模式,支持弹性管理与系统可扩展性。数据库是整个 IT 架构升级的关键。华安保险作为一个中小公司,技术能力相对受限,综合考虑后对技术栈做了收敛,希望建立企业级的数据库服务通用能力,简化系统使用与管理。
2019 年,华安保险启动数据库选型,经过多方比较测试,最终选择 OceanBase 搭建统一的数据库底座。通过建立多集群、多租户的方式,根据不同的场景,指定独享或者共享模式,更好地适配业务需要。
○ 集群划分:整体规划,核心业务系统、一般业务系统、办公管理系统纳 入不同集群进行管理;
○ 租户划分:根据业务场景及性能要求,划分不同规格租户,资源相对隔离,承载一个或多个关联应用服务。
第二,依托业务场景,适配不同引擎,访问分层、分流,系统压力共担。应对场景多元化,华安保险同时引入其他引擎,实现访问分层、分流处理,比如高频键值访问采用 Redis、批量查询采用 ES、关联查询采用数据湖等。通过技术的组合应用,很好解决了复杂场景下的系统压力。
第三,业务数据汇集于湖,应对跑批、批查等综合功能需要。考虑到多租户、集群、跨库数据隔离的问题,我们后端建立了联机数据湖,实现数据汇集,提供综合查询能力。数据湖也是大数据平台抽取业务数据的中间库,规避后端数据平台直接从业务库抽数对生产环境造成波动。
第四,主数据统一管理,建立实时分发机制,实现数据同源和系统解耦。华安保险建立了企业主数据管理平台,统一管理和实时分发,保证基础数据源自一处,提高数据的一致性和可用性,进而提升数据管理和应用效率。
第五,将数据嵌入应用场景,保持数据在线,让数据真正服务应用系统。华安保险基于离线与实时技术,建立了统一数据中台,研发面向业务域的数据产品,与此同时,积极开发数据看板与数据服务,将之嵌入业务系统,为风控、操作提供数据指引,保持“数尽其用”。
(三)分布式应用的运行与监控
首先,迭代容器平台,实现一云多芯、多集群纳管,支撑系统稳定运行。天枢容器平台从 2019 年开始自主研发,2022 年重大升级到 2.0 版本,打造“一站式”应用交付管理模式。目前,华安保险的内部新应用,大规模运行在容器平台上,实现一云多芯、多集群纳管。
其次,服务可观测多管齐下,系统运维从事后告警转变为事前预警。分布式对 DBA 或运维人员来说,主要还是需要解决运维便捷度的问题。在数据可观测层面,华安保险同样基于自研和开源技术,构建服务可观测能力平台-天眼平台,实现应用指标与数据指标的采集、处理与展示,并提供微服务的分布式追踪、服务网格遥测分析、度量聚合和可视化。
四、未来展望:建立两地三中心容灾能力
未来,华安保险将持续推进分布式技术深度应用。2024 年,将以分布式架构为基础,建立两地三中心的容灾能力,实现应用同城双活、异地数据容灾,提升业务运营连续性。