近日,由金科创新社主办、全球金融专业人士协会支持的“2024 鑫智奖·第六届金融数据智能优秀解决方案”评选结果正式公布。凭借卓越的技术实力和方案能力,宝兰德「智能全链路性能监控解决方案」从90个参选方案中脱颖而出,荣誉入选“鑫智奖·2024金融数据智能运维创新优秀解决方案”榜单,为金融机构数字化转型提供有力支撑。
(图源:金科创新社官方微信公众号)
“鑫智奖”聚焦行业数智化发展趋势及金融场景数智应用创新实践,激发数据智能领域磅礴的创新力量,助力打造数字金融深化发展的核心引擎。据悉,金融数据智能优秀解决方案评选”活动已经连续举办了五届,累计收到406家科技企业的499个解决方案参评。本次评选邀请28位业内权威评审专家,经过专家打分,评选出“数据治理与数据平台、大模型应用、运营、营销、风控、运维、网络与数据安全”等专业领域内的优秀解决方案。
金融行业是国民经济和社会发展的重要支柱,是数字化转型浪潮中的排头兵。而智能运维作为金融行业基础设施和应用系统的管理及运营保障,成为推动数字技术与金融业务深度融合的新动能,能够帮助金融机构大幅度降低运营成本,是金融行业必备的新质生产力之一。宝兰德深耕智能运维领域多年,沉淀了丰富的技术能力、创新能力和专业化服务能力,为金融行业提供了提供覆盖应用全技术栈融合的解决方案及服务,提升业务应用系统的持续运行能力。获此殊荣,彰显了金融机构专家对宝兰德充分认可与一致好评。
智能全链路性能监控解决方案
智能全链路性能监控解决方案适用于金融企业业务性能监控场景,方案从业务视角出发,以业务交易链为抓手,实施端到端的性能监控,融合多源数据、多维分析和智能算法,协助运维团队快速定位问题、通过多维分析迅速掌握故障根因,降低故障平均修复时间。
关键词:方案亮点
亮点1:以业务交易链的角度来监控性能和定位故障
在5G、移动互联网、物联网等新环境下,金融业务的迭代速度更快,业务创新更频繁,使得支撑系统的变更也更加日常化。在云原生、大数据、虚拟化等技术的影响和塑造下,金融企业的支撑系统架构也变得更加的复杂和多样,业务的开展所需要的资源数量也是指数级增长,给系统监控和故障处理带来了全新的挑战。
智能全链路性能监控解决方案通过融合CMDB数据,自采集数据、日志数据进行梳理和处理,形成业务视角的服务调用链数据。基于该调用链进行相关的细粒度的监控,实现服务类型、服务健康度、服务调用、调用链等指标的监控和展现。
整体方案坚持以业务为中心,从宏观到微观的全方位监控与故障处理策略。在宏观层面,我们重点关注由系统级问题(例如磁盘损坏、进程崩溃等)所引发的整体性业务故障。为解决这类问题,我们首先梳理业务的横纵向拓扑结构,确保对各个业务环节之间的依赖关系和影响范围有清晰的认识。一旦出现故障,我们能够迅速识别问题源头,有效隔离故障,并最小化对整体业务的影响。
而在微观层面,我们则针对由业务配置错误或操作失误等逻辑问题导致的局部性业务故障。通过深入查询业务关键参数的明细数据,我们能够精准地识别出异常配置或操作。同时,我们还结合业务的关键性特征指标进行追踪和定位,确保能够迅速找到问题的根源,并进行有效的修复。
方案形成以业务交易为中心的调用链监控体系,从而实现了业务、技术人员视角一致的运维体系,帮助金融企业业务出现问题时精准定位问题,最终解决故障,提升业务的可用性和连续性。
亮点2:业务系统视角的多维度分析,快速定位问题故障
传统的系统监控是根据部门职能分工来进行各个系统运维职责的划分,划分的原则是基于IT视角的。相关的运维视图、各类分析和相关的工具也都是根据该划分原则来横向的提供相关的数据展现和分析能力。
智能全链路性能监控解决方案在系统监控的基础上,基于三大数据基础,包括指标、调用链、日志等数据,实现数据无侵入采集、问题分析、深入剖析、问题定位、快速诊断、历史回溯等,提供在线DEBUG、组件剖析、应用剖析、可观测互动、可以测数据治理、可观测应用地图等核心能力。实现系统可观测、容器可观测、组件可观测、应用可观测、服务可观测等各类可观测视图。
智能全链路性能监控解决方案在系统监控的基础上,提供以业务的视角(纵向视角)进行监控运维的手段,业务人员和系统运维人员能够以相同的目标和一致的范围来进行业务运维工作数据分析和问题定位。方案中运维人员可以从监控系统提供的系统->拓扑->服务->调用菜单逐级下钻、查看和分析相关的运维事件和问题,该过程从用户视角逐步分析、跟踪一个业务交易的全流程过程,可以更加快速的定位问题,提升业务的可用性和连续性。
(图:系统总览)
亮点3:让大模型融入业务性能监控
在未来的发展规划中,将大模型技术深度融入业务性能监控领域,以此推动智能全链路性能监控解决方案的全面升级。通过引入大模型,期望能够显著提升监控运维的精确度和自动化程度,进而构建一个集监控、管理、控制于一体的智能化解决方案。
借助大模型强大的数据处理和分析能力,能够更精确地捕捉业务性能的细微变化,及时发现潜在问题,从而提高监控的精准度。大模型也通过其出色的自我学习和优化能力,推动监控运维过程向更高程度的自动化迈进,减轻人工负担,提升工作效率。
在这个平台上,监控、管理和控制将无缝衔接,形成一个闭环系统。大模型将在这个系统中发挥核心作用,不仅提供数据支持,还能通过智能分析为运维团队提供决策依据,实现更加科学、高效的管理和控制。
关键词:方案价值
通过该方案对用户A类、B类、C类业务系统3000+应用实例进行全面监控,弥补了现有监控手段的不足,解决跨厂商零散监控的局面,实现了分布式环境下故障实例的快速定位,随时随地掌握系统的健康状况,故障提前预警,减少故障发生率。
1
可视化强,运维人员日常可以根据大屏展示,迅速了解系统健康状态,提前预警减少故障发生率。
2
精确判断集群内具体问题实例,快速解决故障,提高故障处理效率。
3
实现了跨厂商统一监控管理,指标统一展现,实时反映系统性能状态,为性能优化提供可靠数据依据。
4
上线变更检查,系统上线后所有服务的可用性检查,提前避免故障产生。
5
故障告警功能与现有CMDB系统无缝集成,自动将故障告警信息发送给运维责任人,使故障第一时间得到处理。
6
通过阶段性告警统计,数据分析,了解真实访问情况,使公司领导更及时了解到相关信息,用以决策。
7
基于海量采集数据和大数据、AI的算法大大提高了分析的准确性,提升了运维的效率。
作为国内领先的基础软件供应商,宝兰德具备丰富的方案能力和行业落地经验,在保持中间件领域技术优势的同时,积极发展智能运维技术及方案能力,并在银行、证券、保险等核心金融机构打造了众多成功案例。未来,宝兰德将会以国家金融科技发展规划为指导,持续洞察金融行业用户核心需求,不断提升产品研发和解决方案能力,为金融行业用户提供更多更稳定、更高效、更好用的解决方案,助力金融行业数字化转型与数智化升级。