中信建投在金融电于化期刊发布 DataOps 实践

文 ‖ 中信建投证券股份有限公司 马丽霞 高宇航 李可 许哲 李海伟

file

近年来,数据的分析和应用对各行各工业的业务模式和竞争形态进行重塑,而积极应对挑战和顺应时代变化是各个市场参与者的必选项。作为资本市场数字化转型的领航者,中信建投证券重视数字化转型机遇,陆续启动了各业务领域的数字化转型建设。

DataOps 作为近年来数据管理领域兴起的工程文化和实践,借用了 DevOps 敏捷交付的基础框架,揉合了 DAMA 数据治理理念,强调在如此激烈竞争的商业环境下,最大限度地快速匹配业务部门的需求和资源开展交付,加速业务价值的试验与试错,持续实现数据价值。

为高质量服务公司数字化转型,中信建投证券于 2021 年正式启动 DataOps 能力建设,结合公司现状打造了 DataOps 研发管理创新体系,梳理优化需求、设计、开发、测试、投产的全过程及相关支撑工具的整合,逐步建立了标准化、全线上流水线,支持数据持续集成和交付,为数据供给提供效率和质量的双重保障,支撑公司数字化转型。

基于DataOps的券商数据平台与应用服务体系建设

1. 面向“汇聚共享”的数据底座

中信建投证券建设了信创化的云原生湖仓一体数据底座。该平台是将数据湖的灵活性和数仓的易用性、规范性、高性能结合起来的融合架构,是公司打造的新代数据底座,满足了数据高效汇聚、数据算力灵活扩展、资源隔离的需求。

file

通过建设数据底座,打破了公司数据“烟囱”壁垒,将公司内外部的数据汇聚在一起,并参考证券行业SDOM数据模型结合公司数据标准规范和实际情况,对数据进行重新清洗、整理、组织和联系,逐步形成公司级的高质量、可信的、标准化的产品、客户、机构等共性数据,为经营分析、风控等数据消费提供数据供给。

同时探索建立指标标签管理体系,在共性数据的基础上,数据底座还构建了指标标签工厂。一方面推动指标标签的定义归集、计算(结果)归集和服务归集 ;另一方面通过解耦指标标签需求与数据开发,通过提供统一语义层,下游数据消费者可以方便地将业务语言转换为技术语言,快速实现业务服务。

2. 建设“服务化”的数据中台

搭建企业级数据能力框架,弥合数据供需鸿沟,用户不需关注数据架构和技术只需关注业务实现,快速响应数据需求数据中台服务化分为数据技术服务化和数据服务化。

数据技术服务化通过搭建数据基础能力平台,为用户提供开箱即用的数据开发能力。为此,数据中台构建了数据开发中心和数据基础服务中心。

数据开发中心:构建统一、标准化的一站式数据开发协作平台,完成采集、建模、加工、测试、调度、发布、监控功能的整合和集成,降低数据开发门槛,提升开发运维效率。中信建投联合白鲸开源基于WhaleScheduler产品基础上打造了全栈信创化的数据开发平台,实现统一数据开发、任务编排、任务调度,更好地完成了离线批处理、实时流处理等任务,有效峰低了数据加工处理成本,真正实现精益敏捷的数据运营。

数据基础服务中心:数据中台搭建了AI、BI、图计算、OLAP、实时计算等基础服务集群,封装了对应的数据服务能力,满足各种业务场景对计算能力的要求,帮助下游系统快速构建数据应用。

“数据服务化” 体现为封装数据底座数据应用的数据接口,提供服务化的数据调用介入方式。为此,数据中台构建了数据服务中心和数据资产中心。

数据服务中心:在数据安全合规的前提下,将数据以API、文件等形式开放供业务流程调用、下游系统交换数据使用。

数据资产中心:建设数据门户,提供企业级数据资源访问入口和数据工作展示服务窗口。将数据资产目录建设为公司级的数据资产查询和操作系统,解决数据“是什么,在哪里”的问题,具备向数据服务引流的能力,支持数据应用。同时整合公司各项数据能力,打造数据工具箱,面向不同用户提供不同的数据能力服务,着力解决数据“怎么用”的问题。

3. 打造“敏捷高效”的数据产品交付中心

数据需求方面,通过“两归口”实现需求统筹管理。一方面,发挥SI制度优势由业务部门SI归口本部门数据需求,从源头上规范数据需求:另一方面,组织数据专家形成评审委员会,对重点项目重点需求开展评审,借助专家经验不断提升交付质量。

数据研发方面,通过一站式数据开发协作平台与公司DevOps持续交付体系结合起来,数据开发协作平台统一对接Gitlab进行代码托管,将各种数据任务类型构建数据研发流水线,提高数据研发效率和交付能力。同时,数据研发过程引入数据模型管控,通过对接数据模型管理工具,实现数据模型设计标准化。

CI/CD方面,数据流水线通过持续集成插件自动化进行代码规范扫描、业务规则测试、测试报告生成,满足数据测试质量要求版本后,运维人员可以一键确认和发布,极大节省了测试和运维工作量,提升了版本发布效率和成功率,实现了数据产交付的标准化规范化。数据研发流水线可以实现开发、测试和部署的多重保障降本增效,提升大规模数据需求交付能力实现数据价值快速输出。

4.面向“自助消费”的数据服务体系

传统的企业数据需求很大一部分是通过内部数据查询单的模式触发数据分析工作,由于开发人员工作排期及需求理解等问题,分析需求需要多轮迭代才能完成导致数据分析的时效性低。针对这一问题中信建投证券探索建立自主消费的数据服务体系。

从工具层面,基于数据中台打通了数据探源、整合及分析展现的整个链路构建自助分析体系,通过可视化低代码开发代替专业工具代码开发将以往的开发门槛大大降低。通过数据自助分析,业务用户可以更快速地进行数据探查和分析模型迭代,极大提高了数据分析的时效性。

从制度文化层面,持续开展数据分析师培训,帮助更多人建立数据思维。从人力资源层面,以数据中台为依托,举办数据分析师培训及作品评比比赛,通过作品评选挖掘发现潜在种子用户、种子部门逐步建立企业数据分析师团队。

5.构建“智能”数据管理与运营平台

(1)价值驱动的数据交付。倡导由数据价值驱动的数据开发运营,评估数据产品的业务价值和经济价值。企业数字化的目标是要建立长期目标和规划的,以关键项目为抓手,集中最优势的资源,攻坚克难,解决业务发展中最迫切的数智化要求。

(2)开发治理一体化。遵从源头管控的原则,积极开展数据治理并将相关动作尽量前置,并与数据的研发工艺有机结合.在数据产生阶段即开展数据治理。通过数据开发和治理的统一规划管理,推动数据汇聚和标准化,强化大数据融合分析。

(3)运营管理一体化。数据产品的强大生命力,一方面依赖于高质量的数据数据研发;另一方面通过收集和挖摇用户需求,以及实际的使用效果和反馈,不断优化迭代数据产品,将其建设为业务级甚至是公司级的重量级数据产品,实现数据运营与研发管理的协同。

未来展望

DataOps能力体系的建设是一个不断打磨、精益求精的过程,中信建投证券将在不断探索和总结中持续前行,为公司数字化转型提供更多动力和支持。

一是加强业务赋能。围绕关键数据应用和场景、数据组织,借助DataOps开展持续集成交付,提高数据仓库、数据中台等平台类工程建设的ROI,实现数据组织协作效能最大化,帮助企业实现数字化转型。

二是聚焦内功、不断进化。目前DataOps理念和方法论还在不断演进中因此,需积极对标最佳实践,完善我司DataOps体系,同时也会积极参与相关标准的制定和推广工作。

file

文章来源于金融电子化第355期期刊

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/185196.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【meta】Scaling Speech Technology to 1,000+ Languages

nvidia-NeMo包含TTS的模型,开源数据 uroma转写工具介绍 uroman转写工具 N-to-M mapping 转写的规范,包含一些中文-拼音,拉丁文-读法的规则转换。字符串匹配规则下的查字典; 将字母对应到发音单元 转写规范 转写过程尽量做到可…

打字练习--Master of Typing 3

Master of Typing 3是一款适用于Mac OS平台的打字速度提升和键盘技能训练软件。它旨在帮助用户提高打字速度、准确性和键盘操作技能,无论用户是初学者还是熟练的键盘操作者,都能提供适合的练习模式。Master of Typing 3提供了一系列结构化的打字课程和实…

(2023码蹄杯)省赛(初赛)第二场真题(原题)(题解+AC代码)

题目1&#xff1a;MC0214捡麦子 码题集OJ-捡麦子 (matiji.net) 思路: 1.第n米在前n-1米的基础上多加一个n个麦子&#xff0c;那么直接从1开始枚举&#xff0c;累加答案即可 AC_Code:C #include<bits/stdc.h> using namespace std;int main( ) {int n; cin>>n;…

三维模型重建中地面控制点刺点输入常见问题及解决方法

三维模型重建中地面控制点刺点输入常见问题及解决方法 在倾斜摄影三维模型重建中&#xff0c;地面控制点的人工刺点输入是一个重要的环节。然而&#xff0c;这个过程可能会遇到一些常见问题。以下是一些常见问题及相应的解决方法&#xff1a; 1、问题&#xff1a;标定点位置不…

路由跳转到另一个页面

点击添加员工跳转到详情页 <el-button size"mini" type"primary" click"$router.push(/employee/detail)">添加员工</el-button>配置员工详情的路由信息 import layout from "/layout"; export default {path: "/em…

OBC、DCDC自动化测试解决方案!

OBC(车载充电机&#xff09;和DCDC&#xff08;直流-直流变换器&#xff09;是电动汽车的核心部件&#xff0c;DCDC和OBC的功能质量对于整车的性能和安全性至关重要。在OBC和DCDC&#xff0c;以及整车开发测试过程中&#xff0c;需要对OBC和DCDC进行功能和性能方面进行全面的测…

水溶性肥料行业分析:预计2028年将达到202亿美元

随着我国农业的集约化、规模化不断发展&#xff0c;以及大型农场涌现&#xff0c;水肥一体化面积将会不断扩大。同时&#xff0c;水溶肥是符合更加环保、更加可持续发展的新一代肥料&#xff0c;是中国肥料产业未来的重点发展课题。 水溶性肥料(Water Soluble Fertilizer&…

ChatGPT生成的一些有趣的文件管理用python小程序

1. 在前位置中的所有文件夹内增加一个名为 abc 的新文件夹 import osdef create_abc_directories(root_dir.):# 获取当前目录下的所有目录subdirectories [d for d in os.listdir(root_dir) if os.path.isdir(os.path.join(root_dir, d))]# 在每个目录中创建名为abc的子目录f…

Android自动化测试中使用ADB进行网络状态管理!

技术分享&#xff1a;使用ADB进行Android网络状态管理 Android自动化测试中的网络状态切换是提高测试覆盖率、捕获潜在问题的关键步骤之一&#xff0c;本文将介绍 如何使用ADB检测和管理Android设备的网络状态。 自动化测试中的网络状态切换变得尤为重要。 网络状态查询 adb s…

【23真题】复录比高达2.24,但题目很棒!

今天分享的是23年广东工业837的信号与系统试题及解析。注意官方不公示真题&#xff0c;所以这套试卷为回忆版本。 本套试卷难度分析&#xff1a;22年广东工业837考研真题&#xff0c;我也发布过&#xff0c;若有需要&#xff0c;戳这里自取&#xff01;平均分107.93&#xff…

Java中的Lambda表达式

lambda表达式是一个可传递的代码块&#xff0c;可以在以后执行一次或多次。 1.lambda表达式的语法 eg&#xff1a;有如下lambda表达式&#xff1a; (int a, int b) -> {return ab}; 这个表达式的本质是一个函数。 一般的函数类似如下&#xff1a; int add(int a, int …

我的创作纪念日--成为创作者的 第1825天(5年) 啦

醉颜凉 &#xff0c;不知不觉今天已经是你成为创作者的 第1825天&#xff08;5年&#xff09; 啦。 机缘 1、作为一个创作者&#xff0c;我最初成为创作者的初心是出于对技术的热爱和对分享的渴望。我希望通过创作&#xff0c;将自己在实战项目中的经验分享给大家&#xff0c;…

ECONGU4280 Corporate Finance

ECONGU4280 Corporate Finance WeChat: zh6-86

P8649 [蓝桥杯 2017 省 B] k 倍区间(前缀和+优化(桶分类))

分析&#xff1a; &#xff08;1&#xff09;任意连续子序列可用两个前缀和的差来表示 &#xff08;2&#xff09;判断该子序列是否为k的倍数 p1-p2 模 0 (mod k) 等价于&#xff1a;前缀和模 k 是否同余 &#xff08;3&#xff09;同余的任意两前缀和组合的序列均满足…

WEB安全之Python

WEB安全之python python-pyc反编译 python类似java一样&#xff0c;存在编译过程&#xff0c;先将源码文件*.py编译成 *.pyc文件&#xff0c;然后通过python解释器执行 生成pyc文件 创建一个py文件随便输入几句代码(1.py) 通过python交互终端 >>>import py_compil…

CISO在2024年应该优先考虑七项安全任务

专业安全媒体CyberTalk.org主编Shira Landau日前表示&#xff1a;现代企业的CISO们在2024年必须做出改变&#xff0c;要更多关注于企业整体安全路线图的推进与实现&#xff0c;让网络安全工作与业务发展目标保持更紧密的一致性。 首席信息安全官&#xff08;CISO&#xff09;是…

采购业务中的组织概述

目录 一、采购和库存管理中组织单位的概览二、企业的组织结构三、采购中组织结构3.1采购组织3.2采购组 一、采购和库存管理中组织单位的概览 1、 客户端&#xff1a;在SAP ERP系统中&#xff0c;客户端通过三位数字定义&#xff0c;并代表这独立的数据记录和独立的业务流程。客…

JavaScript WebApi 一(详讲)

基础知识在前面的部分已经讲过了&#xff0c;大家如果没有学习过JavaScript的可以去看一下 1.DOM 引入 在JavaScript中&#xff0c;DOM&#xff08;文档对象模型&#xff09;提供了一种表示和操作HTML文档的方式。在DOM中&#xff0c;文档被表示为一个由节点组成的树形结构。…

nodejs最新电商jd m端h5st 4.2签名算法4.2版本逆向,jd API接口,jd商品数据采集

前言&#xff1a; jd m端使用最新的h5st 4.2签名算法&#xff0c;与h5st 4.1版本有很大的不同。在这儿分析一下&#xff0c;供大家参考。 一、目标地址(Base64解码) aHR0cHM6Ly9zby5tLmpkLmNvbS93YXJlL3NlYXJjaC5hY3Rpb24/a2V5d29yZD0lRTklOTklQTQlRTYlQjklQkYlRTYlOUMlQkEmc2…

java编程:给定⼀组正整数数组M,找出M数组中N项和为给定数S。如果有多对N项数字的和都等于 S,则输出N个数的乘积最⼩的哪⼀项,没有则返回空

题目&#xff1a; 编程题&#xff1a;给定⼀组正整数数组M&#xff0c;找出M数组中N项和为给定数S。如果有多对N项数字的和都等于 S&#xff0c;则输出N个数的乘积最⼩的哪⼀项&#xff0c;没有则返回空&#xff1b; 程序如下&#xff1a; 测试主程序&#xff1a; 先看下测试示…