数据库资深“学霸”再启程,专访数据库初创公司矩阵起源全球 CTO 田丰博士

师出名门,工业界履历从大厂首席工程师到创业公司 CTO,并能一直从事底层系统的核心研发工作,可能是很多优秀技术人向往的光鲜履历。不过抛弃大厂的光鲜稳定工作和成功的创业项目,再次加入初创公司,则需要比常人更大的魄力和勇气。

过去几年间技术发展进程中,许多新数据库诞生并打开市场,现在,数据库呈现了爆发式增长,CSDN 的《新程序员》杂志第二期也做了主题为“新数据库时代”的系列专题报道。最近,师从数据库元老级前辈 David DeWitt 的田丰博士,宣布正式加入了刚刚成立一年多的数据库初创公司矩阵起源任 Global CTO,CSDN 专访了田丰博士,让我们一同了解他对于数据库与技术人生的思考与选择。

资深“学霸”之路:师从数据库元老,SIGMOD十年间影响最深远 paper

从中科大到加州大学圣地亚哥分校,一直从事数学专业研究的田丰博士,因为导师投身工业界(加入微软)的启发,从数学“改行”到计算机,跟随威斯康星大学数据库前辈 David DeWitt 做非结构化与并行数据库的研究。博士期间,田丰博士从事的是在 XML 格式数据库上做非结构化查询、流处理、并行化的研究,多篇论文入选数据库领域国际顶级会议 SIGMOD、VLDB。

田丰博士

在 2000 年田丰博士与团队发表了一篇重要的论文,这篇论文中的核心思路,是第一次设计了查询与数据的“翻转”,即让用户查询变为数据,数据流变为查询动作,在这个基础上去提升数据查询的性能,以及定义查询、抽取、记录等流数据中的变化。这个思路影响了后来很多流数据处理系统的设计思路,甚至在 2010 年被 SIGMOD 评为了上一个十年对工业界影响最大的一篇论文。

一转眼 20 多年过去,回顾自己学术研究中最大的收获,田丰博士表示,在他转去数据库领域研究时,他的导师 David DeWitt 那时已经功成名就,但这些前辈们仍然对最前沿的技术与新生事物保持着非常高的热情,并持续钻研,对他也产生了深远的影响。不过同时,团队的科研是务实的,所有工作都会反映到工业界实践中,在实际系统有没有产生影响与价值,也是研究生毕业的一个重要考量。

当然,研究中田丰博士要面临和解决太多工程上很艰难的问题,他的经验是做好充分的前期理论和调研,明确最重要和绕不开的问题,然后咬牙坚持做下去,以解决科研与工作中客户的难题。博士毕业后,田丰博士历任微软/Greenplum/VMware Aurora/Snowflake 首席工程师,以及原 Vitesse Data 创始人兼 CTO,推出了业界最快最稳定的 Greenplum——Deepgreen DB。

重新启程数据库下一站,打造 AP、TP、流与异构基础设施的“超融合”

在每一段工作中,田丰博士都是与数据打交道,并且是数据在各类不同系统的应用,如数据库索引 index、虚拟化和云上数据管理等等。从 IBM 事务型数据分析开始,再到数据增多,田丰博士的导师 David DeWitt 开创了并行分析型的数据库,企业的数据被割裂为了事务处理(TP)与自我分析(AP)两部分各自为战。云计算与 IoT 兴起之后,企业需要在流数据上实时的处理与分析,以往 TP 与 AP 数据库的时延,已经无法满足实时性需求。

以往工作中田丰博士已经接触和看到 TP、AP、流数据各类系统,在客户使用中存在着各自的问题,现在多个系统揉合到一起,客户的痛点不仅没有消失,反而会更明显。所以,矩阵起源提供的超融合数据系统,希望统一实现 AP、TP、流等不同类型数据和支持不同异构基础设施的应用,保证性能与简便管理。矩阵起源想做的事情吸引了田丰博士,在和矩阵起源技术团队充分交流后,田丰博士最终决定加入。

虽然提供给客户的是统一和易用的系统,但超融合数据系统内部研发的复杂性极高。矩阵起源所做的超融合引擎、异构云原生、极致性能,每一场都是硬仗。现在的 0.2 版本中,通过计算层的向量化执行引擎和因子化加速模型等技术突破,性能测试(如 SSB,Star Schema Benchmark)已经表现优异。田丰博士表示,今年团队将首先重点研发分布式系统上的 AP 与 TP 融合数据库,具备安全与重要性能,能够满足大多数客户的通用场景和重要工作负载。

成为 CTO,田丰博士仍然不会脱离技术和 code,他表示现在每周保留 10-15%的工作时间用于写代码。田丰博士也向 CSDN 的读者推荐了 Jim Gray《事务处理》(《Transaction Processing ——Concepts and Techniques》),虽然这是数据库领域的经典读物之一,对于不从事数据库研发的读者来说读起来会很痛苦,但是田丰博士仍然向开发者推荐本书的前三章,Jim Gray从很高的角度阐述了整个计算机系统性能与稳定性,以及系统出错的原因,其中硬件、人为操作失败的占比。前三章充满故事性与易读性,适合所有开发者去了解学习。

从 2020 年 1024 程序员节与《新程序员》杂志开始,CSDN 持续关注了中国底层软件与系统的发展与崛起。现在,从事数据库研发 20 年的资深技术老兵田丰博士加入优秀的初创公司矩阵起源,是值得欣喜的事。让我们共同期待更多的优秀技术人与公司能够在底层软件扎实研发,持续创新,CSDN 也将持续关注与报道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511693.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring官方RSocket Broker 0.3.0发布: 快速构建你的RSocket架构

简介:Spring官方的RSocket Broker其实开发已经非常久了,我以为会伴随着Spring Cloud 2021.0发布的,但是没有发生。不过Spring RSocket Broker还是发布了最新的0.3版本,虽然还是预览版,但目前已经可用,考虑官…

Redis 6 中的多线程是如何实现的!?

作者 | 张彦飞allen来源 | 开发内功修炼Redis 是一个高性能服务端的典范。它通过多路复用 epoll 来管理海量的用户连接,只使用一个线程来通过事件循环来处理所有用户请求,就可以达到每秒数万 QPS 的处理能力。下图是单线程版本 Redis 工作的核心原理图单…

如何构建流量无损的在线应用架构 | 专题开篇

简介:本篇是整个《如何构建流量无损的在线应用架构》系列的第一篇,这一系列共三篇,旨在使用最为朴素的语言将影响在线应用流量稳定性的技术问题做一个归类,这些问题的解决方案有的只是一些代码层面的细节,有的需要工具…

云原生时代的运维体系进化

简介:基于容器、Kubernetes 等云原生技术,提供的开放社区标准、不可变基础设施、声明式 API 会成为企业 CloudOps 的最佳实践,也将在这个基础上推进数据化、智能化体系建设,将运维复杂性进一步下沉,让企业可以聚焦于自…

企业如何从 0 到 1 构建整套全链路追踪体系

简介:本文将分享 ARMS 在全链路追踪领域的最佳实践,分享主要分为四部分。首先,是对分布式链路追踪的整体简介。其次,是对 ARMS 在分布式链路追踪领域的核心能力进行介绍。然后,介绍如何从 0 到 1 构建整套全链路追踪体…

React18 的 useEffect 新特性为什么被疯狂吐槽?

作者 | 零一来源 | 前端印象react18 已经出来一段时间了,create-react-app 默认安装的 React 版本也已经是 18,不知道有没有小伙伴发现自己有点看不懂 React 了?import { useEffect, useState } from reactfunction App () {const [data, set…

如何构建一个流量无损的在线应用架构 | 专题中篇

简介:本篇是整个《如何流量无损的在线应用架构》系列的第二篇,这一系列共三篇,旨在使用最为朴素的语言将影响在线应用流量稳定性的技术问题做一个归类,这些问题的解决方案有的只是一些代码层面的细节,有的需要工具进行…

一文读懂蓝绿发布、A/B 测试和金丝雀发布的优缺点

简介:目前,业界已经总结出了几种常见的服务发布策略来解决版本升级过程中带来的流量有损问题。本文首先会对这些普遍的发布策略进行简单的原理解析,最后结合阿里云的云原生网关对这些发布策略进行实践。 作者 | 扬少 背景 目前&#xff0c…

Kafka 到底有多高可靠?

作者 | 敖丙来源 | 敖丙什么叫可靠性?大家都知道,系统架构有三高:「高性能、高并发和高可用」,三者的重要性不言而喻。对于任意系统,想要同时满足三高都是一件非常困难的事情,大型业务系统或者传统中间件都…

阿里云张振尧:阿里云边缘云驱动5G时代行业新价值

简介:近日,以“5G融合通信趋势下的技术创新”为主题的2021中国增值电信及虚拟运营高峰论坛在北京召开,阿里云边缘云高级产品专家张振尧发表了《阿里云边缘云驱动5G时代行业新价值》主题演讲,分享了阿里云边缘云作为5G时代的新基础…

美的工业技术亮相2022汉诺威工业博览会,助力全球工业向数字化与可持续迈进

2022年5月31日,2022汉诺威工业博览会开幕并重启线下展览,美的工业技术以“科技驱动,拥抱高效、绿色、智能的工业未来”为主题,携旗下工业自动化品牌“高创”、 “合康新能”和“东菱”,以覆盖自动化、绿色能源领域的领…

hyengine - 面向移动端的高性能通用编译/解释引擎

简介:手机淘宝客户端在历史上接过多种多样的脚本引擎,用于支持的语言包括:js/python/wasm/lua,其中js引擎接过的就有:javascriptcore/duktape/v8/quickjs 等多个。众多的引擎会面临共同面临包大小及性能相关的问题&…

如何进行基于Anolis OS的企业级Java应用规模化实践?|龙蜥技术

简介:提供了724小时的专属钉钉或者电话支持,响应时间保证到在业务不可用情况下10分钟响应,业务一般的问题在一小时可以获得响应,主要城市可以两小时内得到到达现场的服务。 本文作者郁磊,是Java语言与虚拟机SIG负责人…

大数据的下一站 DataOps,智领云发布纯 K8s 云原生数据平台 BDOS Online

最近几年,业界对数据中台的追捧度像坐过山车从高点走低,但在数字化和业务创新驱动下,对数据管理与分析的热度在今年不降反升。 以往搭建一套 Hadoop 大数据平台,技术团队重点要搞定数据的采集、存储、处理和数仓的设计搭建等复杂动…

“全”事件触发:阿里云函数计算与事件总线产品完成全面深度集成

简介:目前,函数计算已具备接入EventBridge所有事件源的触发能力,实现触达阿里云全系产品服务的“最后一公里”。 作者:史明伟(世如)阿里云高级技术专家 随着云原生技术的普及和落地,企业在构建…

开源 Serverless 里程碑:Knative 1.0 来了

简介:近期Knative发布了1.0版本,达到了一个重要的里程碑。Knative自2018年7月首次发布以来, 版本不断的迭代发展,除了无数的错误修复、稳定性和性能增强之外,按时间顺序还进行了一些改进,下文将进行简单介绍。 作者&a…

勒索软件攻击层出不穷,企业如何做好数据保护?

近日,“搜狐员工遭遇工资补助诈骗”事件引起广泛热议:搜狐员工收到一封来自“搜狐财务部”名为《5月份员工工资补助通知》的邮件,员工按照邮件要求扫码,填写银行账号等信息后,大家并没有等到“补助”,并且工…

以一致的体验交付和管理云原生多集群应用

简介:本次文章将首先介绍云原生应用交付和管理的挑战,然后介绍这背后的 KubeVela 和 OCM 技术原理,最后是整体的最佳实践,以及一个完整的 Demo。 作者:冯泳,孙健波 大家好,很高兴能在 KubeCon…

阿里云低代码音视频工厂正式上线,为企业用户提供音视频开发最短路径

简介:阿里云低代码音视频工厂正式上线,极大程度降低音视频开发门槛,打破传统音视频开发壁垒,全新定义音视频应用开发。 1月5日,阿里云低代码音视频工厂正式上线,极大程度降低音视频开发门槛,打…

网络的现代化建设如何进行?详解 Aruba 平台重要特性

作者 | 宋慧 出品 | CSDN 云计算 5G 和 IoT 的快速发展,以及新商业环境的挑战下,网络也在进入新的发展阶段。 商业竞争变化,企业纷纷采取数字化转型以提升创新性和效率。另外,疫情之后,混合办公模式的普及和常态化后&…