海量结构化数据解决方案-表格存储场景解读

简介: 数据是驱动业务创新的最核心的资产。不同类型的数据如非结构化数据(视频、图片等)、结构化数据(订单、轨迹),面向不同业务的使用要求需要选择适合的存储引擎,能够真正发挥数据的价值。针对于海量的非强事务的海量结构化/半结构数据,表格存储一站式解决。这里详细解读该适合场景的使用解读。

数据是驱动业务创新的最核心的资产。不同类型的数据如非结构化数据(视频、图片等)、结构化数据(订单、轨迹),面向不同业务的使用要求需要选择适合的存储引擎,能够真正发挥数据的价值。
比如:非结构化的数据-视频图片等适合对象存储OSS,强事务的结构化数据-交易订单适合MySQL。

而针对于海量的非强事务的海量结构化/半结构数据:
pic1.png

这些场景特点是:
1. 数据规模大,常见的关系型数据库难以存储。
2.需要支持很高的读写吞吐与极低的响应延迟。
3. 数据结构相对简单,无跨数据表的关联查询,数据存储写入是无需复杂的事务机制。

表格存储Talestore正是为了解决上述数据的存储、访问以及计算。

历史订单场景

在电商、金融、外卖、新零售等所有涉及交易与协定的所有场景中,都涉及大量的订单。记录社会方方面面。传统关系型数据能够解决需要支持强一致的事务的在线业务,但海量的订单关系型数据无法保存全量数据,需要数据分层。

架构核心需求

  • 在线数据同步:做实时数据与历史数据分层—支持实时同步在线业务
  • 历史数据存储:历史订单数据存储—支持低延迟数据点查,搜索。
  • 高性价比海量存储数据分析:针对历史库进行报备统计分析—需支持计算组件分析统计!pic2.png

核心优势

  • 弥补在线库容量问题,降低在线库压力
  • PB级历史库存储,可全量保存所有数据,并能提供低延迟高并发查询
  • 索引订单内多字段,提供任意条件组合查询


 

IM/Feed流场景

IM(Instant Messaging,即时通讯)成为当前互联网业务基础组件,在社交、游戏、直播等场景广泛需要。需要高效支持海量消息的存储、同步、检索。  

架构核心组件

  • 消息历史库:按对话存储历史消息—需海量数据,存储易拓展
  • 消息同步库:按接受者存储同步消息—需支持高并发写入,实时拉取(写扩散)
  • 消息索引:针对历史库数据支持数据检索—需数据更新同步
    pic3.png

核心优势

  • Tablestore Timeline 消息模型,专为 IM/Feeds 场景设计,简化开发
  • 同步表百 TB 存储,存储表 PB 级存储。
  • 分布式架构,LSM存储引擎,支撑每秒百万写扩散消息写入,毫秒级同步库拉取
  • 读写扩散混合同步模型

时序场景-监控/IOT

针对实时数据的记录与分析极大的丰富了我们对于数据的使用场景。针对系统的运维监控、针对Iot场景中对于环境与人的监控都更有效帮助我们做事实理解与决策。这里需要面临众多设备与系统的高并发写入与数据存储,以及决策分析。

场景核心需求

  • 数据高并发写入:面向众多设备与系统支持百万级节点实时写入
  • 数据实时聚合:针对原始数据监控预聚合,降低精度—支持数据实时同步对接流计算
  • 数据存储:长久保存数据—需单表规模极大,高性价比存储

pic4.png

核心优势

  • 核心单表数据规模达 10 PB,可自定义数据生命周期
  • 核心单表持续每秒写入进 5000万个数据点
  • 数据实时写入,大大提升数据可见时效性
  • 毫秒级实时查询展示趋势图和报表,查询性能不受单表规模约束

舆情&风控分析

针对舆情信息的分析与把控,可以有效的分析与洞察市场。比如针对点评、新闻、评论等信息的收集分析。需要丰富的多类数据高并发写入与便捷的数据流转进行计算分析

场景核心需求

  • 原始数据写入存储:海量数据爬虫需要高并发写入能力与PB及存储。
  • 多数据类型存储:爬取的内容与生成的标签类似丰富需要写入Schema-Free
  • 数据分析:针对数据分阶段处理原始信息->结构化标签->结果存储—需要支持实时计算与离线计算对接
    pic5.png

核心优势

  • 分布式 LSM 引擎数据存储,提供高并发高吞吐写入,PB 级数据存储
  • 通过数据更新捕获,实时触发后续对数据的自定义处理逻辑
  • 与大数据平台实时数据同步,分析结果写入结果表,供应用层实时查询

推荐系统

推荐系统作为当前所有业务精细化运营的主要抓手,颠覆了传统内容输出方式,成为当前海量信息时代流转的核心引擎。广泛在电商、短视频、新闻等场景应用。需要高效支持海量消息存储与实时、离线分析。 

架构核心组件

  • 行为日志:存储客户端写入实时数据—需高并发写入,支持对接流式计算实时分析
  • 历史数据:冷数据同步下沉至OSS数据湖—需支持数据投递、便于数据分层
  • 用户标签:针对分析标签与推荐信息存储—需支持属性列横向拓展,高效检索

pic6.png

核心优势

  • 数据规模:存储量无上限,冷热数据分层灵活定义
  • 海量并发:单表写入水平扩展,支持亿行每秒级别
  • 数据实时写入,实时可见
  • 数据实时投递 OSS数据湖, Tablestore 只存储热数据,提供丰富索引,高吞吐扫描

 

 

原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/515076.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

​谁是信创担当 《2021中国信创生态市场研究报告》今日正式发布

1986年3月,我国启动国家高技术研究发展计划——863计划,我国坚持走信息技术应用自主创新之路,全面拉开序幕。 三十五年来,我国加强自主创新,并在民用实践中不断提升产品及技术可用性,实现从小范围推动到“…

戏说云栖,如果这些名人参加云栖大会。。。

导语:参加云栖大会是怎样一种体验?当人们在谈云栖大会时,到底在聊什么?如果这些名人参加云栖大会,他们是不是这样想? 看你脑洞清奇,是万中无一的创意奇才~你就是评论区最皮的仔! 上…

如果故障选择了你……

简介: 总以为混沌工程离你很远?但发生故障的那一刻不是由你来选择的,而是那一刻来选择你,你能做的就是为之做好准备。混沌工程在阿里内部已经应用多年,而ChaosBlade这个开源项目是阿里多年来通过注入故障来对抗故障的经…

存储基础:磁盘 IO 为什么总叫你对齐?

‍‍来源 | 奇伢云存储头图 | 下载于ICphoto存储 IO 重要的一个知识点划重点:存储 IO 要对齐。资深存储人员为啥总叫你注意 IO 对齐的?机械磁盘 IO 为什么要 512 对齐呢,SSD 盘为啥要 4K 对齐?不对齐又会如何?重要的知…

如何理解这6种常见设计模式?

简介: 设计模式能够帮助我们优化代码结构,让代码更优雅灵活。有哪些常见的设计模式?如何合理运用?本文分享作者对工厂模式、单例模式、装饰模式、策略模式、代理模式和观察者模式的理解,介绍每种模式的模式结构、优缺点…

构建在线教育弹性高可用视频处理架构实战

简介: 对于负责建设视频处理系统的技术团队而言,这样的业务场景就留给了他们一系列的挑战。 前言 近些年,在线教育行业飞速发展,为整个社会的知识传播提供了前所未有的便利性。通过多种形式的在线教育平台,学员与教师…

一文解开java中字符串编码的小秘密

简介: 在本文中你将了解到Unicode和UTF-8,UTF-16,UTF-32的关系,同时你还会了解变种UTF-8,并且探讨一下UTF-8和变种UTF-8在java中的应用。 简介 在本文中你将了解到Unicode和UTF-8,UTF-16,UTF-32的关系,同时你还会了解变种UTF-8&…

Gartner数据劲爆:阿里全球第三,华为中国第二!

看了一份数据,非常振奋人心,给大家分享一下。国外著名信息分析公司 Gartner,4月21号发布了一份数据,瞬间引发了朋友圈是刷屏。这份数据是讲什么的呢?云计算!可能由于疫情,很多公司上云的热情变得…

程序员:写作能收获什么?

简介: 很多程序员已经通过自己的个人博客或者公众号来进行技术沉淀,记录自己的成长。越来越多的程序员们也开始意识到了写作的重要性。程序员为什么需要写作?写作能带来什么收获?又有哪些额外的惊喜?本文介绍三位长期坚…

腾讯云~Redis6.2.6 伪集群 哨兵模式_搭建

文章目录一、redis准备3节点1. 创建目录2. 节点1~配置3. 节点2~配置4. 节点3~配置5. 启动redis二、新增sentinel配置1. sentinel_01.conf2. sentinel_02.conf3. sentinel_03.conf4. sentinel 启动5. sentinel 监控6. 哨兵验证一、redis准备3节点 1. 创建目录 mkdir /usr/loca…

教你 4 步搭建弹性可扩展的 WebAPI

简介: 本文整理自《Serverless 技术公开课》,关注“Serverless”公众号,回复“入门”,即可获取 Serverless 系列文章 PPT。 作者 | 萧起 阿里云云原生团队 本文整理自《Serverless 技术公开课》,关注“Serverless”公…

从 0 到 1,高德 Serverless 平台建设及实践

来源 | Serverless作者 | 邓学祥头图 | 下载于东方IC导读:高德从 FY21 财年开始启动 Serverless 建设,至今一年了,高德 Serverless 业务的峰值超过十万 qps 量级,平台从 0 到 1,qps 从零到十万,成为阿里集团…

看动画学算法之:排序-快速排序

简介: 快速排序也采用的是分而制之的思想。那么快速排序和归并排序的区别在什么地方呢? 归并排序是将所有的元素拆分成一个个排好序的数组,然后将这些数组再进行合并。 而快速排序虽然也是拆分,但是拆分之后的操作是从数组中选出一…

思考、创新、坚持——阿里做了七年前端,我的成长经验分享

在成长的未知道路上,我们总会遇到各种各样的问题,但是,所有的迷茫与逆境都能够帮助我们成长,我们要抓住每一个机会让自己进步,而不是徘徊不前。 淘系前端开发同学——林晚,今天就来和大家分享他这七年的成长…

存储进阶:怎么才能保证 IO 数据的安全?

来源 | 奇伢云存储头图 | 下载于视觉中国写成功了数据就安全了吗?思考一个问题:写数据做到什么程度才叫安全了?就是:用户发过来一个写 IO 请求,只要你给他回复了 “写成功了”,那么无论机器发生掉电&#x…

设计稿生成代码与 Serverless 的前世今生与未来!

简介: 云栖大会云上 Hello World 活动火热进行中!每位参与者都可收获一份阿里云出品的全球唯一序列号纪念证书! 一场脑洞实验 云栖大会云上 Hello World 活动火热进行中!每位参与者都可收获一份阿里云出品的全球唯一序列号纪念证…

ARMS在APM工具选型中的实践

简介: 当前的系统在数字化转型需求以及互联网架构实施的影响下,越来越普遍地使用了微服务架构,我们在享受微服务带来的好处(开发效率高, 独立部署, 水平扩展, 故障与资源隔离等等)外…

无人机、IoT 设备都有漏洞?专访以色列老牌安全公司 Check Point|拟合

从无序中寻找踪迹,从眼前事探索未来。 2021 年正值黄金十年新开端,CSDN 以中立技术社区专业、客观的角度,深度探讨中国前沿 IT 技术演进,推出年度重磅企划栏目——「拟合」,通过对话企业技术高管大咖,跟踪报…

从零入门 Serverless | 函数计算的可观测性

简介: 本文主要分为三个部分:概述中介绍可观测性的基本概念,主要包括 Logging、Metrics、Tracing 三个方面;然后详细介绍函数计算上的 Logging、Metrics、Tracing;最后以几个常见场景为例,介绍在函数计算中…

宜家:打造新零售时代的智能客户身份管理系统

简介: 宜家选择了阿里云应用身份服务(IDaaS)来为其提供一个包括统一认证、统一账户管理的CIAM解决方案,为所有前端提供统一的安全、可扩展和可靠的身份认证服务,包括灵活的认证配置、单点登录、多因素认证、社交平台登…