Flink应用场景

 本文为《Flink大数据项目实战》学习笔记,想通过视频系统学习Flink这个最火爆的大数据计算框架的同学,推荐学习课程:

 

Flink大数据项目实战:http://t.cn/EJtKhaz

 

主要应用场景有三类:

1.Event-driven Applications【事件驱动】

 

2.Data Analytics Applications【分析】

 

3.Data Pipeline Applications【管道式ETL】

3.1 Event-driven Applications

 

 

上图包含两块:Traditional transaction Application(传统事务应用)和Event-driven Applications(事件驱动应用)。

 Traditional transaction Application执行流程:比如点击流Events可以通过Application写入Transaction DB(数据库),同时也可以通过Application从Transaction DB将数据读出,并进行处理,当处理结果达到一个预警值就会触发一个Action动作,这种方式一般为事后诸葛亮。

 Event-driven Applications执行流程:比如采集的数据Events可以不断的放入消息队列,Flink应用会不断ingest(消费)消息队列中的数据,Flink 应用内部维护着一段时间的数据(state),隔一段时间会将数据持久化存储(Persistent sstorage),防止Flink应用死掉。Flink应用每接受一条数据,就会处理一条数据,处理之后就会触发(trigger)一个动作(Action),同时也可以将处理结果写入外部消息队列中,其他Flink应用再消费。

 

典型的事件驱动类应用:

1.欺诈检测(Fraud detection)

2.异常检测(Anomaly detection)

3.基于规则的告警(Rule-based alerting)

4.业务流程监控(Business process monitoring)

5.Web应用程序(社交网络)

3.2 Data Analytics Applications

 

Data Analytics Applications包含Batch analytics(批处理分析)和Streaming analytics(流处理分析)。

 Batch analytics可以理解为周期性查询:比如Flink应用凌晨从Recorded Events中读取昨天的数据,然后做周期查询运算,最后将数据写入Database或者HDFS,或者直接将数据生成报表供公司上层领导决策使用。

 

Streaming analytics可以理解为连续性查询:比如实时展示双十一天猫销售GMV,用户下单数据需要实时写入消息队列,Flink 应用源源不断读取数据做实时计算,然后不断的将数据更新至Database或者K-VStore,最后做大屏实时展示。

3.3 Data Pipeline Applications

 

Data Pipeline Applications包含Periodic (周期性)ETL和Data Pipeline(管道)

 Periodic ETL:比如每天凌晨周期性的启动一个Flink ETL Job,读取传统数据库中的数据,然后做ETL,最后写入数据库和文件系统。

 Data Pipeline:比如启动一个Flink 实时应用,数据源(比如数据库、Kafka)中的数据不断的通过Flink Data Pipeline流入或者追加到数据仓库(数据库或者文件系统),或者Kafka消息队列。

3.4阿里Flink应用场景

 

阿里在Flink的应用主要包含四个模块:实时监控、实时报表、流数据分析和实时仓库。

实时监控:

  1. 用户行为预警、app crash 预警、服务器攻击预警
  2. 对用户行为或者相关事件进行实时监测和分析,基于风控规则进行预警

 

实时报表:

  1. 双11、双12等活动直播大屏
  2. 对外数据产品:生意参谋等
  3. 数据化运营

 

流数据分析:

  1. 实时计算相关指标反馈及时调整决策
  2. 内容投放、无线智能推送、实时个性化推荐等

 

实时仓库:

  1. 数据实时清洗、归并、结构化
  2. 数仓的补充和优化

 欺诈检测

 

背景:

假设你是一个电商公司,经常搞运营活动,但收效甚微,经过细致排查,发现原来是羊毛党在薅平台的羊毛,把补给用户的补贴都薅走了,钱花了不少,效果却没达到。

 

怎么办呢?

 

你可以做一个实时的异常检测系统,监控用户的高危行为,及时发现高危行为并采取措施,降低损失。

 

系统流程:

1.用户的行为经由app 上报或web日志记录下来,发送到一个消息队列里去;

2.然后流计算订阅消息队列,过滤出感兴趣的行为,比如:购买、领券、浏览等;

3.流计算把这个行为特征化;

4.流计算通过UDF调用外部一个风险模型,判断这次行为是否有问题(单次行为);

5.流计算里通过CEP功能,跨多条记录分析用户行为(比如用户先做了a,又做了b,又做了3次c),整体识别是否有风险;

6.综合风险模型和CEP的结果,产出预警信息。

 

转载于:https://www.cnblogs.com/dajiangtai/p/10642423.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483775.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

未来,中国空间站将成为怎样的“太空科研站”?

来源:中国科学报作者:赵维杰,NSR新闻编辑9月17日13点34分,神舟十二号载人飞船返回舱在东风着陆场顺利着陆。航天员聂海胜、刘伯明、汤洪波状态良好,我国空间站阶段首次载人飞行任务取得圆满成功。从6月17日升空至今&am…

牛客16464 神奇的幻方

链接:https://ac.nowcoder.com/acm/problem/16464 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 131072K,其他语言262144K 64bit IO Format: %lld 题目描述 幻方是一种很神奇的 N*N 矩阵&…

李飞飞AI100报告第二弹,提出14大AI机遇与挑战,82页pdf

来源:Stanford编辑:好困 David「AI100」报告第二弹!本次报告评估了2016年至2021年间人工智能的发展,涵盖14大问题,探讨了人工智能发展的关键领域。主题是「人工智能在日常生活中的渗透影响:希望、关注和方向…

牛客16502 螺旋矩阵

链接:https://ac.nowcoder.com/acm/problem/16502 来源:牛客网 题目描述 一个 n 行 n 列的螺旋矩阵可由如下方法生成: 从矩阵的左上角(第 1 行第 1 列)出发,初始时向右移动;如果前方是未曾经…

java 接口

转载于:https://www.cnblogs.com/javawen/p/10650269.html

四位专家谈:数字医学中的因果关系

来源:ScienceAI编译:凯霞Ben Glocker(伦敦帝国理工学院医学成像机器学习专家)、Mirco Musolesi(伦敦大学学院数据科学和数字健康专家)、Jonathan Richens(诊断机器学习模型专家,Baby…

牛客21781 牛兄牛弟

链接:https://ac.nowcoder.com/acm/problem/21781 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 32768K,其他语言65536K 64bit IO Format: %lld 题目描述 一群牛兄牛弟准备去一家餐厅吃饭&am…

中国算力发展指数白皮书(2021)

来源:中国信息通信研究院编辑:蒲蒲当前,新一轮科技革命和产业变革正在重塑全球经济结构,算力作为数字经济时代新的生产力,是支撑数字经济发展的坚实基础,对推动科技进步、促进行业数字化以及支撑经济社会发…

牛客14605 画三角

链接:https://ac.nowcoder.com/acm/problem/14605 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 131072K,其他语言262144K 64bit IO Format: %lld 题目描述 小学时,JYM和XJ刚刚学…

高金吉院士:让机器“自愈化”引领新科技变革

来源:《 人民日报海外版 》( 2021年09月20日 第 09 版)作者:高金吉,中国工程院院士、北京化工大学教授、兼任中国工业互联网研究院技术委员会主任18世纪60年代,发端于英国的第一次工业革命开创了以机器代…

Kaggle初学者五步入门指南,七大诀窍助你享受竞赛

Kaggle 是一个流行的数据科学竞赛平台,已被谷歌收购,参阅《业界 | 谷歌云官方正式宣布收购数据科学社区 Kaggle》。作为一个竞赛平台,Kaggle 对于初学者来说可能有些难度。毕竟其中的一些竞赛有高达 100 万美元的奖金池和数百位参赛者。顶级的…

牛客14350 苦逼的单身狗

链接:https://ac.nowcoder.com/acm/problem/14350 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 32768K,其他语言65536K 64bit IO Format: %lld 题目描述 双11又到了,小Z依然只是…

让机器“自愈化”引领新科技变革

来源:金台资讯18世纪60年代,发端于英国的第一次工业革命开创了以机器代替手工劳动的时代。然而,机器是把“双刃剑”,可以为人类带来福祉,也可能造成灾害。随着高危流程工业装备和空天飞行器的发展,故障导致…

牛客14338 分苹果

链接:https://ac.nowcoder.com/acm/problem/14338 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 32768K,其他语言65536K 64bit IO Format: %lld 题目描述 今天是Tabris和mengxiang000来到幼儿…

揭秘特斯拉自动驾驶雄心:最大优势非算法或技术而是海量数据

来源:腾讯科技 审校:金鹿腾讯科技讯 9月20日消息,对于电动汽车制造商特斯拉来说,实现全自动驾驶始终是其优先议程之一。与其他竞争对手相比,该公司的最大优势并非技术或算法,而是目前上路的40多万辆汽车提供…

JavaScript 转载

JavaScript概述 ECMAScript和JavaScript的关系 1996年11月,JavaScript的创造者--Netscape公司,决定将JavaScript提交给国际标准化组织ECMA,希望这门语言能够成为国际标准。次年,ECMA发布262号标准文件(ECMA-262&#x…

《2021年全球创新指数报告》发布!

来源:科技日报作者:操秀英世界知识产权组织(WIPO)9月20日在日内瓦发布的《2021年全球创新指数报告》显示,中国排名第12位,较2020年上升2位。《报告》高度评价中国在创新方面取得的进步,并强调了…

牛客16464 神奇的幻方

链接:https://ac.nowcoder.com/acm/problem/16464 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 131072K,其他语言262144K 64bit IO Format: %lld 题目描述 幻方是一种很神奇的 N*N 矩阵&…

《汽车驾驶自动化分级》国家标准发布

来源:国家市场监管总局编辑:蒲蒲据市场监管总局官网,近日,市场监管总局(标准委)集中发布了一批重要国家标准。其中,就有针对自动驾驶功能的《汽车驾驶自动化分级》国家推荐标准(GB/T…

牛客13592 武藏牌牛奶促销

链接:https://ac.nowcoder.com/acm/problem/13592 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 131072K,其他语言262144K 64bit IO Format: %lld 题目描述 武藏牌牛奶为了吸引顾客&#xff…