Python气流介绍

This is a memo to share what I have learnt in Apache Airflow, capturing the learning objectives as well as my personal notes. The course is taught by Mike Metzger from DataCamp.

这是一份备忘录,旨在分享我在Apache Airflow中学到的知识,记录学习目标以及我的个人笔记。 该课程由DataCamp的Mike Metzger教授。

A data engineer’s job includes writing scripts, adding complex CRON tasks, and trying various ways to meet an ever-changing set of requirements to deliver data on schedule. Airflow can do all these while adding scheduling, error handling, and reporting.

数据工程师的工作包括编写脚本,添加复杂的CRON任务以及尝试各种方法来满足日新月异的要求,以按计划交付数据。 Airflow可以在添加计划,错误处理和报告的同时完成所有这些工作。

I have learnt the following topics:

我已经学习了以下主题:

  • Workflows / DAGs / Tasks

    工作流程/ DAG /任务
  • Operators (BashOperator, PythonOperator, BranchPythonOperator, EmailOperator)

    运算子(BashOperator,PythonOperator,BranchPythonOperator,EmailOperator)
  • Dependencies between tasks / Bitshift operators

    任务之间的依赖关系/移位运算符
  • Sensors (to react to workflow conditions and state)

    传感器(对工作流程条件和状态做出React)
  • Scheduling DAGs

    安排DAG
  • SLAs / Alerting to maintain visibility on workflows

    SLA /警报以保持工作流程的可见性
  • Templates for maximum flexibility when defining tasks

    定义任务时具有最大灵活性的模板
  • Branching, to add conditional logic to DAGs

    分支,为DAG添加条件逻辑
  • Airflow interfaces: command line / UI

    气流接口:命令行/ UI
  • Airflow executors

    气流执行器
  • Debugging / Troubleshooting

    调试/故障排除

My next steps would be:

我的下一步将是:

  • Set up my own environment for practice

    建立自己的练习环境
  • Explore other operators (eg. Amazon’s S3, Postgresql) and sensors (eg. HDFS)

    探索其他运营商(例如Amazon的S3,Postgresql)和传感器(例如HDFS)
  • Experiment with dependencies with a large number of tasks

    试验具有大量任务的依赖项
  • Look into parts of Airflow: XCom, Connections, etc

    查看气流的各个部分:XCom,连接等
  • Refer to Airflow documentations

    请参阅气流文档
  • Keep building workflows

    继续构建工作流程

More notes and codes can be found on my GitHub.

在我的GitHub上可以找到更多注释和代码。

Overall, I have enjoyed learning this course and would highly recommend it!

总的来说,我很喜欢学习这门课程,并强烈推荐它!

翻译自: https://medium.com/swlh/introduction-to-airflow-in-python-67b554f06f0b

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java~springcloud微服务目录索引

回到占占推荐博客索引 最近写了不过关于java,spring,微服务的相关文章,今天把它整理一下,方便大家学习与参考。 java~springcloud微服务~目录索引 springcloud~服务注册与发现Eureka的使用 springcloud~配置中心的使用 springclou…

DNS Bind9在windows7下

有些公司技术力量薄弱一些,一直在用windows系统,所以本文从windows出发,安装bind,利用它的view功能,做智能DNS,解决双线机房南北电信联通访问问题前言: 搞LINUX的朋友都知道,bind是l…

正确的词典访问方式

unity3d 词典访问Python字典指南 (Python Dictionary Guide) The dictionary is one of the data structures that are ready to use when programming in Python.字典是使用Python进行编程时可以使用的数据结构之一。 在我们开始之前,什么是字典? (Bef…

Vue.js(5)- 全局组件

全局组件 定义组件的语法 Vue.component(组件的名称, { 组件的配置对象 }) 在组件的配置对象中:可以使用 template 属性指定当前组件要渲染的模板结构; 使用组件的语法 把 组件的名称, 以标签的形式,引入到页面上就行; // 导入v…

DNS的几个基本概念:

一. 根域 就是所谓的“.”,其实我们的网址www.baidu.com在配置当中应该是www.baidu.com.(最后有一点),一般我们在浏览器里输入时会省略后面的点,而这也已经成为了习惯。 根域服务器我们知道有13台&#xff…

废水处理计算书 excel_废水监测数据是匿名的吗?

废水处理计算书 excelOur collective flushes help track and respond to Covid-19 and so much more. Your body waste contains harvestable compounds that can reveal your illnesses and diseases, consumption habits, and cosmetic use. Researchers gain insights from…

文件在线预览 图片 PDF Excel Word

1、前端实现pdf文件在线预览功能 方式一、pdf文件理论上可以在浏览器直接打开预览但是需要打开新页面。在仅仅是预览pdf文件且UI要求不高的情况下可以直接通过a标签href属性实现预览 <a href"文档地址"></a> 2、word、xls、ppt文件在线预览功能 word、pp…

数据科学还是计算机科学_您应该拥有数据科学博客的3个原因

数据科学还是计算机科学“Start a Blog to cement the things you learn. When you teach what you’ve learned in the form of a blog you can see the gaps in your knowledge and fill them in” — My Manager (2019)“创建一个博客以巩固您所学到的东西。 当您以博客的形…

D3.js 加标签

条形图还可以配上实际的数值,我们通过文本元素添加数据值。 svg.selectAll("text").data(dataset).enter().append("text").text(function(d){return d;}) 通过 x 和 y 值来定位文本元素。 .attr("text-anchor", "middle").attr("…

oppo5.0以上机器(亲测有效)激活Xposed框架的教程

对于喜欢玩手机的朋友而言&#xff0c;常常会用到xposed框架以及种类繁多功能强大的模块&#xff0c;对于5.0以下的系统版本&#xff0c;只要手机能获得ROOT权限&#xff0c;安装和激活xposed框架是异常简便的&#xff0c;但随着系统版本的迭代&#xff0c;5.0以后的系统&#…

和matlab一样的轻量级

Python&#xff08;英国发音&#xff1a;/ˈpaɪθən/ 美国发音&#xff1a;/ˈpaɪθɑːn/&#xff09;, 是一种面向对象、解释型计算机程序设计语言&#xff0c;由Guido van Rossum于1989年发明&#xff0c;第一个公开发行版发行于1991年。Python是纯粹的自由软件&#xff…

熊猫分发_流利的熊猫

熊猫分发Let’s uncover the practical details of Pandas’ Series, DataFrame, and Panel让我们揭露Pandas系列&#xff0c;DataFrame和Panel的实用细节 Note to the Readers: Paying attention to comments in examples would be more helpful than going through the theo…

redis tomcat session

本机ip为192.168.1.101 1、准备测试环境 两个Tomcat 在Eclipse中新建2个Servers&#xff0c;指定对应的Tomcat&#xff0c;端口号错开。 Tomcat1&#xff08;18005、18080、18009&#xff09; Tomcat2&#xff08;28005、28080、28009&#xff09; 一个Redis Redis下载官网&…

Fiddler抓包-只抓APP的请求

from:https://www.cnblogs.com/yoyoketang/p/6582437.html fiddler抓手机app的请求&#xff0c;估计大部分都会&#xff0c;但是如何只抓来自app的请求呢&#xff1f; 把来自pc的请求过滤掉&#xff0c;因为请求太多&#xff0c;这样会找不到重要的信息了。 环境准备&#xff1…

技术分享 | 基于EOS的Dapp开发

区块链技术是当前最能挑动社会舆论神经&#xff0c;激起资本欲望的现象级技术。去中心化的价值互联&#xff0c;信用共识&#xff0c;新型组织构架&#xff0c;新的生产关系和智能合约&#xff0c;颠覆法币的发行流通体系和记账体系。这些新的技术都让人充满想象&#xff0c;充…

DOCKER windows 安装Tomcat内容

DOCKER windows安装 DOCKER windows安装 1.下载程序包2. 设置环境变量3. 启动DOCKERT4. 分析start.sh5. 利用SSH工具管理6. 下载镜像 6.1 下载地址6.2 用FTP工具上传tar包6.3 安装6.4 查看镜像6.5 运行 windows必须是64位的 1.下载程序包 安装包 https://github.com/boot2doc…

python记录日志_5分钟内解释日志记录—使用Python演练

python记录日志Making your code production-ready is not an easy task. There are so many things to consider, one of them being able to monitor the application’s flow. That’s where logging comes in — a simple tool to save some nerves and many, many hours.使…

理解 Linux 中 `ls` 的输出

理解 Linux 中 ls 的输出ls 的输出会因各 Linux 版本变种而略有差异&#xff0c;这里只讨论一般情况下的输出。 下面是来自 man page 关于 ls 的描述&#xff1a; $ man ls ls - list directory contents 列出文件夹中的内容。 但一般我们会配合着 -l 参数使用&#xff0c;将输…

锁表的进程和语句,并杀掉

查看锁表进程SQL语句1&#xff1a; select sess.sid, sess.serial#, lo.oracle_username, lo.os_user_name, ao.object_name, lo.locked_mode from v$locked_object lo, dba_objects ao, v$session sess where ao.object_id lo.object_id and lo.session_id sess.sid; 查看锁…

p值 t值 统计_非统计师的P值

p值 t值 统计Here is a summary of how I was taught to assess the p-value in hopes of helping some other non-statistician out there.这是关于如何教会我评估p值的摘要&#xff0c;希望可以帮助其他一些非统计学家。 P-value in Context上下文中的P值 Let’s start wit…