yaml 是什么?
在 github 一些开源项目里经常可以看到 .travis.yml 文件,后来接触持续集成这个概念时发现很多文件都是 .yml 后缀的文件。我在 阮一峰-YAML 语言教程 里了解了它的作用以及基本写法,他的那篇文章描述的略微有点啰嗦,实际看到的大多数配置文件还是及其简单的,而我们要做的是能读懂它们,就像读懂 .json 一样。
yaml 语言(或者说是一种规范吧)可以编写 .yml 文件,和 json 一样是配置文件。也许是有人认为 json 的写法不爽,于是乎发明了这玩意,通过下面的例子,可以看到 yaml 写的配置文件确实要比 json 方便很多。
编写规则
- 大小写敏感
json 里也是大小写敏感的,这点二者一样。
- 使用缩进表示层级关系
json 中使用 {}
的嵌套表示层级,而 yaml 使用缩进,后者更方便一些。
#
表示注释
json 文件中不允许写注释,对于很长配置文件全靠字面意思猜挺痛快的,yaml 可以写注释,:100:
数据结构
配置文件理应十分简洁,与 json 相比,不用频繁的写 {}
和 []
,毕竟换行和 -
符号更加简洁,字符串也不需要频繁的加引号(无论是单引号还是双引号)。
对象
# conf.yml
animal: pets
hash: { name: Steve, foo: bar }
转换为 json 为:
{{ "animal": "pets" },{ "hash": { "name": "Steve", "foo": "bar" } }
}
数组
# conf.yml
Animal:- Cat- Dog- Goldfish
转换为 json 为:
{ "Animal": [ "Cat", "Dog", "Goldfish" ] }
字符串
# conf.yml
# 正常情况下字符串不用写引号
str: 这是一行字符串
# 字符串内有空格或者特殊字符时需要加引号
str: '内容: 字符串'
null
# conf.yml
parent: ~
.yml 中 ~ 表示 null,转换为 json 为:
{ "parent": null }
1. 认识 YAML
YAML是一个类似 XML、JSON 的标记性语言。YAML 强调以数据为中心,并不是以标识语言为重点。因而 YAML 本身的定义比较简单,号称“一种人性化的数据格式语言”。
1.1 YAML 的设计目标:
人类容易阅读
可用于不同程序间的数据交换
适合描述程序所使用的数据结构,特别是脚本语言
丰富的表达能力与可扩展性
易于使用
1.2 YAML 与 XML、JSON
YAML 与 XML
具有 XML 同样的优点,但比 XML 更加简单、敏捷等
YAML 与 JSON
JSON 可以看作是 YAML 的子集,也就是说 JSON 能够做的事情,YAML 也能够做
YAML 能表示得比 JSON 更加简单和阅读,例如“字符串不需要引号”。所以 YAML 容易可以写成 JSON 的格式,但并不建议这种做
YAML 能够描述比 JSON 更加复杂的结构,例如“关系锚点”可以表示数据引用(如重复数据的引用)。
1.3 YAML 组织结构
YAML 文件可以由一或多个文档组成(也即相对独立的组织结构组成),文档间使用“---”(三个横线)在每文档开始作为分隔符。同时,文档也可以使用“...”(三个点号)作为结束符(可选)。如下图所示:
如果只是单个文档,分隔符“---”可省略。
每个文档并不需要使用结束符“...”来表示结束,但是对于网络传输或者流来说,作为明确结束的符号,有利于软件处理。(例如不需要知道流关闭就能知道文档结束) <br/>
YAML 认为数据由以下三种结构组成:(每个文档由三种结构混合组成)
标量 (相当于数据类型)
序列 (相当于数组和列表)
键值表(相当于 Map 表)
2. YAML 编写规范
规范一:文档使用 Unicode 编码作为字符标准编码,例如 UTF-8
规范二:使用“#”来表示注释内容
# 客户订单
date: 2015-02-01
customer:
- name: Jai
items:
- no: 1234 # 订单号
- descript: cpu
规范三:使用空格作为嵌套缩进工具。通常建议使用两个空格缩进,不建议使用 tab (甚至不支持)
规范四:序列表示
使用“-”(横线) + 单个空格表示单个列表项
--- # 文档开始
- 第一章 简介
- 第二章 设计目录
使用"[]"表示一组数据
--- # 文档开始
[blue, red, green]
组合表示。每个结构都可以嵌套组成复杂的表示结构。
--- # 文档开始
- [blue, red, green] # 列表项本身也是一个列表
- [Age, Bag]
- site: {osc:www.oschina.net, baidu: www.baidu.com} # 这里是同 键值表 组合表示
规范五:键值表
使用 “:”(冒号) + 空格表示单个键值对
# 客户订单
date: 2015-02-01
customer:
- name: Jai
items:
- no: 1234 # 订单号
- descript: cpu
- price: ¥800.00
使用"{}"表示一个键值表
# 客户订单
date: 2015-02-01
customer:
- name: Jai
items: {no: 1234, descript: cpu, price: ¥800.00}
"? " 问号+空格表示复杂的键。当键是一个列表或键值表时,就需要使用本符号来标记。
# 使用一个列表作为键
? [blue, reg, green]: Color
# 等价于
? - blue
- reg
- gree
: Color
组合表示。每个结构都可以嵌套组成复杂的表示结构。
Color:
- blue
- red
- green
# 相当于 (也是 JSON 的表示)
{Color: [blue, red, green]}
div:
- border: {color: red, width: 2px}
- background: {color: green}
- padding: [0, 10px, 0, 10px]
# 使用缩进表示的键值表与列表项
items:
- item: cpu
model: i3
price: ¥800.00
- item: HD
model: WD
price: ¥450.00
# 上面使用 “-” 前导与缩进来表示多个列表项,相当于下面的JSON表示
items: [{item:cpu, model:i3, price:¥800.00}, {item:HD, model:WD, price: ¥450.00}]
规范六:文本块
使用 “|” 和文本内容缩进表示的块:保留块中已有的回车换行。相当于段落块
yaml: | # 注意 ":" 与 "|" 之间的空格
JSON的语法其实是YAML的子集,大部分的JSON文件都可以被YAML的解释器解释。
如果你想更深入的学习YAML,我建议你去 http://www.yaml.org 看看
使用 “>” 和文本内容缩进表示的块:将块中回车替换为空格,最终连接成一行。
yaml: > # 注意 ":" 与 ">" 之间的空格,另外可以使用空行来分段落
JSON的语法其实是YAML的子集,
大部分的JSON文件都可以被YAML的解释器解释。
如果你想更深入的学习YAML,我建议你去 http://www.yaml.org 看看
使用定界符“”(双引号)、‘’(单引号)或回车表示的块:最终表示成一行。
yaml: # 使用回车的多行,最终连接成一行。
JSON的语法其实是YAML的子集,
大部分的JSON文件都可以被YAML的解释器解释。
yaml: # 使用了双引号,双引号的好处是可以转义,即在里面可以使用特殊符号
"JSON的语法其实是YAML的子集,
大部分的JSON文件都可以被YAML的解释器解释。"
规范七:数据类型的约定
对一些常用数据类型的表示格式进行了约定,包括:
integer: 12345 # 整数标准形式
octal: 0o34 # 八进制表示,第二个是字母 o
hex: 0xFF # 十六进制表示
float: 1.23e+3 # 浮点数
fixed: 13.67 # 固定小数
minmin: -.inf # 表示负无穷
notNumber: .NaN # 无效数字
null: # 空值
boolean: [true, false] # 布尔值
string: ‘12345‘ # 字符串
date: 2015-08-23 # 日期
datetime: 2015-08-23T02:02:00.1z # 日期时间
iso8601: 2015-08-23t21:59:43.10-05:00 # iso8601 日期格式
spaced: 2015-08-23 21:59:43.10 -5 # ?
“!”(叹号)显式指示类型,或自定义类型标识。单叹号通常是自定义类型,双叹号是内置类型
isString: !!str 2015-08-23 # 强调是字符串不是日期数据
picture: !!binary | # Base64 图片
R0lGODlhDAAMAIQAAP//9/X
17unp5WZmZgAAAOfn515eXv
Pz7Y6OjuDg4J+fn5OTk6enp
56enmleECcgggoBADs=
#下面是内置类型
!!int # 整数类型
!!float # 浮点类型
!!bool # 布尔类型
!!str # 字符串类型
!!binary # 也是字符串类型
!!timestamp # 日期时间类型
!!null # 空值
!!set # 集合
!!omap, !!pairs # 键值列表或对象列表
!!seq # 序列,也是列表
!!map # 键值表
#下面是一些例子:
--- !!omap
- Mark: 65
- Sammy: 63
- Key: 58
--- !!set # 注意,“?”表示键为列表,在这里列表为 null
? Mark
? Sammy
? Key
# 下面是自定义的类型或标识
%TAG ! tag:clarkevans.com,2002: # % 是指令符号
--- !shape
# Use the ! handle for presenting
# tag:clarkevans.com,2002:circle
- !circle
center: &ORIGIN {x: 73, y: 129}
radius: 7
- !line
start: *ORIGIN
finish: { x: 89, y: 102 }
- !label
start: *ORIGIN
color: 0xFFEEBB
text: Pretty vector drawing.
规范八:锚点与引用,定义数据的复用。
第一步:使用 “&” 定义数据锚点(即要复制的数据)
第二步:使用 “*” 引用上述锚点数据(即数据的复制目的地)
---
hr:
- Mark McGwire
# Following node labeled SS
- &SS Sammy Sosa # 定义要复制的数据
rbi:
- *SS # Subsequent occurrence 这里是数据复制目标