昨天介绍完了最常用的列表,之后就是次常用的元组、集合与字典了。
5.3. 元组和序列
元组和之前讲过的列表有很多共同特性,例如索引和切片操作。实际上,他们是 序列 数据类型(list, tuple, range)中的两种。
一个元组由几个被逗号隔开的值组成,例如:
>>> t = 12345, 54321, 'hello!' # 元组打包
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> # 元组可以嵌套
... u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))
>>> # 元组本身是不可变的
... t[0] = 88888
Traceback (most recent call last):File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment
>>> # 但是元组可以包含可变对象,如下面的列表
... v = ([1, 2, 3], [3, 2, 1])
>>> v
([1, 2, 3], [3, 2, 1])
如你所见,元组在输出时总是被圆括号()
包围的,以便正确表示嵌套元组。输入时圆括号可有可无,不过经常会是必须的(如果这个元组是一个更大的表达式的一部分)。
虽然元组可能看起来与列表很像,但它们通常是在不同的场景被使用,并且有着不同的用途。元组是 immutable (不可变的),其序列通常包含不同种类的元素,并且通过解包或者索引来访问。列表是 mutable (可变的),并且列表中的元素一般是同种类型的,并且通过迭代访问。给元组中的一个单独的元素赋值是不允许的,当然你可以创建包含可变对象的元组,例如列表。
一个特殊的问题是构造包含0个或1个元素的元组:为了适应这种情况,语法有一些额外的改变。空元组可以直接被一对空圆括号创建,含有一个元素的元组可以通过在这个元素后添加一个逗号来构建(圆括号里只有一个值的话不够明确)。不好看,但是有效。例如:
>>> empty = ()
>>> singleton = 'hello', # 一个元素后面加了一个逗号,表示是包含一个元素的元组
>>> len(empty)
0
>>> len(singleton)
1
>>> singleton
('hello',)
最后讲解一对概念,元组打包和序列解包。如最开始代码中的 t = 12345, 54321, 'hello!'
就是元组打包的例子,我们通过x, y, z = t
即序列解包,就能得到x = 12345,y = 54321,z = 'hello!'
的结果。
实际上元组打包和序列解包是互为逆操作的,注意序列解包要求等号左侧的变量数与右侧序列里所含的元素数相同。而多重赋值,其实也不过是元组打包和序列解包的组合而已。
5.4. 集合
我们都知道,集合是由不重复元素组成的无序的集,所以python中的集合也是如此。它的基本用法包括成员检测(查找)和消除重复元素(去重)。集合对象也支持像 并集,交集,差集等数学运算。花括号{}
或 set()
函数可以用来创建集合。
注意:要创建一个空集合你只能用 set()
而不能用 {}
,因为后者是创建一个空字典,这种数据结构我们会在下面进行讨论。
以下是一些简单的示例:
>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket) # 重复项被自动删除了
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket # 检测元素是否在集合中
True
>>> 'crabgrass' in basket
False>>> # 两个字母集合之间进行运算
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a # 一段字母去重后的即为集合
{'a', 'r', 'b', 'c', 'd'}
>>> a - b # a有但是b没有的字母(差集)
{'r', 'd', 'b'}
>>> a | b # a或者b有的字母(并集)
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b # a和b都有的字母(交集)
{'a', 'c'}
>>> a ^ b # a或b只有一个有的字母(异或)
{'r', 'd', 'b', 'm', 'z', 'l'}
类似于 列表推导式,集合也支持推导式形式(集合推导式):
>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}
5.5. 字典
另一个非常有用的 Python 內置数据类型是字典。字典在其他语言里可能会被叫做联合内存 或联合数组。与以连续整数为索引的序列不同,字典是以关键字为索引的,关键字可以是任意不可变类型,通常是字符串或数字。如果一个元组只包含字符串、数字或元组,那么这个元组也可以用作关键字。但如果元组直接或间接地包含了可变对象,那么它就不能用作关键字。列表不能用作关键字,因为列表可以通过索引、切片或 append() 和 extend() 之类的方法来改变(可变类型)。
理解字典的最好方式,就是将它看做是一个 键: 值 对的集合,键必须是唯一的(在一个字典中)。一对花括号(大括号){}
可以创建一个空字典 。另一种初始化字典的方式是在一对花括号里放置一些以逗号分隔的键值对,而这也是字典输出的方式。
字典主要的操作是使用关键字存储和解析值。也可以用 del
来删除一个键值对。如果你使用了一个已经存在的关键字来存储值,那么之前与这个关键字关联的值就会被遗忘。用一个不存在的键来取值则会报错。
对一个字典执行 list()
将返回包含该字典中所有键的列表,按插入次序排列 (如需其他排序,则要使用 sorted()
)。要检查字典中是否存在一个特定键,可使用 in
关键字。
以下是使用字典的一些简单示例:
>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'jack': 4098, 'sape': 4139, 'guido': 4127}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'jack': 4098, 'guido': 4127, 'irv': 4127}
>>> list(tel)
['jack', 'guido', 'irv']
>>> sorted(tel)
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False
除了用花括号,也可以用dict()
构造函数直接从键值对序列里创建字典:
>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'guido': 4127, 'jack': 4098}
当关键字是简单字符串时,有时直接通过关键字参数来指定键值对更方便:
>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'guido': 4127, 'jack': 4098}
此外,字典推导式可以从任意的键值表达式中创建字典:
>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}