Python 字典简介
Python 内置了字典:dict 的支持,dict 全称 dictionary,在其他语言中也称为 map,使用键-值(key-value)存储,具有极快的查找速度。
这种 key-value 存储方式,在放进去的时候,必须根据 key 算出 value 的存放位置,这样,取的时候才能根据 key 直接拿到 value。
请务必注意,dict 内部存放的顺序和 key 放入的顺序是没有关系的。
和 list 比较,dict 有以下几个特点:
- 查找和插入的速度极快,不会随着 key 的增加而增加;
- 需要占用大量的内存,内存浪费多。
而 list 相反:
- 查找和插入的时间随着元素的增加而增加;
- 占用空间小,浪费内存很少。
所以,dict 是用空间来换取时间的一种方法。字典的定义及初始化,
d = {}
d = dict()
d = {'a': 1, 'b': 2}
d = dict([('a', 1), ('b', 2)]) # 可迭代对象的元素必须是一个二元组,二元组的第0个元素为字典的key,第1个元素为字典的value
d = dict.fromkeys(range(5)) # 传入的可迭代元素为key,值为None
d = dict.fromkeys(range(5), 'abc') # 传入的可迭代元素为key,值为abc
dict 可以用在需要高速查找的很多地方,在 Python 代码中几乎无处不在,正确使用 dict 非常重要,需要牢记的第一条就是 dict 的 key 必须是不可变对象。这是因为 dict 根据 key 来计算 value 的存储位置,如果每次计算相同的 key 得到的结果不同,那 dict 内部就完全混乱了。这个通过 key 计算位置的算法称为哈希算法(Hash)。
要保证 hash 的正确性,作为 key 的对象就不能变。在Python 中,字符串、整数等都是不可变的,因此,可以放心地作为 key。而 list 是可变的,就不能作为 key:
In [1]: d = {}
In [2]: key = [1, 2, 3]
In [3]: d[key] = 'a list'
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
TypeError: unhashable type: 'list'
字典常用方法
首先总结一下有哪些常用的方法:
- 增加:
update
- 删除:
pop
,popitem
,clear
- 修改:
update
- 查找:
get
- 其他:
keys
,values
,items
,fromkeys
字典增加或修改
update
方法会修改或增加字典内容。如有下一个字典:
In [12]: dict01 = {'laven': 23, 'taoqi': 20}
In [13]: dict01
Out[13]: {'laven': 23, 'taoqi': 20}
# 使用update增加一个key-value
n [14]: dict01.update(a=123)
In [15]: dict01
Out[15]: {'a': 123, 'laven': 23, 'taoqi': 20}
当然,我们直接使用dict01['a'] = 123
也是可以的,只不过我们这里介绍的是字典的update
方法。接下来看看update
方法的修改作用:
In [15]: dict01
Out[15]: {'a': 123, 'laven': 23, 'taoqi': 20}
In [16]: dict01.update(laven=21)
In [17]: dict01
Out[17]: {'a': 123, 'laven': 21, 'taoqi': 20}
update
方法也可以接收一个二元组列表作为其参数来增加字典:
In [17]: dict01
Out[17]: {'a': 123, 'laven': 21, 'taoqi': 20}
In [18]: dict01.update([('b', 456), ('c', 789)])
In [19]: dict01
Out[19]: {'a': 123, 'b': 456, 'c': 789, 'laven': 21, 'taoqi': 20}
update
的参数也可以是一个字典,不过这种形式用的比较少,还是举个例子吧:
In [20]: dict01
Out[20]: {'a': 123, 'b': 456, 'c': 789, 'laven': 21, 'taoqi': 20}
In [21]: dict01.update({'d': 987, 'e': 654})
In [22]: dict01
Out[22]: {'a': 123, 'b': 456, 'c': 789, 'd': 987, 'e': 654, 'laven': 21, 'taoqi': 20}
总结一下update的用法,它的参数的几种情况:
- 可以是字典
- 可以是由二元组构成的可迭代对象
- 关键字参数
字典删除
删除字典有三种形式:
pop
删除指定的key,返回该key的valuepopitem
随机删除,返回随机删除的一个kv二元组clear
清空字典
接下来看例子:
In [23]: dict01 = {'laven': 23, 'taoqi': 20}
# pop一个存在的key
In [24]: dict01.pop('laven')
Out[24]: 23
# pop一个不存在的key呢?
In [25]: dict01.pop('lavenliu')
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-25-a346227feeaa> in <module>()
----> 1 dict01.pop('lavenliu')
KeyError: 'lavenliu'
如果pop
一个不存在的key,为了不让出现KeyError
异常,我们可以为其设置一个默认值,如下:
In [26]: dict01.pop('lavenliu', 'not exist')
Out[26]: 'not exist'
接下来看看popitem
方法:
In [27]: dict01
Out[27]: {'taoqi': 20}
In [28]: dict01['laven'] = 23
In [29]: dict01
Out[29]: {'laven': 23, 'taoqi': 20}
In [30]: dict01.popitem()
Out[30]: ('laven', 23) # 随机返回一个二元组
In [31]: dict01
Out[31]: {'taoqi': 20}
如果是空字典呢?我们还能否进行popitem
方法呢?大家可以试试看。
最后看看字典的clear
方法:
In [34]: dict01 = {'laven': 23, 'taoqi': 20}
In [35]: dict01.clear()
In [36]: dict01
Out[36]: {}
如果空字典再次执行clear
方法会怎样呢?大家可以试试看。
字典查找
字典查找也可以叫做字典的访问,如果我们知道字典有哪些key,直接进行访问就可以了。如下示例:
In [38]: dict01 = {'laven': 23, 'taoqi': 20}
In [39]: dict01['taoqi']
Out[39]: 20
In [40]: dict01['laven']
Out[40]: 23
我们使用get
方法试试呢?
In [41]: dict01.get('laven')
Out[41]: 23
# 访问一个不存在的key呢
In [42]: dict01.get('lavenliu')
# 发现什么都没有返回,我们可以给get方法一个默认值,
In [46]: dict01.get('lavenliu', -1)
Out[46]: -1
# 当对存在的key进行get时,返回的还是相应的value
In [47]: dict01.get('laven', -1)
Out[47]: 23
字典其他方法
字典的其他方法:
keys
返回所有的keyvalues
返回所有的valueitems
返回一个二元组列表fromkeys
可以批量创建字典的key-value
下面分别演示:
# keys方法演示
In [50]: dict01 = {'laven': 23, 'taoqi': 20}
In [51]: dict01.keys()
Out[51]: dict_keys(['laven', 'taoqi'])
# values方法演示
In [52]: dict01.values()
Out[52]: dict_values([23, 20])
# items方法演示
In [53]: dict01.items()
Out[53]: dict_items([('laven', 23), ('taoqi', 20)])
# fromkeys方法演示
In [54]: dict02 = {}
In [55]: dict02 = dict.fromkeys(range(5)) # 传入的可迭代元素为keys
In [56]: dict02
Out[56]: {0: None, 1: None, 2: None, 3: None, 4: None}
In [57]: dict02 = dict.fromkeys(range(5), 'not none') # 还可以给一个默认值
In [58]: dict02
Out[58]: {0: 'not none', 1: 'not none', 2: 'not none', 3: 'not none', 4: 'not none'}
字典的遍历
字典的遍历很简单:
In [48]: dict01
Out[48]: {'laven': 23, 'taoqi': 20}
In [49]: for k, v in dict01.items():...: print(k, '=>', v)...:
laven => 23
taoqi => 20
In [63]: for k in dict01.keys():...: print(k, "=>", dict01[k])...:
laven => 23
taoqi => 20
keys
、 values
、items
返回的都是生成器,它并不会复制一份内存。而Python2对应的方法返回的是列表,会复制一份。
还有一个不常用的方法叫做enumerate
,它返回的是key的所以及相应的key。示例如下:
In [64]: for idx, k in enumerate(dict01):...: print(idx, "=>", k)...:
0 => laven
1 => taoqi
# 还可以这样使用
In [65]: for i, (k, v) in enumerate(dict01.items()):...: print(i, k, "=>", v)...:
0 laven => 23
1 taoqi => 20
根据value找其对应的key:
In [88]: d = {'a': 1, 'b': 2, 'c': 3}
In [89]: d.update(c=123)
In [90]: d
Out[90]: {'a': 1, 'b': 2, 'c': 123}
In [91]: for k, v in d.items():...: if v == 123:...: print(k)...: break...:
字典排序
由于字典是散列表,没有顺序,适合插入、查询等操作。另外字典的key不一定是字符串,但一定是不可变对象。字典排序我们使用内置的sorted
函数:
In [107]: dict01
Out[107]: {'laven': 23, 'taoqi': 20}
In [108]: sorted(dict01.items(), key=lambda d: d[1], reverse=True)
Out[108]: [('laven', 23), ('taoqi', 20)]
In [109]: sorted(dict01.items(), key=lambda d: d[1], reverse=False)
Out[109]: [('taoqi', 20), ('laven', 23)]
默认字典
default初始化的时候,需要传入一个函数,这个函数也叫工厂函数。当我们使用下标访问一个key的时候,如果这个key不存在,defaultdict会自动调用初始化时传入的函数,生成一个对象作为这个key的value。一个默认字典的例子,我们来构造一个多值的字典:
In [79]: from collections import defaultdict
# 常规方法
In [80]: d = {}
In [81]: for k in range(10):...: for v in range(10):...: if k not in d.keys():...: d[k] = []...: d[k].append(v)...:
In [82]: d
Out[82]:
{0: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
1: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
2: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
3: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
4: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
5: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
6: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
7: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
8: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
9: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}# 使用默认字典的方法
In [83]: d = defaultdict(list)
In [84]: d
Out[84]: defaultdict(list, {})
In [85]: print(d)
defaultdict(<class 'list'>, {})
In [86]: for k in range(10):...: for v in range(10):...: d[k].append(v)...:
In [87]: d
Out[87]:
defaultdict(list,{0: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],1: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],2: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],3: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],4: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],5: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],6: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],7: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],8: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],9: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]})
有序字典
在绝大多数的编程语言中,字典都是无序的。在Python中,字典也是无序的。但标准库提供了有序字典的库,我们可以创建有序字典。但是有序字典比常规的字典要占用多一倍的内存空间。
示例如下:
In [4]: from collections import OrderedDict
In [5]: od = OrderedDict()
In [6]: od['a'] = 1
In [7]: od['b'] = 2
In [8]: od['c'] = 3
In [9]: od.keys()
Out[9]: odict_keys(['a', 'b', 'c'])
In [10]: for k, v in od.items():
...: print(k, '->', v)
...:
a -> 1
b -> 2
c -> 3
字典的限制
- 字典的 key 不能重复;
- 字典的 key 需要可 hash。
总结
今天,我们讲解了字典的绝大部分的知识点。当然了Python字典的实现这里就不讲解了,可以作为拓展内容自己进行学习了解。这里只是提一下,Python字典的实现主要有:“拉链法”和“开地址法”。