先区分一下序列类型和散列类型:
序列类型:list、string、tuple,他们中的元素是有序的。
散列类型:set、dict,他们中的元素无序的。(注意:python3.7.0开始字典变成"有序"了)
序列类型有序,可以用索引。而散列类型中的元素是无序的,所以不能索引。
一、集合
(一).集合的特性:无序、唯一、可变。集合中的元素需要可哈希的,元素不可以是可变对象。
定义一个集合:
(1).工厂方法:se = set()
注意不要写成 se = () 这样变成元组了。
(2).直接定义:se = {1,2,3} 用大括号括起来。
大括号中要写入元素,不写元素就是一个空字典了。
(3).案例分析:
#分析这两种定义,哪一个会报错?
s1 = {1, ['a', 'b', 'c']}
s2= {1, ('a', 'b', 'c')}
第一种会报错。TypeError: unhashable type: 'list'
因为集合中的元素要符合不可变这个规则, 列表可变,不符合规则,报错了。
第二种,元组不可变,符合规则,所以解释器不会跟你叫劲。
至于什么是可哈希?往下翻……
(二).集合的运算
(1).检查成员:in / not in
语法:item in set_object -> bool
例:
not in 就是取反
(2).交集:&
两个集合共同有的元素,取两个集合重复的元素。
例:
#1.有两个列表 x = [1,2,3,'a','b','c'] y = ['a','b','c'] 找出x,y列表中,共有元素
x= [1, 2, 3, 'a', 'b', 'c']
y= ['a', 'b', 'c']print(set(x) &set(y))"""列表没有交集"&"的功能,但是集合有。
那么先工厂一下,然后再交集。
运行结果:
{'c', 'b', 'a'} # 集合无序,所以元素输出的顺序未必如自己预想的"""
View Code
为什么运行结果的顺序是乱的?因为集合无序的!
(3).并集:|(shift+回车上面那个)
取出不重复的值。字面意思理解,并集,并在一起了(相当于变成一个集合了,集合的特性之一:元素唯一)。
例:
(4).差集:-
剪掉两个集合中的重复部分。
本人数学最烂,就这么死记硬背着,第二个集合后面的元素都会砍掉。
(5).与非集:^(脱字符:shift+6)
取两个集合各自独有的元素。
(6).小技巧:如何去重元素?
利用集合的特性之一:唯一性
a = [1, 2, 2, 3, "a", "b", "c", "a", "b", "a", 3]
# 工厂一下,set()print(set(a)) # {1, 2, 3, 'c', 'b', 'a'}
(三).集合的常用方法
(1).set.add() 添加单个元素
(2).set.update(iterable) 批量更新,会去重。
二、字典
(一).字典的特性
1.key唯一
2.无序(散列类型,Python3.7.0之前)
3.可变
key是唯一的,需要的是不可变对象,且要符合变量命名规则。key重名的话,值会被后者所覆盖。
注意版本之间的区别,在Python3.7.0之前:字典是无序的(散列类型);从Python3.7.0开始:字典不再是散列类型了,是按照键的插入顺序进行排列!
4.可以嵌套到任意深度(仅受可用内存约束)
(二).定义一个字典
(1).直接大括号:di = {} 是一个空字典
type(di)之后:
注意要与集合的定义区别开来!定义空集合是:s1 = set()
一般是直接把值写进去,语法:di = {key1:value,key2:value,...} 键值对是冒号的形式
例:
(2).工厂方式:di = dict(key1=value,key2=value,...) 键值对用等号"="等起来,工厂方式的key不要加引号!
例:
(3).案例分析:
#分析这两种定义,哪一个会报错?
di1 = {'a': 'test', ('a', 'b'): 'test'}
di2= {'a': 'test', {'a', 'b'}: 'test'}
di2会报错,TypeError: unhashable type: 'set'
key需要是不可变对象。第二种里有一个集合,集合的特性之一是可变,不符合key的规则,解释器跟你急了。
而第一种里是一个元组,元组不可变,没问题了。
另外,内建函数也可以作为字典的key:
d1 = {len: 1, str: "aaa"}print(d1[len]) #1
print(d1[str]) #'aaa'
View Code
(三).往字典里插入值
di ={}#直接赋值一样
di["name"] = "quanquan616"
"""get(key) 如果key不存在,不会报错。取到了会返回原有值。
get(key,value) 当key不存在的时候,会返回value的值,常用来提示。"""di.get("sex", "没有这个键")"""如果要插入值,可以这么做:
di["name"] = di.get("name","")+"zyb"
di["sex"] = di.get("sex","male")
di["age"] = di.get("age",0)+30
di -> {'name': 'zyb', 'sex': 'male', 'age': 30}"""
"""setdefault(key,value) 字面理解,设置默认。
key有的话会返回原有值,无此key才会设置。
如果此key已有,不会改变原有值,不会被更新"""di.setdefault("name", "zyb")"""update(dict_object) 参数需要是一个字典对象。
有就改变,没有就添加进去。"""di.update({"age": 35, "read": 15})#fromkeys(iterable,value) 批量设置,所有的值都是一样的。不会改变原有字典
di.fromkeys("abc", 30)print(di)#{'name': 'quanquan616', 'age': 35, 'read': 15}
View Code
(四).对字典进行取值
#直接用键进行取值,Dict[key]
print(di["name"]) #quanquan616
#get(key) 取到了就返回值,没有取到不会报错
print(di.get("name")) #quanquan616
#get()的另一种用法
di ={}
di["name"] = di.get("name", "") + "zyb"
print(di) #{'name': 'zyb'}
#setdefault(key) 有就返回这个键的值。如果没有这个键,会创建,不指定值的话,会是None。不会因为指定了值而改变原有数据。
print(di.setdefault("name")) #quanquan616
#values() 取出所有的值,返回一个迭代器
print(di.values()) #dict_values(['quanquan616', 35, 15])
View Code
(五).changed in python3.7.0
官方文档对python3.7.0中字典的描述:
Dictionary order is guaranteed to be insertion order.Dictionaries preserve insertion order.
Note that updating a key does not affect the order.Keys added after deletion are inserted at the end.
大意:字典保留的顺序是键插入的顺序,更新值不会影响原有的顺序,但删除后添加的键将在末尾插入。
演示如下:
(六).字典小技巧(以下代码均在python3.7.0中运行)
(1).对字典中的元素进行排序
di = {"in": 123, "to": 511, "she": 255, "i": 111}print(sorted(di.items(), key=lambda item: item[1], reverse=True))#运行结果:[('to', 511), ('she', 255), ('in', 123), ('i', 111)]
"""di.items() 将字典转化为可迭代对象。Dict.items()将字典中的key-value元素,转化为了元组
# [('in', 123), ('to', 511), ('she', 255), ('i', 111)]
key=lambda item: item[1] 取元素中的第二个元素作为比较的参数"""
key是用来指定做排序的每项元素的那个部分。匿名函数的item,就是指代每项元素,item[1]就是元素的第二项的意思。
注意此方法中,value的值只能是数值,如果出现字符串就会报错。(字符串和数值能直接做比较吗?)
(2).对列表中的多个字典排序
#按age从大到小排序
alist = [{"name": "a", "age": 20}, {"name": "b", "age": 30}, {"name": "c", "age": 25}]
alist.sort(key=lambda item: -item.get("age"))"""key中的lambda表达,等价于下面这种方式。
获得字典中"age"的值,key的意思是以哪个函数为关键字。"""
#def get_sort(li):#return li.get("age")#alist.sort(key=get_sort, reverse=True)
print(alist)#[{'name': 'b', 'age': 30}, {'name': 'c', 'age': 25}, {'name': 'a', 'age': 20}]
View Code
(3).合并字典(键相同则覆盖)
x = {"a": 1, "b": 2}
y= {"b": 3, "c": 3, "d": 4}
z= {**x, **y}print(z)#{'a': 1, 'b': 3, 'c': 3, 'd': 4}
View Code
(4).字典代替多个if...elif
如下这段if...elif...else语句:
deffun(x):if x == "a":return 1
elif x == "b":return 2
else:return None
View Code
可以写成更加简洁更加pythonic的代码:
deffun(x):return {"a": 1, "b": 2}.get(x)
dict.get() 如果get不到值会返回None
(5).dict.pop()方法从字典中删除条目。但是,传递给pop()中的参数,必须是字典中存在的键,而不是值。
三、运算符(部分简单的运算符之前已有摘录,不在这里重复了,遇到实际情况不会了直接google it)
(一).身份运算符:is / is not
两个对象,是否指向同一个id。(id和内存地址还是有区别的)
注意区分"=="和"is":
==用来判断两个值是否相等,is是判断两个对象的id是否相同。
(二).逻辑运算符 not > and > or
四、哈希
hash(object)生成一个唯一的哈希值。
小技巧:这个内置函数,可以来判断一个对象是否是可变的。能生成哈希值的就是不可变对象。