四、标准数据类型
1、为什么编程语言中要有类型
类型有以下几个重要角色:
-
对机器而言,类型描述了内存中的电荷是怎么解释的。
-
对编译器或者解释器而言,类型可以协助确保上面那些电荷、字节在程序的运行中始终如一地被理解。
-
对程序员而言,类型可以帮助他们命名、组织概念,帮助编纂文档,支持交互式编辑环境等。
以上观点是 Edwin Brady 在《Type-driven Development with Idris》中的说法。
2、标准数据类型
Python3 中有六个标准的数据类型:
-
Number(数字)
-
String(字符串)
-
List(列表)
-
Tuple(元组)
-
Set(集合)
-
Dictionary(字典)
Python3 的六个标准数据类型中:
-
不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);
-
可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。
1、Number(数字)
Python 数字数据类型用于存储数值。
数据类型是不允许改变的,这就意味着如果改变数字数据类型的值,将重新分配内存空间。
以下实例在变量赋值时 Number 对象将被创建:
var1 = 1 var2 = 10
您也可以使用del语句删除一些数字对象的引用。
del语句的语法是:
del var1[,var2[,var3[....,varN]]]
您可以通过使用del语句删除单个或多个对象的引用,例如:
del var del var_a, var_b
Python 支持三种不同的数值类型:
-
整型(Int) - 通常被称为是整型或整数,是正或负整数,不带小数点。Python3 整型是没有限制大小的,可以当作 Long 类型使用,所以 Python3 没有 Python2 的 Long 类型。
-
浮点型(float) - 浮点型由整数部分与小数部分组成,浮点型也可以使用科学计数法表示(2.5e2 = 2.5 x 102 = 250)
-
复数( (complex)) - 复数由实数部分和虚数部分构成,可以用a + bj,或者complex(a,b)表示, 复数的实部a和虚部b都是浮点型。
我们可以使用十六进制和八进制来代表整数:
>>> number = 0xA0F # 十六进制 >>> number 2575 >>> number=0o37 # 八进制 >>> number 31 写一个脚本进行数值转换 #!/usr/bin/python # -*- coding: UTF-8 -*-# Filename : test.py # author by : www.1000phone.com# 获取用户输入十进制数 dec = int(input("输入数字:"))print("十进制数为:", dec) print("转换为二进制为 :", bin(dec)) print("转换为八进制为:", oct(dec)) print("转换为十六进制为:", hex(dec))
1、Python 数字类型转换
有时候,我们需要对数据内置的类型进行转换,数据类型的转换,你只需要将数据类型作为函数名即可。
-
int(x) 将x转换为一个整数。
-
float(x) 将x转换到一个浮点数。
以下实例将浮点数变量 a 转换为整数:
>>> a = 1.0 >>> int(a) 1
2、Python 数字运算
Python 解释器可以作为一个简单的计算器,您可以在解释器里输入一个表达式,它将输出表达式的值。
表达式的语法很直白: +, -, * 和 /, 和其它语言(如Pascal或C)里一样。例如:
>>> 2 + 2 4 >>> 50 - 5*6 20 >>> (50 - 5*6) / 4 5.0 >>> 8 / 5 # 总是返回一个浮点数 1.6
注意:在不同的机器上浮点运算的结果可能会不一样。
在整数除法中,除法 / 总是返回一个浮点数,如果只想得到整数的结果,丢弃可能的分数部分,可以使用运算符 // :
>>> 17 / 3 # 整数除法返回浮点型 5.666666666666667 >>> >>> 17 // 3 # 整数除法返回向下取整后的结果 5 >>> 17 % 3 # %操作符返回除法的余数 2 >>> 5 * 3 + 2 17
注意: // 得到的并不一定是整数类型的数,它与分母分子的数据类型有关系。
>>> 7//2 3 >>> 7.0//2 3.0 >>> 7//2.0 3.0 >>>
等号 = 用于给变量赋值。赋值之后,除了下一个提示符,解释器不会显示任何结果。
>>> width = 20 >>> height = 5*9 >>> width * height 900
Python 可以使用 **_ _操作来进行幂运算:
>>> 5 ** 2 # 5 的平方 25 >>> 2 ** 7 # 2的7次方 128
变量在使用前必须先"定义"(即赋予变量一个值),否则会出现错误:
>>> n # 尝试访问一个未定义的变量 Traceback (most recent call last):File "<stdin>", line 1, in <module> NameError: name 'n' is not defined
不同类型的数混合运算时会将整数转换为浮点数:
>>> 3 * 3.75 / 1.5 7.5 >>> 7.0 / 2 3.5
在交互模式中,最后被输出的表达式结果被赋值给变量 _ 。例如:
>>> tax = 12.5 / 100 >>> price = 100.50 >>> price * tax 12.5625 >>> price + _ # _ 在交互式模式中表示上一条命令的结果 在python程序中无意义,一般用来表示私有变量 113.0625 >>> round(_, 2) 113.06
此处, _ 变量应被用户视为只读变量。
3、数学函数(附加了解)
函数 | 返回值 ( 描述 ) |
---|---|
abs(x) | 返回数字的绝对值,如abs(-10) 返回 10 |
[round(x [,n]) | 返回浮点数x的四舍五入值,如给出n值,则代表舍入到小数点后的位数。 |
4、随机数函数
随机数可以用于数学,游戏,安全等领域中,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。
Python包含以下常用随机数函数:
函数 | 描述 |
---|---|
choice(seq) | 从序列的元素中随机挑选一个元素,比如random.choice(range(10)),从0到9中随机挑选一个整数。 |
randrange ([start,] stop [,step]) | 从指定范围内,按指定基数递增的集合中获取一个随机数,基数缺省值为1 |
random() | 随机生成下一个实数,它在[0,1)范围内。 |
shuffle(lst) | 将序列的所有元素随机排序 |
2、String(字符串)及常用功能:
Python中的字符串是最常用的数据类型,用单引号 ' 或双引号 " 括起来,同时使用反斜杠 \ 转义特殊字符。
字符串常用功能:
创建字符串很简单,只要为变量分配一个值即可。例如:
var1 = 'Hello World!' var2 = "qianfeng"
1、Python 访问字符串中的值
Python 不支持单字符类型,单字符在 Python 中也是作为一个字符串使用。
Python 访问子字符串,可以使用方括号来截取字符串,如下实例:
变量[头下标:尾下标]
索引值以 0 为开始值,-1 为从末尾的开始位置。
#!/usr/bin/python3 str = 'hello' print (str) # 输出字符串 print (str[0:-1]) # 输出第一个到倒数第二个的所有字符 print (str[0]) # 输出字符串第一个字符 print (str[2:4]) # 输出从第三个开始到第四个的字符 print (str[2:]) # 输出从第三个开始的后的所有字符 print (str * 2) # 输出字符串两次 print (str + "TEST") # 连接字符串
执行以上程序会输出如下结果:
hello hell h ll llo hellohello helloTEST
#!/usr/bin/python3var1 = 'Hello World!' var2 = "qianfeng"print ("var1[0]: ", var1[0]) print ("var2[1:5]: ", var2[1:5])
以上实例执行结果:
var1[0]: H var2[1:5]: ianf
2、Python 字符串更新
你可以截取字符串的一部分并与其他字段拼接,如下实例:
#!/usr/bin/python3 var1 = 'Hello World!' print ("已更新字符串 : ", var1[:6] + 'qianfeng!')
以上实例执行结果
已更新字符串 : Hello qianfeng!
3、Python转义字符
在需要在字符中使用特殊字符时,python用反斜杠()转义字符。如下表:
转义字符 | 描述 |
---|---|
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
Python 使用反斜杠()转义特殊字符,如果你不想让反斜杠发生转义,可以在字符串前面添加一个 r,表示原始字符串:
>>> print('h\nello') h ello >>> print(r'h\ello') h\ello >>>
另外,反斜杠()可以作为续行符,表示下一行是上一行的延续。也可以使用 """...""" 或者 '''...''' 跨越多行。
注意,Python 没有单独的字符类型,一个字符就是长度为1的字符串。
>>> word = 'Python' >>> print(word[0], word[5]) P n >>> print(word[-1], word[-6]) n P 与 C 字符串不同的是,Python 字符串不能被改变。向一个索引位置赋值,比如word[0] = 'm'会导致错误。
注意:
-
1、反斜杠可以用来转义,使用r可以让反斜杠不发生转义。
-
2、字符串可以用+运算符连接在一起,用*运算符重复。
-
3、Python中的字符串有两种索引方式,从左往右以0开始,从右往左以-1开始。
-
4、Python中的字符串不能改变。
4、Python 字符串运算符
下表实例变量a值为字符串 "Hello",b变量值为 "Python":
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | a + b 输出结果: HelloPython |
* | 重复输出字符串 | a*2 输出结果:HelloHello |
[] | 通过索引获取字符串中字符 | a[1] 输出结果 e |
[ : ] | 截取字符串中的一部分,遵循左闭右开原则,str[0,2] 是不包含第 3 个字符的。 | a[1:4] 输出结果 ell |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | 'H' in a 输出结果 True |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | 'M' not in a 输出结果 True |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | print( r'\\n' ) print( R'\\n' ) |
% | 格式字符串 | 请看下一节内容。 |
#!/usr/bin/python3a = "Hello" b = "Python"print("a + b 输出结果:", a + b) print("a * 2 输出结果:", a * 2) print("a[1] 输出结果:", a[1]) print("a[1:4] 输出结果:", a[1:4])if( "H" in a) :print("H 在变量 a 中") else :print("H 不在变量 a 中")if( "M" not in a) :print("M 不在变量 a 中") else :print("M 在变量 a 中")print (r'\n') print (R'\n')
以上实例输出结果为:
a + b 输出结果: HelloPython a * 2 输出结果: HelloHello a[1] 输出结果: e a[1:4] 输出结果: ell H 在变量 a 中 M 不在变量 a 中 \n \n
5、Python字符串格式化
Python 支持格式化字符串的输出 。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。
在 Python 中,字符串格式化使用与 C 中 sprintf 函数一样的语法。
#!/usr/bin/python3 print ("我叫 %s 今年 %d 岁!" % ('小明', 10))
以上实例输出结果:
我叫 小明 今年 10 岁!
python字符串格式化符号:
符 号 | 描述 |
---|---|
%s | 格式化字符串 |
%d | 格式化整数 |
%f | 格式化浮点数字,可指定小数点后的精度 |
格式化操作符辅助指令:
符号 | 功能 |
---|---|
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
0 | 显示的数字前面填充'0'而不是默认的空格 |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
6、Python三引号
python三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。实例如下
#!/usr/bin/python3 para_str = """这是一个多行字符串的实例 多行字符串可以使用制表符 TAB ( \t )。 也可以使用换行符 [ \n ]。 """ print (para_str)
以上实例执行结果为:
这是一个多行字符串的实例 多行字符串可以使用制表符 TAB ( )。 也可以使用换行符 [ ]。
三引号让程序员从引号和特殊字符串的泥潭里面解脱出来,自始至终保持一小块字符串的格式是所谓的WYSIWYG(所见即所得)格式的。
一个典型的用例是,当你需要一块HTML或者SQL时,这时用字符串组合,特殊字符串转义将会非常的繁琐。
errHTML = ''' <HTML><HEAD><TITLE> Friends CGI Demo</TITLE></HEAD> <BODY><H3>ERROR</H3> <B>%s</B><P> <FORM><INPUT TYPE=button VALUE=Back ONCLICK="window.history.back()"></FORM> </BODY></HTML> ''' cursor.execute(''' CREATE TABLE users ( login VARCHAR(8), uid INTEGER, prid INTEGER) ''')
7、Unicode 字符串
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。
在Python3中,所有的字符串都是Unicode字符串。
8、Python 的字符串内建函数
Python 的字符串常用内建函数如下:
语法 | 解释 |
---|---|
count(str, beg= 0,end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
find(str, beg=0 end=len(string)) | 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
isdigit() | 如果字符串只包含数字则返回 True 否则返回 False.. |
isnumeric() | 如果字符串中只包含数字字符,则返回 True,否则返回 False |
join(seq) | 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
maketrans() | 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
replace(old, new [, max]) | 把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。 |
split(str="", num=string.count(str)) | 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串 |
startswith(substr, beg=0,end=len(string)) | 检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
strip([chars]) | 删除左右两边的空格或指定字符 |
translate(table, deletechars="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
3、List(列表)
List(列表) 是 Python 中使用最频繁的数据类型。可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。列表是写在方括号 [] 之间、用逗号分隔开的元素列表,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。列表是Python中最基本的数据结构。列表中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。如下所示:
list=[] list1 = ['Google', 'baidu', 1997, 2000] list2 = [1, 2, 3, 4, 5 ] list3 = ["a", "b", "c", "d"]
与字符串的索引一样,列表索引从0开始。列表可以进行截取、组合等。
基本操作:
-
索引
-
切片
-
追加
-
删除
-
长度
-
循环
-
包含
1、访问列表中的值
使用下标索引来访问列表中的值,同样你也可以使用方括号的形式截取字符,如下所示:
#!/usr/bin/python3 list1 = ['Google', 'baidu', 1997, 2000] list2 = [1, 2, 3, 4, 5, 6, 7 ] print ("list1[0]: ", list1[0]) print ("list2[1:5]: ", list2[1:5])
以上实例输出结果
list1[0]: Google list2[1:5]: [2, 3, 4, 5]
2、更新列表
你可以对列表的数据项进行修改或更新,你也可以使用append()方法来添加列表项,如下所示:
#!/usr/bin/python3 list = ['Google', 'baidu', 1997, 2000] print ("第三个元素为 : ", list[2]) list[2] = 2001 print ("更新后的第三个元素为 : ", list[2])
注意:我们会在接下来的章节讨论append()方法的使用
以上实例输出结果:
第三个元素为 : 1997 更新后的第三个元素为 : 2001
3、删除列表元素
可以使用 del 语句来删除列表的的元素,如下实例:
#!/usr/bin/python3 list = ['Google', 'baidu', 1997, 2000] print ("原始列表 : ", list) del list[2] print ("删除第三个元素 : ", list)
以上实例输出结果:
原始列表 : ['Google', 'baidu', 1997, 2000] 删除第三个元素 : ['Google', 'baidu', 2000]
注意:我们会在接下来的章节讨论 remove() 方法的使用
4、Python列表脚本操作符
列表对 + 和 _ 的操作符与字符串相似。+ 号用于组合列表,_ 号用于重复列表。
如下所示:
PYTHON 表达式 | 结果 | 描述 |
---|---|---|
len([1, 2, 3]) | 3 | 长度 |
[1, 2, 3] + [4, 5, 6] | [1, 2, 3, 4, 5, 6] | 组合 |
['Hi!'] * 4 | ['Hi!', 'Hi!', 'Hi!', 'Hi!'] | 重复 |
3 in [1, 2, 3] | True | 元素是否存在于列表中 |
for x in [1, 2, 3]: print(x, end=" ") | 1 2 3 | 迭代 |
5、Python列表截取与拼接
Python的列表截取与字符串操作类型,如下所示:
变量[头下标:尾下标]
索引值以 0 为开始值,-1 为从末尾的开始位置。
列表实例:
#!/usr/bin/python3 list = [ 'abcd', 786 , 2.23, 'hello', 70.2 ] tinylist = [123, 'hello'] print (list) # 输出完整列表 print (list[0]) # 输出列表第一个元素 print (list[1:3]) # 从第二个开始输出到第三个元素 print (list[2:]) # 输出从第三个元素开始的所有元素 print (tinylist * 2) # 输出两次列表 print (list + tinylist) # 连接列表
以上实例输出结果:
['abcd', 786, 2.23, 'hello', 70.2] abcd [786, 2.23] [2.23, 'hello', 70.2] [123, 'hello', 123, 'hello'] ['abcd', 786, 2.23, 'hello', 70.2, 123, 'hello']
与Python字符串不一样的是,列表中的元素是可以改变的:
a = [1, 2, 3, 4, 5, 6] a[0] = 9 a[2:5] = [13, 14, 15] a [9, 2, 13, 14, 15, 6] a[2:5] = [] # 将对应的元素值设置为 [] a [9, 2, 6]
List 内置了有很多方法,例如 append()、pop() 等等
注意:
-
1、List写在方括号之间,元素用逗号隔开。
-
2、和字符串一样,list可以被索引和切片。
-
3、List可以使用+操作符进行拼接。
-
4、List中的元素是可以改变的。
Python 列表截取可以接收第三个参数,参数作用是截取的步长,以下实例在索引 1 到索引 4 的位置并设置为步长为 2(间隔一个位置)来截取字符串:
如下所示:
L=['Google', 'Baidu', 'Taobao']
操作:
PYTHON 表达式 | 结果 | 描述 |
---|---|---|
L[2] | 'Taobao' | 读取第三个元素 |
L[-2] | 'Baidu' | 从右侧开始读取倒数第二个元素: count from the right |
L[1:] | ['Baidu', 'Taobao'] | 输出从第二个元素开始后的所有元素 |
L=['Google', 'Baidu', 'Taobao'] L[2] 'Taobao' L[-2] 'Baidu' L[1:] ['Baidu', 'Taobao']
列表还支持拼接操作:
squares = [1, 4, 9, 16, 25] squares += [36, 49, 64, 81, 100] squares [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
6、嵌套列表
使用嵌套列表即在列表里创建其它列表,例如:
a = ['a', 'b', 'c'] n = [1, 2, 3] x = [a, n] x [['a', 'b', 'c'], [1, 2, 3]] x[0] ['a', 'b', 'c'] x[0] 'b'
8、Python列表函数&方法
Python包含以下函数:
语法 | 解释 |
---|---|
len(list) | 列表元素个数 |
max(list) | 返回列表元素最大值 |
min(list) | 返回列表元素最小值 |
list(seq) | 将元组转换为列表 |
Python包含以下方法:
语法 | 解释 |
---|---|
list.append(obj) | 在列表末尾添加新的对象 |
list.count(obj) | 统计某个元素在列表中出现的次数 |
list.index(obj) | 从列表中找出某个值第一个匹配项的索引位置 |
list.insert(index, obj) | 将对象插入列表 |
list.remove(obj) | 移除列表中某个值的第一个匹配项 |
list.reverse() | 反向列表中元素 |
list.sort( key=None, reverse=False) | 对原列表进行排序 |
4、Tuple(元组)
元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组写在小括号 () 里,元素之间用逗号隔开。
元组中的元素类型也可以不相同:
元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。
创建空元组
tup1 = ();
元组中只包含一个元素时,需要在元素后面添加逗号,否则括号会被当作运算符使用:
>>> tup1 = (50) >>> type(tup1) # 不加逗号,类型为整型 <class 'int'> >>> tup1 = (50,) >>> type(tup1) # 加上逗号,类型为元组 <class 'tuple'>
>>> tup1 = ('Google', 'Baidu', 1997, 2000) >>> tup2 = (1, 2, 3, 4, 5 ) >>> tup3 = "a", "b", "c", "d" # 不需要括号也可以 >>> type(tup3) <class 'tuple'>
基本操作:
-
索引
-
切片
-
循环
-
长度
-
包含
元组实例:
#!/usr/bin/python3 tuple1 = ( 'abcd', 786 , 2.23, 'hello', 70.2 ) tinytuple = (123, 'hello') print (tuple1) # 输出完整元组 print (tuple1[0]) # 输出元组的第一个元素 print (tuple1[1:3]) # 输出从第二个元素开始到第三个元素 print (tuple1[2:]) # 输出从第三个元素开始的所有元素 print (tinytuple * 2) # 输出两次元组 print (tuple1 + tinytuple) # 连接元组
以上实例输出结果:
('abcd', 786, 2.23, 'hello', 70.2) abcd (786, 2.23) (2.23, 'hello', 70.2) (123, 'hello', 123, 'hello') ('abcd', 786, 2.23, 'hello', 70.2, 123, 'hello')
string、list 和 tuple 都属于 sequence(序列)。
注意:
-
1、与字符串一样,元组的元素不能修改。
-
2、元组也可以被索引和切片,方法一样。
-
3、注意构造包含 0 或 1 个元素的元组的特殊语法规则。
-
4、元组也可以使用+操作符进行拼接。
1、访问元组
元组可以使用下标索引来访问元组中的值,如下实例:
#!/usr/bin/python3 tup1 = ('Google', 'Baidu', 1997, 2000) tup2 = (1, 2, 3, 4, 5, 6, 7 ) print ("tup1[0]: ", tup1[0]) print ("tup2[1:5]: ", tup2[1:5])
以上实例输出结果:
tup1[0]: Google tup2[1:5]: (2, 3, 4, 5)
2、修改元组
元组中的元素值是不允许修改的,但我们可以对元组进行连接组合,如下实例:
#!/usr/bin/python3 tup1 = (12, 34.56) tup2 = ('abc', 'xyz') # 以下修改元组元素操作是非法的。 # tup1[0] = 100 # 创建一个新的元组 # 元组数据类型不可改变 tup3 = tup1 + tup2 print (tup3)
以上实例输出结果:
(12, 34.56, 'abc', 'xyz')
3、删除元组
元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组,如下实例:
#!/usr/bin/python3 tup = ('Google', 'Baidu', 1997, 2000) print (tup) del tup print ("删除后的元组 tup : ") print (tup)
以上实例元组被删除后,输出变量会有异常信息,输出如下所示:
删除后的元组 tup : Traceback (most recent call last):File "test.py", line 8, in <module>print (tup) NameError: name 'tup' is not defined
4、元组运算符
与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。
PYTHON 表达式 | 结果 | 描述 |
---|---|---|
len((1, 2, 3)) | 3 | 计算元素个数 |
(1, 2, 3) + (4, 5, 6) | (1, 2, 3, 4, 5, 6) | 连接 |
('Hi!',) * 4 | ('Hi!', 'Hi!', 'Hi!', 'Hi!') | 复制 |
3 in (1, 2, 3) | True | 元素是否存在 |
for x in (1, 2, 3): print (x,) | 1 2 3 | 迭代 |
5、元组索引,截取
因为元组也是一个序列,所以我们可以访问元组中的指定位置的元素,也可以截取索引中的一段元素,如下所示:
元组:
L = ('Google', 'Taobao', 'Baidu')
PYTHON 表达式 | 描述 | 结果 |
---|---|---|
L[2] | 读取第三个元素 | 'Baidu' |
L[-2] | 反向读取;读取倒数第二个元素 | 'Taobao' |
L[1:] | 截取元素,从第二个开始后的所有元素。 | ('Taobao', Baidu'') |
运行实例如下:
>>> L = ('Google', 'Taobao', '1000phone') >>> L[2] 'Runoob' >>> L[-2] 'Taobao' >>> L[1:] ('Taobao', '1000phone')
tup = (1, 2, 3, 4, 5, 6) print(tup[0]) 1 print(tup[1:5]) (2, 3, 4, 5) tup[0] = 11 # 修改元组元素的操作是非法的 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'tuple' object does not support item assignment
注意:虽然tuple的元素不可改变,但它可以包含可变的对象,比如list列表。
6、元组内置函数
Python元组包含了以下内置函数
len(tuple) 计算元组元素个数
>>> tuple1 = ('Google', 'Baidu', 'Taobao') >>> len(tuple1) 3 >>>
max(tuple) 返回元组中元素最大值
>>> tuple2 = ('5', '4', '8') >>> max(tuple2) '8' >>>
min(tuple)返回元组中元素最小值
>>> tuple2 = ('5', '4', '8') >>> min(tuple2) '4' >>>
tuple(seq)将列表转换为元组
>>> list1= ['Google', 'Taobao', 'Tengxun', 'Baidu'] >>> tuple1=tuple(list1) >>> tuple1 ('Google', 'Taobao', 'Tengxun', 'Baidu')
5、Set(集合)
集合(set)是由一个或数个形态各异的大小整体组成的,构成集合的事物或对象称作元素或是成员。
基本功能是进行成员关系测试和删除重复元素。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
创建格式:
parame = {value01,value02,...} 或者 set(value)
集合实例:
#!/usr/bin/python3 student = {'Tom', 'Jim', 'Mary', 'Tom', 'Jack', 'Rose'} print(student) # 输出集合,重复的元素被自动去掉 # 成员测试 if 'Rose' in student :print('Rose 在集合中') else :print('Rose 不在集合中') # set可以进行集合运算 a = set('abracadabra') b = set('alacazam') print(a) print(a - b) # a 和 b 的差集 print(a | b) # a 和 b 的并集 print(a & b) # a 和 b 的交集 print(a ^ b) # a 和 b 中不同时存在的元素
以上实例输出结果:
{'Mary', 'Jim', 'Rose', 'Jack', 'Tom'} Rose 在集合中 {'b', 'a', 'c', 'r', 'd'} {'b', 'd', 'r'} {'l', 'r', 'a', 'c', 'z', 'm', 'b', 'd'} {'a', 'c'} {'l', 'r', 'z', 'm', 'b', 'd'}
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'} print(basket) # 这里演示的是去重功能 {'orange', 'banana', 'pear', 'apple'} 'orange' in basket # 快速判断元素是否在集合内 True 'crabgrass' in basket False
下面展示两个集合间的运算:
... a = set('abracadabra') b = set('alacazam') a {'a', 'r', 'b', 'c', 'd'} a - b # 集合a中包含而集合b中不包含的元素 {'r', 'd', 'b'} a | b # 集合a或b中包含的所有元素 {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'} a & b # 集合a和b中都包含了的元素 {'a', 'c'} a ^ b # 不同时包含于a和b的元素 {'r', 'd', 'b', 'm', 'z', 'l'}
>>> a = {x for x in 'abracadabra' if x not in 'abc'} >>> a {'r', 'd'} # 集合支持集合推导式
1、添加元素
语法格式如下:
s.add( x )
将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。
>>> thisset = set(("Google", "Baidu", "Taobao")) >>> thisset.add("Facebook") >>> print(thisset) {'Taobao', 'Facebook', 'Google', 'Baidu'}
还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:
s.update( x )
x 可以有多个,用逗号分开。
thisset = set(("Google", "Baidu", "Taobao")) thisset.update({1,3}) print(thisset) {1, 3, 'Google', 'Taobao', 'Baidu'} thisset.update([1,4],[5,6]) print(thisset) {1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}
2、移除元素
语法格式如下:
s.remove( x )
将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。
thisset = set(("Google", "Baidu", "Taobao")) thisset.remove("Taobao") print(thisset) {'Google', 'Baidu'} thisset.remove("Facebook") # 不存在会发生错误 Traceback (most recent call last):File "<stdin>", line 1, in <module> KeyError: 'Facebook'
此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:
s.discard( x )
>>> thisset = set(("Google", "Baidu", "Taobao")) >>> thisset.discard("Facebook") # 不存在不会发生错误 >>> print(thisset) {'Taobao', 'Google', 'Baidu'}
我们也可以设置随机删除集合中的一个元素,语法格式如下:
s.pop()
thisset = set(("Google", "Baidu", "Taobao", "Facebook")) x = thisset.pop() print(x)
输出结果:
python3 test.py Baidu
多次执行测试结果都不一样。
然而在交互模式,pop 是删除集合的第一个元素(排序后的集合的第一个元素)。
>>> thisset = set(("Google", "Baidu", "Taobao", "Facebook")) >>> thisset.pop() 'Facebook' >>> print(thisset) {'Google', 'Taobao', 'baidu'} >>>
3、计算集合元素个数
语法格式如下:
len(s)
计算集合 s 元素个数。
>>> thisset = set(("Google", "Baidu", "Taobao")) >>> len(thisset) 3
4、清空集合
语法格式如下:
s.clear()
清空集合 s。
>>> thisset = set(("Google", "Baidu", "Taobao")) >>> thisset.clear() >>> print(thisset) set()
4、判断元素是否在集合中存在
语法格式如下:
x in s
判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
>>> thisset = set(("Google", "Baidu", "Taobao")) >>> "Baidu" in thisset True >>> "Facebook" in thisset False >>>
5、集合内置方法完整列表
方法 | 描述 |
---|---|
add() | 为集合添加元素 |
discard() | 删除集合中指定的元素 |
pop() | 随机移除元素 |
remove() | 移除指定元素 |
update() | 给集合添加元素,参数可以使列表,元组等 |
由于集合的无序性,所有的添加操作,都不能指定位置
6、Dictionary(字典)
字典(dictionary)是Python中另一个非常有用的内置数据类型。是另一种可变容器模型,且可存储任意类型对象。列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。
键(key)必须使用不可变类型。
在同一个字典中,键(key)必须是唯一的。
字典实例:
#!/usr/bin/python3 dict1 = {} dict1['one'] = "1 - hello" dict1[2] = "2 - nihao" tinydict = {'name': 'hello','code':1, 'site': 'nihao'} print (dict1['one']) # 输出键为 'one' 的值 print (dict1[2]) # 输出键为 2 的值 print (tinydict) # 输出完整的字典 print (tinydict.keys()) # 输出所有键 print (tinydict.values()) # 输出所有值
以上实例输出结果:
1 - hello 2 - nihao {'name': 'hello', 'code': 1, 'site': 'nihao'} dict_keys(['name', 'code', 'site']) dict_values(['hello', 1, 'nihao'])
构造函数 dict() 可以直接从键值对序列中构建字典如下:
>>>dict([('Runoob', 1), ('Google', 2), ('Taobao', 3)]) {'Taobao': 3, 'Runoob': 1, 'Google': 2}>>> {x: x**2 for x in (2, 4, 6)} {2: 4, 4: 16, 6: 36}>>> dict(Runoob=1, Google=2, Taobao=3) {'Runoob': 1, 'Google': 2, 'Taobao': 3}
另外,字典类型也有一些内置的函数,例如clear()、keys()、values()等。
注意:
-
1、字典是一种映射类型,它的元素是键值对。
-
2、字典的关键字必须为不可变类型,且不能重复。
-
3、创建空字典使用 { }。
字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:
d = {key1 : value1, key2 : value2 }
键必须是唯一的,但值则不必。
值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。
一个简单的字典实例:
dict = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}
也可如此创建字典:
dict1 = { 'abc': 456 }; dict2 = { 'abc': 123, 98.6: 37 };
1、访问字典里的值
把相应的键放入到方括号中,如下实例:
#!/usr/bin/python3 dict = {'Name': 'Baidu', 'Age': 7, 'Class': 'First'} print ("dict['Name']: ", dict['Name']) print ("dict['Age']: ", dict['Age'])
以上实例输出结果:
dict['Name']: Baidu dict['Age']: 7
如果用字典里没有的键访问数据,会输出错误如下:
#!/usr/bin/python3 dict = {'Name': 'Runoob', 'Age': 7, 'Class': 'First'} print ("dict['Alice']: ", dict['Alice'])
以上实例输出结果:
Traceback (most recent call last):File "test.py", line 5, in <module>print ("dict['Alice']: ", dict['Alice']) KeyError: 'Alice'
2、修改字典
向字典添加新内容的方法是增加新的键/值对,修改或删除已有键/值对如下实例:
#!/usr/bin/python3 dict = {'Name': 'Baidu', 'Age': 7, 'Class': 'First'} dict['Age'] = 8 # 更新 Age dict['School'] = "qianfeng" # 添加信息 print ("dict['Age']: ", dict['Age']) print ("dict['School']: ", dict['School'])
以上实例输出结果:
dict['Age']: 8 dict['School']: qianfeng
3、删除字典元素
能删单一的元素也能清空字典,清空只需一项操作。
显示删除一个字典用del命令,如下实例:
#!/usr/bin/python3 dict = {'Name': 'Runoob', 'Age': 7, 'Class': 'First'} del dict['Name'] # 删除键 'Name' dict.clear() # 清空字典 del dict # 删除字典 print ("dict['Age']: ", dict['Age']) print ("dict['School']: ", dict['School'])
但这会引发一个异常,因为用执行 del 操作后字典不再存在:
Traceback (most recent call last):File "test.py", line 9, in <module>print ("dict['Age']: ", dict['Age']) TypeError: 'type' object is not subscriptable
注:del() 方法后面也会讨论。
4、字典键的特性
字典值可以是任何的 python 对象,既可以是标准的对象,也可以是用户定义的,但键不行。
两个重要的点需要记住:
1)不允许同一个键出现两次。创建时如果同一个键被赋值两次,后一个值会被记住,如下实例:
#!/usr/bin/python3 dict = {'Name': 'qianfeng', 'Age': 7, 'Name': 'xueyuan'} print ("dict['Name']: ", dict['Name'])
以上实例输出结果:
dict['Name']: xueyuan
2)键必须不可变,所以可以用数字,字符串或元组充当,而用列表就不行,如下实例:
#!/usr/bin/python3 dict = {['Name']: 'Baidu', 'Age': 7} print ("dict['Name']: ", dict['Name'])
以上实例输出结果:
Traceback (most recent call last):File "test.py", line 3, in <module>dict = {['Name']: 'Runoob', 'Age': 7} TypeError: unhashable type: 'list'
5、字典内置函数&方法
Python字典包含了以下内置函数:
len(dict) 计算字典元素个数,即键的总数
>>> dict = {'Name': 'Baidu', 'Age': 7, 'Class': 'First'} >>> len(dict) 3
str(dict) 输出字典,以可打印的字符串表示
>>> dict = {'Name': 'Baidu', 'Age': 7, 'Class': 'First'} >>> str(dict) "{'Name': 'Baidu', 'Class': 'First', 'Age': 7}"
type(variable) 返回输入的变量类型,如果变量是字典就返回字典类型
>>> dict = {'Name': 'Baidu', 'Age': 7, 'Class': 'First'} >>> type(dict) <class 'dict'>
Python字典包含了以下内置方法:
序号 | 函数及描述 |
---|---|
dict.fromkeys() | 创建一个新字典,以序列seq中元素做字典的键,val为字典所有键对应的初始值 |
dict.get(key, default=None) | 返回指定键的值,如果值不在字典中返回default值 |
dict.items() | 以列表返回可遍历的(键, 值) 元组数组 |
dict.keys() | 返回一个迭代器,可以使用 list() 来转换为列表 |
dict.setdefault(key, default=None) | 和get()类似, 但如果键不存在于字典中,将会添加键并将值设为default |
dict.update(dict2) | 把字典dict2的键/值对更新到dict里 |
dict.values() | 返回一个迭代器,可以使用 list() 来转换为列表 |
数据类型
数据类型 | 是否有序 | 是否可重复 | 是否为序列 | 是否可变 | 转换函数 |
---|---|---|---|---|---|
数值 | Null | Null | 否 | 否 | int()、float() |
字符串 | 是 | 是 | 是 | 否 | str() |
列表 | 是 | 是 | 是 | 是 | list() |
元组 | 是 | 是 | 是 | 否 | tuple() |
集合 | 否 | 否 | 是 | 是 | set() |
字典 | 否 | 键不可以重复 | 是 | 是 | dict() |
3、Python数据类型转换
有时候,我们需要对数据内置的类型进行转换,数据类型的转换,你只需要将数据类型作为函数名即可。
以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象,表示转换的值。
函数 | 描述 |
---|---|
[int(x [,base])] | 将x转换为一个整数 |
[float(x)] | 将x转换到一个浮点数 |
[str(x)] | 将对象 x 转换为字符串 |
[repr(x)] | 将对象 x 转换为表达式字符串 |
[eval(str)] | 用来计算在字符串中的有效Python表达式,并返回一个对象 |
[tuple(s)] | 将序列 s 转换为一个元组 |
[list(s)] | 将序列 s 转换为一个列表 |
[set(s)] | 转换为可变集合 |
[dict(d)] | 创建一个字典。d 必须是一个序列 (key,value)元组。 |
[chr(x)] | 将一个整数转换为一个字符 |
[ord(x)] | 将一个字符转换为它的整数值 |