数据模型(译)
1 对象(object)、类型(type)和值(value)
python中所有的数据都是通过对象(object)或者对象之间的关系来表示
每个对象(object)都有ID、类型(type)和数值(value)
一旦对象创建,它的ID便固定不变,可以理解成对象存放在内存中的地址;is
操作就是比较两个对象的ID,而id()
函数则是返回对象ID的整数表达式
对象的类型(type)决定了对象的行为,以及决定对象可能的值(value);type()
函数返回对象的类型(type本身也是对象);类似于ID,对象的类型一般情况下也是不可变的
部分对象的值(value)是可变的,我们称之为可变类型(mutable);部分对象的值是不可变的,我们称这为不可变类型(immutable);当一个不可变容器(如tuple)包含可变类型的对象引用,虽然引用对象的值可以改变,但我们依然认为此容器的值不是可变的,因为容器本身包含的对象不可变,所以严格来讲,不可变类型并不意味着数值(value)不可更改。对象是否可变由类型决定,比如数字(numbers)、字符串(strings)和元组(tuples)是不可变的;字典(dictionaries)和列表(lists)是可变的
对象从不显示地销毁,当没有引用指向这些对象时,它们就可能被回收(GC)
注意,try...except
语句会使对象保持存活
有些对象指向外部资源,如打开的文件或窗口;当对象被回归时,资源也一并释放。然而由于回收机制无法确定触发,所以类似的对象提供了显示的方式来释放外部资源,通常是close()
方法。程序建议使用try...finally
或者with
语句来显示关闭
2 特殊方法
类可以通过定义具有特殊名称的方法来实现由特殊语法调用的某些操作,这是python的运算符重载方法,允许类根据语言运算符定义自己的行为
例如,如果一个类定义了__getitem__()
的方法,并且x是该类的一个实例,那么x[i]大致相当于type(x).__getitem()__(x, i)
将特殊方法设置为None,意味着相关操作不可用;比如,将类的__iter()__
方法设置为None,类将无法迭代,因此调用iter()
方法时会抛出类型错误(TypeError)的异常
2.1 基本定制
object.__new__(cls[, ...])
创建类的实例,__new__()
是静态方法,它将请求实例的类作为第一个参数,其余参数传递给对象构造函数,__new__()
的返回值应该是新的对象实例(通常是cls的实例)
典型的实现__new__()
,是使用适当的参数调用超类的方法,然后在返回之前根据需要,修改新创建的类的实例,super().__new__(cls[, ...])
如果__new__()
返回cls的实例,那么实例的__init__()
方法将被调用,如__init__(self [, ...])
,其中self 代表新实例,其余的参数与传入__new__()
方法的参数相同
如果__new__()
没有返回类的实例,那么__init__()
方法将不会调用
__new__()
意在允许不可变类型(如数字、字符 串、元组)的子类自定义实例的创建;另外,也可以创建自定义的元类(metaclass)来定制类的创建
object.__init__(self, [...])
在实例被创建(即__new__()
)后,尚未返回给调用者之前调用,参数与传递给类的构造器表达式一致。如果基类有__init__()
方法,子类的__init__()
方法,如果存在的话,必须显示调用来保证实例的基类实例化操作,如super().__init__([args...])
因为__new__()
和__init__()
共同完成对象的创建(new用来创建,init用来初始化),所以__init__()
不允许非空值返回,不然的话会在运行时抛出类型错误异常
object.__del__(self)
在实例将要销毁时调用
object.__repr__(self)
通过repr()
内置函数调用,用来获取对象的机器表达式;如果可能的话,这应该看起来像一个有效的python表达式,可用于重新创建具有相同值的对象;如果无法做到这一点,则应返回形式上的字符串
object.__str__(self)
通过str(),format(),print()方法调用,计算对象的可打印字符串
与object.__repr__()
的不同在于,__str__()
不要求返回有效的python表达式,即可以使用更方便更简洁的表示方式
object.__bytes__(self)
通过bytes调用,计算对象的字节码
object.__bool__(self)
返回True或False,如果此方法未定义,__len__()
被调用,非0意味着True;如果2个方法都未定义,则认定返回值为True
2.2 基本属性访问
object.__getattr__(self, name)
当调用__getattribute__()
方法抛出AttributeError异常,或者__get__()
方法抛出AttributeError异常时,__getattr__()
才被调用,可以返回某个值,异或同样抛出异常
object.__getattrbute__(self, name)
访问实例的属性时无条件调用
为了避免无限递归,方法内部在访问对象的属性时,应始终使用类方法,而不是A.a的形式
object.__setattr__(self, name, value)
属性赋值时调用
object.__delattr__(self, name)
删除对象的属性
object.__get__(self, instance, owner)
在获取类(owner)的属性,或者类的实例(instance)的属性时调用
object.__set__(self, instance, value)
将实例的属性设置为新值
object.__delete__(self, instance)
删除实例的属性
2.3 自定义类创建
object.__init_subclass__(cls)
当一个类继承自另一个类时,另一个类的__init_subclass__()
方法都将被调用
class Philosopher:def __init_subclass__(cls, default_name, **kwargs): super().__init_subclass__(**kwargs) cls.default_name = default_name class AustralianPhilosopher(Philosopher, default_name="Bruce"): pass
默认情况下,object.__init_subclass__()
无任何操作,但是被调用时,如果有传入参数,会抛出异常
元类(metaclass)
默认情况下,类对象通过type()函数创建,type(name, bases, namespace)
类对象的创建过程,可以通过传递metaclass关键字属性,或者继承自另一个拥有此参数的类
定义类对象时,会执行如下操作:
- MRO entries are resolved(还不清楚具体含义)
- 如果基类不是type,会搜索
__mro_entries__
方法;如果发现了,通过original bases tuple调用;该方法必须返回类的元组,当然可以为空
- 如果基类不是type,会搜索
- the appropriate metaclass is determined
- 如果没有明确指定metaclass,则使用type
- 如果指定了metaclass,且不是type的实例,那么直接使用
- 如果指定了type的实例作为metaclass,那么将追溯到顶层的metaclass并使用
- the class namespace is prepared
- 如果metaclass有
__prepare__
属性,那么namespace = metaclass.__preprare__(name, bases, **kwargs)
- 如果没有
__prepare__
属性,类的命名空间将被初始化为空的有序映射
- 如果metaclass有
- the class body is executed
- the class object is created
- 通过执行类主体填充命名空间后,调用
metaclass(name, bases, namespace, **kwargs)
方法来创建类对象,额外的关键字参数与__prepare__
相同
- 通过执行类主体填充命名空间后,调用
元类事例
class OrderedClass(type): @classmethod def __prepare__(metacls, name, bases, **kwds): return collections.OrderedDict() def __new__(cls, name, bases, namespace, **kwds): result = type.__new__(cls, name, bases, dict(namespace)) result.members = tuple(namespace) return result class A(metaclass=OrderedClass): def one(self): pass def two(self): pass def three(self): pass def four(self): pass >>> A.members ('__module__', 'one', 'two', 'three', 'four')
2.4 模拟可调用对象
object.__call__(self [, args...])
使实例可以像函数一样调用,假设定义方法x(arg1, arg2, ...),相当于调用
x._call_(arg1, arg2, ...)`
2.5 模拟容器类型
object.__len__(self)
len()方法的实现,返回对象的长度
object.__getitem__(self, key)
self[key]的实现,对于序列,key必须为整数或切片对象
object.__missing__(self, key)
对字典类型数据,调用self[key]且key不在字典中时触发
object.__setitem__(self, key, value)
对self[key]赋值,注意只适用于key对应的值可以改变,或者可以追加新key
object.__delitem__(self, key)
删除self[key]
object.__iter__(self)
当容器需要迭代器时,调用此方法,返回一个新的迭代器对象
如果是映射类型,应当迭代容器的所有键
object.__reversed__(self)
reversed()方法的实现,返回一个新的迭代器,以倒序形式迭代容器中的元素
object.__contain__(self, item)
成员检测时调用,返回True或False
对于映射类型,只考虑键是否包含,而非值
2.6 with语句
上下文管理器是在执行with语句时定义要建立的运行时上下文的对象
上下文管理器处理对代码执行所需的运行时上下文的入口和出口
上下文管理器的典型应用包括,保存或恢复各种全局状态、锁定和解锁资源、打开关闭文件等
object.__enter__(self)
与对象相关的运行时上下文入口,with语句将方法的返回值绑定到as子句指定的目标
object.__exit__(self, exc_type, exc_value, traceback)
与对象相关的运行时上下文出口,如果退出时无异常,三个参数都为None
如果有异常出现,此方法希望禁止异常抛出,从而返回一个真正的值;否则异常将在退出此方法时正常处理