Cython的C指针
与C一样,尽管指针性与变量而不是类型相关联,但可以在类型或变量附近声*号。
%%cython
cdef int *a
cdef int *b
但这样在变量a,b写在一行,cython编译器会发出警告的信息,因此建议每个变量单独声明
%%cython
cdef int *a,*b
Cython中的指针的解引操作
在Cython中解引用指针与在C语言中不同。
由于Python语言已经使用*args和**kwargs语法来允许任意位置和关键字参数并支持函数参数解包,因此Cython不支持*
*解引语法是C指针的语法。 取而代之的是,我们在位置0的指针处建立索引,以解引Cython中的指针的引用。 这种语法也可以解引C中的指针,尽管这种情况很少见。
Cython的结构体与指针
无论在C中使用箭头运算符的任何地方,在Cython中的结构体都使用点运算符访问其内部的成员变量,Cython将生成正确的C级代码
%%cython -a
cdef struct Person:
char* name
unsigned int age
#end-cdef
#初始化结构体
cdef Person p=Person("jck308",32)
#声明Person类型结构体指针p_per
#并将变量p的地址赋值给指针p_per
cdef Person *p_per=&p
#访问结构体的成员
print(p.age)
print(p.name)
print(p_per.age)
print(p_per.name)
混合静态和动态类型变量
Cython允许静态和动态类型变量之间的赋值。静态和动态的这种流体混合是一个强大的特性,我们将在多个实例中使用它:它允许我们对大多数代码基使用动态Python对象,并轻松地将它们转换为性能关键部分加速、静态类型的类比。
举例来说,假设我们有几个静态int,我们想将它们组合成(动态)Python元组。使用Python/C API创建和初始化这个元组的C代码很简单,但是很繁琐,需要几十行代码,并且需要大量的错误检查。在Cython,显而易见的方法就是:
%%cython
#静态类型的变量
cdef int a=1,b=2,c=3
##动态类型的变量
tuple_of_ints=(a,b,c)
print(tuple_of_ints)
这段代码很无聊。 这里要强调的一点是,a,b和c是静态类型的整数,而Cython允许使用它们创建动态类型的Python元组。 然后,我们可以将该元组分配给动态键入的tuple_of_ints变量。 该示例的简单性是Cython强大之处:我们可以以显而易见的方式创建一个C类型int元组,而无需进一步思考。 我们希望像这样的概念上简单的事情变得简单,这就是Cython所提供的。
此示例之所以有效,是因为C类型的int与Python int之间存在明显的对应关系,因此Python可以为我们自动类型转换。 例如,如果a,b和c是C指针,则此示例无法按原样工作。 在这种情况下,我们必须解引它们,然后再将它们放入元组或使用其他策略。
例如下面的代码是个错误的例子,因为Python解释器无法识别指针类型的变量
%%cython
cdef int k=55,j=56
cdef int *a=&k
cdef int *b=&j
tuple_of_ints=(a,b)
print(tuple_of_ints)
正确的做法,如下图所示,我们通过解引指针变量a、b
ss8.png
给出了内置Python类型与C或C ++类型之间对应关系的完整列表
ss8.png
Cythond的bint类型
bint布尔整数类型是C级别的int,并与Python的bool相互转换。 它具有真实性的标准C解释:零为False,非零为True。
整数类型转换和溢出
Python 3中,所有int对象都是无限精度的。当将整数类型从Python转换为C时,Cython会生成检查溢出的代码。 如果C类型不能表示Python整数,则会引发运行时OverflowError。
float类型转换
Python fload存储为C double。 根据IEEE 754转换规则,将Python浮点数转换为C浮点数可能会截断为0.0或正负无穷大。
Cython的double类型会被动态转换Python的float类型
%%cython
cdef double d=384848048282945060321.3835
b=d
print(b)
print(type(b))
ss8.png
Complex类定
The Python complex类型存储为两个double的C结构,Cython具有浮点复数和双复数C级类型,它们对应于Python复数类型。 C类型与Python复杂类型具有相同的接口,但是使用有效的C级操作。 这包括访问实数和虚数分量的实数和imag属性,创建多个复数共轭的共轭方法,以及用于加,减,乘和除的有效运算。C级Complex类型与C99 _Complex类型或C ++ std :: complex模板化类兼容。
bytes类型
Python字节类型会自动在char *或std :: string之间来回转换。下面示例就是Cython char类型指针 动态转换为Python的bytes
%%cython
cdef char* s="Hello World"
b=s
print(b)
print(type(b))
用Python类型静态声明变量
到目前为止,我们一直使用cdef静态声明C类型的变量。 也可以使用cdef静态声明Python类型的变量。 我们可以对内置类型(例如list,tuple和dict)执行此操作; 扩展类型,例如NumPy数组; 还有很多其他
并非所有的Python类型都可以静态声明:它们必须用C实现,并且Cython必须有权访问该声明。 内置的Python类型已经满足了这些要求,并且声明它们很简单。 例如Python典型的集合类型list,dict,str,set(str就是集合类型,字符串数组):
cdef list mylist
cdef dict mydi
cdef str pname
cdef set myset
此示例中的变量是完整的Python对象。 在后台,Cython将它们声明为指向某些内置Python结构类型的C指针。 它们可以像普通的Python变量一样使用,但是受其声明类型的约束:
%%cython
cdef list mylist=[k+1 for k in range(1,11)]
pylist=mylist
print("mylist:",mylist)
print("删除pylist索引2的元素")
del pylist[2]
print(mylist)
在这里,通过删除pylist第3个元素也会删除mylist的第3个元素,因为它们引用的是同一列表。mylist和pylist之间的一个区别是,mylist只能引用Python列表对象,而pylist可以引用任何Python类型。 Cython将在编译时和运行时对mylist施加类型约束。
备注:关于Cython更复杂的数组类型引用,可以参考此篇文章《第5篇:Cython的线性表性操作》
乍一看,Cython允许静态声明具有内置Python类型的变量似乎有些奇怪。 为什么不照常使用Python的动态类型? 答案指出了Cython的一般原理:我们提供的静态类型信息越多,Cython就能更好地优化结果。 像往常一样,该规则也有例外,但这通常是正确的。 例如,以下代码从Cython函数中返回sieveOfEratosthenes()返回一个cdef list的对象附加到动态类型的变量中:
%%cython
#cython:language_level=3
cpdef list sieveOfEratosthenes(int n):
cdef list pr = [True for i in range(n + 1)]
cdef int p = 2
cdef list res=list()
while (p * p <= n):
if (pr[p] == True):
for i in range(p * p, n + 1, p):
pr[i] = False
#end-for
#end-if
p += 1
#end-while
cdef int k
for k in range(2,n):
if pr[k]:
res.append(k)
#end-if
#end-for
return res
#end-def
#这是Python动态类型的list
primers=[]
primers=sieveOfEratosthenes(9)
print(primers)
print("调用append方法")
primers.append(11)
print(primers)
程序输出
Cython编译器将生成可处理任何Python对象的代码,并在运行时测试primers是否为列表。如果不是,只要它具有带参数的append方法,该代码就会运行。在后台,生成的代码首先在primers对象上查找append属性(使用PyObject_GetAttr),然后使用完全通用的PyObject_Call Python / C API函数调用该方法。 这实质上模拟了当运行等效的Python字节码时Python解释器将执行的操作。
假设上面的代码中primers变量我们使用静态声明
cdef list primers
现在,Cython可以生成专门的代码,这些代码可以直接从C API调用PyList_SET_ITEM或PyList_Append函数。 这就是上一示例中的PyObject_Call最终仍然要调用的内容,但是静态类型允许Cython绕过了Python解释器在动态调度(Dynamic Dispatch)一系列繁琐沉重的类型检测(内部类型指针查找),这也是Cython的静态版本list比Python动态版本list性能高效的原因。
关于Python解释器的动态调度的详细介绍,请查看此文《第2篇:Cython VS Python 执行原理》
Cython当前支持的集中内置可静态声明的Python类型,我们常用静态声明的可能就是list,dict
type,object
bool
complex
basestring,str,unicode,bytes,bytearray
list,tuple,dict,set,frosenset
array
slace
date,time,datetime,timedelta,tzinfo
上面的列出的中不包括直接C对应的Python类型(例如int,long和float)。 事实证明,在Cython中静态声明和使用PyIntObjects,PyLongObjects或PyFloatObjects并不容易。 幸运的是,这样做的需要很少。 我们只声明常规的C基本数据类型int,long,float和double,然后让Cython为我们进行往返于Python的自动转换。
数字字面量的基本运算
当我们对数字字面量进行加,减或乘运算时,当操作数是动态类型化的Python对象时,这些操作具有Python语义(包括对于数值大的自动Python long强制转换)。当操作数是静态类型的C变量时,它们具有C语义(即,对于有限精度的整数类型,结果可能会溢出)
除数和模数(即计算余数)值得特别提及。使用带符号整数操作数计算模数时,C和Python具有明显不同的行为:C舍入为零,而Python舍入为无穷。例如,使用Python语义时,-1%5的结果为4;但是,如果使用C语义,它将得出-1。当将两个整数相除时,Python始终检查分母,并在其为零时引发ZeroDivisionError,而C没有适当的保护措施。
对于除法/取模运算中,即便指定了C类型的静态数字变量,Cython的行为是倾向于Python的,要获取与C/C++完全相同的语义,我们可以在全局模块级别或在指令注释中使用cdivision编译器指令,如下示例所示
在Python 3中,在C级别,所有整数都是PyLongObjects。Cython以与语言无关的方式在C整数类型和这些Python整数类型之间正确转换,并在无法进行转换时引发OverflowError。
当我们在Cython中使用Python对象时,无论是静态声明还是动态声明,Cython仍将为我们管理对象的所有方面,包括繁琐的引用计数。下一篇我们将会谈到Cython中的引用计数和静态的字符串类型。