生命周期
一个变量的生命周期就是它从创建到销毁的整个过程。其实我们在前面已经注意到了这样的现象:
然而,如果一个变量永远只能有唯一一个入口可以访问的话,那就太难使用了。因此,所有权还可以借用。
借用
变量对其管理的内存拥有所有权。这个所有权不仅可以被转移(move),还可以被借用(borrow)。
借用指针的语法使用&符号或者&mut符号表示。前者表示只读借用,后者表示可读写借用。借用指针(borrow pointer)也可以称作“引用”(reference)。借用指针与普通指针的内部数据是一模一样的,唯一的区别是语义层面上的。它的作用是告诉编译器,它对指向的这块内存区域没有所有权。
这里会出现编译错误,信息为“cannot borrow immutable borrowed content’*v’as mutable”。原因在于Vec::push函数。它的作用是对动态数组添加元素,它的签名是
pub fn push(&mut self,value:T)
它要求self参数是一个&mut Self类型。而我们给foo传递的参数是&Vec类型,因此会报错。修复方式如下:
对于&mut型指针,请大家注意不要混淆它与变量绑定之间的语法。
如果mut修饰的是变量名,那么它代表这个变量可以被重新绑定;如果mut修饰的是“借用指针&”,那么它代表的是被指向的对象可以被修改。示例如下:
借用规则
关于借用指针,有以下几个规则:
- 借用指针不能比它指向的变量存在的时间更长。
- &mut型借用只能指向本身具有mut修饰的变量,对于只读变量,不可以有&mut型借用。
- &mut型借用指针存在的时候,被借用的变量本身会处于“冻结”状态。
- 如果只有&型借用指针,那么能同时存在多个;如果存在&mut型借用指针,那么只能存在一个;如果同时有其他的&或者&mut型借用指针存在,那么会出现编译错误。
借用指针只能临时地拥有对这个变量读或写的权限,没有义务管理这个变量的生命周期。因此,借用指针的生命周期绝对不能大于它所引用的原来变量的生命周期,否则就是悬空指针,会导致内存不安全。示例如下:
在这里给大家提个醒:一般情况下,函数参数使用引用传递的时候,不仅在函数声明这里要写上类型参数,在函数调用这里也要显式地使用引用运算符。
但是,有一个例外,那就是当参数为self &self &mut self等时,若使用小数点语法调用成员方法,在函数调用这里不能显式写出借用运算符。以常见的String类型来举例:
在这个示例中,所有的函数调用都是同样的语法,比如x.len()、x.push(‘!’)、x.into_bytes()等,但它们背后对self参数的传递类型完全不同,因此也就出现了不同的语义。
这是需要提醒大家注意的地方。当然,如果我们使用统一的完整函数调用语法,那么所有的参数传递类型在调用端都是显式写出来的。
任何借用指针的存在,都会导致原来的变量被“冻结”(Frozen)。示例如下:
编译结果为:
error:cannot assign to `x^because it is borrowed
因为p的存在,此时对x的改变被认为是非法的。
生命周期标记
对一个函数内部的生命周期进行分析,Rust编译器可以很好地解决。但是,当生命周期跨函数的时候,就需要一种特殊的生命周期标记符号了。
函数的生命周期标记
生命周期符号使用单引号开头,后面跟一个合法的名字。生命周期标记和泛型类型参数是一样的,都需要先声明后使用。在上面这段代码中,尖括号里面的’a是声明一个生命周期参数,它在后面的参数和返回值中被使用。
前面提到的借用指针类型都有一个生命周期泛型参数,它们的完整写法应该是&'a T &'a mut T,只不过在做局部变量的时候,生命周期参数是可以省略的。
生命周期之间有重要的包含关系。如果生命周期’a比’b更长或相等,则记为’a : 'b,意思是’a至少不会比’b短,英语读做“lifetime a outlives lifetime b”。对于借用指针类型来说,如果&'a是合法的,那么’b作为’a的一部分,&'b也一定是合法的。
另外,'static是一个特殊的生命周期,它代表的是这个程序从开始到结束的整个阶段,所以它比其他任何生命周期都长。这意味着,任意一个生命周期’a都满足’static : 'a。
在上面这个例子中,如果我们把变量t的真实生命周期记为’t,那么这个生命周期’t实际上是变量t从“出生”到“死亡”的区间。在函数被调用的时候,它传人的实际参数是&t,它是指向t的引用。那么可以说,在调用的时候,这个泛型参数’a被实例化为了’t。根据函数签名,基于返回类型的生命周期与参数是一致的,可以推理出test函数的返回类型是&'t i32。
如果我们把x的生命周期记为’x。这条let x =text(&t);语句实际上是把&'t i32类型的变量赋值给&'x i32类型的变量。这个赋值是否合理呢?它应该是合理的。因为这两个生命周期的关系是’t: 'x。test返回的那个指针在’t这个生命周期范围内都是合法的,在一个被’t包围的更小范围的生命周期内,它当然也是合法的。所以,上面这个例子可以编译通过。
接下来,我们把上面这个例子稍作修改,让test函数有两个生命周期参数,其中一个给函数参数使用,另外一个给返回值使用:
编译时果然出了问题,在&arg.member这一行,报了生命周期错误。这是为什么呢?因为这一行代码是把&'a i32类型赋值给&'b i32类型。
'a和’b有什么关系?答案是什么关系都没有。所以编译器觉得这个赋值是错误的。
怎么修复呢?指定’a:'b就可以了。'a比’b“活”得长,自然,&'a i32类型赋值给&'b i32类型是没问题的。
验证如下:
经过这样的改写后,我们可以认为,在test函数被调用的时候,生命周期参数’a和’b被分别实例化为了’t和’x。
它们刚好满足了where条件中的’t:'x约束。而&arg.member这条表达式的类型是&'t i32,返回值要求的是&'x i32类型,可见这也是合法的。
所以test函数的生命周期检查可以通过。
上述示例是读者比较难理解的地方。以下两种写法都是可行的:
这里的关键是,Rust的引用类型是支持“协变”的。
在编译器眼里,生命周期就是一个区间,生命周期参数就是一个普通的泛型参数,它可以被特化为某个具体的生命周期。
我们再看一个例子。它有两个引用参数,共享同一个生命周期标记:
上述示例中,select这个函数引入了一个生命周期标记,两个参数以及返回值都是用的这个生命周期标记。同时我们注意到,在调用的时候,传递的实参其实是具备不同的生命周期的。
x的生命周期明显大于y的生命周期,&x可存活的范围要大于&y可存活的范围,我们把它们的实际生命周期分别记录为’x和’y。
select函数的形式参数要求的是同样的生命周期,而实际参数是两个不同生命周期的引用,这个类型之所以可以匹配成功,就是因为生命周期的协变特性。
编译器可以把&x和&y的生命周期都缩小到某个生命周期’a以内,且满足’x:‘a,'y:‘a。返回的selected变量具备’a生命周期,也并没有超过’x和’y的范围。所以,最终的生命周期检查可以通过。
类型的生命周期标记
如果自定义类型中有成员包含生命周期参数,那么这个自定义类型也必须有生命周期参数。示例如下:
在使用impl的时候,也需要先声明再使用:
impl后面的那个’t是用于声明生命周期参数的,后面的Test<'t>是在类型中使用这个参数。
如果有必要的话,方法中还能继续引入新的泛型参数。
如果在泛型约束中有where T:'a之类的条件,其意思是,类型T的所有生命周期参数必须大于等于’a。
要特别说明的是,若是有where T:'static的约束,意思则是,类型T里面不包含任何指向短生命周期的借用指针,意思是要么完全不包含任何借用,要么可以有指向’static的借用指针。
省略生命周期标记
在某些情况下,Rust允许我们在写函数的时候省略掉显式生命周期标记。
在这种时候,编译器会通过一定的固定规则为参数和返回值指定合适的生命周期,从而省略一些显而易见的生命周期标记。比如我们可以写这样的代码:
实际上,它等同于下面这样的代码,只是把显式的生命周期标记省略掉了而已: