当前位置：首页 > 科技 > 软件

Rust编程基础核心之所有权

来源：责编：时间：2024-01-10 09:34:10 277观看

导读什么是所有权?Rust 的核心功能（之一）是所有权（ownership）。虽然该功能很容易解释，但它对语言的其他部分有着深刻的影响。所有程序都必须管理其运行时使用计算机内存的方式。一些语言中具有垃圾回收机制，在程序运行时有规律

什么是所有权?

Rust 的核心功能（之一）是所有权（ownership）。虽然该功能很容易解释，但它对语言的其他部分有着深刻的影响。

所有程序都必须管理其运行时使用计算机内存的方式。一些语言中具有垃圾回收机制，在程序运行时有规律地寻找不再使用的内存,例如:Java、Go；在另一些语言中，程序员必须亲自分配和释放内存,例如:C、C++。Rust 则选择了第三种方式：通过所有权系统管理内存，编译器在编译时会根据一系列的规则进行检查。如果违反了任何这些规则，程序都不能编译。在运行时，所有权系统的任何功能都不会减慢程序。

因为所有权对很多程序员来说都是一个新概念，需要一些时间来适应。随着你对 Rust 和所有权系统的规则越来越有经验，你就越能自然地编写出安全和高效的代码, 需要学习者能够持之以恒。

当理解了所有权，将会有一个坚实的基础来理解那些使 Rust 独特的功能。

栈和堆基础

在很多语言中，并不需要经常考虑到栈与堆。不过在像 Rust 这样的系统编程语言中，值是位于栈上还是堆上在更大程度上影响了语言的行为以及为何必须做出这样的抉择。

栈和堆都是代码在运行时可供使用的内存，但是它们的结构不同。栈以放入值的顺序存储值并以相反顺序取出值。这也被称作后进先出（last in, first out）。

增加数据叫做进栈（pushing onto the stack），而移出数据叫做出栈（popping off the stack）。栈中的所有数据都必须占用已知且固定的大小。在编译时大小未知或大小可能变化的数据，要改为存储在堆上。

堆是缺乏组织的：当向堆放入数据时，你要请求一定大小的空间。内存分配器（memory allocator）在堆的某处找到一块足够大的空位，把它标记为已使用，并返回一个表示该位置地址的指针（pointer）。这个过程称作在堆上分配内存（allocating on the heap），有时简称为 “分配”（allocating）。因为指向放入堆中数据的指针是已知的并且大小是固定的，你可以将该指针存储在栈上，不过当需要实际数据时，必须访问指针。

入栈比在堆上分配内存要快，因为（入栈时）分配器无需为存储新数据去搜索内存空间；其位置总是在栈顶。相比之下，在堆上分配内存则需要更多的工作，这是因为分配器必须首先找到一块足够存放数据的内存空间，并接着做一些记录为下一次分配做准备。

访问堆上的数据比访问栈上的数据慢，因为必须通过指针来访问。现代处理器在内存中跳转越少就越快（缓存）。出于同样原因，处理器在处理的数据彼此较近的时候（比如在栈上）比较远的时候（比如可能在堆上）能更好的工作。当你的代码调用一个函数时，传递给函数的值（包括可能指向堆上数据的指针）和函数的局部变量被压入栈中。当函数结束时，这些值被移出栈。

跟踪哪部分代码正在使用堆上的哪些数据，最大限度的减少堆上的重复数据的数量，以及清理堆上不再使用的数据确保不会耗尽空间，这些问题正是所有权系统要处理的。一旦理解了所有权，就不需要经常考虑栈和堆了，不过明白了所有权的主要目的就是为了管理堆数据，能够帮助解释为什么所有权要以这种方式工作。

所有权规则

所有权规则核心主要有三条,务必牢记：

Rust 中的每一个值都有一个所有者(owner)。
值在任一时刻有且只有一个所有者。
当所有者(变量)离开作用域，这个值将被丢弃。

在所有权的第一个例子中，我们看看一些变量的作用域（scope）。作用域是一个项（item）在程序中有效的范围。假设有这样一个变量：

let s = "hello";

变量 s 绑定到了一个字符串字面值，这个字符串值是硬编码进程序代码中的。这个变量从声明的点开始直到当前作用域结束时都是有效的。可以看下面的标注:

{ // s 在这里无效，它尚未声明        let s = "hello";// 从此处起，s 是有效的        // 使用 s } // 此作用域已结束，s 不再有效

换句话说，这里有两个重要的时间点：

当 s 进入作用域时，它就是有效的。
这一直持续到它离开作用域为止。

目前为止，变量是否有效与作用域的关系跟其他编程语言是类似的。现在在此基础上介绍 String 类型。

看下面的一段代码:

let s = String::from("hello");

这两个冒号 :: 是运算符，允许将特定的 from 函数置于 String 类型的命名空间（namespace）下，而不需要使用类似 string_from 这样的名字。

可以修改此类字符串如下:

let mut s = String::from("hello");s.push_str(", world!"); // push_str() 在字符串后追加字面值println!("{}", s); // 将打印 `hello, world!`

我们已经见过字符串字面值，即被硬编码进程序里的字符串值, 它们是不可变的。那么这里有什么区别呢？为什么 String 可变而字面值却不行呢？区别在于两个类型对内存的处理上。

所有权内存和分配

对于字符串字面值，我们在编译时就知道其内容，所以文本被直接硬编码进最终的可执行文件中。这使得字符串字面值快速且高效。不过这些特性都只得益于字符串字面值的不可变性。不幸的是，我们不能为了每一个在编译时大小未知的文本而将一块内存放入二进制文件中，并且它的大小还可能随着程序运行而改变。

对于 String 类型，为了支持一个可变，可增长的文本片段，需要在堆上分配一块在编译时未知大小的内存来存放内容。这意味着：

必须在运行时向内存分配器（memory allocator）请求内存。
需要一个当我们处理完 String 时将内存返回给分配器的方法。

第一部分由我们完成：当调用 String::from 时，它的实现 (implementation) 请求其所需的内存。这在编程语言中是非常通用的。

然而，第二部分实现起来就各有区别了。在有垃圾回收（garbage collector，GC）的语言中，GC 记录并清除不再使用的内存，而我们并不需要关心它。在大部分没有 GC 的语言中，识别出不再使用的内存并调用代码显式释放就是我们的责任了，跟请求内存的时候一样。从历史的角度上说正确处理内存回收曾经是一个困难的编程问题。如果忘记回收了会浪费内存。如果过早回收了，将会出现无效变量。如果重复回收，这也是个 bug。我们需要精确的为一个 allocate 配对一个 free。

Rust 采取了一个不同的策略：内存在拥有它的变量离开作用域后就被自动释放。下面是作用域例子的一个使用 String 而不是字符串字面值的版本：

{        let s = String::from("hello"); // 从此处起，s 是有效的        // 使用 s } // 此作用域已结束，                                    // s 不再有效

这是一个将 String 需要的内存返回给分配器的很自然的位置：当 s 离开作用域的时候。当变量离开作用域，Rust 为我们调用一个特殊的函数。这个函数叫做 drop，在这里 String 的作者可以放置释放内存的代码。Rust 在结尾的 } 处自动调用 drop。

这个模式对编写 Rust 代码的方式有着深远的影响。现在它看起来很简单，不过在更复杂的场景下代码的行为可能是不可预测的，比如当有多个变量使用在堆上分配的内存时。下面来探索一些场景。

变量与数据交互方式之移动

在 Rust 中，多个变量可以采取不同的方式与同一数据进行交互。看下面的例子:

let x = 5;let y = x;

我们大致可以猜到这在干什么：将 5 绑定到 x；接着生成一个值 x 的拷贝并绑定到 y。现在有了两个变量，x 和 y，都等于 5。因为整数是有已知固定大小的简单值，所以这两个 5 被放入了栈中。

现在看看这个 String 版本：

let s1 = String::from("hello");let s2 = s1;

这看起来与上面的代码非常类似，所以我们可能会假设它们的运行方式也是类似的：也就是说，第二行可能会生成一个 s1 的拷贝并绑定到 s2 上。不过，事实上并不完全是这样。

下面先看一张图解:

从左边代表的s1内容可以看到, String是由三部分组成: 一个指向存放字符串内容内存的指针, 一个是长度和一个容量。这一组数据存储在栈上, 而右侧的数据, 也就是"hello"字符串内容则是存储在堆上。

这里我们要区分一下长度和容量。长度是表示String的内容当前使用了多少字节的内存; 而容量是String从分配器总共获取了多少字节的内存。长度和容量的区别非常重要, 但在这里的上下文中并不重要, 所以现在暂时忽略容量。

当我们将s1赋值给s2, String的数据被复制了, 这意味着我们从栈上拷贝了它的指针、长度和容量。但并没有复制指针指向的堆上的数据:"hello", 为了更好的理解, 可以参考下面的图解:

从图中可以看出, 将s1赋给s2之后, s2有一份s1的拷贝,内容是: ptr、len和capacity, 设想一下, 如果此时Rust也拷贝了堆上的数据将会发生什么?那么内存看起来就像下面这样:

如果Rust真的这样做了, 在操作s2 = s1的过程中,假如堆里的数据不是"hello",而是一串大数据, 那么在运行时可能会对性能造成重大的影响。

之前我们提到过当变量离开作用域后，Rust 自动调用 drop 函数并清理变量的堆内存。当执行语句:s2 = s1时, 两个数据指针指向了同一个位置, 此时就有一个问题: 当s2和s1离开作用域, 它们都会尝试释放相同的内存, 这是一个典型的二次释放(double free)的错误, 也是之前提到过的内存安全性bug之一, 两次释放(相同)内存会导致内存污染, 它可能会导致潜在的安全漏洞。

为了确保内存安全，在 let s2 = s1; 之后，Rust 认为 s1 不再有效，因此 Rust 不需要在 s1 离开作用域后清理任何东西。看看在 s2 被创建之后尝试使用 s1 会发生什么, 代码如下:

let s1 = String::from("hello");let s2 = s1;println!("{}, world!", s1);

这段代码执行后, 会得到一个错误, 因为Rust禁止使用无效的引用,如图:

如果在其他语言中听说过术语浅拷贝（shallow copy）和深拷贝（deep copy），那么拷贝指针、长度和容量而不拷贝数据可能听起来像浅拷贝。不过因为 Rust 同时使第一个变量无效了，这个操作被称为移动（move），而不是叫做浅拷贝。上面的例子可以解读为 s1 被移动到了 s2 中。那么具体发生了什么,可以参考下图:

当执行let s2 = s1后, s1被移动到s2, 随后被释放, 这样就解决了二次释放问题, 只有s2是有效的, 当其离开作用域, s2会释放自己的内存,完美解决。

另外，这里还隐含了一个设计选择：Rust 永远也不会自动创建数据的 “深拷贝”。因此，任何自动的复制可以被认为对运行时性能影响较小。

变量与数据交互方式之二: 克隆

如果我们确实需要深度复制 String 中堆上的数据，而不仅仅是栈上的数据，可以使用一个叫做 clone 的通用函数。

看下面的代码:

let s1 = String::from("hello");let s2 = s1.clone();println!("s1 = {}, s2 = {}", s1, s2);

这段代码能正常运行, 并且堆上的数据现在可以被复制了。

我们在代码中下个断点, 使用调试器观察下s1的内容,如图:

结合上一章节的分析, 此时s1变量中保存的指针ptr指向的内存保存了内容:"hello"。

现在执行语句: let s2 = s1.clone(); 单不执行一下看下s2的内容,如图:

可以看到, clone()函数的确将字符串内容复制到变量s2中。

注意:当出现 clone 调用时，我们心里要清楚一些特定的代码被执行而且这些代码可能相当消耗资源。很容易能察觉到一些不寻常的事情正在发生。

下面再看一段代码:

let x = 5;let y = x;println!("x = {}, y = {}", x, y);

执行这段代码, 结果如下:

这段代码似乎与我们刚刚学到的内容相矛盾：没有调用 clone，不过 x 依然有效且没有被移动到 y 中。

原因是像整型这样的在编译时已知大小的类型被整个存储在栈上，所以拷贝其实际的值是快速的。这意味着没有理由在创建变量 y 后使 x 无效。换句话说，这里没有深浅拷贝的区别，所以这里调用 clone 并不会与通常的浅拷贝有什么不同，我们可以不用管它。

Rust 有一个叫做 Copy trait 的特殊注解，可以用在类似整型这样的存储在栈上的类型上, 如果一个类型实现了 Copy trait，那么一个旧的变量在将其赋值给其他变量后仍然可用。

Rust 不允许自身或其任何部分实现了 Drop trait 的类型使用 Copy trait。如果我们对其值离开作用域时需要特殊处理的类型使用 Copy 注解，将会出现一个编译时错误。

那么哪些类型实现了 Copy trait 呢？可以查看给定类型的文档来确认，不过作为一个通用的规则，任何一组简单标量值的组合都可以实现 Copy，任何不需要分配内存或某种形式资源的类型都可以实现 Copy 。如下是一些 Copy 的类型：

所有整数类型，比如 u32。
布尔类型，bool，它的值是 true 和 false。
所有浮点数类型，比如 f64。
字符类型，char。
元组，当且仅当其包含的类型也都实现 Copy 的时候。比如，(i32, i32) 实现了 Copy，但 (i32, String) 就没有。

所有权和函数

将值传递给函数与给变量赋值的原理相似。向函数传递值可能会移动或者复制，就像赋值语句一样。

看一下下面的代码:

fn main() {    let s = String::from("hello"); // s 进入作用域    takes_ownership(s); // s 的值移动到函数里 ...                                    // ... 所以到这里不再有效    let x = 5; // x 进入作用域    makes_copy(x); // x 应该移动函数里，                                    // 但 i32 是 Copy 的，                                    // 所以在后面可继续使用 x} // 这里，x 先移出了作用域，然后是 s。但因为 s 的值已被移走，  // 没有特殊之处fn takes_ownership(some_string: String) { // some_string 进入作用域    println!("{}", some_string);} // 这里，some_string 移出作用域并调用 `drop` 方法。  // 占用的内存被释放fn makes_copy(some_integer: i32) { // some_integer 进入作用域    println!("{}", some_integer);} // 这里，some_integer 移出作用域。没有特殊之处

当尝试在调用 takes_ownership 后使用 s 时，Rust 会抛出一个编译时错误。这些静态检查使我们免于犯错。

返回值与作用域

返回值也可以转移所有权, 看下面的代码:

fn main() {    let s1 = gives_ownership(); // gives_ownership 将返回值                                        // 转移给 s1    let s2 = String::from("hello"); // s2 进入作用域    let s3 = takes_and_gives_back(s2); // s2 被移动到                                        // takes_and_gives_back 中，                                        // 它也将返回值移给 s3} // 这里，s3 移出作用域并被丢弃。s2 也移出作用域，但已被移走，  // 所以什么也不会发生。s1 离开作用域并被丢弃fn gives_ownership() -> String { // gives_ownership 会将                                             // 返回值移动给                                             // 调用它的函数    let some_string = String::from("yours"); // some_string 进入作用域。    some_string // 返回 some_string                                             // 并移出给调用的函数                                             //}// takes_and_gives_back 将传入字符串并返回该值fn takes_and_gives_back(a_string: String) -> String { // a_string 进入作用域                                                      //    a_string // 返回 a_string 并移出给调用的函数}

变量的所有权总是遵循相同的模式：将值赋给另一个变量时移动它。当持有堆中数据值的变量离开作用域时，其值将通过 drop 被清理掉，除非数据被移动为另一个变量所有。

虽然这样是可以的，但是在每一个函数中都获取所有权并接着返回所有权有些啰嗦。如果我们想要函数使用一个值但不获取所有权该怎么办呢？如果我们还要接着使用它的话，每次都传进去再返回来就有点烦人了，除此之外，我们也可能想返回函数体中产生的一些数据。

我们可以使用元组来返回多个值, 看下面的代码:

fn main() {    let s1 = String::from("hello");    let (s2, len) = calculate_length(s1);    println!("The length of '{}' is {}.", s2, len);}fn calculate_length(s: String) -> (String, usize) {    let length = s.len(); // len() 返回字符串的长度    (s, length)}

但是这未免有些形式主义，而且这种场景应该很常见。幸运的是，Rust 对此提供了一个不用获取所有权就可以使用值的功能，叫做引用（references）。

本文链接：http://www.28at.com/showinfo-26-59631-0.htmlRust编程基础核心之所有权

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：欢聚发布 2022 年 Q4 及全年财报：集团连续第二年盈利净利润同比增长 83%

下一篇：有了GPT+Copilot，学习 Rust 直接起飞

标签：

热门焦点

俄罗斯：将审查iPhone等外国公司设备保数据安全

iPhone和特斯拉都属于在各自领域领头羊的品牌，推出的产品也也都是数一数二的，但对于一些国家而言，它们的产品可靠性和安全性还是在限制范围内。近日，俄罗斯联邦通信、信息技术
6月iOS设备性能榜：M2稳居榜首 A系列只能等一手3nm来救

没有新品发布，自然iOS设备性能榜的上榜设备就没有什么更替，仅仅只有跑分变化而产生的排名变动，毕竟苹果新品的发布节奏就是这样的，一年下来也就几个移动端新品，不会像安卓厂商，一
28个SpringBoot项目中常用注解，日常开发、求职面试不再懵圈

前言在使用SpringBoot开发中或者在求职面试中都会使用到很多注解或者问到注解相关的知识。本文主要对一些常用的注解进行了总结，同时也会举出具体例子，供大家学习和参考。注解
如何通过Python线程池实现异步编程？

线程池的概念和基本原理线程池是一种并发处理机制，它可以在程序启动时创建一组线程，并将它们置于等待任务的状态。当任务到达时，线程池中的某个线程会被唤醒并执行任务，执行完任
华为发布HarmonyOS 4：更好玩、更流畅、更安全

在8月4日的华为开发者大会2023（HDC.Together）大会上，HarmonyOS 4正式发布。自2019年发布以来，HarmonyOS一直以用户为中心，经历四年多的发展HarmonyOS已
三星Galaxy Z Fold/Flip 5国行售价曝光：最低7499元/12999元起

据官方此前宣布，三星将于7月26日也就是明天在韩国首尔举办Unpacked活动，届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
Counterpoint ：OPPO双旗舰战略全面落地高端产品销量增长22%

2023年6月30日，全球行业分析机构Counterpoint Research发布的《中国智能手机高端市场白皮书》显示，中国智能手机品牌正在寻求高质量发展，中国高端智能
联想小新Pad Pro 12.6将要推出，搭载高通骁龙 870 处理器

联想小新Pad Pro 12.6将于秋季新品会上推出，官方按照惯例直接在发布会前给出了机型的所有参数。联想小新 Pad Pro 12.6 将搭载高通骁龙 870 处理器，重量为 5
2022爆款：ROG魔霸6 冰川散热系统持续护航

喜逢开学季，各大商家开始推出自己的新产品，进行打折促销活动。对于忠实的端游爱好者来说，能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的

Rust编程基础核心之所有权

什么是所有权?

栈和堆基础

所有权规则

所有权内存和分配

变量与数据交互方式之移动

变量与数据交互方式之二: 克隆

所有权和函数

返回值与作用域

俄罗斯：将审查iPhone等外国公司设备保数据安全

6月iOS设备性能榜：M2稳居榜首 A系列只能等一手3nm来救

28个SpringBoot项目中常用注解，日常开发、求职面试不再懵圈

如何通过Python线程池实现异步编程？

华为发布HarmonyOS 4：更好玩、更流畅、更安全

三星Galaxy Z Fold/Flip 5国行售价曝光：最低7499元/12999元起

Counterpoint ：OPPO双旗舰战略全面落地高端产品销量增长22%

联想小新Pad Pro 12.6将要推出，搭载高通骁龙 870 处理器

2022爆款：ROG魔霸6 冰川散热系统持续护航

最新推荐

猜你喜欢

热门推荐

相关资讯