linq 查询的结果会开辟新的内存吗?

一:背景

1. 讲故事

昨天群里有位朋友问:linq 查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用?

其实这个问题我觉得问的挺好,很多初学 C# 的朋友或多或少都有这样的疑问,甚至有 3,4 年工作经验的朋友可能都不是很清楚,这就导致在写代码的时候总是会畏手畏脚,还会莫名的揪心这样玩的话内存会不会暴涨暴跌,这一篇我就用 windbg 来帮助朋友彻底分析一下。

二:寻找答案

1. 一个小案例

这位老弟提到了是深拷贝还是浅拷贝,本意就是想问:linq 一个引用类型集合 到底会怎样? 这里我先模拟一个集合,代码如下:

class Program{static void Main(string[] args){var personList = new List<Person>() {new Person() { Name="jack", Age=20 },new Person() { Name="elen",Age=25,  },new Person() {  Name="john", Age=22 }};var query = personList.Where(m => m.Age > 20).ToList();Console.WriteLine($"query.count={query.Count}");Console.ReadLine();}}class Person{public string Name { get; set; }public int Age { get; set; }}

2. 真的是深copy吗?

如果用 windbg 的话,就非常简单了,假设是深copy 的话,那么 query 之后,托管堆上就会有 5个 Person,那是不是这样呢?用 !dumpheap -stat -type Person 到托管堆验证一下即可。


0:000> !dumpheap -stat -type Person
Statistics:MT    Count    TotalSize Class Name
00007ff7f27c3528        1           64 System.Func`2[[ConsoleApp5.Person, ConsoleApp5],[System.Boolean, System.Private.CoreLib]]
00007ff7f27c2b60        2           64 System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c9878        1           72 System.Linq.Enumerable+WhereListIterator`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c7a10        3          136 ConsoleApp5.Person[]
00007ff7f27c2ad0        3           96 ConsoleApp5.Person

从最后一行输出可以看到: ConsoleApp5.Person 的 Count=3,也就表明没有所谓的深copy,如果你还不信的话,可以在 query 中修改某一个Person的Age,看看原始的 personList 集合是不是同步更新,修改代码如下:

static void Main(string[] args){var personList = new List<Person>() {new Person() { Name="jack", Age=20 },new Person() { Name="elen",Age=25,  },new Person() {  Name="john", Age=22 }};var query = personList.Where(m => m.Age > 20).ToList();//故意修改 Age=25 为  Age=100; query[0].Age = 100;Console.WriteLine($"query[0].Age={query[0].Age}, personList[2].Age={personList[1].Age}");Console.ReadLine();}

从截图来看更加验证了 并没有所谓的 深copy 一说。

3. 真的是 copy 引用吗?

要验证是不是 copy 引用,最粗暴的方法就是看看 query 这个数组在 托管堆上的存储行态就明白了,同样你也可以借助 windbg 去验证一下,先到线程栈去找 query 变量,然后用 da 命令 对 query 进行打印。


0:000> !clrstack -l
OS Thread Id: 0x809c (0)Child SP               IP Call Site
000000E143D7E9B0 00007ff7f26f18be ConsoleApp5.Program.Main(System.String[]) [E:\net5\ConsoleApp5\ConsoleApp5\Program.cs @ 20]LOCALS:0x000000E143D7EA38 = 0x00000218266aab700x000000E143D7EA30 = 0x00000218266aad980:000> !do 0x00000218266aad98
Name:        System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
MethodTable: 00007ff7f27b2b60
EEClass:     00007ff7f27abad0
Size:        32(0x20) bytes
File:        C:\Program Files\dotnet\shared\Microsoft.NETCore.App\3.1.9\System.Private.CoreLib.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
0000000000000000  4001c35        8              SZARRAY  0 instance 00000218266aadb8 _items
00007ff7f26bb1f0  4001c36       10         System.Int32  1 instance                2 _size
00007ff7f26bb1f0  4001c37       14         System.Int32  1 instance                2 _version
0000000000000000  4001c38        8              SZARRAY  0   static dynamic statics NYI                 s_emptyArray0:000> !da 00000218266aadb8
Name:        ConsoleApp5.Person[]
MethodTable: 00007ff7f27b7a10
EEClass:     00007ff7f26b6580
Size:        56(0x38) bytes
Array:       Rank 1, Number of elements 4, Type CLASS
Element Methodtable: 00007ff7f27b2ad0
[0] 00000218266aac00
[1] 00000218266aac20
[2] null
[3] null

从最后四行代码可以看出数组有 4 个格子,前2个格子放的是内存地址,后两个都是 null,可能有些朋友会问,query 不是 2 条记录吗?怎么会有 4 个格子呢?这是因为 query 是 List 结构,而 List 底层用的是数组,默认以 4 个格子起步,不信的话翻一下 List 原代码即可。

public class List<T>{private void EnsureCapacity(int min){if (_items.Length < min){int num = (_items.Length == 0) ? 4 : (_items.Length * 2);   //默认 4 个大小if ((uint)num > 2146435071u){num = 2146435071;}if (num < min){num = min;}Capacity = num;}}}

如果你想进一步查看数组中前两个元素 00000218266aac00, 00000218266aac20 指向的是什么,可以用 !do 打印一下即可。


0:000> !do 00000218266aac00
Name:        ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass:     00007ff7f27c2a00
Size:        32(0x20) bytes
File:        E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
00007ff7f2771e18  4000001        8        System.String  0 instance 00000218266aab30 <Name>k__BackingField
00007ff7f26bb1f0  4000002       10         System.Int32  1 instance               25 <Age>k__BackingField
0:000> !do 00000218266aac20
Name:        ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass:     00007ff7f27c2a00
Size:        32(0x20) bytes
File:        E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
00007ff7f2771e18  4000001        8        System.String  0 instance 00000218266aab50 <Name>k__BackingField
00007ff7f26bb1f0  4000002       10         System.Int32  1 instance               22 <Age>k__BackingField

到这里为止,我觉得回答这位朋友的疑问应该是没有问题了,不过这里既然说到了集合中的引用类型,不得不说一下集合中的值类型又会是怎么样的?

三:集合中的值类型是什么样的copy方式

1. 使用 windbg 验证

有了上面的基础,验证这个问题的答案就简单了,先上测试代码

static void Main(string[] args){var list = new List<int>() { 1, 2, 3, 4, 5, 6, 7,8,9,10 };var query = list.Where(m => m > 5).ToList();Console.ReadLine();}

然后直接把整个数组内容打印出来


// list
0:000> !DumpArray /d 0000019687c8aba8
Name:        System.Int32[]
MethodTable: 00007ff7f279f090
EEClass:     00007ff7f279f010
Size:        88(0x58) bytes
Array:       Rank 1, Number of elements 16, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8abb8
[1] 0000019687c8abbc
[2] 0000019687c8abc0
[3] 0000019687c8abc4
[4] 0000019687c8abc8
[5] 0000019687c8abcc
[6] 0000019687c8abd0
[7] 0000019687c8abd4
[8] 0000019687c8abd8
[9] 0000019687c8abdc
[10] 0000019687c8abe0
[11] 0000019687c8abe4
[12] 0000019687c8abe8
[13] 0000019687c8abec
[14] 0000019687c8abf0
[15] 0000019687c8abf4// query
0:000> !DumpArray /d 0000019687c8ae68
Name:        System.Int32[]
MethodTable: 00007ff7f279f090
EEClass:     00007ff7f279f010
Size:        56(0x38) bytes
Array:       Rank 1, Number of elements 8, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8ae78
[1] 0000019687c8ae7c
[2] 0000019687c8ae80
[3] 0000019687c8ae84
[4] 0000019687c8ae88
[5] 0000019687c8ae8c
[6] 0000019687c8ae90
[7] 0000019687c8ae94

仔细对比 list 和 query 的数组呈现,发现有两点好玩的信息:

  • 值类型和引用类型一样,数组中都是存放地址的。

  • 值类型数组中的所有格子都被填满,不像引用类型数组中还有 null 的情况。

接下来的问题是,数组中每个元素的地址到底指向了谁,可以挑出每个数组的 0 号元素地址,用 dp 命令看一看:


//list
0:000> dp 0000019687c8abb8
00000196`87c8abb8  00000002`00000001 00000004`00000003
00000196`87c8abc8  00000006`00000005 00000008`00000007
00000196`87c8abd8  0000000a`00000009 00000000`00000000//query
0:000> dp 0000019687c8ae78
00000196`87c8ae78  00000007`00000006 00000009`00000008
00000196`87c8ae88  00000000`0000000a 00000000`00000000

看到没有,原来地址上面存放的都是数字值,深copy无疑哈。

四:总结

以上所有的分析可以得出:引用类型数组是引用copy,值类型数组是深copy,有时候背诵得来的东西总是容易忘记,只有实操验证才能真正的刻骨铭心!????????????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/306717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

问题 B: 十进制到二进制的转换

这个问题我们来用栈来实现 首先&#xff0c;我们先定义一个栈的结构体&#xff08;栈的结构体与链表的结构体不可同&#xff0c;栈的结构体第二项是用int定义栈的顶端; 而链表的第二项&#xff0c;是用struct定义一个指针&#xff09; struct stack{int data[10005];int top;…

javascript内存泄漏调试工具mac_node.js 内存泄漏的秘密

一直以来&#xff0c;跟踪 Node.js 的内存泄漏是一个反复出现的话题&#xff0c;人们始终希望对其复杂性和原因了解更多。并非所有的内存泄漏都显而易见。但是&#xff0c;一旦我们确定了其模式&#xff0c;就必须在内存使用率&#xff0c;内存中保存的对象和响应时间之间寻找关…

c++STL中的find()函数 有两种使用方法

cSTL中的find()函数 有两种使用方法 方法一&#xff1a; 开头引头文件&#xff1a;中的函数 其调用形式为 find&#xff08;start,end,value&#xff09; start搜寻的起点&#xff0c;end搜寻的终点&#xff0c;要寻找的value值; 如果没有找到&#xff0c;则返回end。函数的返…

关于C# Span的一些实践

Span这个东西出来很久了&#xff0c;居然因为5.0又火起来了。特别感谢RC兄弟提出这个话题。相关知识在大多数情况下&#xff0c;C#开发时&#xff0c;我们只使用托管内存。而实际上&#xff0c;C#为我们提供了三种类型的内存&#xff1a;堆栈内存 - 最快速的内存&#xff0c;能…

问题 C: 【例2-3】围圈报数

题目描述 有&#xff4e;(n<100)个人依次围成一圈&#xff0c;从第&#xff11;个人开始报数&#xff0c;数到第&#xff4d;个人出列&#xff0c;然后从出列的下一个人开始报数&#xff0c;数到第&#xff4d;个人又出列&#xff0c;…&#xff0c;如此反复到所有的人全部…

怎样用python批量处理文件夹_python批量处理文件或文件夹

本文实例为大家分享了python批量处理文件或文件夹的具体代码&#xff0c;供大家参考&#xff0c;具体内容如下 # -*- coding: utf-8 -*- import os,shutil import sys import numpy as np ##########批量删除不同文件夹下的同名文件夹############# def arrange_file(dir_path0…

leetcode-349-两个数组的交集

给定两个数组&#xff0c;编写一个函数来计算它们的交集。 示例 1&#xff1a; 输入&#xff1a;nums1 [1,2,2,1], nums2 [2,2] 输出&#xff1a;[2] 示例 2&#xff1a; 输入&#xff1a;nums1 [4,9,5], nums2 [9,4,9,8,4] 输出&#xff1a;[9,4] 说明&#xff1a; 输…

Leansoft再发招贤令:面试官徐磊有话讲 | IDCF

&#xff08;图片来源于网络&#xff09;2020是Leansoft成立的第五年&#xff0c;凭借专业的服务及实施能力&#xff0c;逐渐成长为国内唯一的端到端专业DevOps实施服务公司。Leansoft是一家怎样的公司呢&#xff1f;准确地说&#xff0c;我们其实是国内唯一一家提供端到端的De…

问题 B: 数塔问题

题目描述 有如下所示的数塔&#xff0c;要求从顶层走到底层&#xff0c;若每一步只能走到相邻的结点&#xff0c;则经过的结点的数字之和最大是多少&#xff1f; 输入 第一行是一个整数N(1 < N < 20)&#xff0c;表示数塔的高度&#xff0c;接下来用N个数字表示数塔&a…

leetcode-345-翻转字符串中的元音字母

编写一个函数&#xff0c;以字符串作为输入&#xff0c;反转该字符串中的元音字母。 示例 1&#xff1a; 输入&#xff1a;“hello” 输出&#xff1a;“holle” 示例 2&#xff1a; 输入&#xff1a;“leetcode” 输出&#xff1a;“leotcede” 来源&#xff1a;力扣&…

e盾服务端源码_gRPC服务注册发现及负载均衡的实现方案与源码解析

今天聊一下gRPC的服务发现和负载均衡原理相关的话题&#xff0c;不同于Nginx、Lvs或者F5这些服务端的负载均衡策略&#xff0c;gRPC采用的是客户端实现的负载均衡。什么意思呢&#xff0c;对于使用服务端负载均衡的系统&#xff0c;客户端会首先访问负载均衡的域名/IP&#xff…

堆问题(最小堆变最大堆,堆删除,中序遍历)

2-6 设最小堆&#xff08;小根堆&#xff09;的层序遍历结果为 {8, 38, 25, 58, 52, 82, 70, 60}。用线性时间复杂度的算法将该堆调整为最大堆&#xff08;大根堆&#xff09;&#xff0c;然后连续执行两次删除最大元素操作&#xff08;DeleteMax&#xff09;。则该树的中序遍历…

推荐一款.NET Core开源爬虫神器:DotnetSpider

没有爬虫就没有互联网&#xff01;爬虫的意义在于采集大批量数据&#xff0c;然后基于此进行加工/分析&#xff0c;做更有意义的事情。谷歌&#xff0c;百度&#xff0c;今日头条&#xff0c;天眼查都离不开爬虫。去开源中国和Github查询C#的爬虫项目&#xff0c;仅有几个非常简…

Excel学习使用教程

1.Excel的保存与加密 加密&#xff1a; 我设置的密码&#xff1a;517485

python数据导入hive_Python操作HIve,将数据插入到Mysql

Python操作HIve&#xff0c;将数据插入到Mysql import sys from hive_service import ThriftHive from hive_service.ttypes import HiveServerException from thrift import Thrift from thrift.transport import TSocket from thrift.transport import TTransport from thrif…

问题 D: 二叉树求高度

题目描述 已知一棵二叉树用邻接表结构存储&#xff0c;求这棵树的高度。例&#xff1a;如图二叉树的数据文件的数据格式如下: 输入 第一行n为二叉树的结点个树&#xff0c;n≤100&#xff1b;以下第一列数据是各结点的值&#xff0c;第二列数据是左儿子结点编号&#xff0c;第…

.Net Core in Docker - 使用阿里云Codepipeline及阿里云容器镜像服务实现持续集成(CI)...

前面已经介绍过了 .Net Core In Docker 在容器内编译并发布的内容。但是每次通过 SSH 链接到服务器敲命令&#xff0c;运行脚本也是挺麻烦的一件事。程序员是最懒的&#xff0c;能让电脑解决的问题绝不手动解决&#xff0c;如果当我们push一次代码后自动build代码&#xff0c;自…

leetcode-445. 两数相加 II

给你两个 非空 链表来代表两个非负整数。数字最高位位于链表开始位置。它们的每个节点只存储一位数字。将这两数相加会返回一个新的链表。 你可以假设除了数字 0 之外&#xff0c;这两个数字都不会以零开头。 进阶&#xff1a; 如果输入链表不能修改该如何处理&#xff1f;换…

mysql 序列_MySql中序列的应用和总结

Mysql中的序列主要用于主键&#xff0c;主键是递增的字段&#xff0c;不可重复。Mysql与Oracle不同的是&#xff0c;它不支持原生态的sequence&#xff0c;需要用表和函数的组合来实现类似序列的功能。1.首先创建序列的主表/*2.其次创建如下三个函数&#xff0c;它们的功能分别…

汉诺塔问题详细解析zufeoj

汉诺塔&#xff08;Tower of Hanoi&#xff09;&#xff0c;又称河内塔&#xff0c;是一个源于印度古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子&#xff0c;在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重…