[翻译] NumSharp的数组切片功能 [:]

原文地址:https://medium.com/scisharp/slicing-in-numsharp-e56c46826630

 

翻译初稿(英文水平有限,请多包涵):

由于Numsharp新推出了数组切片这个牛逼的功能,所以.NET社区距离拥有强大的开源机器学习平台又近了一步。  

  

Python之所以是机器学习的首选语言,部分原因就是因为它拥有一些牛逼的库,例如NumPyTensorflow与此同时,C#开发人员也迫切需要用于机器学习和数据科学的强大开源库。而NumSharp这个由 SciSharp STACK这个开源组织全力推动的,要把NumPy移植到C#的这个项目,由于其最近全面实现了切片技术,从而向该目标迈进了一大步。该技术允许对n维数组随意的创建子集,并将其作为对原始数据的高效视图。因为这些,使得它与TensorFlow.net一起成为了C#中机器学习的有用工具。  

  

牛逼在哪?  

如果你没用过NumPy,你可能不知道切片技术有多好用, Python数组允许通过对一定范围对元素进行索引来返回数组的一个切片,其索引操作是这样的:a[start:end:step]。但是,只有使用NumPy复杂巧妙的数组实现,切片才成为一种真正强大的数据操作技术,若没有这种技术,机器学习或数据科学就无法想象了。  

  

 

 640?wx_fmt=png

 

640?wx_fmt=png

而使用NumSharp写出的C#代码也是差不多一样的。但请注意,这里有一个细微的差别是,这里的切片使用的是字符串作为索引器的参数进行的索引。 

  

640?wx_fmt=png

640?wx_fmt=png

正如您所看到的,NumSharp团队花了很多的精力来保证代码尽可能的与Python相似。 这非常重要,因为这样的话,现有的依赖于NumPy的代码就可以很轻松的移植到C#上去了。 

 

用例使用同一数据的多个视图 

640?wx_fmt=png

对于运行时性能,尤其是对于大规模的数据集而言,能够在不进行复制的情况下仅对函数传入和传出底层数据的本地部分(即大镜像像的一小块)是至关重要的。切片使用局部坐标进行索引的,因此您的算法无需了解数据的全局结构,这样就有效地简化了您的工作,并确保尽可能高的性能,因为避免了不必要的复制。 

 

用例:稀疏视图和递归切片 

 

除了对切片的范围指定startend之外,再通过指定它的step(步幅),就可以创建数组的稀疏视图了。这是一个连C# 8.0新的数组切片语法都做不到的事情(据我所知)。在使用交错数据时,此功能变得非常重要。您可以通过设计算法来让它们处理连的续数据并为它们提供模拟连续数据源的稀疏切片,从而尽可能降低算法的复杂性。 

640?wx_fmt=png

切片可以进一步切片,如果您使用高维数据的话,这也将是一个非常重要的功能。同时这也有助于减少算法的复杂性,因为通过递归切片减少了数据的维数。 

 

用例:高效地处理高维数据 

640?wx_fmt=png

如果您需要将数据数组视为一个卷,并在不需要进行令人烦躁的坐标转换计算的情况下使用其中的某些部分,那么.reshape()方法就是您的朋友。 

所有由.reshape()或切片操作创建的数组都只是原始数据的视图。当您对视图的元素进行迭代、读取或写入时,其实您访问的是原始的数据数组。很显然,NumSharp为您做了相应的索引变换,所以您可以使用相对的坐标对切片进行索引。 

 

用例:在无任何额外成本的情况下颠倒元素的顺序 

使用值为负数的step(步幅)可以高效的反转切片的顺序。它的优点是不需要复制或列举数据就可以完成此操作,就像IEnumerable.Reverse() 一样。区别在于,视图(就是指a["::-1"]的操作结果)以相反的顺序显示数据,此外您无需对其进行列举就可以索引到该反转序列。 

 

用例:通过减少维度来降低复杂性 

当处理高维数据时,该数据的算法也会变得非常复杂。在处理NumSharpNDArray.ToString() 方法时(这个方法可以打印出任意高维卷)我注意到该算法通过系统地和递归地将(N-1)D卷切出ND-卷等诸如此类的方式简单而优雅的取得了结果。 

通过在可返回低维子卷的范围符号上使用NumSharp的索引符号进行切片,才使这种分而治之的方法变得可行。 

  

范围符号 vs 索引符号 

范围符号[“start:stop:step”]允许您访问具有相同维度给定卷的子范围。所以即使只划出二维矩阵的一列,仍然可以得到只有一列的二维矩阵。下面这一小段C#代码就展示了这一点: 

640?wx_fmt=png

索引符号为您提供了一个在N维父卷指定位置切出来的(N-1)维切片。因此,用索引符号从二维矩阵中分割出一个列,可以得到一个一维向量: 

640?wx_fmt=png

640?wx_fmt=png

如果您一眼也没有发现差异,那么下面这两个切片定义, ange [":,2:3"] vs index [":,2"],它们的结果是大不相同的。NumSharp wiki提供了新切片表示法的完整参考 

 

附注:ArraySlice <T> 

在实现N维视图的切片时,我得出这样一个结论,对于.NET中的许多其他领域来说它可能很有趣,因此我将它分解出一个自己的独立库SliceAndDice它里面有个东西叫做ArraySlice <T>,它是对所有索引的C#数据结构(如T[]IList<T>)的一个轻量级包装,此外它还允许您使用相同的塑形,切片和视图机制,并且无需进行任何其他的重度数值计算。它只使用了几百行代码就漂亮简洁的完成了切片的壮举。 

  

综上

NumSharp最近被赋予了同切片和视图机制,同样就是这些机制让NumPy成为Python机器学习生态最重要的库之一。SciSharp Stack作为一个开源组织,目前只有少数技术娴熟的开发人员,但他们却非常努力地要为.NET世界带来同样的魔力。NumSharp最近的这次改进就是实现这一目标的重要基石。  


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315754.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

P3978 [TJOI2015]概率论

P3978 [TJOI2015]概率论 题目描述 Solution 设CnC_nCn​表示nnn个节点的树的个数&#xff08;卡特兰数&#xff09;&#xff0c;SnS_nSn​表示nnn个节点的所有树的叶子的个数和。 Cn∑i0n−1CiCn−i−1[n0]Sn2∑i0n−1SiCn−i−1[n1]C_n\sum_{i0}^{n-1} C_iC_{n-i-1}[n0]\\ …

Visual Studio 2019 16.1发布,更快更高效

Visual Studio 2019 16.1 已正式发布&#xff0c;可以看到&#xff0c;新版本的启动速度有了显著的提升&#xff0c;还节省了不少的内存空间。主要更新如下&#xff1a;IDE现已公开发布 Visual Studio IntelliCode&#xff0c;并且可以随任何支持 C#、C、TypeScipt/JavaScript …

牛顿迭代法

牛顿迭代法 定义 在一般意义下&#xff0c;牛顿迭代法可以求出一个函数的零点&#xff0c;而在多项式意义下&#xff0c;牛顿迭代能够求出&#xff1a;给定一个G(x)G(x)G(x)&#xff0c;求F(x)F(x)F(x)&#xff0c;使得G(F(x))≡0(modxn)G(F(x)) \equiv 0\;\;\;(mod\;\;x^n)G…

.NET Core 3.0之创建基于Consul的Configuration扩展组件

经过前面三篇关于.NET Core Configuration的文章之后&#xff0c;本篇文章主要讨论如何扩展一个Configuration组件出来。如果前面三篇文章没有看到&#xff0c;可以点击如下地址访问.NET Core 3.0之深入源码理解Configuration(一).NET Core 3.0之深入源码理解Configuration(二)…

Mono 和 .NET Core比翼双飞

大家好&#xff0c;今天给大家分享.NET 蓝图之下的Mono和.NET Core 话题&#xff0c;微软在Build 2019 大会上给.NET 做了一个五年规划&#xff0c;所以分享的主题就是《Mono和.NET Core 比翼双飞》&#xff0c;将在完成这个五年规划的时候合体。在开始这个主题之前&#xff0c…

在上司面前硬不起来?教你如何快速将字符串转换为可执行代码

老是因为活不好被上司欺凌&#xff1f;在上司面前很没面子&#xff1f;在上司面前硬不起来&#xff1f; 是时候分享一个可以快速将字符串转换为可执行代码的项目给你了 - YACEP !不过&#xff0c;这不是一篇专门对YACEP 做详细介绍的随笔&#xff0c;想知道更详细的的YACEP 细节…

P4827 [国家集训队] Crash 的文明世界

P4827 [国家集训队] Crash 的文明世界 题目描述 Solution 看到这种kkk次幂的式子&#xff0c;就应该往斯特林数的方面想想。 mn∑i{ni}(ni)i!m^n\sum_i \left\{ \begin{aligned} n \\ i \end{aligned} \right\} \left ( \begin{aligned} n \\ i \end{aligned} \right )i!mn∑…

ConcurrentDictionary线程不安全么,你难道没疑惑,你难道弄懂了么?

事情不太多时&#xff0c;会时不时去看项目中同事写的代码可以作个参考或者学习&#xff0c;个人觉得只有这样才能走的更远&#xff0c;抱着一副老子天下第一的态度最终只能是井底之蛙。前两篇写到关于断点传续的文章&#xff0c;还有一篇还未写出&#xff0c;后续会补上&#…

bzoj#4555. [Tjoi2016Heoi2016]求和

bzoj#4555. [Tjoi2016&Heoi2016]求和 题目描述 Solution 有一个关于第二类斯特林数的公式&#xff1a; {nm}1m!∑i(mk)(m−k)n(−1)k\left\{ \begin{aligned} n \\ m \end{aligned} \right\} \frac{1}{m!}\sum_i \left ( \begin{aligned} m \\ k \end{aligned} \right )…

记一次ORM的权衡和取舍

面对ORM的选型&#xff0c;有些人是根据自己熟悉程度来评判&#xff0c;有些人是根据他人的推荐来抉择&#xff0c;有些人觉得都差不多&#xff0c;随便了。当自己要真正做选择的时候&#xff0c;以上的这些依据都无法真正说服自己&#xff0c;因为不同的业务需求&#xff0c;不…

P5395 【模板】第二类斯特林数·行

P5395 【模板】第二类斯特林数行 题目描述 Solution 这题是[Tjoi2016&Heoi2016]求和的前置技能啊…… 我似乎直接跳过这题&#xff0c;去做应用了QAQQAQQAQ。 Code #include <vector> #include <list> #include <map> #include <set> #inclu…

出让执行权:Task.Yield, Dispatcher.Yield

一个耗时的任务&#xff0c;可以通过 Task.Yield 或者 Dispatcher.Yield 来中断以便分割成多个小的任务片段执行。Yield 这个词很有意思&#xff0c;叫做“屈服”“放弃”“让步”&#xff0c;字面意义上是让出当前任务的执行权&#xff0c;转而让其他任务可以插入执行。Task、…

HDU4372 Count the Buildings

HDU4372 Count the Buildings 题目描述 Solution 思路很妙。 考虑从最高的一个楼房将序列分开&#xff0c;左边可以看到FFF个&#xff0c;右边可以看到BBB个&#xff0c;一个楼房可以被看到&#xff0c;则一定是其之前没有比它高的楼房&#xff0c;其之后有若干个比它矮的楼…

VS Code 即将迎来再一次的 logo 更新!已可在 Insiders 版本尝鲜

为什么要说“再一次”&#xff1f; 相信 VS Code 的老用户都还记得两年前的 logo 更新风波吧。当时 VS Code 改了新 logo 之后&#xff0c;VS Code 的用户们一片哀嚎&#xff0c;纷纷觉得新 logo 太丑&#xff0c;在 GitHub 和各种社交媒体上各种吐槽&#xff01;不过幸运的是&…

CF961G Partitions

CF961G Partitions 题目描述 Solution 推式子&#xff1a; AnsAnsAns ∑wi∑s0n(n−1s−1){n−sk−1}\sum w_i\sum_{s0}^n\left ( \begin{aligned} n-1 \\ s-1 \end{aligned} \right ) \left\{ \begin{aligned} n-s \\ k-1 \end{aligned} \right\}∑wi​∑s0n​(n−1s−1​)…

从零开始在 Windows 上部署 .NET Core 到 Kubernetes

本章节所有代码已上传至&#xff1a;https://github.com/Seanwong933/.NET-Core-on-Kubernetes文末附有本人遇到过的 Docker 和 k8s 的故障排除。本文目标&#xff1a;带领大家在 Kubernetes 上部署一个 .NET Core Api 的单节点集群。后续文章会帮助大家继续深入。安装 Kuberne…

bzoj5093: [Lydsy1711月赛]图的价值

bzoj5093: [Lydsy1711月赛]图的价值 题目描述 Solution 考虑每一个点的贡献&#xff0c;枚举它的度数。 Ansn∗2(n−12)∑i1n−1(n−1i)∗ikAnsn*2^{\tbinom{n-1}{2}}\sum_{i1}^{n-1} \left( \begin{aligned} n-1 \\ i\;\;\; \end{aligned} \right)*i^kAnsn∗2(2n−1​)i1∑…

.NET Core微服务 权限系统+工作流(一)权限系统

一、前言实际上权限系统老早之前我就在一直开发&#xff0c;大概在刚毕业没多久就想一个人写一个系统&#xff0c;断断续续一直坚持到现在&#xff0c;毕竟自己亲动手自写的系统才有收获&#xff0c;本篇仅介绍权限。小小系统上不了台面&#xff0c;望各位大神勿喷。二、系统介…

bzoj#3456. 城市规划

bzoj#3456. 城市规划 题目描述 Solution 用组合意义推很简单。 iii个点的简单无向图个数为2(i2)2^{\tbinom{i}{2}}2(2i​)个。 则其EGFEGFEGF为 G(x)∑i>02(n2)i!xiG(x)\sum_{i>0}\frac{2^{\tbinom{n}{2}}}{i!}x^i G(x)i>0∑​i!2(2n​)​xi 令iii个点的简单无向连…

iNeuOS云操作系统,.NET Core全系打造

一.演示地址演示地址&#xff1a; 进入iNeuOS系统。&#xff08;建议使用chrome浏览器&#xff09;http://192.144.173.38:8081/login.html测试名称&#xff1a;admin测试密码&#xff1a;admin下载《iNeuOS云操作系统演示应用手册》 链接&#xff1a;https://pan.baidu.co…