torch.from_numpy()和torch.tensor()区别

torch.from_numpy()和torch.tensor()都可以用于创建PyTorch张量，但它们有以下区别：

torch.from_numpy()：这个函数创建的PyTorch张量与原始numpy数组共享相同的数据内存。这意味着，如果修改了numpy数组中的数据，相应的PyTorch张量也会改变，反之亦然。而且，这种共享内存的方式在创建张量时不需要额外复制数据，所以在内存使用上比较高效，尤其是对于大型数组。例如，如果有一个非常大的numpy数组，使用torch.from_numpy()将其转换为PyTorch张量时，不会产生额外的内存开销用于存储数据副本。
torch.tensor()：当使用torch.tensor()创建张量时，它会从给定的数据（可以是多种数据类型，包括numpy数组、Python列表等）创建一个新的、独立的张量副本。这意味着即使原始数据发生变化，新创建的PyTorch张量也不会受到影响。但是，这种方式会占用额外的内存空间，因为它复制了数据。

torch.from_numpy()：创建的PyTorch张量的数据类型会与原始numpy数组的数据类型保持一致。例如，如果numpy数组是float64类型，那么通过torch.from_numpy()创建的张量也是float64类型（在PyTorch中对应的类型）。
torch.tensor()：torch.tensor()在创建张量时会根据输入数据自动推断数据类型，但它的推断规则可能与torch.from_numpy()有所不同。一般情况下，它会尝试选择一个合适的数据类型，但在某些情况下，可能需要显式指定数据类型以避免类型不匹配的问题。例如，对于整数类型的数据，如果数据范围较小，torch.tensor()可能会将其推断为int8或int16类型；而对于numpy数组转换，torch.from_numpy()则完全依赖于numpy数组的原始类型。

torch.from_numpy()：适用于已经有numpy数组数据，并且希望在PyTorch中使用这些数据，同时希望避免额外的内存开销和保持数据一致性的情况。特别是在处理大型数据集或者需要频繁在numpy和PyTorch之间切换数据操作时非常有用。
torch.tensor()：更适合从非numpy数据（如Python列表、元组等）创建PyTorch张量，或者当需要创建独立于原始数据的张量副本时使用。例如，当从用户输入的数据或者经过一些数据处理步骤得到的数据创建张量时，torch.tensor()可以确保数据的独立性和安全性。

如何判断是否是numpy方法：

以下是判断是否适用于 torch.from_numpy() 的一些方法：

直接从文件读取为 numpy 数组：如果数据是通过 numpy 的加载函数（如 np.loadtxt()、np.load() 等）从文件（如 .csv、.npy 文件）中读取的，那么这些数据就是 numpy 数组形式。例如，xy = np.loadtxt('data.csv', delimiter=',', dtype=np.float32)，这里的 xy 就是 numpy 数组，可以使用 torch.from_numpy() 将其转换为 PyTorch 张量。
在 numpy 环境中生成的数据：如果数据是在 numpy 操作过程中生成的，比如通过 numpy 的运算（如 np.matmul(a, b) 计算矩阵乘法得到的结果数组）、随机数生成（如 np.random.randn(m, n) 生成 m×n 的正态分布随机数数组）等方式产生的数组，也是 numpy 数组，可以使用 torch.from_numpy()。

在Python中，可以使用 type() 函数来检查数据的类型。如果数据类型是 numpy.ndarray，那么就可以使用 torch.from_numpy()。例如：

import numpy as np
data = np.array([1, 2, 3])
print(type(data))  
# 如果输出为<class 'numpy.ndarray'>，则可以使用torch.from_numpy()

如果在整个数据处理管道中，数据一直是以 numpy 数组的形式在不同的函数或模块之间传递，那么在将数据传递给 PyTorch 相关操作之前，就可以使用 torch.from_numpy()。例如，在一个数据预处理模块中，数据经过了多种 numpy 函数的处理（如归一化、特征选择等），最后准备输入到 PyTorch 模型时，就适合使用 torch.from_numpy()。

总之，如果数据当前是以 numpy 数组的形式存在，并且希望在转换为 PyTorch 张量时节省内存和保持数据关联（例如后续可能还需要在 numpy 中对数据进行其他操作），就可以使用 torch.from_numpy()。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/59088.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！