PyTorch 与 TensorFlow:机器学习框架之战

alt

深度学习框架是简化人工神经网络 (ANN) 开发的重要工具,并且其发展非常迅速。其中,TensorFlow 和 PyTorch 脱颖而出,各自在不同的机器学习领域占有一席之地。但如何为特定项目确定理想的工具呢?本综合指南[1]旨在阐明它们的优点和缺点。

起源

  • TensorFlow:诞生于 Google Brain 团队的大脑,TensorFlow 从专有工具转变为开源。作为一个端到端平台,它提供从基本算术运算到神经网络部署的一切。其适应性体现在与CPU、GPU、TPU、移动设备等平台的兼容性上。值得注意的是,谷歌、Uber 和微软等行业巨头已将 TensorFlow 集成到他们的运营中。

  • PyTorch:PyTorch 于 2016 年推出,通过将用户友好性与高性能相结合而引起了共鸣。其 Pythonic 设计方法和动态计算图使其成为研究社区的首选。主要用 C++ 开发,其效率非常显着,并且在 Tesla Autopilot 和 Uber 的 Pyro 等平台中的采用进一步证明了其功能。

优势

TensorFlow

  • 丰富的生态系统:其全面的库和工具使 TensorFlow 成为机器学习任务的整体解决方案。
  • 多功能性:它的兼容性扩展到多种语言,包括 C++、JavaScript 和 Python。
  • TensorBoard:一种直观的工具,提供可视化功能,可简化神经网络检查和调试。

PyTorch

  • 以用户为中心:其以 Python 为中心的特性确保了与 Python 代码的无缝集成,这使其对数据科学家极具吸引力。
  • 动态计算图:PyTorch 对动态计算图的支持允许对模型进行实时调整。
  • 轻松的多 GPU 支持:使用 PyTorch,数据并行性和计算任务的分配并不复杂。

流行趋势

alt

一段时间内 PyTorch 和 TensorFlow 之间流行度的动态变化可以与这些框架领域的重大事件和里程碑联系起来:

  • TensorFlow 的初始受欢迎程度:在我们时间线的早期阶段,TensorFlow 在受欢迎程度方面具有明显的优势。这可以归功于谷歌的大力支持及其广泛的工具,可以满足初学者和专业人士的需求。
  • PyTorch 的崛起:展望未来,PyTorch 开始获得动力。许多人发现它的方法对于研究和实验来说更加灵活,在吸引注意力方面发挥了作用。此外,随着 PyTorch 获得更多资源和支持,其用户群也在增长。
  • 最近的情况:到最后,PyTorch 和 TensorFlow 都已经在机器学习领域占据了自己的角色。对于那些寻求大规模部署和行业解决方案的人来说,TensorFlow 仍然是一个不错的选择。 PyTorch 因其强调灵活性而受到许多人的欢迎,特别是在研究领域。

局限

TensorFlow

  • 复杂性:虽然多功能性是一种优势,但它可能会带来一些复杂性,这可能会让一些人望而生畏。
  • 死板:一旦设置了计算图,进行更改并不简单。
  • 有限的初始 GPU 语言支持:早期的 TensorFlow 版本有 GPU 和语言限制。

PyTorch

  • 生产环境:虽然 PyTorch 在研究方面表现出色,但过渡到全面生产有时需要额外的步骤。
  • 可视化:PyTorch 开箱即用的可视化能力与 TensorBoard 的可视化能力不太匹配。

静态与动态计算图

TensorFlow 和 PyTorch 之间的基本区别在于它们的计算图方法。 TensorFlow 采用静态计算图,而 PyTorch 提倡动态计算图。

TensorFlow

在 TensorFlow 中,首先定义计算图。只有设置好图表后,您才能在会话中运行它并输入数据。

import tensorflow as tf

# Define the graph
a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
sum_ab = a + b

# Initiate a session
with tf.Session() as sess:
    # Input data and execute the graph
    result = sess.run(sum_ab, feed_dict={a: 1, b: 2})

print(result)

PyTorch

使用 PyTorch,操作在编写时执行,并且图形是动态构建的。

import torch

# Operations are performed immediately
a = torch.tensor(1.0)
b = torch.tensor(2.0)
sum_ab = a + b

print(sum_ab)

虽然 TensorFlow 的静态方法可以在图编译期间进行优化,但它可能不太直观,特别是对于那些刚接触深度学习的人来说。相反,PyTorch 的动态特性更加灵活,特别有利于研究。

部署与集成

在考虑部署时,尤其是在生产环境中,框架与各种平台的兼容性和易于集成变得至关重要。

TensorFlow

  • TensorFlow Serving:专为生产就绪部署而设计。它支持多种模型和版本控制,确保无缝过渡和回滚。
  • TensorFlow Lite:专为移动和嵌入式设备量身定制,允许在资源有限的边缘设备上进行机器学习。
  • 云集成:作为 Google 产品,TensorFlow 与 Google Cloud 高效集成,提供可扩展的训练和部署等优势。

PyTorch

  • TorchServe:TorchServe 是一个相对较新的补充,提供了一种大规模部署 PyTorch 模型的简单方法。它无缝处理版本控制和日志记录等任务。
  • ONNX 兼容性:PyTorch 模型可以导出为 ONNX(开放神经网络交换)格式,这确保了深度学习框架之间的互操作性以及在各种平台上更轻松的部署。
  • 本机移动支持:PyTorch 提供本机库来支持 Android 和 iOS,从而简化了移动设备上的部署过程。

社区支持和文档

框架的增长、适应性和可持续性通常反映了其社区的活力。

TensorFlow

  • 庞大的社区:TensorFlow 存在的时间较长,并且已经建立了一个庞大的社区。在论坛或 Stack Overflow 上找到常见(和不常见)问题的解决方案的可能性更高。
  • 全面的文档:TensorFlow 的文档内容丰富,为各种任务和级别提供教程、指南和最佳实践。

PyTorch

  • 快速增长的社区:虽然较新,PyTorch 的社区正在快速增长,尤其是在学术和研究领域。
  • 用户友好的文档:PyTorch 的文档清晰简洁,经常因其简单性和易于理解而受到称赞,特别是对于初学者来说。

未来发展

密切关注每个框架的发展方向可以深入了解它们的寿命和相关性。

TensorFlow

  • 对 TF 2.x 的投资:随着 TensorFlow 2.x 的发布,借用了其他框架的一些最佳功能,明显推动了使 TensorFlow 更加用户友好和直观。
  • 不断发展的生态系统:借助 TensorFlow.js(用于基于浏览器的应用程序)和 TensorFlow Hub(用于可重用模型组件)等工具,TensorFlow 生态系统不断扩展。

PyTorch

  • 研究到生产:借助 TorchScript 和 TorchServe 等工具,PyTorch 正在弥合研究和生产之间的差距,确保模型可以无缝过渡。
  • 扩展库:TorchText、TorchVision 和 TorchAudio 等库正在不断开发,为从 NLP 到计算机视觉的一系列应用提供预训练的模型和数据集。

选择

在 TensorFlow 和 PyTorch 之间进行选择并不是要选择“最佳”框架,而是要找到最符合您需求的框架。这两个框架都具有独特的优势,并且在解决其最初的局限性方面取得了重大进展。通过评估您的项目需求、您对 Python 的熟悉程度、可扩展性的需求、部署偏好以及您正在寻求的社区支持类型,您可以做出确保效率和生产力的选择。随着深度学习世界的不断发展,这些框架也会不断发展,保持更新将使您能够一次又一次地做出明智的决策。

Reference

[1]

Source: https://medium.com/@kaveh.kamali/pytorch-vs-tensorflow-the-battle-of-machine-learning-frameworks-908cc301f795

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/115929.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kotlin中的委托、属性委托和延迟加载

委托模式是一种常用的设计模式,用于将某个对象的责任委托给另一个对象来处理。在Kotlin中,委托可以通过关键字by来实现,主要分为类委托和属性委托两种形式。此外,Kotlin还提供了延迟加载的功能,可以在需要时才进行初始…

WebService SOAP1.1 SOAP1.12 HTTP PSOT方式调用

Visual Studio 2022 新建WebService项目 创建之后启动运行 设置默认文档即可 经过上面的创建WebService已经创建完成,添加HelloWorld3方法, [WebMethod] public string HelloWorld3(int a, string b) { //var s a b; return $"Hello World ab{a …

老卫带你学---leetcode刷题(8. 字符串转换整数 (atoi))

8. 字符串转换整数 (atoi) 问题: 请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C 中的 atoi 函数)。 函数 myAtoi(string s) 的算法如下: 读入字符串并丢弃无用的前导空…

如何高效率地阅读论文

▚ 01 Active versus passive reading: how to read scientific papers? 📢小疑则小悟,大疑则大悟,不疑则不悟。 If you read/do research with small questions in mind, you learn small things. If you do so with big questions in…

华为OD 食堂供餐(100分)【java】A卷+B卷

华为OD统一考试A卷B卷 新题库说明 你收到的链接上面会标注A卷还是B卷。目前大部分收到的都是B卷。 B卷对应20022部分考题以及新出的题目,A卷对应的是新出的题目。 我将持续更新最新题目 获取更多免费题目可前往夸克网盘下载,请点击以下链接进入&#xff…

Unable to connect to the server: x509: certificate is valid for问题解决

文章目录 环境描述问题描述问题原因解决方案额外问题问题描述问题解决方案新问题 环境描述 Kubernetes版本1.15测试客户端centos7 问题描述 将构建于内网网络环境上的kubernetes集群的/etc/kubernetes/admin.conf文件拷贝到外网的一台装有kubernetes客户端的设备上&#xff…

机器学习中的核方法

一、说明 线性模型很棒,因为它们易于理解且易于优化。他们受苦是因为他们只能学习非常简单的决策边界。神经网络可以学习更复杂的决策边界,但失去了线性模型良好的凸性特性。 使线性模型表现出非线性的一种方法是转换输入。例如,通过添加特征…

ISP Pipeline典型场景要点SAT、Bokeh、MFNR、HDR

目录 一、概述 二、通用流程 三、典型场景 1. SAT 2. Bokeh背景虚化 MFNR 3. HDR(DOL、DCG等) 一、概述 本文解释isp pipeline的一些非常典型的场景,不同厂商对pipeline的连接及node的port口设计可能不同,但核心的思想相同…

【面试经典150 | 区间】用最少数量的箭引爆气球

文章目录 Tag题目来源题目解读解题思路方法一:合并区间 其他语言python3 写在最后 Tag 【合并区间】【排序】【数组】 题目来源 452. 用最少数量的箭引爆气球 题目解读 每个气球都有一个占据x轴的一个范围,在这个范围里射出一只箭就会引爆该气球&…

matlab常用函数

绘图函数 一、plot():二维图形绘制 1、plot(y): 对于只含一个输入参数的plot函数,如果输入参数y为向量,则以该参数为纵坐标,横坐标从1开始至与向量的长度相等;如果输入参数y是矩阵时,则按列绘…

C++笔记之关于函数名前的取址符

C笔记之关于函数名前的取址符 相关博文:C之指针探究(十一):函数名的本质和函数指针 code review! 文章目录 C笔记之关于函数名前的取址符一.函数名可以被视为指向函数的地址二.sayHello和&sayHello是不是等同?三.Qt信号与槽中的取地址符& 一…

2023全新小程序广告流量主奖励发放系统源码 流量变现系统

2023全新小程序广告流量主奖励发放系统源码 流量变现系统 分享软件,吃瓜视频,或其他资源内容,通过用户付费买会员来变现,用户需要付费,有些人喜欢白嫖,所以会流失一部分用户,所以就写了这个系统…

【2024秋招】2023-9-14 最右后端开发线下一面

1 自我介绍 2 计算机网络 2.1 说说你对tcp滑动窗口的理解 TCP 滑动窗口是 TCP 协议流量控制的一个重要机制。它的主要目的是确保发送方不会因为发送太多数据而使接收方不堪重负。下面我会详细地描述滑动窗口的概念: 窗口的大小: 滑动窗口的大小&#…

Node编写用户登录接口

目录 前言 服务器 编写登录接口API 使用sql语句查询数据库中是否有该用户 判断密码是否正确 生成JWT的Token字符串 配置解析token的中间件 配置捕获错误中间件 完整的登录接口代码 前言 本文介绍如何使用node编写登录接口以及解密生成token,如何编写注册接…

关于 硬盘

关于 硬盘 1. 机械硬盘1.1 基本概念1.2 工作原理1.3 寻址方式1.4 磁盘磁记录方式 2. 固态硬盘2.1 基本概念2.2 工作原理 1. 机械硬盘 1.1 基本概念 机械硬盘即是传统普通硬盘,硬盘的物理结构一般由磁头与盘片、电动机、主控芯片与排线等部件组成。 所有的数据都是…

利用dns协议发起ddos反射攻击

利用DNS服务器发起反射型DDOS,攻击带宽 基本思路: 1、利用any类型的dns查询,可完成发送少量请求数据,获得大量返回数据。 2、将原请求地址改为受害者地址,则dns会向受害者返回大量数据,占用带宽 警告&…

c# ManualResetEvent WaitHandle 实现同步

//本文演示了ManualResetEvent 类的非静态set()、Reset()、WaitOne()和 //WaitHandle类的静态方法WaitAllWaitAll() //它们用于线程间的同步控制。 //实现了如下功能:线程1(定时控制)通知线程2和线程3采集数据 //线程2和3数据采集完了&am…

QCC 音频输入输出

QCC 音频输入输出 QCC蓝牙芯片(QCC3040 QCC3083 QCC3084 QCC5181 等等)支持DAC、I2S、SPDIF输出,AUX、I2S、SPDIF、A2DP 输入 蓝牙音频输入,模拟输出是最常见的方式。 也可以再此基础上动态切换输入方式。 输入方式切换参考 sta…

POJ 3470 Walls 树上分桶

今天太晚了&#xff0c;代码先发上&#xff0c;思路明天说吧。 陌上花开&#xff0c;树上分桶 #include <iostream> #include <algorithm> #include <vector> using namespace std; /*** 对于y1不等于y2的&#xff0c;可以用datC求解&#xff0c;对于x1不等…

AD9371 官方例程HDL详解之JESD204B TX侧时钟生成 (一)

AD9371 系列快速入口 AD9371ZCU102 移植到 ZCU106 &#xff1a; AD9371 官方例程构建及单音信号收发 ad9371_tx_jesd -->util_ad9371_xcvr接口映射&#xff1a; AD9371 官方例程之 tx_jesd 与 xcvr接口映射 梳理 AD9371 时钟&#xff0c;理解采样率和各个时钟之间的关系 …