言有三新书出版,《深度学习之图像识别(全彩版)》上市发行,配套超详细的原理讲解与丰富的实战案例!...

4fb8677c6dcf3b20f49b7a741f514f13.jpeg

各位同学,今天有三来发布新书了,名为《深度学习之图像识别:核心算法与实战案例(全彩版)》,本次书籍为我写作并出版的第6本书籍。

前言

2019年5月份我写作了《深度学习之图像识别:核心技术与案例实战》,迄今已经重印5次,被众多读者所认可。可见如下:言有三新书预售,不贵,有料

3724b82f7d30c0c7d1177c88e0d91f4c.jpeg

2019年版(全黑白印刷,正文267页)

只是这是笔者第一次执笔写书,当时笔者在互联网公司上班,时间非常紧,加之自身能力不足和水平所限,所写内容还不算太成熟和完备,仍然有大量可以改进、扩展和深入的空间。近几年,笔者进一步对相关技术进行了潜心研究和实践,对相关技术有了更加深入和全面的认识,其间还出版了几本相关图书,还与大量读者和技术爱好者进行过多次线上和线下交流,并在各大平台上进行过多场直播,收集了大量的反馈和建议,因此觉得有必要重新写一本书,分享更新、更系统、更细致和更深入的计算机视觉技术。

2022年笔者终于有一段较为空闲的时间,便投入到这本书的写作中,经过大半年时间的编写,终于完成了本书的写作任务。这本书相对于2019年版,成为了一本更系统、更细致的书籍。(2019年的书已经停止印刷,不会再提供支持,请大家直接购买2023年的新书)

本次出版的新书虽然不敢说是完美的,但的确是尽最大努力去争取做到完美,从最终呈现的效果也要远好于之前出版的图书,尤其是全彩色印刷,用的纸张还非常上档次,最终呈现的效果我还是比较满意的。我想,只要我还在这个领域,这本书我一定会持续维护下去,争取把这本书做成一本内容丰富、主体很齐全、配套很超值的经典图书,让这本书成为业内有口皆碑的书。

736539082476134e71be67fe6627a65f.jpeg

2023年版(全彩色印刷,正文382页)

2023年版相对于2019年版的提升

在本次出版的书籍中,我们保留了2019年版本的主要目录结构,但是重点进行了几处修改,包括:将全书所有的案例统一调整为Pytorch框架代码,新增了许多图表以及关键技术细节的描述,新增了若干重要领域的应用实践代码。

具体而言,2023年版和2019年版的不同之处主要有:

  • 修改:给第1章和第2章新增了大量插图,便于初学者更好地进行学习。

319f46fef1435733f66f91b13e131b34.png

  • 修改:给第3章新增了大量插图,将原来第7章中的数据可视化内容移动到本章。

2fe418f7cc2754c2bbae7f04d3e130e1.png

  • 修改:给第4章新增了大量插图和最新研究与应用,将案例代码统一调整为Pytorch框架格式。

ef2c21ebb31e195d9834f793835dc9ed.png

  • 调整:调整了目标检测与图像分割的顺序,将目标检测放置在图像分割之前,使得本书的阅读顺序更加合理。

  • 修改:给第5章新增了大量插图和最新研究与应用(如添加了YOLO v4和v5等内容),将案例代码统一调整为Pytorch框架格式。

d233c1d36bc4baa1b07ecff1ea7d2229.png

  • 修改:给第6章新增了大量插图和最新研究与应用,将案例代码统一调整为Pytorch框架格式。

8e37f9cc45830b025d32b34806a075d1.png

  • 修改:将原来第7章中的数据可视化内容移动到第3章,添加了3个全新的案例实践。

86124d558413a310928591ac6f646de7.png

  • 修改:给第8章新增了大量插图和最新研究与应用,删除了原来的案例,添加了3个全新的案例实践(结构化模型剪枝,8bit模型量化,经典知识蒸馏)。

f79ed3cbf4b46a5ec23be7f60a19eb4f.png

  • 删除:删除了原来第9章损失函数,并将相关内容融入到其他章节中。

  • 修改:优化调整了原来第10章模型部署的内容。

本书内容

本书从深度学习的背景和基础理论开始讲起,然后介绍了深度学习中的数据使用,以及计算机视觉的三大核心领域,图像分类、图像分割、目标检测,并介绍了深度学习模型的可视化、模型的优化和部署。

1f6706c5230a90d4befde64b54cbbdff.jpeg

9abf183905d16f3a2ac5cb2afaed5a1a.jpeg

d8a92a8e763fe855dbe3c44acb186c86.jpeg

全书正文约382页,共计9章,目录如下:

ad245e3b3ddf1a03d5a92505eef4c791.png

第1章 神经网络与卷积神经网络基础

本章首先介绍了神经网络的生物基础与数学模型,然后介绍了卷积神经网络的基础知识,这也是当前深度学习模型的基础。

a422d0080075ec9da12358a2b5feb042.png

第2章 深度学习优化基础

本章首先介绍了深度学习优化相关的内容,包括激活函数、标准化方法、正则化方法、最优化方法、参数初始化方法等。然后介绍了深度学习主流开源框架,包括Pytorch等,并对其特点与性能做了对比;本章旨在让大家对深度卷积神经网络的优化有一个较为全面的认识,给后续章节的学习打好基础。

26239f9ae7c335744583dd91e11bc009.png

第3章 深度学习中的数据

本章首先介绍了深度学习发展过程中的几个数据集,给读者展示了数据集对深度学习的重要性;接着介绍了几大重要发展方向中的数据集;接着讲述了数据的收集、整理及标注、数据增强等相关问题;最后讲述了数据的可视化与分析。本章是工业项目中非常重要的环节,也是实践性很强的内容。

5b61e556d598f2284e6346a007d7d37b.png

第4章 图像分类

本章首先介绍了图像分类的基础、然后详细介绍了图像分类的各个研究领域,包括多类别图像分类,细粒度图像分类,多标签图像分类,半监督与无监督图像分类,零样本图像分类;在案例实践部分,首先以一个从零搭建的图像分类模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分类任务的实践流程;然后介绍了一个细粒度级别的图像分类任务,以一个较好的基准模型,展示了较难的图像分类任务特点以及模型训练调优。

1997e94adcd3d80b6d3a33633df04ea6.png

第5章  目标检测

本章首先介绍了目标检测的基础和基本流程,并讲述了一个经典的V-J目标检测框架;然后介绍了基于深度学习的目标检测任务的研究方法与发展现状,并重点总结了其中的二阶段目标检测方法与一阶段目标检测方法;最后给出了一个目标检测任务实践,使用当下比较主流的YOLO系列中的YOLO v3框架来进行模型训练与测试。

f30ff5424cdf7ef6423f8568e26f262d.png

第6章  图像分割

本章首先介绍了图像分割基础与研究方向,简单回顾了经典的图像分割方法;然后介绍了基于深度学习的图像分割方法的基本原理与核心技术,并重点总结了语义分割模型、实例分割模型、Image Matting模型;在案例实践部分,以一个从零搭建的图像分割模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分割任务的实践流程;然后介绍了一个更加复杂的人像软分割任务,展示了典型Image Matting框架的代码实现与模型训练。

9dca89d713c765fb610952d67e3c6edd.png

第7章  模型可视化

本章首先对深度学习中的模型结构可视化做了介绍,然后对具有代表性的模型可视化分析方法进行了介绍;在案例实践部分,分别对梯度法可视化、反卷积可视化、激活热图可视化方法进行了代码分析与实践。

2d6bdb0cadc91983781a214e5cf29fd4.png

第8章  模型压缩

本章首先介绍了轻量级模型设计的代表性方法,然后依次详细介绍了模型剪枝、模型量化、模型蒸馏的代表性模型;在案例实践部分,分别进行了基于缩放因子的结构化模型剪枝、基于KL散度的8bit模型量化、以及经典的知识蒸馏框架的代码实现与模型训练和压缩。

f68622c069f9f1fccc82a86be6ff8432.png

第9章  模型部署

本章依托微信小程序平台从3个方面介绍了模型部署的问题。首先介绍了微信小程序的前端开发基础,然后介绍了微信小程序的服务端开发基础,最后介绍服务端算法功能代码的实现,完成了一个可供所有读者验证的工业级线上模型的部署。

6b5e04759ce838ecf892c0a356eefe20.png

详细内容请大家直接阅读书籍。本书内容由浅入深,讲解图文并茂,紧随工业界和学术界的最新发展,理论和实践紧密结合,给出了大量的图表与案例分析。本书抛开了过多的数学理论,完整地剖析了深度学习在图像识别领域中各个维度的重要技术,而不是只停留于理论的阐述和简单的结果展示,更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习,将会对深度学习领域的图像识别技术和其在实际开发中的应用有更深的理解。本书所有实战代码统一使用Pytorch框架,适合新手使用学习。

本书内容邀请了业内资深专家进行阅读,并获得了推荐,推荐语如下:

——中国科学院半导体研究所研究员  鲁华祥

本书作者是一位在深度学习图像识别领域工作多年的有为青年,他根据自己的工作经历和经验编写了本书。本书以理论结合案例的方式系统地介绍计算机视觉中的图像分类、目标检测和图像分割几个核心方向的研究方法,并对模型的可视化分析和压缩方法进行比较深入的介绍,是一本不可多得的图像识别技术读物,推荐给那些对深度学习和图像识别技术感兴趣的人阅读,一定大有裨益。

——阿里巴巴达摩院计算机视觉大模型负责人  赵德丽

本书对深度学习的基础知识做了详细的介绍,并且配了大量的示意图,做到了图文并茂,读起来通俗易懂。本书知识和实践并重,结合多个具体的应用案例讲解,适合学习深度学习基础知识和常见理解类任务的读者阅读。本书作者著有多本相关技术图书,经验丰富,相信这本图像识别类的图书也会给AI的普及带来助力。

——虾皮技术总监   陈强

一个好的算法工程师必须要有扎实的理论基础和丰富的实战经验。本书重点介绍了计算机视觉领域近几年的一些新进展,另外还详细地阐述了如何完成工业界的一些实用且通用的视觉任务。如果你想要成为一名计算机视觉算法工程师,那么建议你系统地阅读本书,在作者的引领下提高自己的水平。

——高途AI算法负责人  邱学侃

随着多模态大模型的技术发展,AI的能力在不断进化,我们马上就要进入真正的AI时代。以感知世界为目标的视觉图像分析算法为切入口,言有三的这本书是我们学习AI技术的一个很好的敲门砖,该书对图像识别领域中多个实际任务的数据集、任务目标、基本方法和工具框架都进行了详细介绍。读者朋友可以通过阅读本书快速理解深度学习的基础概念和理论,并能够根据相关的实战案例介绍亲自动手实践,从而提高学习效率,提升学习效果。

556912a4a6a66c638d429c8fd436a0bf.jpeg

更多图像识别的拓展学习资料

由于作者的水平和时间有限,书籍出版的时间滞后,以及图文形式本身的限制,因此在我们公众号还有针对各个章节的视频学习资料,其中与本书相关的如下:

c0a06d43f61d0c3240f501463d856669.jpeg

【总结】初学深度学习与CV,资料找的一塌糊涂,这个超过2000页PPT,有这个80小时讲解的CV核心内容就够了

d73b1a3b8adb190aa94085743c9975b6.png

【视频课】永久免费!3小时快速掌握深度学习CV数据使用核心内容

4defde787ae59375bebedbb54e09e78b.png

【视频课】CV必学,超10小时,3大模块,5大案例,循序渐进地搞懂图像分类理论与实践!

d8da4314700c49a5069f68569260e8d7.png

【视频课】CV必学,超10小时,3大模块,4大案例,循序渐进地搞懂图像分割!

e076336a9c08d202ea00aa26de593e20.png

【视频课】CV必学,超30小时,4大模块,4大案例,循序渐进地搞懂目标检测!

a05ea1f922540fb7327d13d54a7ad873.png

【视频课】AI必学,超3小时,3大模块,掌握模型分析核心技术!

a503de446d608ccbb7a5a416a3c3f326.png

【视频课】AI必学,超10小时,4大模块,掌握模型优化核心技术!

5f7b9bdf9a58f29ab85b728702aa335e.png

【视频课】快速掌握6大模型部署框架(Pytorch+NCNN+MNN+Tengine+TensorRT+微信小程序)!

更多学习资料,大家可以关注有三AI公众号进行检索。

如何获得本书

现在是时候来谈谈如何获得本书了,本书定价159元,当前有4种方法可以获得。

(1) 在本文下方留言,至本周五早上十点(8月25日10:00),点赞最高的第1到5名,可获赠书【专属签名版书籍】一本。

小提示:购买与赠送的【专属签名版书籍】预计发货时间为本周末,统一使用京东快递。

(2) 在有三AI小鹅通知识店铺购买【专属签名版书籍】(签章为红黑色,随机发货),购买完成后凭订单记录联系有三本人微信Longlongtogo】,发送收货地址。(发票可开*印刷品*深度学习之图像识别书籍)

caaa7f7544e7aee1c89046913779313e.jpeg

(3) 参加有三AI-CV初阶-基础算法组,跟随我们社区系统性地学习深度学习与计算机视觉相关课程,本书为配套辅导教材,将随组赠送。

【一对一学习小组】2023年有三AI-CV初阶-基础算法组发布,如何夯实深度学习图像识别算法理论基础与实践

0ec9b9c964cbfb40c2cb80a23fe4f66c.png

(4) 书籍也已经在京东等平台进行预售,大家可以扫码或者点击原文链接进行跳转购买。

3efb8088a5355a5e224b2c7e8f782d8b.jpeg

另外,本月底我将在深圳有两天的AI视觉项目研发和部署免费公开课,届时每天也会现场送出本书,参与者有一定的机会获得,想要过来学习的也可以来碰碰运气,了解详情如下:

【培训】第一届深圳AI视觉项目研发与部署免费线下公开课启动!2023年8月底与我们相约,开启AI视觉之旅!

fcd01fe27e8961308077dc0160c48dee.png

致谢

书籍创作需要集齐众人之力,特此集中进行致谢。

感谢欧振旭编辑的信任,联系我写作了本书,在后续的编辑校稿中完成了巨大的工作量。

感谢有三AI公众号,有三AI付费课程的忠实粉丝们,是你们的阅读和付费支持让我有了坚持继续前行的力量。

转载文章请后台联系

侵权必究

3607927f8e063a4fe37d95c64694b161.jpeg

51e3ef6ac3d4bb9c55ddd337b511a4e3.png

71dfc630dcd51a6986c05ecdacca5367.png

往期精选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/55797.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring框架

一.简介 Spring 是 2003 年兴起,通过使用IOC 和 AOP 组成的轻量级的为解决企业级开发的Java开发框架 官网:Spring | Home 特点: 1.轻量级:资源jar包少,运行时框架占用资源少,效率更高 2.IOC(Inversion of Control),由Spring容器来对对象实行管理 3.AOP(面相切面的编程)是…

华为eNSP模拟器中,路由器如何添加serial接口

在ensp模拟器中新建拓扑后,添加2个路由器。 在路由器图标上单击鼠标右键,选择设置选项。 在【视图】选项卡的【eNSP支持的接口卡】窗口查找serial接口卡。 选择2SA接口卡,将其拖动到路由器空置的卡槽位。 如上图所示,已经完成路由…

【C++】map的奇葩用法:和函数结合

2023年8月26日&#xff0c;周六下午 今天才发现map居然还能这样用... #include <iostream> #include <map> #include <functional>void printOne() {std::cout << "已经打印出1" << std::endl; }void printTwo() {std::cout <<…

2023年03月 C/C++(四级)真题解析#中国电子学会#全国青少年软件编程等级考试

第1题:最佳路径 如下所示的由正整数数字构成的三角形: 7 3 8 8 1 0 2 7 4 4 4 5 2 6 5 从三角形的顶部到底部有很多条不同的路径。对于每条路径,把路径上面的数加起来可以得到一个和,和最大的路径称为最佳路径。你的任务就是求出最佳路径上的数字之和。 注意:路径上的每一步…

Go语言入门记录:从基础到变量、函数、控制语句、包引用、interface、panic、go协程、Channel、sync下的waitGroup和Once等

程序入口文件的包名必须是main&#xff0c;但主程序文件所在文件夹名称不必须是main&#xff0c;即我们下图hello_world.go在main中&#xff0c;所以感觉package main写顺理成章&#xff0c;但是如果我们把main目录名称改成随便的名字如filename也是可以运行的&#xff0c;所以…

AI创作助手:介绍 TensorFlow 的基本概念和使用场景

目录 背景 环境测试 入门示例 背景 TensorFlow 是一个强大的开源框架&#xff0c;用于实现深度学习和人工智能模型。它最初由 Google 开发&#xff0c;现在已经成为广泛使用的机器学习框架之一。 TensorFlow 简单来说就是一个用于创建和运行机器学习模型的库。它的核心概念…

Vue2向Vue3过度核心技术路由

目录 1 路由介绍1.思考2.路由的介绍3.总结 2 路由的基本使用1.目标2.作用3.说明4.官网5.VueRouter的使用&#xff08;52&#xff09;6.代码示例7.两个核心步骤8.总结 3 组件的存放目录问题1.组件分类2.存放目录3.总结 4 路由的封装抽离5 Vue路由-重定向1.问题2.解决方案3.语法4…

(vue)el-table 怎么把表格列中相同的数据 合并为一行

(vue)el-table 怎么把表格列中相同的数据 合并为一行 效果&#xff1a; 文档解释&#xff1a; 写法&#xff1a; <el-table:data"tableData"size"mini"class"table-class"borderstyle"width:100%"max-height"760":span-…

【集合学习ConcurrentHashMap】ConcurrentHashMap集合学习

ConcurrentHashMap集合学习 一、JDK1.7 和 1.8 版本ConcurrenHashMap对比分析 JDK 1.7版本 在JDK 1.7版本ConcurrentHashMap使用了分段锁的方式&#xff08;对Segment进行加锁&#xff09;&#xff0c;其实际结构为&#xff1a;Segment数组 HashEntry数组 链表。由很多个 …

Shiro认证框架

目录 概述 认证授权及鉴权 Shiro框架的核心组件 基本流程 spring bootshiromybatisPlus...实现用户登录 step1:准备工作 (1)坐标 (2)连接数据库 (3)JavaBean (4)dao数据访问层 (5)密码工具类 DigestsUtil (6)配置类 step2&#xff1a;认证功能 step3:授权鉴权 概述…

一文1500字从0到1搭建 Jenkins 自动化测试平台

Jenkins 自动化测试平台的作用 自动化构建平台的执行流程&#xff08;目标&#xff09;是&#xff1a; 我们将代码提交到代码托管工具上&#xff0c;如github、gitlab、gitee等。 1、Jenkins要能够检测到我们的提交。 2、Jenkins检测到提交后&#xff0c;要自动拉取代码&#x…

leetcode.105 从前序和中序遍历序列构造二叉树

题目描述&#xff1a; 给定两个整数数组 preorder 和 inorder &#xff0c;其中 preorder 是二叉树的先序遍历&#xff0c; inorder 是同一 棵树的中序遍历&#xff0c;请构造二叉树并返回其根节点。 题目要求&#xff1a; 1 < preorder.length < 3000inorder.length…

软件工程(十四) 设计模式之结构型模式(二)

1、组合模式 简要说明 将对象组合成树形结构以表示“整体-部分”的层次结构,使得用户对单个对象和组合对象的使用具有一致性。 速记关键字 树形目录结构 类图如下 由类图其实可以看出,组合模式就是将具有父子关系的结构,组装形成一棵树,并且根据规范,树干节点和叶子节…

【算法专题突破】双指针 - 快乐数(3)

目录 1. 题目解析 2. 算法原理 3. 代码编写 写在最后&#xff1a; 1. 题目解析 题目链接&#xff1a;202. 快乐数 - 力扣&#xff08;Leetcode&#xff09; 这道题的题目也很容易理解&#xff0c; 看一下题目给的示例就能很容易明白&#xff0c; 但是要注意一个点&#…

MyBatis之动态sql

目录 一、MyBatis动态sql 1.1 是什么 1.2 作用 1.3 优点 1.4 特殊标签 1.5 代码演示 二、#和$的区别 2.1 #使用 2.2 $使用 2.3 综合 2.4 代码演示 三、resultType与resultMap的区别 3.1 关于resultType 3.2 关于resultMap 3.3 两者区别 3.4 代码演示 一、MyBati…

退出屏保前玩一把游戏吧!webBrowser中网页如何调用.NET方法

本文主要以 HackerScreenSaver 新功能的开发经历介绍 webBrowser中网页如何调用.NET方法的过程。 1. 背景 之前开源了一款名为 HackerScreenSaver 的 Windows 屏保程序。该程序具有模拟黑客炫酷界面的特点&#xff0c;用户可以将自定义的网页作为锁屏界面。不久前&#xff0c;…

【C++笔记】C++之类与对象(下)

【C笔记】C之类与对象(下&#xff09; 1、再看构造函数1.1、构造函数的初始化列表1.2、C支持单参数的构造函数的隐式类型转换1.3、匿名对象 2、Static成员2.1、为什么要有静态成员变量&#xff1f;2.2、一个类的静态成员变量属于这个类的所有对象2.3、静态成员函数 3、友元3.1、…

基于体素形态学测量分析(VBM)的工具包比较及其在年龄预测中的应用

摘要 基于体素的形态学测量分析(VBM)通常用于灰质体积(GMV)的局部量化。目前存在多种实现VBM的方法。然而&#xff0c;如何比较这些方法及其在应用中的效用(例如对年龄效应的估计)仍不清楚。这会使研究人员疑惑他们应该在其项目中使用哪种VBM工具包。本研究以用户为中心&#…

基于单片机的智能数字电子秤proteus仿真设计

一、系统方案 1、当电子称开机时&#xff0c;单片机会进入一系列初始化&#xff0c;进入1602显示模式设定&#xff0c;如开关显示、光标有无设置、光标闪烁设置&#xff0c;定时器初始化&#xff0c;进入定时器模式&#xff0c;如初始值赋值。之后液晶会显示Welcome To Use Ele…

摆动序列【贪心算法】

摆动序列 如果连续数字之间的差严格地在正数和负数之间交替&#xff0c;则数字序列称为 摆动序列 。第一个差&#xff08;如果存在的话&#xff09;可能是正数或负数。仅有一个元素或者含两个不等元素的序列也视作摆动序列。 class Solution {public int wiggleMaxLength(int…