深度学习1 -- 开头

一 前言

感觉用这玩意越来越多,所以想学学。不过没想好怎么学,也没有提纲,买了两本书,一本是深度学习入门,小日子写的。还有一本就是花书。还有就是回Gatech参加线上课程,CS7643。

CS 7643: Deep Learning | Online Master of Science in Computer Science (OMSCS)

二 深度学习有什么

提纲大概是这样的。

https://omscs.gatech.edu/sites/default/files/documents/2024/Syllabi-CS%207643%202024-1.pdf

Week1:

Module 1: Introduction to Neural Networks Go through Welcome/Getting Started Lesson 1: Linear Classifiers and Gradient Descent Readings:  DL book: Linear Algebra background  DL book: Probability background  DL book: ML Background  LeCun et al., Nature '15  Shannon, 1956

Week2:

Lesson 2: Neural Networks Readings:  DL book: Deep Feedforward Nets  Matrix calculus for deep learning  Automatic Differentiation Survey, Baydin et al.

Week3:

Lesson 3: Optimization of Deep Neural Networks Readings:  DL book: Regularization for DL  DL book: Optimization for Training Deep Models

Week4:

Module 2: Convolutional Neural Networks (OPTIONAL) Lesson 6: Data Wrangling Lesson 5: Convolution and Pooling Layers Readings:  Preprocessing for deep learning: from covariance matrix to image whitening  cs231n on preprocessing  DL book: Convolutional Networks  Optional: Khetarpal, Khimya, et al. Reevaluate: Reproducibility in evaluating reinforcement learning algorithms." (2018). See related blog post

Week5:

Lesson 6: Convolutional Neural Network Architectures

Week6:

Lesson 7: Visualization Lesson 8: PyTorch and Scalable Training Readings:  Understanding Neural Networks Through Deep Visualization  Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization

Week7:

Lesson 9: Advanced Computer Vision Architectures Lesson 10: Bias and Fairness Readings:  Fully Convolutional Networks for Semantic Segmentation

Week8:

Module 3: Structured Neural Representations Lesson 11: Introduction to Structured Representations Lesson 12: Language Models Readings:  DL Book: Sequential Modeling and Recurrent Neural Networks (RNNs)

Week9:

Lesson 13: Embeddings Readings:  word2vec tutorial  word2vec paper  StarSpace paper

Week10:

Lesson 14: Neural Attention Models Readings:  Attention is all you need  BERT Paper The Illustrated Transformer 

Week11:

Lesson 15: Neural Machine Translation Lesson 16: Automated Speech Recognition (ASR)

Week12:

Module 4: Advanced Topics Lesson 17: Deep Reinforcement Learning Readings:  MDP Notes (courtesy Byron Boots)  Notes on Q-learning (courtesy Byron Boots)  Policy iteration notes (courtesy Byron Boots)  Policy gradient notes (courtesy Byron Boots)

Week13:

Lesson 18: Unsupervised and Semi-Supervised Learning

Week14:

Lesson 19: Generative Models Readings:  Tutorial on Variational Autoencoder  NIPS 2016 Tutorial: Generative Adversarial Networks

从提纲可以看到,核心还是神经网络

然后就是网络的几种架构。卷积神经网络(CNN):主要用于图像处理和计算机视觉任务。**循环神经网络(RNN)**及其变种(如LSTM、GRU):主要用于处理序列数据,如时间序列分析和自然语言处理。生成对抗网络(GAN):用于生成逼真的数据样本,如图像生成。自编码器(Autoencoder):用于无监督学习和特征提取。

大概就是这些,看起来也不是太多。。。

三 AI,机器学习,深度学习的关系

下面这个图说明很好,一下就概括了三者的关系。

AI是一个很宽泛的概念,应该说人工智能这个课题就涵盖了一切。

机器学习说的是计算机能够在没有明确编程的情况下自动改进其性能的技术。机器学习依赖于从数据中学习模式和规律,从而做出预测或决策。机器学习的方法包括监督学习、无监督学习和强化学习。常用算法有线性回归、决策树、支持向量机、K-均值聚类和神经网络等。机器学习是实现 AI 的一种方法,通过数据和算法让机器具备学习和改进的能力。

深度学习是机器学习的一个子集,它利用多层神经网络来模拟人脑的工作方式,从大量数据中提取和学习特征。深度学习在处理复杂模式识别任务方面比较优秀。深度学习的核心是深度神经网络(DNN),包括卷积神经网络(CNN)和递归神经网络(RNN)。这些网络通过多个隐藏层逐层提取数据的高层次特征。深度学习是机器学习的一种方法,主要通过多层神经网络实现。它是机器学习中处理复杂数据和任务(如图像识别和自然语言处理)的一种高级技术。

主流的深度学习有,

图像分类:使用卷积神经网络(CNN)进行图像分类,如猫狗识别、物体检测等。

语音识别:使用循环神经网络(RNN)或长短期记忆网络(LSTM)进行语音识别和转换。
自然语言处理:使用变换器(Transformers)模型进行文本分类、情感分析、翻译等任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/30774.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【stm32-新建工程-寄存器版本】

stm32-新建工程-寄存器版本 ■ 下载相关STM32Cube官方固件包(F1,F4,F7,H7)■ 1. ST官方搜索STM32Cube■ 2. 搜索 STM32Cube■ 3. 点击获取软件■ 4. 选择对应的版本下载■ 5. 输入账号信息■ 6. 出现下载弹框&#xff…

怎么开启22端口访问权限,让别的机器通过ssh或者向日葵等远程控制工具链接

在Ubuntu 24.04上开启22端口访问权限,并允许其他机器通过SSH或向日葵等远程控制工具进行连接,您需要进行以下几步操作: 1. 安装并配置SSH服务器 安装OpenSSH服务器: sudo apt update sudo apt install openssh-server检查SSH服务状态: sudo …

推荐 2 个 牛哔哄哄 的 GitHub 项目

推荐两个开源的 GitHub 项目,一个基于大模型的企业级知识库问答系统,支持管理企业知识库、对话问答、RAG 等功能。 另外一个是计算机视觉的工具箱,使用它你可以在你电脑上实现人体跟踪、分割、检测等一系列计算机视觉的场景。 01 基于 LLM 大…

CR、 LF、CRLF的区别

一、CR LF CRLF的区别 CR (Carriage Return),LF (Line Feed),以及 CRLF (Carriage Return Line Feed) 是用于表示文本中换行的控制字符,它们在不同的操作系统和环境中有着不同的使用习惯: CR (Carriage Return) 含义&#xff1…

【unity笔记】二、海洋系统Crest Ocean System插件使用

一、介绍 Crest 是 Unity 技术先进的海洋系统。 它专为性能而设计,并大量使用细节级别 (LOD) 策略和 GPU 加速来实现快速更新和渲染。它还具有高度的灵活性,允许对水形状/泡沫/动态波浪/等进行任何自定义输入,并具有直…

奇迹MU服务器租用一个月需要多少钱?

在网络游戏产业迅猛发展的今天,越来越多的人参与到各种各样的网络游戏当中。其中,《奇迹MU》作为一款经典的多人在线角色扮演游戏,吸引了大量玩家的关注与热爱。为了保证游戏的流畅运行和玩家体验,租用高性能的服务器至关重要。 《…

01 基础入门 编写你的第一个 Go 语言程序

从这节课开始,我会带你走进 Go 语言的世界。我会用通俗易懂的语言,介绍 Go 语言的各个知识点,让你可以从零开始逐步学习,再深入它的世界。不管你以前是否接触过 Go 语言,都可以从这个专栏中受益。 现在,让…

时隔一年,SSD大涨价?

同样产品,2T,去年400多到手,今年700。 去年 今年

【机器学习】MSE和MAE损失函数有什么区别?回归问题的常用损失函数

在机器学习和统计学中,均方误差(Mean Squared Error, MSE)和平均绝对误差(Mean Absolute Error, MAE)是两种常用的损失函数,用于评估模型预测值与真实值之间的差异。它们的区别主要体现在对误差的处理方式和…

使用 Netty 自定义解码器处理粘包和拆包问题详解

使用 Netty 自定义解码器处理粘包和拆包问题详解 在网络编程中,粘包和拆包问题是常见的挑战。粘包是指多个数据包在传输过程中粘在一起,而拆包是指一个数据包在传输过程中被拆分成多个部分。Netty 是一个高性能、事件驱动的网络应用框架,提供…

从零开始精通Onvif之录像存储

💡 如果想阅读最新的文章,或者有技术问题需要交流和沟通,可搜索并关注微信公众号“希望睿智”。 概述 Onvif的录像存储功能主要由Media、Recording和Replay三个关键服务共同支持。它们协同工作,为录像的存储、检索和播放提供了标准…

3ds Max软件下载安装:3D建模软件 轻松开启你的建模之旅!

3ds Max,在建模过程中,网格建模和NURBS建模两大技术发挥着不可或缺的作用。网格建模允许用户通过顶点、边和面等元素的调整,精确地塑造出模型的形态;而NURBS建模则以其优秀的曲线和曲面处理能力,为设计师们提供了更为平…

迅为RK3568驱动教程第十八期-PWM

系统性PWM课程,完全掌握PWM。采用框架学习法,从基础知识、PWM子系统框架、API函数理论由面到点,逐个击破。通过SG90舵机,呼吸灯的控制把理论转为动手能力。最后从零实现输入捕获驱动程序,深入探究,体验一把…

关键字where 、in、not in、or、and、逻辑运算等组合使用

提示:条件筛选所有的关键字都可以进行任意的组合 文章目录 文章目录Mysql数据库内where关键字的常见用法Mysql数据库中几种比较运算符where之比较查询的方法where之逻辑运算【重点 常用】where之模糊查询(类似于正则)【重点、常用】where之范…

《人工智能导论》书面作业

第 1 章:绪论 1、分别解释人工智能的三个主要学派的代表人物和主要思想,并给出每个学派的一个实际应用实例。 符号主义(Symbolists 或 逻辑主义): 代表人物:马文闵斯基(Marvin Minsky&#xf…

dash二次确认

☆ 问题描述 在Dash应用中实现按钮的二次确认功能可以通过使用 dcc.ConfirmDialog 组件来实现。当用户点击按钮时,显示一个确认对话框,用户确认后才执行实际操作。以下是一个示例代码: ★ 解决方案 import dash from dash import dcc, htm…

了解软件开发生命周期 (SDLC)

介绍 软件开发生命周期 (SDLC) 是一种系统化、有序化的方法,用于按时、在预算内交付高质量、可靠的软件。SDLC 涵盖从初始系统概念到替换或退役的所有内容,可详细了解整个软件交付过程。 历史与演变 软件开发生命周期 (SDLC) 概念出现于 20 世纪 60 年…

网络安全练气篇——Web与Http基础

目录 Web安全 一、 大纲 二、 Web 简介 1、什么是 WEB 2、WEB 发展史 静态页面 多媒体阶段 CGI 阶段 AJAX MVC RESTful 云服务 3、WEB 工作方式 进一步讲解 什么是 URL 三、 HTTP 简介 HTTP 请求报文: 请求方法: 请求头部:…

人工智能大模型之开源大语言模型汇总(国内外开源项目模型汇总)

开源大语言模型完整列表 Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。 所谓"语言模型",就是只用来处理语言文…

一文带你理清同源和跨域

1、概述 前后端数据交互经常会碰到请求跨域,什么是跨域,为什么需要跨域,以及常用有哪几种跨域方式,这是本文要探讨的内容。 同源策略(英文全称 Same origin policy)是浏览器提供的一个安全功能。同源策略限制了从同一个源加载的…