深度学习基础与实战:Python实现

深度学习基础与实战:Python实现

深度学习是机器学习的一个重要分支,通过多层神经网络实现对数据的自动特征提取和建模。本文将介绍深度学习的基础概念、常用框架以及一个完整的实战项目,帮助读者从基础入门到实际应用。

目录

  1. 深度学习概述
  2. 深度学习基础
    • 神经网络结构
    • 前向传播与反向传播
    • 激活函数
  3. Python中的深度学习框架
    • TensorFlow
    • Keras
    • PyTorch
  4. 深度学习模型
    • 简单神经网络
    • 卷积神经网络
    • 循环神经网络
  5. 实战项目:手写数字识别
  6. 总结

1. 深度学习概述

深度学习通过模拟人脑的神经网络结构来进行数据处理和模式识别,广泛应用于图像识别、自然语言处理和语音识别等领域。深度学习模型通过多层神经元的非线性变换,逐层提取数据的特征,实现复杂的模式识别和决策。

2. 深度学习基础

神经网络结构

神经网络由多个层(输入层、隐藏层和输出层)组成,每一层包含若干个神经元。神经元之间通过权重相连,权重的调整使得神经网络能够学习和预测。

import numpy as np# 定义一个简单的神经网络
class SimpleNN:def __init__(self, input_size, hidden_size, output_size):self.W1 = np.random.randn(input_size, hidden_size)self.W2 = np.random.randn(hidden_size, output_size)def forward(self, X):self.z1 = np.dot(X, self.W1)self.a1 = self.sigmoid(self.z1)self.z2 = np.dot(self.a1, self.W2)self.a2 = self.sigmoid(self.z2)return self.a2def sigmoid(self, s):return 1 / (1 + np.exp(-s))def sigmoid_derivative(self, s):return s * (1 - s)
前向传播与反向传播

前向传播是计算神经网络输出的过程,反向传播则是通过计算损失函数的梯度来更新权重。

class SimpleNN:# ... previous code ...def backward(self, X, y, output):self.output_error = y - outputself.output_delta = self.output_error * self.sigmoid_derivative(output)self.z1_error = self.output_delta.dot(self.W2.T)self.z1_delta = self.z1_error * self.sigmoid_derivative(self.a1)self.W1 += X.T.dot(self.z1_delta)self.W2 += self.a1.T.dot(self.output_delta)
激活函数

激活函数用于引入非线性特性,使得神经网络可以拟合复杂的函数。常用的激活函数包括Sigmoid、ReLU和Tanh。

import matplotlib.pyplot as pltx = np.linspace(-10, 10, 100)
sigmoid = 1 / (1 + np.exp(-x))
relu = np.maximum(0, x)
tanh = np.tanh(x)plt.figure(figsize=(10, 6))
plt.plot(x, sigmoid, label='Sigmoid')
plt.plot(x, relu, label='ReLU')
plt.plot(x, tanh, label='Tanh')
plt.legend()
plt.show()

3. Python中的深度学习框架

Python中有许多强大的深度学习框架,这些框架提供了丰富的工具和接口,方便我们进行深度学习模型的构建和训练。

TensorFlow

TensorFlow是由Google开发的开源深度学习框架,支持大规模分布式计算。

import tensorflow as tf# 定义一个简单的全连接层
model = tf.keras.Sequential([tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])# 训练模型
model.fit(X_train, y_train, epochs=10)
Keras

Keras是一个高级深度学习API,能够运行在TensorFlow、Theano和CNTK之上,具有简洁和易用的特点。

from keras.models import Sequential
from keras.layers import Dense# 定义一个简单的神经网络
model = Sequential([Dense(64, input_dim=20, activation='relu'),Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])# 训练模型
model.fit(X_train, y_train, epochs=10, batch_size=32)
PyTorch

PyTorch是由Facebook开发的深度学习框架,支持动态图计算,灵活性高。

import torch
import torch.nn as nn
import torch.optim as optim# 定义一个简单的神经网络
class SimpleNN(nn.Module):def __init__(self):super(SimpleNN, self).__init__()self.fc1 = nn.Linear(20, 64)self.fc2 = nn.Linear(64, 10)def forward(self, x):x = torch.relu(self.fc1(x))x = torch.softmax(self.fc2(x), dim=1)return xmodel = SimpleNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练模型
for epoch in range(10):outputs = model(X_train)loss = criterion(outputs, y_train)optimizer.zero_grad()loss.backward()optimizer.step()

4. 深度学习模型

简单神经网络

简单神经网络包含一个或多个隐藏层,每个隐藏层包含若干个神经元。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(32, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
卷积神经网络

卷积神经网络(CNN)擅长处理图像数据,通过卷积层和池化层提取图像特征。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Flatten(),tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
循环神经网络

循环神经网络(RNN)擅长处理序列数据,通过循环结构捕捉数据的时间依赖性。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Embedding(input_dim=10000, output_dim=64),tf.keras.layers.SimpleRNN(128),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)

5. 实战项目:手写数字识别

我们将使用MNIST数据集进行手写数字识别任务,结合前述技术,进行完整的实现。

数据导入与预处理
import tensorflow as tf# 加载数据
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()# 数据归一化
X_train, X_test = X_train / 255.0, X_test / 255.0# 增加通道维度
X_train = X_train[..., tf.newaxis]
X_test = X_test[..., tf.newaxis]
模型构建与训练
model = tf.keras.Sequential([tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Flatten(),tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=5, validation_data=(X_test, y_test))
模型评估
# 模型评估
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Accuracy: {accuracy}')# 可视化预测结果
import matplotlib.pyplot as plt
import numpy as np# 预测
predictions = model.predict(X_test)# 绘制前10个测试样本及其预测结果
for i in range(10):plt.subplot(2, 5, i+1)plt.imshow(X_test[i].reshape(28, 28), cmap='gray')plt.title(f'Pred: {np.argmax(predictions[i])}, True: {y_test[i]}')plt.axis('off')
plt.show()

6. 总结

本文详细介绍了深度学习的基础概念、常用框架、深度学习模型以及一个完整的实战项目。通过本文的学习,读者可以掌握深度学习的基础知识和技术,并能在实际项目中应用这些知识进行模型构建和训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/44920.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CF 1986D. Mathematical Problem

原题链接:Problem - 1986D - Codeforces 题意:一串长度最多为20的由数字组成的字符串,在这些数字中间可以添加字符串长度减去二数量的符号,加或者乘,例如1234,就可以添加加号或者乘号二个,变成…

vue中el-table前端导出excel数据表格

一、el-table为正常时&#xff0c;导出方法如下&#xff1a; 1.添加导出按钮 <el-button class"greenLinearbg dc" size"small" click"webExportTotalExcel()" v-if"totalBillShow">导出</el-button>2.导出方法 // we…

Spring开发实践(二)

EnableAsync 和 Async 注解的使用方法 EnableAsync 和 Async 是Spring框架中的两个注解&#xff0c;用于启用和使用异步方法执行。它们可以帮助你在Spring应用程序中实现异步编程&#xff0c;从而提高应用程序的性能和响应速度。 EnableAsync EnableAsync 注解用于启用Sprin…

ARM Ubuntu 主机安装指定版本Python

要在你的ARM Linux主机上安装Python 3.12&#xff0c;你可以从源码编译安装。以下是具体步骤&#xff1a; 步骤1&#xff1a;安装依赖 首先&#xff0c;确保你有必要的编译工具和依赖包&#xff1a; sudo apt-get update sudo apt-get install -y build-essential libssl-d…

【每日一练】python的类.对象.成员.行为.方法传参综合实例(保姆式教学)

运行结果: 本节课程内容&#xff1a;类的使用 1.掌握类的定义和使用方法 2.掌握类的成员的方法使用 3.掌握self关键字的作用 4.定义在类里的函数是类的一种行为&#xff0c;叫方法 5.带传参的行为使用方法 类基本分两部分组成&#xff1a;1.属性,2.方法 类的使用语法&#xf…

springCloud整合Dubbo案例

前言&#xff1a; 好久没有使用dubbo了&#xff0c;温习一下。 一、先搭建一个SpringCloud框架 整体框架如下图 1. 先创建一个父工程&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4…

开发者必读:获取电商API的多种渠道

开发电商软件往往需要对接电商API&#xff0c;电商API可以从哪些渠道获取&#xff1f;下面给大家介绍两种获取渠道。 一、从电商平台开放平台获取电商API 电商平台的开放平台是获取电商API最直接的渠道&#xff0c;但是电商平台较多&#xff0c;每一个电商平台都需要单…

Vue3 引入腾讯地图 包含标注简易操作

1. 引入腾讯地图API JavaScript API | 腾讯位置服务 (qq.com) 首先在官网注册账号 并正确获取并配置key后 找到合适的引入方式 本文不涉及版本操作和附加库 据体引入参数参考如下图 具体以链接中官方参数为准标题 在项目根目录 index.html 中 写入如下代码 <!-- 引入腾…

Socks5代理为什么比HTTP代理快?

在数字化日益深入的时代&#xff0c;网络安全和隐私保护成为了公众关注的焦点。为了应对网络威胁&#xff0c;保护个人隐私和数据安全&#xff0c;代理技术应运而生。在众多代理协议中&#xff0c;SOCKS5代理和HTTP代理是两种较为常见的选择。然而&#xff0c;为何SOCKS5代理在…

网页设计零基础入门:前端技术全攻略

在当今互联网飞速发展的时代&#xff0c;前端网页设计已经成为一个备受关注的领域。随着其重要性的不断提高&#xff0c;越来越多的专业人士和爱好者开始对前端设计感兴趣&#xff0c;希望通过掌握这项技术开辟自己的职业道路。然而&#xff0c;对于新手设计师来说&#xff0c;…

ollama + lobechat 搭建自己的多模型助手

背景 人工智能已经推出了快2年了&#xff0c;各种模型和插件&#xff0c;有渐渐变成熟的趋势&#xff0c;打造一个类似 hao123网站的人工智能模型入口&#xff0c;也变得有需求了。用户会去比较多个ai给出的答案&#xff0c;作为程序员想拥有一台自己的GPU服务器来为自己服务。…

如何在vue的项目中导入阿里巴巴图标库

阿里巴巴矢量图标库官网&#xff1a;iconfont-阿里巴巴矢量图标库 选择你喜欢的图标&#xff0c;添加入库 点击添加至项目&#xff0c;并新建文件夹&#xff0c;点击确定 选择font-class&#xff0c;点击生成代码 代码生成后&#xff0c;在网站上打开 全选复制到style 点击复制…

【TB作品】MSP430F6638单片机,频率计

基于 MSP430-FFTB6638 实验箱 频率测量与通信系统 利用 MCU 定时器模块相关功能设计实现数字频率计功能&#xff0c;测量范围&#xff1a;100~10000Hz&#xff0c; 测量误差≤1%&#xff0c;测量速度≤1 秒。测量结果本地显示&#xff08;段式 LCD、字符型 LCD、点阵 LCD &…

springboot系列九: 接收参数相关注解

文章目录 基本介绍接收参数相关注解应用实例PathVariableRequestHeaderRequestParamCookieValueRequestBodyRequestAttributeSessionAttribute 复杂参数基本介绍应用实例 自定义对象参数-自动封装基本介绍应用实例 基本介绍 1.SpringBoot 接收客户端提交数据 / 参数会使用到相…

【小白也能看的懂】想要玩转AI大模型,这4招你得知道

前言 对于大部分人来说&#xff0c;能够灵活使用AI工具&#xff0c;并对自己每个常用的AI工具优劣势很清楚&#xff0c;就已经足够了。不过&#xff0c;毕竟AI发展实在太快&#xff0c;多了解一些相关的知识点&#xff0c;以全局的视角去看AI&#xff0c;可以避免管中窥豹&…

编程语言现状:深入剖析与未来展望

编程语言现状&#xff1a;深入剖析与未来展望 在数字化时代的浪潮中&#xff0c;编程语言作为信息科技领域的基石&#xff0c;正经历着前所未有的变革与发展。本文将从四个方面、五个方面、六个方面和七个方面&#xff0c;深入剖析编程语言的现状&#xff0c;并展望其未来的发…

【错题集-编程题】买卖股票的最好时机(四)(动态规划)

力扣对应题目链接&#xff1a;188. 买卖股票的最佳时机 IV - 力扣&#xff08;LeetCode&#xff09; 牛客对应题目链接&#xff1a;买卖股票的最好时机(四)_牛客题霸_牛客网 (nowcoder.com) 一、分析题目 1、状态表示 为了更加清晰的区分买入和卖出&#xff0c;我们换成有股…

【鸿蒙学习笔记】通过用户首选项实现数据持久化

官方文档&#xff1a;通过用户首选项实现数据持久化 目录标题 使用场景第1步&#xff1a;源码第2步&#xff1a;启动模拟器第3步&#xff1a;启动entry第6步&#xff1a;操作样例2 使用场景 Preferences会将该数据缓存在内存中&#xff0c;当用户读取的时候&#xff0c;能够快…

springboot对象参数赋值变化

java springboot 项目&#xff0c; 通过接口修改Person类 name值&#xff0c; 在别的类中&#xff0c;注入Person类 Resource Person person&#xff0c; 为什么拿不到 接口修改的 name的值&#xff0c;是Person类 不同的对象造成的 吗 参数对象和注入对象区别 Person类&…

云WAF | 云waf基础知识详解

随着数字时代的到来&#xff0c;网络安全问题越来越突出&#xff0c; Web应用防火墙&#xff08;WAF&#xff09;是保障 Web应用安全的一道重要防线。在云计算环境下&#xff0c;云环路由云平台&#xff08;WAF&#xff09;的出现&#xff0c;其融合了 WAF的能力和云计算的灵活…