数字探秘:用神经网络解密MNIST数据集中的数字!

用神经网络解密MNIST数据集中的数字!

    • 一. 介绍
      • 1.1 MNIST数据集简介
      • 1.2 MLP(多层感知器)模型介绍
      • 1.3 目标:使用MLP模型对MNIST数据集中的0-9数字进行分类
    • 二.数据预处理
      • 2.1 数据集的获取与加载
      • 2.2 数据集的探索性分析(EDA)
      • 2.3 数据预处理:归一化、展平图像数据
    • 三. MLP模型构建
      • 3.1 MLP模型结构介绍
      • 3.2 激活函数选择
      • 3.3 损失函数和优化算法选择
      • 3.4 模型训练
    • 四. 模型性能评估
      • 4.1 分类准确度(Accuracy)评估
      • 4.2 混淆矩阵(Confusion Matrix)分析
      • 4.3 精确率(Precision)、召回率(Recall)和F1分数(F1 Score)计算
      • 4.4 可视化误差分析
    • 五. 性能改进
      • 5.1 超参数调优
        • 5.1.1 学习率调整
        • 5.1.2 批量大小优化
      • 5.2 模型结构优化
        • 5.2.1 增加隐藏层和神经元数量
        • 5.2.2 正则化技术的应用
      • 5.3 数据增强(Data Augmentation)应用
        • 5.3.1 图像旋转、平移和缩放
    • 六. 结论
      • 6.1 模型性能总结
      • 6.2 可能的改进方向
      • 6.3 对于实际应用的启示

一. 介绍

1.1 MNIST数据集简介

MNIST(Modified National Institute of Standards and Technology database)是一个经典的手写数字数据集,常被用来测试机器学习算法的性能。它包含了大约70000张标准化的手写数字图像,每张图像是28x28像素,灰度图,标记从0到9的数字。这个数据集被广泛应用于数字识别的研究和实验中,是深度学习入门和基准测试的常用选择。
在这里插入图片描述

1.2 MLP(多层感知器)模型介绍

多层感知器(MLP)是一种经典的前馈人工神经网络模型,由一个或多个隐藏层组成,每个隐藏层由多个神经元(节点)组成。MLP的每个神经元与前一层的所有神经元相连,每条连接都有一个权重。通常,MLP包括一个输入层、若干隐藏层和一个输出层。每一层都通过一个非线性激活函数(如ReLU、sigmoid等)来处理输入数据,以产生非线性的模型输出。

MLP适合处理结构化数据,特别是在特征之间存在复杂关系或需要进行非线性映射时表现良好。在数字分类问题中,MLP通过学习输入数据的特征和模式,能够有效地识别和分类不同的数字。

1.3 目标:使用MLP模型对MNIST数据集中的0-9数字进行分类

本项目的主要目标是设计、实现和评估一个MLP模型,用于对MNIST数据集中的手写数字进行准确的分类。我们将通过以下步骤完成这一任务:

  • 数据预处理:包括加载数据集、标准化图像、划分训练集和测试集等。
  • 模型设计:定义MLP模型的结构,包括选择合适的层数、每层的神经元数量和激活函数。
  • 模型训练:使用训练集对MLP模型进行训练,通过反向传播算法优化模型参数。
  • 模型评估:使用测试集评估模型的性能,包括准确率、混淆矩阵等指标。
  • 性能优化:通过调整超参数、正则化技术和其他优化策略改进模型性能。

接下来,我们将详细展开每个步骤,并介绍如何在实际项目中实现这些内容。

二.数据预处理

2.1 数据集的获取与加载

在实现基于MNIST数据集的MLP模型之前,首先需要获取和加载数据集。MNIST数据集可以通过多种方式获取,包括直接从公共数据集存储库下载或使用机器学习库提供的API进行访问。以下是使用Python和相关库加载MNIST数据集的示例代码:

import tensorflow.keras as keras
from tensorflow.keras.datasets import mnist# 加载MNIST数据集,分为训练集和测试集
(X_train, y_train), (X_test, y_test) = mnist.load_data()print("训练集数据量:", X_train.shape[0])
print("测试集数据量:", X_test.shape[0])

2.2 数据集的探索性分析(EDA)

探索性数据分析(EDA)是数据科学中的重要步骤,有助于理解数据的结构、特征分布以及可能存在的问题。对于MNIST数据集,我们可以进行以下分析:

  • 数据形状和类型:检查数据集中图像和标签的维度和类型。
  • 类别分布:统计每个数字类别在数据集中的分布情况,确保类别平衡。
  • 图像可视化:随机可视化几个图像样本,检查图像质量和手写风格的多样性。
import matplotlib.pyplot as plt
import numpy as np# 查看类别分布
unique, counts = np.unique(y_train, return_counts=True)
plt.bar(unique, counts)
plt.title('Class Frequency')
plt.xlabel('Class')
plt.ylabel('Frequency')
plt.xticks(unique)
plt.show()# 随机可视化几个图像样本
plt.figure(figsize=(10, 10))
for i in range(25):plt.subplot(5, 5, i + 1)plt.imshow(X_train[i], cmap='gray')plt.title(f'Label: {y_train[i]}')plt.axis('off')
plt.show()

2.3 数据预处理:归一化、展平图像数据

在训练MLP模型之前,需要对图像数据进行预处理,以便提高模型训练的效果和收敛速度。常见的预处理步骤包括图像归一化和展平操作:

  • 归一化:将图像像素值缩放到0到1之间,有助于加速模型收敛并提高模型的稳定性。
  • 展平:将二维的28x28像素图像转换为一维向量,以作为MLP模型的输入。
# 归一化
X_train = X_train.astype('float32') / 255.0
X_test = X_test.astype('float32') / 255.0# 展平图像数据
X_train_flat = X_train.reshape((-1, 28*28))
X_test_flat = X_test.reshape((-1, 28*28))print("训练集展平后的形状:", X_train_flat.shape)
print("测试集展平后的形状:", X_test_flat.shape)

通过上述步骤,我们完成了对MNIST数据集的加载、探索性分析和预处理操作。接下来,可以设计和训练MLP模型,并对其性能进行评估。在后续章节中,我们将详细讨论如何构建和优化MLP模型,以及如何解释和改进其分类性能。

三. MLP模型构建

3.1 MLP模型结构介绍

多层感知器(MLP)是一种经典的前馈神经网络模型,适用于处理结构化数据和分类问题。MLP由输入层、若干隐藏层和输出层组成,每个层之间的神经元完全连接,并通过权重进行信息传递。以下是一个典型的MLP模型结构示例:

  • 输入层:接收展平后的图像数据作为输入,每个样本是一个长度为784的向量(对应28x28像素的展平图像)。
  • 隐藏层:可以包括一个或多个隐藏层,每个隐藏层包含多个神经元。隐藏层的选择通常基于任务的复杂性和数据的特征。
  • 输出层:最后一层通常是一个具有10个神经元的输出层,每个神经元对应一个数字类别(0到9)的概率。
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense# 定义MLP模型
model = Sequential([Dense(128, activation='relu', input_shape=(784,)),Dense(64, activation='relu'),Dense(10, activation='softmax')
])# 打印模型结构
model.summary()

在上面的示例中,我们创建了一个包含两个隐藏层(128个神经元和64个神经元)的MLP模型,输出层使用softmax激活函数以获得每个类别的概率分布。

3.2 激活函数选择

激活函数在神经网络中起到了非常重要的作用,它们增加了模型的非线性特性,使其能够学习复杂的数据模式和特征。常用的激活函数包括:

  • ReLU(Rectified Linear Unit): ( f(x) = \max(0, x) ),在隐藏层中常用,能够有效地缓解梯度消失问题。
  • sigmoid函数: ( f(x) = \frac{1}{1 + e^{-x}} ),用于二分类问题中的输出层。
  • softmax函数: ( f(x_i) = \frac{e^{x_i}}{\sum_{j} e^{x_j}} ),用于多分类问题中的输出层,将输出转换为概率分布。

在MLP模型中,通常在隐藏层使用ReLU激活函数,在输出层使用softmax激活函数来预测每个类别的概率。

3.3 损失函数和优化算法选择

选择合适的损失函数和优化算法对模型的性能和训练效率至关重要。

  • 损失函数:用于衡量模型预测值与真实标签之间的差异。对于多分类问题,常用的损失函数包括交叉熵损失函数(Categorical Crossentropy),它能够衡量两个概率分布之间的差异。

  • 优化算法:用于更新模型参数以最小化损失函数。常见的优化算法包括随机梯度下降(SGD)、Adam优化器等。Adam优化器结合了动量和自适应学习率调整,通常在训练深度学习模型时表现较好。

# 编译模型,选择损失函数和优化算法
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])

3.4 模型训练

模型构建完成后,我们需要对其进行训练。训练过程包括将模型参数调整到最佳状态,以便能够对新数据做出准确的预测。

四. 模型性能评估

4.1 分类准确度(Accuracy)评估

分类准确度是最常用的性能指标之一,它表示模型正确分类的样本比例。在MNIST数据集上,我们可以通过以下方式计算模型的分类准确度:

# 在测试集上评估模型
test_loss, test_acc = model.evaluate(X_test_flat, y_test, verbose=2)
print(f'测试集上的准确率:{test_acc:.4f}')

4.2 混淆矩阵(Confusion Matrix)分析

混淆矩阵是一种用于可视化模型预测结果的表格,显示了模型在每个类别上的真实预测情况。我们可以使用混淆矩阵来进一步分析模型在各个类别上的表现:

from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay# 预测测试集的类别
y_pred = model.predict_classes(X_test_flat)# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)# 可视化混淆矩阵
plt.figure(figsize=(10, 8))
ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=np.arange(10)).plot(cmap='Blues')
plt.title('Confusion Matrix')
plt.show()

4.3 精确率(Precision)、召回率(Recall)和F1分数(F1 Score)计算

精确率、召回率和F1分数是衡量分类器性能的重要指标,特别是在不平衡类别分布的情况下更为有用。它们的计算公式如下:

  • 精确率(Precision): ( \text{Precision} = \frac{TP}{TP + FP} ),其中TP是真阳性(正确预测为正例的样本数),FP是假阳性(错误预测为正例的样本数)。
  • 召回率(Recall): ( \text{Recall} = \frac{TP}{TP + FN} ),其中FN是假阴性(错误预测为负例的样本数)。
  • F1分数(F1 Score): ( F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}} ),综合考虑了精确率和召回率。
from sklearn.metrics import classification_report# 打印精确率、召回率和F1分数
print(classification_report(y_test, y_pred, target_names=[str(i) for i in range(10)]))

4.4 可视化误差分析

最后,我们可以通过可视化来分析模型在测试集上的误差,帮助我们理解模型预测错误的原因和模式:

# 找出预测错误的样本
incorrect_indices = np.where(y_pred != y_test)[0]# 随机选择一些错误样本进行展示
plt.figure(figsize=(12, 8))
for i, incorrect in enumerate(np.random.choice(incorrect_indices, size=25, replace=False)):plt.subplot(5, 5, i + 1)plt.imshow(X_test[incorrect], cmap='gray')plt.title(f'True: {y_test[incorrect]} Predicted: {y_pred[incorrect]}')plt.axis('off')
plt.tight_layout()
plt.show()

通过以上步骤,我们可以全面评估和理解MLP模型在MNIST数据集上的分类性能。下一步将是根据评估结果对模型进行优化和改进,以提高其在数字分类任务上的表现。

五. 性能改进

5.1 超参数调优

超参数是影响模型性能和训练速度的重要因素,包括学习率、批量大小、隐藏层神经元数量等。通过系统地调整这些超参数,我们可以找到最佳组合以改善模型性能。

5.1.1 学习率调整

学习率控制着模型参数更新的速度,过高的学习率可能导致模型在训练过程中震荡,而过低的学习率则会导致收敛速度缓慢。可以通过尝试不同的学习率来找到最优值。

from tensorflow.keras.optimizers import Adam# 定义不同的学习率
learning_rates = [1e-3, 1e-4, 1e-5]for lr in learning_rates:model = Sequential([Dense(128, activation='relu', input_shape=(784,)),Dense(64, activation='relu'),Dense(10, activation='softmax')])# 编译模型,选择优化器和学习率optimizer = Adam(learning_rate=lr)model.compile(optimizer=optimizer,loss='sparse_categorical_crossentropy',metrics=['accuracy'])# 训练模型history = model.fit(X_train_flat, y_train, epochs=10, batch_size=128, validation_data=(X_test_flat, y_test), verbose=0)# 打印最终的验证集准确率_, test_acc = model.evaluate(X_test_flat, y_test, verbose=0)print(f'学习率 {lr} 下的测试集准确率:{test_acc:.4f}')
5.1.2 批量大小优化

批量大小决定了在每次参数更新时用于计算梯度的样本数。通常情况下,较大的批量大小可以加快训练速度,但可能会影响模型的泛化能力。

# 尝试不同的批量大小
batch_sizes = [32, 64, 128]for bs in batch_sizes:model = Sequential([Dense(128, activation='relu', input_shape=(784,)),Dense(64, activation='relu'),Dense(10, activation='softmax')])# 编译模型,选择优化器和批量大小model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])# 训练模型history = model.fit(X_train_flat, y_train, epochs=10, batch_size=bs, validation_data=(X_test_flat, y_test), verbose=0)# 打印最终的验证集准确率_, test_acc = model.evaluate(X_test_flat, y_test, verbose=0)print(f'批量大小 {bs} 下的测试集准确率:{test_acc:.4f}')

5.2 模型结构优化

优化模型结构是提升模型性能的关键步骤之一,可以通过增加/减少隐藏层、调整神经元数量等方式来改进模型的表现。

5.2.1 增加隐藏层和神经元数量

在某些情况下,增加隐藏层或增加每层神经元数量可以增加模型的表达能力,从而提升性能。但需要注意避免过拟合问题。

# 增加隐藏层和神经元数量的示例
model = Sequential([Dense(256, activation='relu', input_shape=(784,)),Dense(128, activation='relu'),Dense(64, activation='relu'),Dense(10, activation='softmax')
])
5.2.2 正则化技术的应用

正则化技术(如L2正则化、dropout等)可以有效控制模型的复杂度,提升泛化能力,从而减少过拟合现象。

from tensorflow.keras.layers import Dropout
from tensorflow.keras import regularizers# 添加Dropout层进行正则化
model = Sequential([Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.01), input_shape=(784,)),Dropout(0.3),Dense(64, activation='relu', kernel_regularizer=regularizers.l2(0.01)),Dropout(0.3),Dense(10, activation='softmax')
])

5.3 数据增强(Data Augmentation)应用

对于图像数据,数据增强是一种有效的方法,通过对原始图像进行随机变换来生成新的训练样本,以增加数据的多样性和数量,从而提升模型的泛化能力。

5.3.1 图像旋转、平移和缩放
from tensorflow.keras.preprocessing.image import ImageDataGenerator# 创建图像增强生成器
datagen = ImageDataGenerator(rotation_range=10, width_shift_range=0.1, height_shift_range=0.1, zoom_range=0.1)# 在训练集上应用图像增强
datagen.fit(X_train.reshape(-1, 28, 28, 1))# 使用增强后的数据训练模型
model.fit(datagen.flow(X_train_flat, y_train, batch_size=32), epochs=10, validation_data=(X_test_flat, y_test))

通过以上方法,我们可以有效地优化和改进基于MNIST数据集的MLP模型的性能,提升其在数字分类任务上的表现。在实际应用中,建议结合交叉验证等技术,综合考虑模型在不同超参数组合下的表现,以获取最佳的性能结果。

六. 结论

6.1 模型性能总结

通过本文中的实验和分析,我们成功地实现了基于MNIST数据集的MLP(多层感知器)模型,用于识别手写数字图像。以下是我们对模型性能的总结:

  • 准确度评估:我们通过测试集对模型进行了准确度评估,通常能够达到90%以上的准确率,这表明MLP模型在处理MNIST数据集上具有良好的分类能力。
  • 混淆矩阵分析:混淆矩阵展示了模型在各个数字类别上的预测效果,能够清晰地看出模型在每个类别上的精确度和召回率。
  • 精确率、召回率和F1分数:通过计算精确率、召回率和F1分数,我们进一步评估了模型在不同类别上的分类表现,确保模型在各个类别上均有良好的性能。

总体而言,我们的MLP模型在MNIST数据集上展现出了较高的分类精度和稳定性,能够有效地区分手写数字。

6.2 可能的改进方向

尽管我们的模型已经取得了良好的结果,但仍然存在一些改进的空间,以进一步提升其性能和泛化能力:

  • 超参数调优:可以进一步探索不同的学习率、批量大小、隐藏层结构等超参数的组合,以找到最佳的模型配置。
  • 模型结构优化:考虑尝试更复杂的模型结构,如增加更深的隐藏层或者应用正则化技术来提升模型的表达能力和泛化能力。
  • 集成学习:可以尝试集成多个MLP模型,如投票集成或堆叠集成,以进一步提升模型的整体性能。
  • 数据增强:对于MNIST数据集这种小规模数据集,可以应用数据增强技术,如图像旋转、平移、缩放等,增加训练样本的多样性,从而提升模型的鲁棒性。

6.3 对于实际应用的启示

基于我们在MNIST数据集上的探索,我们可以得出以下对于实际应用的启示:

  • 模型迁移:虽然MNIST是一个简单的手写数字数据集,但是MLP模型的训练和优化方法可以迁移到更复杂的图像分类任务中,如物体识别、人脸识别等。
  • 自动化和优化:在实际应用中,可以结合自动化超参数搜索、模型选择和部署技术,以便更快速地优化和部署深度学习模型。
  • 持续学习:随着数据和任务的变化,模型需要不断更新和优化。因此,建立持续学习和监控的机制是确保模型长期性能的关键。

综上所述,通过本文对基于MNIST数据集的MLP模型的实现与性能评估,我们不仅提升了对深度学习模型的理解和应用能力,还为更复杂问题的解决提供了有益的经验和指导。在未来的工作中,可以进一步探索和应用新的技术,以不断提升模型的性能和应用效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/44255.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

骗子用出国月薪3万骗了1000多万上千名求职者被骗

日前,江苏省南通市崇川区人民法院开庭审理了一起涉及诈骗的案件,该案件 审理后引发全国求职者的关注以及热议。根据了解得知,这起案件的主犯是利用出 国劳务的虚假高薪职位位诱饵,最终有上千名求职者被骗上当了。文章来源于:股城网www.gucheng.com 根据法院审…

微信文件太大传不了?学会这些,微信秒变大文件传输神器

在数字化时代,微信已成为我们日常沟通的重要桥梁。然而,当需要在微信上传输大文件时,文件大小的限制往往让人束手无策。 今天,我们将分享一些实用的技巧,帮助你在微信上轻松传输大文件,无论是工作文档还是…

HTTP 概况

Web的应用层协议是超文本传输协议(HyperTextTransferProtocol,HTTP),它是 Web的核心。HTTP由两个程序实现:一个客户程序和一个服务器程序。客户程序和服务器程序运行在不同的端系统中,通过交换HTTP报文进行会话。HTTP定义了这些报文的结构以及…

彩虹小插画:成都亚恒丰创教育科技有限公司

彩虹小插画:色彩斑斓的梦幻世界 在繁忙的生活节奏中,总有一抹温柔的色彩能悄然触动心弦,那就是彩虹小插画带来的梦幻与宁静。彩虹,这一自然界的奇迹,被艺术家们巧妙地融入小巧精致的插画之中,不仅捕捉了瞬…

Oracle基础以及一些‘方言’(一)

1、什么是Oracle ORACLE数据库系统是美国ORACLE公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。 ORACLE 通常应用于大型系统的数据库产品。 ORACLE 数据库是目前世界…

vue使用 “xlsx-style“: “^0.8.13“ 报错

关于jszip not a constructor报错配置config.js文件后可能还报错的问题: 在node_modules处找到node_modules\xlsx-style\xlsx.js 文件。 将 if(typeof jszip undefined) jszip require(./jszip).JSZip;(应该在xlsx.js文件1339行左右) 替换成 if(typeof jszip und…

高压线束屏蔽效能测试之管中管法、线注入法

一、引言 上期推文介绍了高压线束屏蔽效能测试方法三同轴法,本篇文章将继续介绍高压线束相关测试方法——管中管法和线注入法。 二、管中管法 1、一般要求 管中管法参照IEC62153-4-7标准对高低压连接器进行零部件级屏蔽效能测试。在测试时,通过金属延长管…

3、视图和模板

续上一篇,这一篇 着重于创建公共接口——“视图” 第三部分——3、视图和模板 1、概述2、编写更多视图原理——django依次访问了什么文件 3、写一个真正有用的视图一个快捷函数 render() render——渲染 4、抛出404错误一个快捷函数 get_object_or_404() 5、使用模…

实时数仓和离线数仓的区别是什么,企业该如何选择合适的数仓架构?

目录 一、离线数仓 1. 离线数仓是什么? 2. 离线数仓的特点 3. 离线数仓的适用场景 二、实时数仓 1. 实时数仓是什么? 2. 实时数仓的特点 3. 实时数仓的适用场景 三、由数仓需求变化带来的数据仓库架构的演变 1. 传统数仓架构 2. 离线大数据架构 3. Lambd…

tensorflow之欠拟合与过拟合,正则化缓解

过拟合泛化性弱 欠拟合解决方法: 增加输入特征项 增加网络参数 减少正则化参数 过拟合的解决方法: 数据清洗 增大训练集 采用正则化 增大正则化参数 正则化缓解过拟合 正则化在损失函数中引入模型复杂度指标,利用给w增加权重,…

点线面推进未来智造

如今,宁波拥有门类齐全的制造业体系,形成了以石油化工、汽车及零部件、电工电器、纺织服装等为支柱的产业集群。 宁波工业的发展并非一蹴而就,蓝卓总经理谭彰详细解读了宁波制造业的发展历程与当下目标,从工业小市到工业大市、工业…

基于Matlab和Python泰勒图的绘制

一、泰勒图介绍 泰勒图:泰勒图1常用于评价模型的精度,常用的精度指标有相关系数,标准差以及均方根误差(RMSE)。一般而言,泰勒图中的散点代表模型,辐射线代表相关系数,横纵轴代表标准差,而虚线代表均方根误差。泰勒图一改以往用散点图这种只能呈现两个指标来表示模型精度…

Python数据结构的库之Fuk使用详解

概要 fuk 是一个用于处理 Python 数据结构的库,全称为 "Fast and Uncomplicated Kit"。它提供了一系列高效、简洁的数据结构实现,以及对 Python 内置数据结构的扩展。通过使用 fuk,开发者可以更加方便地处理列表、集合、字典等数据类型,提高代码的执行效率和可读…

vite+vue3拍照上传到nodejs服务器

一:效果展示: 拍照效果 二:Nodejs后端接口代码: 三:前端完整代码:

Vue基础--v-model/v-for/事件属性/侦听器

目录 一 v-model表单元素 1.1 v-model绑定文本域的value 1.1.1 lazy属性:光标离开再发请求 1.1.2 number属性:如果能转成number就会转成numer类型 1.1.3 trim属性:去文本域输入的前后空格 1.2v-model绑定单选checkbox 1.3代码展示 二 …

esp8266+micropython+irsend红外发射调试记录

在网上搜索esp8266micropython的红外发射库,没找到,发现 接收库是有的,可以参考:基于MicroPython的ESP8266连接外设IO(二)_micropython 红外接收-CSDN博客 可惜没有发射,很不方便。 这里都有介…

PHP财务记账管理系统小程序源码

理财小能手必备!揭秘财务记账管理系统的魔力✨ 🌟 引入篇:告别糊涂账,拥抱财务自由 你是否曾为月底的账单头疼不已?是否觉得自己的钱总是莫名其妙地消失?别担心,财务记账管理系统来拯救你的钱…

【机器学习】必会数学知识:一文掌握数据科学核心数学知识点(下),收藏~

核心数学知识点 1、引言2、数据科学必会数学知识2.13 K均值聚类2.14 决策树2.15 随机森林2.16 梯度下降2.17 随机梯度下降(SGD)2.18 卷积2.19 拉普拉斯变换2.20 傅里叶变换2.21 信息论2.22 时间序列分析2.23 生成模型与判别模型2.24 支持向量机&#xff…

基于Python的哔哩哔哩数据分析系统设计实现过程,技术使用flask、MySQL、echarts,前端使用Layui

背景和意义 随着互联网和数字媒体行业的快速发展,视频网站作为重要的内容传播平台之一,用户量和内容丰富度呈现爆发式增长。本研究旨在设计并实现一种基于Python的哔哩哔哩数据分析系统,采用Flask框架、MySQL数据库以及echarts数据可视化技术…

NSObject‘s MetaClass 的 super_class 指向谁 ?

在 Objective-C 运行时系统中,NSObject 是所有类的根类。为了理解 NSObject 的元类(MetaClass)以及它的 super_class 指针指向谁,我们需要理解元类的继承关系。 类和元类的关系 每个类对象都有一个 isa 指针,指向其元…