基于飞桨paddle波士顿房价预测练习模型测试代码

基于飞桨paddle波士顿房价预测练习模型测试代码
导入基础库

#paddle:飞桨的主库,paddle 根目录下保留了常用API的别名,当前包括:paddle.tensor、paddle.framework、paddle.device目录下的所有API;
import paddle
#Linear:神经网络的全连接层函数,包含所有输入权重相加的基本神经元结构。在房价预测任务中,使用只有一层的神经网络(全连接层)实现线性回归模型。
from paddle.nn import Linear
#paddle.nn:组网相关的API,包括 Linear、卷积 Conv2D、循环神经网络LSTM、损失函数CrossEntropyLoss、激活函数ReLU等;
#paddle.nn.functional:与paddle.nn一样,包含组网相关的API,如:Linear、激活函数ReLU等,二者包含的同名模块功能相同,运行性能也基本一致。 
#差别在于paddle.nn目录下的模块均是类,每个类自带模块参数;paddle.nn.functional目录下的模块均是函数,需要手动传入函数计算所需要的参数。
#在实际使用时,卷积、全连接层等本身具有可学习的参数,建议使用paddle.nn;而激活函数、池化等操作没有可学习参数,可以考虑使用paddle.nn.functional。
import paddle.nn.functional as F
#NumPy(Numerical Python的简称)是高性能科学计算和数据分析的基础包
import numpy as np
#os 操作系统库
import os
#random 椭机数库
import random

#数据处理

#数据处理
#====================================================
def load_data():# 从文件导入数据datafile = 'housing.data'data = np.fromfile(datafile, sep=' ', dtype=np.float32)# 每条数据包括14项,其中前面13项是影响因素,第14项是相应的房屋价格中位数feature_names = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', \'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV' ]feature_num = len(feature_names)# 将原始数据进行Reshape,变成[N, 14]这样的形状data = data.reshape([data.shape[0] // feature_num, feature_num])# 将原数据集拆分成训练集和测试集# 这里使用80%的数据做训练,20%的数据做测试# 测试集和训练集必须是没有交集的ratio = 0.8offset = int(data.shape[0] * ratio)    #404*0.8=323=offsettraining_data = data[:offset]      #获取-训练集# 计算train数据集的最大值,最小值maximums, minimums = training_data.max(axis=0), training_data.min(axis=0)# 记录数据的归一化参数,在预测时对数据做归一化global max_valuesglobal min_valuesmax_values = maximumsmin_values = minimums# 对数据进行归一化处理for i in range(feature_num):data[:, i] = (data[:, i] - min_values[i]) / (maximums[i] - minimums[i])# 训练集和测试集的划分比例training_data = data[:offset]test_data = data[offset:]return training_data, test_data
#==================================================== 
# 验证数据集读取程序的正确性
training_data, test_data = load_data()
print(training_data.shape)   #=(404, 14)
print(training_data[1,:])   

#模型设计

#模型设计
#==================================================== 
class Regressor(paddle.nn.Layer):# self代表类的实例自身def __init__(self):# 初始化父类中的一些参数super(Regressor, self).__init__()# 定义一层全连接层,输入维度是13,输出维度是1self.fc = Linear(in_features=13, out_features=1)# 网络的前向计算def forward(self, inputs):x = self.fc(inputs)return x
#==================================================== 

#训练配置

#训练配置 
# 声明定义好的线性回归模型
model = Regressor()
# 开启模型训练模式
model.train()
# 加载数据
training_data, test_data = load_data()
# 定义优化算法,使用随机梯度下降SGD
# 学习率设置为0.01
opt = paddle.optimizer.SGD(learning_rate=0.01, parameters=model.parameters())    
#模型实例有两种状态:训练状态.train()和预测状态.eval()。
# 训练时要执行正向计算和反向传播梯度两个过程,而预测时只需要执行正向计算,
# 为模型指定运行状态,  **# 训练过程**
#训练过程采用二层循环嵌套方式: 
#内层循环: 负责整个数据集的一次遍历,采用分批次方式(batch)。
#外层循环: 定义遍历数据集的次数,通过参数EPOCH_NUM设置。
#====================================================
EPOCH_NUM = 10   # 设置外层循环次数
BATCH_SIZE = 10  # 设置batch大小# 定义外层循环
for epoch_id in range(EPOCH_NUM):# 在每轮迭代开始之前,将训练数据的顺序随机的打乱np.random.shuffle(training_data)# 将训练数据进行拆分,每个batch包含10条数据mini_batches = [training_data[k:k+BATCH_SIZE] for k in range(0, len(training_data), BATCH_SIZE)]# 定义内层循环for iter_id, mini_batch in enumerate(mini_batches):x = np.array(mini_batch[:, :-1]) # 获得当前批次训练数据y = np.array(mini_batch[:, -1:]) # 获得当前批次训练标签(真实房价)# 将numpy数据转为飞桨动态图tensor的格式house_features = paddle.to_tensor(x)prices = paddle.to_tensor(y)# 前向计算predicts = model(house_features)# 计算损失loss = F.square_error_cost(predicts, label=prices)avg_loss = paddle.mean(loss)if iter_id%20==0:print("epoch: {}, iter: {}, loss is: {}".format(epoch_id, iter_id, avg_loss.numpy()))# 反向传播,计算每层参数的梯度值avg_loss.backward()# 更新参数,根据设置好的学习率迭代一步opt.step()# 清空梯度变量,以备下一轮计算opt.clear_grad()
#==================================================== 

# 保存并测试模型
# 保存模型

# 保存模型    
# 使用paddle.save API将模型当前的参数数据 model.state_dict() 保存到文件中,
# 用于模型预测或校验的程序调用。 
# 保存模型参数,文件名为LR_model.pdparams
paddle.save(model.state_dict(), 'LR_model.pdparams')
print("模型保存成功,模型参数保存在LR_model.pdparams中") 

#测试模型

#测试模型
#====================================================
def load_one_example():# 从上边已加载的测试集中,随机选择一条作为测试数据idx = np.random.randint(0, test_data.shape[0])idx = -10one_data, label = test_data[idx, :-1], test_data[idx, -1]# 修改该条数据shape为[1,13]one_data =  one_data.reshape([1,-1])return one_data, label
#==================================================== 
# 参数为保存模型参数的文件地址
model_dict = paddle.load('LR_model.pdparams')
model.load_dict(model_dict)
model.eval()# 参数为数据集的文件地址
one_data, label = load_one_example()
# 将数据转为动态图的variable格式 
one_data = paddle.to_tensor(one_data)
predict = model(one_data)# 对结果做反归一化处理
predict = predict * (max_values[-1] - min_values[-1]) + min_values[-1]
# 对label数据做反归一化处理
label = label * (max_values[-1] - min_values[-1]) + min_values[-1]print("预测结果Inference result is {}, 原相应值the corresponding label is {}".format(predict.numpy(), label)) 
#==================================================== 

执行结果如下所示:

PS E:\project\python> & D:/Python39/python.exe e:/project/python/BSD_House.py
(404, 14)
[2.35922547e-04 0.00000000e+00 2.62405723e-01 0.00000000e+001.72839552e-01 5.47997713e-01 7.82698274e-01 3.48961979e-014.34782617e-02 1.14822544e-01 5.53191364e-01 1.00000000e+002.04470202e-01 3.68888885e-01]
epoch: 0, iter: 0, loss is: [1.0095187]
epoch: 0, iter: 20, loss is: [0.05577583]
epoch: 0, iter: 40, loss is: [0.10179052]
epoch: 1, iter: 0, loss is: [0.05334579]
epoch: 1, iter: 20, loss is: [0.05690664]
epoch: 1, iter: 40, loss is: [0.00672564]
epoch: 2, iter: 0, loss is: [0.07125398]
epoch: 2, iter: 20, loss is: [0.07457525]
epoch: 2, iter: 40, loss is: [0.06540678]
epoch: 3, iter: 0, loss is: [0.06383592]
epoch: 8, iter: 40, loss is: [0.02903528]
epoch: 9, iter: 0, loss is: [0.05061438]
epoch: 9, iter: 20, loss is: [0.03942648]
epoch: 9, iter: 40, loss is: [0.02119895]
模型保存成功,模型参数保存在LR_model.pdparams中
预测结果Inference result is [[18.37352]], 原相应值the corresponding label is 19.700000762939453
PS E:\project\python>

模型保存成功,模型参数保存在LR_model.pdparams中
预测结果
预测结果Inference result is [[18.37352]], 原相应值the corresponding label is 19.700000762939453

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/17815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于STM32的儿童误锁车内远程报警系统(华为云IOT)

一、项目背景 汽车发展历史汽车自上个世纪末诞生以来,已经走过了风风雨雨的一百多年。汽车经过百年历史的演变,已经在世界各地获得广泛的普及和应用,但是事物总会具有两面性,汽车方便了人们生活的同时也带来了不安全的因素。 儿童的出行和乘车安全始终都是我国现代汽车安…

Sentinel持久化规则

项目中有用到Sentinel,然后需要将Sentinel上配置的规则做持久化(或者初始化),通过改写Sentinel源码实现了需求,下面记录一下实现过程。 如果不知道Sentinel怎么搭,可以看看: 流控平台Sentinel搭建和接入教程_东皋长歌的博客-CSDN博客 一,背景 Sentinel是Alibaba开源…

信息技术会考操作题excel,信息技术会考操作题目

大家好,小编来为大家解答以下问题,信息技术会考操作题python计算题,信息技术会考操作题没有保存,今天让我们一起来看看吧! 1. 数据分析题(17分): 流行病学通常关注单日治愈患者例数增…

@vue/composition-api功能介绍

前言 vue/composition-api 是通过一个插件的方式,为 Vue2(2.7自带,2.6及以下可用) 提供类似 Vue3 composition API 的函数式编程能力。它的实现思路主要有: 1、提供组合式函数,在函数内部追踪响应性依赖。 2、将组合产生的响应式状态保存到…

网络知识介绍

一、TCP 传输控制协议,Transmission Control Protocol。 面向广域网的通信协议,跨域多个网络通信时,为两个通信端点之间提供一条具有如下特点的通信方式: 基于流、面向连接、可靠通信方式、网络状况不佳时尽量降低系统由于重传带…

初识Linux

今天简单了解了关于操作系统的发展史,学习了在Linux中如何远程连接云服务器的指令,以及在Linux中创建多个用户的指令。 1. ssh root 服务器远程地址 作用是用来连接XShell与云服务器,输入该指令后会自动生成输入密码的窗口,如…

【产品经理】高阶产品如何处理需求?(3方法论+2案例+1清单)

不管你是萌新小白,还是工作了几年的“老油条”,需求一直是产品经理工作的重点。只不过,不同年限的产品经理需要面对的需求大有不同,对能力的要求更高。 不知你是否遇过以下问题? 你接手一个项目后,不知从何…

DID以及社交网络中的ZKP

1. 引言 本文关键术语为: Decentralized Identity (DID,去中心化身份) or self-sovereign identity (SSI,自治身份) :是一个基于开放标准的框架,使用自主、独立的标识符和可验证证书,实现可信的数据交换。…

九五从零开始的运维之路(其二十九)

文章目录 前言一、概述二、数据备份的重要性三、造成数据丢失的原因三、备份类型1.物理与逻辑角度(一)物理备份(二)逻辑备份 2.数据库备份策略角度(一)完整备份(二)增量备份 四、常见…

计算机视觉项目中的文件批量操作与文件批量预处理

计算机视觉项目中的文件批量操作与文件批量预处理 目录 数据集制作文件批量重命名文件批量移动将文件批量按照一定格式进行重命名修改xml文件内容的方法 引言 在计算机视觉项目中,文件批量操作和文件批量预处理是必不可少的步骤。它们涉及处理大量的图像文件&am…

CentOS 上配置 NFS 服务器和客户端

部署 要在 CentOS 上配置 NFS 服务器和客户端,你可以按照以下步骤进行操作: 配置 NFS 服务器: 安装 NFS 服务器软件包: sudo yum install nfs-utils编辑 NFS 服务器配置文件 /etc/exports,添加要共享的目录和权限设置…

虹科案例|如何分析设备故障时间和次数,打破生产瓶颈?

虹科设备绩效管理系统 保障生产设备的稳定性和可靠性 生产设备的稳定性和可靠性是保证企业正常生产的重要条件之一,设备故障的频发严重影响企业的正常生产,那么如何分析设备故障时间和次数,查找设备故障原因,协助企业打破生产瓶…

python题-将多个Linux文件夹路径转换为JSON形式

要将多个Linux文件夹路径转换为JSON形式,我们可以使用一个字典来表示这个JSON结构。每个路径都是一个字符串,我们需要将其拆分成目录名,并将目录名按照层次结构组织成一个嵌套的字典。 思路如下: 遍历每个文件夹路径。将每个路径…

树莓派通过天线+gps获取经纬度并调用高德地图api在地图上标点

完整项目为《基于机器视觉的行人和路面缺陷检测及其边缘设备部署》 完整功能视频演示地址:本科最后的课设:“车载系统的辅助系统——基于机器视觉的行人和路面缺陷检测”完结撒花*罒▽罒*_哔哩哔哩_bilibili 该博客介绍的功能为: 1&#xff1…

初步了解c#编程语言--(1)

初识c#编程语言 一、见识c#语言编写的各类应用程序 关于用c#语言编写的各类应用程序有以下几种: 1.Console 在编写Console程序时,要注意创建项目时,是选择控制台应用程序(Console Application),在这里…

正泰电力携手图扑:VR 变电站事故追忆反演

VR(Virtual Reality,虚拟现实)技术作为近年来快速发展的一项新技术,具有广泛的应用前景,支持融合人工智能、机器学习、大数据等技术,实现更加智能化、个性化的应用。在电力能源领域,VR 技术在高性能计算机和专有设备支…

Zabbix 5.0 离线安装

1、安装说明参考 安装链接 离线安装包挺全 2、主动和被动配置 /etc/zabbix/zabbix_agentd.conf配置,禁用被动 StartAgents0 3、支持容器监控 所在监控设置安装zabbix_agent2 官网下载导入模板:Template App Docker

大数据课程E6——Flume的Processor

文章作者邮箱:yugongshiyesina.cn 地址:广东惠州 ▲ 本章节目的 ⚪ 了解Processor的概念和配置参数; ⚪ 掌握Processor的使用方法; ⚪ 掌握Processor的Default Processo; ⚪ 掌握Processor的Load Bal…

远程控制平台二之高效率录屏

内容优化 前面说的受控端推流,这个“流”的数据就来源于录屏,那么我们是否只是简单录屏呢?显然不是的,我们的要求只是看到远程设备的屏幕以及操控远程设备,所以,图像是必须的,但声音是多余的,至少在我们目前这个项目是这样,所以,我们在录屏的时候,只需使用ImageRea…

qssh使用

到官网下载qssh的源码QSsh-botan-1,使用qtcreator打开后,直接编译,即可得到qssh的库 头文件将QSsh-botan-1\src\libs\ssh目录下的.h文件拷到include文件夹下,即为库头文件。 qssh有个问题,如果你将qssh的类放在子线程…