基于矩阵分解算法的评分预测实现---信息检索课设以及所涉及的深度学习原理

一、实验环境

Windows,Python 3

Python作为主要编程语言,使用PythonPandasNumPyMatplotlib等库

二、实验内容

主要任务

  1. 查阅相关资料,了解矩阵分解算法的基本概念、应用场景及其难点。重点了解SVD(Singular Value Decomposition,奇异值分解)系列方法。
  2. 掌握Python语言的基本使用。
  3. 了解梯度下降算法概念,熟悉并复现矩阵分解算法。
  4. 标准评测数据集MovieLens上验证矩阵分解算法。
  5. 学习numpy或pandas的基本使用方法,能够对ratings.csv和movies.csv文件中的数据进行提取。使用numpy或sklearn中的知识,随机划分训练集、验证集、测试集,比例为8:1:1。
  6. 使用Python语言或利用PyTorch、TensorFlow等深度学习库,复现矩阵分解算法,在标准评测数据集MovieLens上验证该算法,并且能够取得较低的均方误差(MSE不能高于1.5)。

三、实验过程

第一步:学习numpy或pandas的基本使用方法,能够对ratings.csv和movies.csv文件中的数据进行提取。

运行结果:

通过这些处理,生成了两个新的文件moviesProcessed.csv和ratingsProcessed.csv,其中包含了处理后的电影信息和电影评分信息,为后续的推荐系统构建提供了处理后的数据。

第二步:划分使用numpy或sklearn中的知识,随机划分训练集、验证集、测试集,比例为8:1:1。

随机划分训练集(80%)train_data、验证集(10%)valid_data和测试集(10%)test_data。

第三步:使用Python语言或利用PyTorch、TensorFlow等深度学习库,复现矩阵分解算法。

为了创建矩阵分解模型,我们使用嵌入来显示用户和电影,使用点积来捕捉它们之间的相互作用。

我们还引入了用户和电影的偏置,以考虑用户和电影的整体评分倾向。

def matrix_factorization_model(num_users, num_movies, embedding_size=10):
    user_input = Input(shape=(1,), name='user_input')
    user_embedding = Embedding(input_dim=num_users, output_dim=embedding_size, input_length=1)(user_input)

    movie_input = Input(shape=(1,), name='movie_input')
    movie_embedding = Embedding(input_dim=num_movies, output_dim=embedding_size, input_length=1)(movie_input)
   偏置:

    user_bias = Embedding(input_dim=num_users, output_dim=1, input_length=1)(user_input)
    movie_bias = Embedding(input_dim=num_movies, output_dim=1, input_length=1)(movie_input)

    dot_user_movie = Dot(axes=2)([user_embedding, movie_embedding])
    dot_user_movie = Add()([dot_user_movie, user_bias, movie_bias])
    prediction = Flatten()(dot_user_movie)

    model = Model(inputs=[user_input, movie_input], outputs=prediction)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/40137.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python进行文件批量重命名:轻松实现文件管理

哈喽,大家好,我是木头左! 引言 在日常生活和工作中,经常需要对大量的文件进行重命名。手动一个个地修改文件名不仅耗时耗力,还容易出错。为了解决这个问题,可以利用Python编程语言来实现文件的批量重命名。本文将介绍如何使用Python编写一个简单的脚本,实现对文件进行批…

windows@无密码的本地用户账户相关问题@仅用用户名免密登录远程桌面登录和控制@无密码用户访问共享文件夹以及挂载问题

文章目录 abstract此用户无法登录账户被禁用问题访问共享文件夹时带上凭据错误案例和解决 两类登录方式控制台登录与远程登录的区别为什么限制空密码账户只允许控制台登录相关安全策略如何修改该策略注意事项 启用允许被免密登录功能使用空密码进行远程桌面连接设置远程桌面链接…

硅纪元视角 | 1 分钟搞定 3D 创作,Meta 推出革命性 3D Gen AI 模型

在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,…

2.2.2 C#中显示控件BDPictureBox 的实现----DisplayContext说明续

2.2.2 C#中显示控件BDPictureBox 的实现----DisplayContext说明续 1 主要目标描述 实现图片缩放信息和中心点位置偏移信息的管理,外部调用者只要输入放大,缩小,位置偏移,其他全部由displayContext 实现 2 公共的函数部分&#…

第二天:ALOAM前端讲解【第2部分】

三、scan2scan 3. 帧间匹配 特征关联与损失函数计算 (1)线特征 点到线的距离公式: d ϵ = ∣ ( X ~ ( k +

网安小贴士(2)OSI七层模型

一、前言 OSI七层模型是一种网络协议参考模型,用于描述计算机网络体系结构中的不同层次和功能。它由国际标准化组织 (ISO) 在1984年开发并发布。 二、定义 OSI七层模型,全称为开放式系统互联通信参考模型(Open Systems Interconnection Refe…

微信小程序 DOM 问题

DOM 渲染问题 问题 Dom limit exceeded, please check if theres any mistake youve made.测试页面 <template><scroll-view scroll"screen" style"width: 100%;height: 100vh;" :scroll-y"true" :scroll-with-animation"true&…

记录:pcl库使用VoxelGrid对象对点云下采样时引发free(ptr)异常的解决办法 C++

如题&#xff0c;使用pcl库的VoxelGrid对象对点云下采样时&#xff0c;Memory.h文件中EIGEN_DEVICE_FUNC inline void aligned_free(void *ptr)函数的free(ptr);引发异常&#xff08;203行&#xff09;解决办法。 原使用场景代码&#xff1a; pcl::VoxelGrid<pcl::PointXYZ…

如何应对.rmallox勒索病毒:预防勒索病毒的实用技巧

导言&#xff1a; 在当今数字化世界中&#xff0c;网络安全成为了任何组织和个人都必须面对的重要挑战之一。勒索病毒&#xff08;Ransomware&#xff09;作为一种恶意软件类型&#xff0c;已经成为网络安全威胁中的重要一环。最近出现的.rmallox勒索病毒引发了广泛关注和担忧…

casefold()方法——所有大写字符转换为小写

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 语法参考 casefold()方法是Python3.3版本之后引入的&#xff0c;其效果和lower()方法非常相似&#xff0c;都可以转换字符串中所有大写字符为小写。…

基于深度学习的虚拟换装

基于深度学习的虚拟换装技术旨在通过计算机视觉和图像处理技术&#xff0c;将不同的服装虚拟地穿在用户身上&#xff0c;实现快速的试穿和展示。这项技术在电商、时尚和虚拟现实领域具有广泛的应用&#xff0c;能够提升用户体验&#xff0c;增加互动性。以下是关于这一领域的系…

bazel的详细使用教程

由于CSDN&#xff1b;复制近来的mk笔记格式太乱 建议看这个pdf文档 https://download.csdn.net/download/qq_41537499/89512254 为什么要学习bazel&#xff1f; 从Android 14开始&#xff0c;Google仍然强烈建议开发者使用Bazel和Kleaf构建Android内核及其工件。这表明Bazel在…

一篇文章用python GUI构建学生管理系统

引言 通过使用Python&#xff0c;我们可以利用其简洁和功能强大的特性&#xff0c;结合Tkinter提供的GUI开发能力&#xff0c;快速构建一个直观且易于使用的学生管理系统。 准备工作 在开始之前&#xff0c;确保你的开发环境中已经安装了 PythonTkinter库 安装完成后&…

华为HCIP Datacom H12-821 卷23

1.单选题 下面是路由器Huawei的部分配置信息,关于该配置信息描述错误的是: [HUAWEl] ip as-path-filter 2 permit_200 300[HUAWEI]route-policy test permit node 10 [HUAWE-route-policy]if-match as-path-filter 2 该Route Policy只能在OSPF进程中进行调用B、设置序…

LINUX高级编程part1

使用Linux系统提供的函数实现功能 shell程序的作用--->保护Linux内核&#xff0c;提供一个与用户交互的界面 shell有两种 1、 图形化shell 2、命令行shell shell编程就是使用一些shell命令来完成一些功能 在linux中创建 &#xff1a; …

Qt:5.QWidget属性介绍(Enabled属性-控件可用性设置、geometry属性-控件位置/大小设置)

目录 一、 QWidget属性的介绍&#xff1a; 二、Enabled属性-控件可用性设置&#xff1a; 2.1Enabled属性的介绍&#xff1a; 2.2获取控件当前可用状态的api——isEnabled()&#xff1a; 2.3设置控件当前的可用状态的api—— setEnabled() &#xff1a; 2.4 实例&#xff…

CMake 3.19:预设

可以以 JSON 的方式添加预设&#xff0c;用户将获得预设的默认值。find_package 支持版本范围&#xff0c;特殊的查找模块&#xff0c;比如&#xff1a;FindPython&#xff0c;有对版本范围的自定义支持。添加了许多新的权限控制&#xff0c;进一步的普及生成器表达式。 首次发…

Rhino 犀牛三维建模工具下载安装,Rhino适用于机械设计广泛领域

Rhinoceros&#xff0c;这款软件小巧而强大&#xff0c;无论是机械设计、科学工业还是三维动画等多元化领域&#xff0c;它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能&#xff0c;堪称业界翘楚。NURBS&#xff0c;即非均匀有理B样条&#xff0c;是计算机图…

代码随想录算法跟练 | Day13 | 栈与队列 Part03

个人博客主页&#xff1a;http://myblog.nxx.nx.cn 代码GitHub地址&#xff1a;https://github.com/nx-xn2002/Data_Structure.git Day13 239. 滑动窗口最大值 题目链接&#xff1a; https://leetcode.cn/problems/sliding-window-maximum/ 题目描述&#xff1a; 给你一个整…

昇思25天学习打卡营第6天|数据变换 Transforms

学习目标&#xff1a;熟练掌握数据变换操作 熟悉mindspore.dataset.transforms接口 实践掌握常用变换 昇思大模型平台学习心得记录&#xff1a; 一、关于mindspore.dataset.transforms 1.1 变换 mindspore.dataset.transforms.Compose将多个数据增强操作组合使用。 mindspo…