Spark 2.2.0 文档中文版 Collaborative Filtering 协同过滤 JAVA推荐系统

  协同过滤常用于推荐系统,这项技术旨在填补 丢失的user-item关联矩阵 的条目,spark.ml目前支持基于模型的协同过滤(用一些丢失条目的潜在因素在描述用户和产品)。spark.ml使用ALS(交替最小二乘法)去学习这些潜在因素。在spark.ml中的实现有以下参数:

numBlocks:块的数量,user和item将被分成多少块,以并行计算。(默认10)

ranK:模型隐含因素的个数。(默认10)

maxIter:模型的最大迭代次数。(默认10)

regParam :ALS的正则化参数。(默认1.0)

implicitPrefs :使用显式反馈还是隐式反馈。(默认false,即显式反馈)

alpha:信心权重所应达到的基准线。(默认1.0)

nonnegative :是否使用非负数的约束。(默认false)

  注意:基于dataFrame - API的ALS目前只支持整数型的userID和itemID,其他数字类型也支持,但是取值范围必须在整数之内。

显式反馈VS隐式反馈

  标准的基于矩阵分解的协同过滤方法对待user-item矩阵的条目项 是显式地给出user对item的偏好,例如,用户给电影评级。

  而现实生活中常见案例是只能有隐式反馈(例如:视图,点击鼠标,购买,喜欢,分享……)。在spark.ml中使用的方法是:对隐式反馈数据集的协同过滤。实际上,这种方法不是直接对数据矩阵进行建模,而是将数据视为代表用户行为意愿强度的数字(例如点击的次数或某人累积观看电影的时间)。然后,这些数字与观察到的用户偏好的置信水平相关,而不是给予项目的明确评级。 然后,该模型尝试找到可用于预测用户对项目的预期偏好的潜在因素。

 

转载于:https://www.cnblogs.com/taoshiqian/p/7206380.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/252286.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

淘宝top平台调用接口响应时间优化

我的专栏地址:我的segmentfault,欢迎浏览 一、背景 调用top接口的响应时间长(160ms左右),超时和连接异常频繁发生。导致消息组件消费工程的tps遇到瓶颈(单实例单消息队列250tps),只能通过增加实…

树上倍增一些理解和写法

树上倍增可以比较容易求得i节点的第k个父亲,我们定义一个二维数组fa[i][j]代表节点i的第2^j个父亲,关于有什么用我们等会再说,现在先学会怎么去求这个fa数组 我们可以通过从根节点开始一遍dfs求得所有fa数组,首先我们发现fa数组有…

图像去畸变和添加畸变

背景:最近的项目中用到的图像去畸变的知识,刚开始是直接调用opencv中提供的函数cv::initUndistortRectifyMap()和cv::remap()函数,实现图像的全局去畸变,但是由于图像的分辨率很高,再加上,实际过程中我们只…

win10上编译libharu库

背景: 最近的项目需要自动的生成pdf文件,我在网上查看相关的资料,发现目前比较流行的生成pdf文件的库有两个,一个是libpdf,另一个是libharu。libpdf个人使用时免费的但是商业使用就需要收费了,否则得到的p…

爬虫——正则表达式re模块

为什么要学习正则表达式 实际上爬虫一共就四个主要步骤: 明确目标:需清楚目标网站爬:将所有的目标网站的内容全部爬下来取:在爬下来的网站内容中去掉对我们没有用处的数据,只留取我们需要的数据处理数据:按…

深入Spring Boot:快速集成Dubbo + Hystrix

2019独角兽企业重金招聘Python工程师标准>>> 背景 Hystrix 旨在通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力。Hystrix具备拥有回退机制和断路器功能的线程和信号隔离,请求缓存和请求打包&#xff…

BZOJ2333 [SCOI2011]棘手的操作 【离线 + 线段树】

题目 有N个节点,标号从1到N,这N个节点一开始相互不连通。第i个节点的初始权值为a[i],接下来有如下一些操作: U x y: 加一条边,连接第x个节点和第y个节点 A1 x v: 将第x个节点的权值增加v A2 x v: 将第x个节点所在的连通…

opencv图像仿射变换和普通旋转

背景:今天需要对程序生成的图像进行旋转90度和下采样操作,当然还有改变图像类型的操作,就是把原来.png的图像转换为.jpg的图像,主要是我目前使用libharu库,无法成功从本地加载png图像到pdf中去,不得不使用j…

讨厌麻烦的ora 01722无效数字

webservice开发过程中,数据库由原来的oracle改为现在的sql server。然后重新调试,结果报出ora 01722无效数字的错误。 由于连接oracle数据库的时候并没有问题,所以一开始我以为是数据库不同,导致部分数据类型差异,&…

CSS样式:覆盖规则

规则一&#xff1a;由于继承而发生样式冲突时&#xff0c;最近祖先获胜。 CSS的继承机制使得元素可以从包含它的祖先元素中继承样式&#xff0c;考虑下面这种情况: <html><head><title>rule 1</title><style>body {color:black;}p {color:blue;}…

try{}里有一个 return 语句,那么紧跟在这个 try 后的 finally {}里的 code 会 不会被执行,什么时候被执行,在 return 前还是后?...

这是一道面试题&#xff0c;首先finally{}里面的code肯定是会执行的&#xff0c;至于在return前还是后&#xff0c; 看答案说的是在return后执行&#xff0c;我觉得不对&#xff0c;百度了一下&#xff0c;有说return前的&#xff0c;有说return后的&#xff0c;还有return中间…

相机和镜头选型需要注意哪些问题

背景&#xff1a; 最近需要优于项目需求需要对工业相机和镜头进行选型&#xff0c;于是我就开启的学习相机之旅&#xff0c;虽然我一直在做机器视觉方向&#xff0c;但是我对相机的了解还是很少&#xff0c;我想正好趁这次机会好好学习一下。如果有错误的观点请指正。 一、相…

响应式网页布局 - W3Schools How-Tos 01

W3Schools教学系列 W3Schools是知名的网页设计&#xff0f;前端开发教学网站&#xff0c;不仅提供HTML、CSS、JavaScript等的详尽教学&#xff0c;还可以把它当作说明文件&#xff08;Documents&#xff09;。有经验的前端或多或少已经接触过这个网站&#xff0c;因为它经常出现…

正則表達式,终极使用!3个工具,搞定一切

文章前提&#xff0c;本人。不会正则的不论什么语法&#xff0c;仅仅懂一点正则的概念。本人从未自己写过正则&#xff0c;都是网上收罗进行改动的。相同。没有时间去研究正则。 可是为了方便&#xff0c;入手了几个工具。 如今就为大家一一展示。 第一个&#xff0c;regexBuil…

iOS 在tableview的侧滑事件里执行tableView.selectRow无效的解决办法

很奇怪的问题&#xff0c;在执行默认选中一个cell的时候&#xff0c;突然发现这句话不起作用了 &#xff08;我的场景是&#xff1a;当前cell侧滑删除后&#xff0c;默认选中上一个cell&#xff09; 搞了半天&#xff0c;终于发现罪魁祸首竟然是因为&#xff1a;这句话写在了侧…

VS2017 C++工程 执行python脚本

我解决了哪怕很小的一个问题&#xff0c;我也想记录下来来见证我的经历。 背景&#xff1a; 一、使用libhuru库生成pdf报告 最近参与一些测试工作&#xff0c;希望测试结束后能够根据测试得到的数据和图像自动生成测试报告&#xff0c;最开始调研到了生成报告的库有libharu和…

标准正弦波变频电源调制方式的实现

目前变频电源正不断向规模化、专业化、智能化、精细化方向发展。变频电源的技术随着工业电器电子制造的兴起而不断得到重视和发展。其中,中港扬以正弦脉SPWM为核心变频电源系统电路便是一个很好的代表。纯硬件电路在焊接电路上比较复杂&#xff0c;但是调节出来的SPWM波形比较完…

Jmeter教程索引贴

Jmeter教程索引贴 新的一年即将到来&#xff0c;不知不觉2015年自己在Jmeter方面总结的文章有十几篇&#xff0c;在此汇总一下&#xff0c;顺便也算是个总结吧。2016年&#xff0c;继续学习技术&#xff0c;总结&#xff0c;写文章。 一、基础部分&#xff1a; 使用Jmeter进行h…

类与接口(二)java的四种内部类详解

引言 内部类&#xff0c;嵌套在另一个类的里面&#xff0c;所以也称为 嵌套类; 内部类分为以下四种&#xff1a; 静态内部类成员内部类局部内部类匿名内部类一、静态内部类 静态内部类&#xff1a; 一般也称”静态嵌套类“&#xff0c;在类中用static声明的内部类。 因为是stat…

单例设计模式和多线程

单例设计模式 单例&#xff1a;整个项目中&#xff0c;有某个类或者某些特殊的类&#xff0c;属于该类的对象只能建立一个。 #include<iostream> using namespace std;class MyCAS { private:MyCAS(){}private:static MyCAS *m_instance;public:static MyCAS *GetInstanc…