推荐系统简介

推荐系统简介

文章目录

  • 推荐系统简介
    • 1.推荐系统概述
      • 推荐系统目的
        • 我们推荐的目的:
      • 推荐系统的应用
      • 推荐系统的基本思想
      • 推荐系统的数据分析
      • 推荐系统分类
    • 2.推荐系统简介
      • 基于人口统计学的推荐
      • 基于内容的推荐
      • 基于协同过滤的推荐
      • 混合推荐
    • 3.推荐系统评测
      • 推荐系统的实验方法
      • 推荐系统评测指标
      • 评分预测

1.推荐系统概述

推荐系统目的

我们推荐的目的:

  • 信息爆炸和信息过载。
  • 推荐系统是信息过载所采用的措施,面对海量的数据信息,从中快速推荐出符合特点的物品。解决一些人的“选择恐惧症”。
  • 解决如何从大量信息中找到自己感兴趣的信息。
  • 解决如何让自己生产的信息脱颖而出,受到大众的喜欢。

即:

  • 让用户更快更好的获取到自己需要的内容
  • 让内容更快更好的推送到喜欢它的用户手中
  • 让网站更有效的保留用户资源

推荐系统的应用

  • 个性化音乐
  • 电子商务
  • 电影视频
  • 社交网络
  • 个性化阅读
  • 证劵、理财
  • 个性化旅游
  • 个性化广告
  • 个性化邮件
  • 位置服务

推荐系统的基本思想

在这里插入图片描述

  • 知你所想,精准推送——利用用户和物品的特征信息,给用户推荐那些具有用户喜欢的特征物品
  • 物以类聚——利用用户喜欢过的物品,给用户推荐与他人喜欢过的物品相似的物品
  • 人以群分——利用和用户相似的其他用户,给用户推荐那些和他兴趣爱好相似的其他用户喜欢的物品

推荐系统的数据分析

  • 要推荐物品或内容的元数据,例如关键字,分类标签,基因描述等;
  • 系统用户的基本信息,例如年龄、性别、兴趣标签等;
  • 用户的行为数据可以转换为对物品或者信息的偏好,根据应用本身的不同,可能包括用户对物品的评分,用户查看物品的记录,用户的购买记录等。这些用户偏好信息可以分为两类:
    • 显式用户反馈:这类用户在网站上自然浏览或者使用网站以外,显式的提供反馈信息,例如用户对物品的评分,或者对物品的评论。
    • 隐式的用户反馈:这类是用户在使用网站时产生的数据,隐式反映了用户对物品的喜好,例如用户购买了某物品,用户查看了某物品的信息等等。

推荐系统分类

  • 根据实时性分类
    • 离线推荐
    • 实时推荐
  • 根据推荐原则分类
    • 基于相似度的推荐
    • 基于知识的推荐
    • 基于模型的推荐
  • 根据推荐是否个性化分类
    • 基于统计的推荐
    • 个性化推荐
  • 根据数据源分类
    • 基于人口统计的推荐
    • 基于内容的推荐
    • 基于协同过滤的推荐

2.推荐系统简介

基于人口统计学的推荐

基于内容的推荐

基于内容(Content based,CB)主要利用的是用户评价过的物品的内容特征,而CF的方法还可以利用其他用户评分过的物品内容

基于协同过滤的推荐

  • 协同过滤(Collaborative Filtering,CF)
  • 基于近邻的协同过滤
    • 基于用户(User-CF)
    • 基于物品(Item-CF)
  • 基于模型的协同过滤
    • 奇异值分解(SVD)
    • 潜在语义分析(LSA)
    • 支撑向量机(SVM)

基于内容和协同过滤算法区别

CF可以解决CB的一些局限,.如:

  1. 物品内容不完全或者难以获取时,依然可以通过其他用户的反馈给出推荐;
  2. CF基于用户之间对物品的评价质量,避免了CB仅依赖内容可能造成的对物品质量判断的干扰
  3. CF推荐不受内容限制,只要其他类似用户给出了对不同物品的兴趣,CF就可以推荐出内容差距很大的物品(但有某种内在联系)

分为两类: 基于近邻和基于模型

依赖历史数据,冷启动问题

基于数据、基于

混合推荐

实际网站的推荐往往都不是单纯只采用一种推荐机制和策略,往往是将多个方法混合在一起,从而达到更好的推荐效果。比较流行的组合方法有:

  • 加权混合——用线性公式(liner formula)将几种不同的推荐按照一定的权重组合起来,具体的权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果
  • 切换混合——切换的混合方式,就是允许在不同情况(数据量,系统运行情况,用户和物品的数目等)下,选择最为合适的推荐机制计算推荐
  • 分区推荐——采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户
  • 分层混合——采用多种推荐机制,并将一个推荐机制的输入作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐

3.推荐系统评测

推荐系统的实验方法

  • 离线实验
    • 通过体制系统获得用户行为数据,并按照一定格式生成一个标准的数据集
    • 将数据集按照一定的规则分成训练集和测试集
    • 在训练集上训练用户兴趣模型,在测试集上进行预测
    • 通过事先定义的离线指标评测算法在测试集上的预测结果
  • 用户调查
    • 用户调查需要有一些真实用户,让他们在需要测试的推荐系统上完成一些任务;我们需要记录他们的行为,并让他们回答一些问题;最后进行分析
  • 在线实验
    • AB测试(AB测试是为Web或App界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。)

推荐系统评测指标

  • 预测准确度
  • 用户满意度
  • 覆盖率(不能只推荐热门,冷门小众大部分的都可以推荐出来)
  • 多样性
  • 惊喜度
  • 信任度
  • 实时性
  • 健壮性
  • 商业目标

评分预测

  • 很多网站都有让用户对物品打分的功能,如果知道用户对物品的历史评分,就可以从中学习一个兴趣模型,从而预测用户对新物品的评分
  • 评分预测准确度一般用均方根误差(RMSE)或者平均绝对误差(MAE)计算

TOP-N推荐

  • 网站提供推荐服务时,一般是给一个用户一个个性化推荐列表,这种推荐叫做TOP-N推荐
  • TOP-N推荐的预测率一般用精确率(precision)和召回率(recall)来度量

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483850.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

清华大学孙茂松:透过喧嚣,坐看云起,NLP 的迷思与感悟

来源:智源社区图源:澎湃新闻2010年深层神经网络在语音识别研究方向上取得里程碑式进展,以这一事件为新起点和新动能,整个人工智能领域迅速跃迁到深度学习时代,包括自然语言处理(NLP)等关键领域也…

2022年科学突破奖,9人共获奖金1500万美元,mRNA 新冠疫苗2位奠基人获奖

来源:科研圈编辑:David9 月 9 日,2022 年科学突破奖获奖名单在美国旧金山公布。生命科学奖、物理学奖、数学奖分别授予 5 个项目共 9 位科学家,每个项目奖金金额为 300 万元。新冠 mRNA 疫苗技术奠基者 Katalin Karik 与 Drew Wei…

多巴胺如何驱使我们克服复杂情况、逆境、情绪, 让我们掌控周遭的环境的

来源:本文摘自《贪婪的多巴胺》仅仅是“想要”很少能让你得到任何东西。你必须弄清楚如何获得它,以及它是否值得拥有。事实上,如果我们做事时不考虑怎么做和下一步做什么,失败甚至不是最坏的结果。结果可能从吃得有点儿多发展为不…

火爆股市的元宇宙,究竟关VR/AR什么事?

来源:VR每日必看VR设备被普遍认为是进出元宇宙的主要终端,据Wind数据,VR概念的上市公司包括歌尔股份、中科创达、欣旺达等55家公司。大洋彼岸的“蝴蝶”扇动翅膀,A股的元宇宙概念也火热起来。A股代表性企业中青宝已经连续两日“20…

2018-2019-2 网络对抗技术 20165301 Exp2 后门原理与实践

2018-2019-2 网络对抗技术 20165301 Exp2 后门原理与实践 实验内容 (1)使用netcat获取主机操作Shell,cron启动(2)使用socat获取主机操作Shell, 任务计划启动(3)使用MSF meterpreter(或其他软件)生成可执行文件,利用ncat或socat传送…

世界机器人大会|人工智能VS人类

来源:新华社作者:北京邮电大学人工智能学院 刘伟配音:郑琬策划、终审:刘君校对:周雪晴2021世界机器人大会于9月10日至13日在北京召开,世界机器人博览会及世界机器人大赛将同期举办。其实,智能不…

LeetCode LCP 06. 拿硬币

题目:桌上有 n 堆力扣币,每堆的数量保存在数组 coins 中。我们每次可以选择任意一堆,拿走其中的一枚或者两枚,求拿完所有力扣币的最少次数。 示例 1: 输入:[4,2,1]输出:4解释:第一…

华为:憧憬6G,共同定义6G

来源:华为华为心声社区发布了由徐直军签发的总裁办电子邮件,邮件内容为徐直军为《6G无线通信新征程》一书作的序《憧憬6G,共同定义6G》。徐直军在文中表示,6G将在2030年左右投向市场,究竟市场将会迎来什么样的6G&#…

“中国诺奖”2021未来科学大奖公布:袁国勇、裴伟士、张杰、施敏获奖,总奖金300万美元...

来源:学术头条中国首个由科学家、企业家共同发起的民间公益组织颁发的世界级科学大奖——未来科学大奖,9 月 12 日正式揭晓 2021 年生命科学奖、物质科学奖、数学与计算机科学奖获奖名单。香港大学袁国勇、裴伟士获得生命科学奖。获奖理由:他…

实验二——函数重载,快速排序,类对象

函数重载&#xff1a; #include<iostream> using namespace std; struct complex{ double real; double imaginary; }; int add(int,int); double add(double,double); complex add(complex,complex); int main() { int a12,b13; double a22.0,b23.0; struct complex num…

LeetCode 771. 宝石与石头

题目&#xff1a; 给定字符串J 代表石头中宝石的类型&#xff0c;和字符串 S代表你拥有的石头。 S 中每个字符代表了一种你拥有的石头的类型&#xff0c;你想知道你拥有的石头中有多少是宝石。 J 中的字母不重复&#xff0c;J 和 S中的所有字符都是字母。字母区分大小写&#…

【前沿技术】Facebook 硬件负责人,带摄像头的智能眼镜将在 10 年内成为常态

拍照功能将在十年内成为智能眼镜的标准配置来源&#xff1a;智能研究院在 Facebook 与 Luxottica 的首款智能眼镜合作产品 Ray-Ban Stories 发布后&#xff0c;Facebook 硬件业务负责人 Andrew Bosworth 周五在与 Essilor Luxottica 的首席可穿戴设备官 Rocco Basilico 交谈时表…

9大领域50名青年学者获2021年科学探索奖,单人奖金300万元

来源&#xff1a;科学探索奖官网、科学网等9 月 13 日&#xff0c;2021 年科学探索奖获奖人名单公布&#xff0c;来自 9 个领域的 50 名青年科学家获奖。其中包括 8 名女性科学家&#xff0c;最年轻获奖者仅 32 岁。他们将在 5 年内获得总计 300 万元人民币的奖金&#xff0c;可…

多角度回顾因果推断的模型方法

来源&#xff1a;AI干货知识库推断因果关系&#xff0c;是人类思想史与科学史上的重要主题。现代因果推断的研究&#xff0c;始于约尔-辛普森悖论&#xff0c;经由鲁宾因果模型、随机试验等改进&#xff0c;到朱力亚珀尔的因果革命&#xff0c;如今因果科学与人工智能的结合正掀…

Eclipse+ADT+Android SDK 搭建安卓开发环境

要求&#xff1a;windows 7 基本操作。运行环境&#xff1a;windows 7(64位); eclipse-jee-luna-SR2-win32(32位);ADT-23.0.4 最近刚开始接触Android(安卓)嵌入式开发&#xff0c;首要问题是搭建Andoid开发环境&#xff0c;由于本人用的是windows7的笔记本&#xff0c;也就只能…

骆利群院士最新Science综述:神经环路架构,激发新的AI

来源&#xff1a;ScienceAI编辑&#xff1a;凯霞人脑包含大约 1000 亿个神经元&#xff0c;每个神经元都有数千个突触连接。尽管单个神经元是神经系统的基本单位&#xff0c;但正是它们的突触连接模式使神经元能够为特定功能形成专门的神经环路&#xff0c;从而使大脑成为强大的…

软件设计作业 1

第一部分先列出本次采用Scrum敏捷编程的任务完成情况&#xff0c;并写出心得 酒店管理系统能够极大的方便酒店的工资人员在关于酒店的管理的操作&#xff0c;如客人入住、退房&#xff0c;信息录入、查询等&#xff0c;极大的提高了酒店整体管理活动的工作效率。 使用Scrum使得…

决策树简介与入门

决策树表示对象属性&#xff08;比如贷款用户的年龄、是否有工作、是否有房产、信用评分等&#xff09;和对象类别&#xff08;是否批准其贷款申请&#xff09;之间的一种映射。使用层层推理来实现最终的分类。  根节点&#xff1a;包含样本的全集  内部节点&#xff1a;对…

前端vue实现pdf文件的在线预览

3.前端vue实现pdf文件的在线预览 我是通过 <iframe> 标签就可以满足我工作的 pdf预览需求 如果<iframe> 无法满足需求 &#xff0c; 可以使用pdf.js这个插件&#xff0c;功能强大。 <iframe:src"url"type"application/x-google-chrome-pdf"…

中国科学院院士骆清铭: “看见”大脑

来源&#xff1a;瞭望 新闻周刊编辑&#xff1a;宋若一责任编辑&#xff1a;冀娴贤文&#xff1a;《瞭望》新闻周刊记者 扈永顺 ◇以工业化的方式大规模、标准化地产生数据并绘制脑图谱&#xff0c;将改变神经科学已有的研究方式◇“全脑介观神经联接图谱”大科学计划目前已凝…