鱼哥推荐书籍第18期:《推荐系统》算法 案例与大模型

鱼哥推荐书籍第18期:《推荐系统》算法 案例与大模型

    • 什么是推荐系统?
    • 推荐系统解决了哪些问题?
    • 推荐系统的应用领域
    • 常用的推荐算法:
        • 基于内容的推荐算法
        • 协同过滤算法:
    • 如何系统学习推荐系统:
        • 第一部分:
        • 第二部分:
        • 第三部分:
        • 第四部分:

在当今数字化时代,推荐系统已经成为许多互联网平台的核心功能之一。无论是在线购物、音乐和视频流媒体、社交媒体,还是新闻和内容聚合,推荐系统都扮演着至关重要的角色。它们通过分析用户的历史行为和偏好,以及其他相关信息,为用户提供个性化的推荐内容,从而提高用户体验,增加平台的粘性,以及促进销售和内容传播。那么,推荐系统究竟是如何运作的呢?让我们深入探索一下。

在这里插入图片描述

什么是推荐系统?

推荐系统是计算机软件工程的一个子领域,通过大数据、机器学习等技术,在用户使用产品的过程中,学习用户的兴趣偏好,主动展示他可能喜欢的“物品”(这里的物品是指待推荐的东西,可以是商品、电影、视频、文章、音乐、美食、景点、理财产品甚至是人,后面都用物品指代,不再说明),从而促成“消费”,节省用户时间,提升用户体验,优化资源配置,最终为服务提供方、物品提供方创造商业价值。

上述定义有几点需要说明,以便大家更好地理解推荐系统的特性与本质。

  • 推荐系统是一种软件工程解决方案,通过代码实现推荐能力,将为用户推荐物品这一流程做到完全自动化。
  • 推荐系统是机器学习的一种应用,通过学习用户的行为数据,构建数学模型,预测用户的兴趣,最终为用户推送其可能喜欢的物品,满足用户被动的需求,提升用户体验。
  • 推荐系统是一项交互式产品功能,产品为推荐系统提供载体,用户在使用产品的过程中触发推荐系统,推荐系统为用户提供个性化的推荐。作为一个产品,物品怎么展示、如何与用户交互、交互过程中可能遇到什么问题,这些都要考虑。
  • 推荐系统是一项人机协同的(软件)服务,通过推荐系统,用户可以获得符合自身兴趣的物品推荐,满足其个性化的、被动的需求。任何服务都需要运营,在服务过程中,服务的宣导、问题的解决等都需要借助人力。
  • 推荐系统是一种过滤信息、匹配资源的手段,通过机器学习算法和软件工程,推荐系统从海量信息中为用户进行筛选和过滤。
  • 推荐系统最终的目标是提升用户体验,为服务提供方和物品提供方创造商业价值。

从上面的说明可知,推荐系统是一个偏业务的交叉学科,需要综合利用软件工程、机器学习、产品设计、运营、大数据等跨学科的知识,才可以构建出满足用户需求、有商业价值的推荐系统。

推荐系统解决了哪些问题?

推荐系统是互联网(特别是移动互联网)快速发展的产物。它本质上是一种从海量信息中为用户检索其感兴趣的信息的技术手段。推荐系统结合用户信息(地域、年龄、性别等)、物品信息(名称、价格、产地等)以及用户行为(浏览、购买、点击、播放等),利用机器学习技术构建用户兴趣模型,利用软件工程技术实现软件服务,为用户提供精准的个性化推荐。

推荐系统能够很好地满足物品提供方、平台方、用户三方的需求。拿淘宝购物举例,物品提供方是成千上万的网店,平台方是淘宝,用户是在淘宝上购物的自然人或企业。推荐系统可以更好地将物品曝光给有需要的用户,提升用户和物品的匹配效率。

从本质上讲,推荐系统解决的是资源配置问题。通过软件、算法、工程手段,将供给端(物品提供方)和需求端(用户)通过平台(提供个性化推荐的产品,如淘宝)进行匹配。推荐系统的目标是提升资源的配置效率。

推荐系统的应用领域

对于一款互联网产品来说,只要平台上存在“大量供用户消费的物品”,推荐系统就有用武之地。具体来说,推荐系统的应用领域主要有如下几类。

  • 电商:淘宝、京东、亚马逊等。
  • 视频:B 站、爱奇艺、抖音、快手等。
  • 音乐:网易云音乐、酷狗音乐、QQ 音乐等。
  • 资讯:微信公众号、今日头条、网易新闻等。
  • 生活服务:美团、携程、脉脉等。

可以说,只要是 to C 的互联网产品,都能看到推荐系统的身影。随着技术的发展、生活方式的改变,推荐系统更多的应用场景正在不断被挖掘和创造,比如无人驾驶汽车上的推荐、VR 设备上的推荐、线上线下融合推荐、跨品类的商品和服务推荐等。

常用的推荐算法:

推荐系统大量使用机器学习技术,机器学习技术是推荐系统中最核心的部分。推荐系统的常用算法,主要分为两类:基于内容的推荐算法和协同过滤算法。

基于内容的推荐算法

推荐系统通过技术手段将物品与人关联起来。物品自身包含很多属性,这些属性可以作为用户偏好的标签。通过记录用户与物品的交互行为,我们可以挖掘出代表用户对物品的偏好的标签,利用这些偏好标签为用户进行推荐,就是基于内容的推荐算法。拿商品推荐来说,商品有品牌、品类、价格、产地等属性,推荐系统可以根据用户以前的购买行为获得他对商品品牌、品类、价格、产地等属性的偏好,从而为他推荐可能感兴趣的商品。比如用户购买过 iPhone 手机,我们就可以根据这一行为挖掘出用户对“苹果”这个标签感兴趣,进而为用户推荐苹果电脑、苹果手机壳、苹果电源线等商品,如图所示。

在这里插入图片描述

协同过滤算法:

通过记录用户在互联网产品上的交互行为,可以利用“物以类聚,人以群分”的朴素思想来为用户提供个性化推荐。
具体来说,“物以类聚”是指如果有很多用户对某两个物品有相似的偏好,说明这两个物品是“相似”的,我们可以给用户推荐与其喜欢的物品“相似”的物品,这就是基于物品的(item-based)协同过滤算法。“人以群分”就是找到与目标用户兴趣相同的用户(有过类似的行为),将他们浏览过的内容推荐给目标用户,这就是基于用户的(user-based)协同过滤算法
在这里插入图片描述
这里提到的协同过滤算法是最古老、最简单的协同过滤算法。我们熟知的基于社交关系的推荐其实也是一种协同过滤,比如微信公众号将朋友点过“在看”的内容推荐给你。
在这里插入图片描述
这里提到的协同过滤是比较宽泛的概念,不局限于 user-based、item-based。只要利用群体行为构建推荐算法模型,就属于协同过滤的范畴。协同过滤的概念类似于生物学中的协同进化,通过个体之间直接或者间接的相互作用,挖掘出个体之间隐含的联系,由此推荐系统会越来越懂用户的兴趣偏好。

基于内容的推荐算法和协同过滤算法的差异。二者最本质的区别是:基于内容的推荐算法只使用用户自身的行为信息(与别的用户无关)为其进行推荐,而协同过滤需要利用群体的行为来为某个用户进行推荐(“协同”代表的是群体智慧)。

在真实的推荐场景中,多种算法往往会混合使用,比如混合多种基于内容的推荐算法,混合多种协同过滤算法,甚至将基于内容的推荐算法和协同过滤算法混合。

另外,在商业应用中,推荐算法一般包括召回和排序,召回是初筛的过程(利用多种策略、算法将用户可能喜欢的物品筛选出来),排序是精准打分的过程(构建打分模型,将初选的、用户可能感兴趣的物品按照用户兴趣分数降序排列)。

如何系统学习推荐系统:

今天在这里给大家推荐一本新上市的书《推荐系统:算法、案例与大模型》。全书共 8 篇 24 章,从不同角度介绍了推荐系统构建的理论、方法、策略、案例,围绕推荐系统在企业(特别是 B 端行业)中的应用与实践展开叙述。

在这里插入图片描述
给大家列出目录看一下,非常全面!

第一部分:

详解推荐系统基础,清晰、全面的推荐基础知识。

在这里插入图片描述

第二部分:

详解推荐系统核心算法。

在这里插入图片描述

第三部分:

工程实践与代码实战。

在这里插入图片描述

第四部分:

行业案例通过真实行业案例,呈现 B 端高频规则和策略。
在这里插入图片描述
最后一部分,ChatGPT、大模型与推荐系统篇,通过洞悉未来趋势,了解大模型时代下的推荐系统。
在这里插入图片描述
这本书是绝对的干货满满,书中的案例也是来自行业一线的真实案例,非常具有借鉴意义。

本书不同于市面上现有的推荐系统专题图书,对经典推荐问题的讲解简洁,且有实际案例,尤其增加了现今最火热的大模型与推荐系统结合的内容,可见这个有二十多年企业实践应用历史的话题,也正在焕发新的生命力。

推荐大家仔细看看目录,如果有你需要的知识,就可以买一本来看看~

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/820564.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IO流-IO框架

简介 java的IO流操作提供了最简单的操作&#xff0c;第三方基于日常使用习惯&#xff0c;写了很多IO框架&#xff0c;更加方便操作避免重复造轮子&#xff0c;提高开发效率 Commons-io 简介 Commons-io是apche提供的IO操作的小框架 部分常用的API 引入依赖 <dependency>…

天工杂志社《天工》杂志社2024年第5期目录

业界翘楚 巍巍者昆仑 煌煌者华夏 乔彦鹏; 6-8 工美史话 日月之光照澈幽冥——墓葬铜镜中柿蒂纹意象辨析 周昕怡;刘春芽; 9-11 西藏传统手工艺技能教育发展历程研究 吕元菊; 12-14 探索研究《天工》投稿&#xff1a;cn7kantougao163.com 传统装饰艺术设计美学的…

HashMap的扩容看这一篇足够

在Java中&#xff0c;对于HashMap这样的实现&#xff0c;put方法是用来将一个键值对插入到Map中的核心方法。以下是HashMap类中put方法的大致执行流程&#xff1a; 计算Hash值&#xff1a; 首先&#xff0c;put方法会接收一个键&#xff08;Key&#xff09;和一个值&#xff0…

局域网管理软件哪个好?局域网电脑管理系统实践案例

之前有一个公司案例&#xff0c;是这样的&#xff1a; 公司名称&#xff1a;智慧科技有限公司 背景&#xff1a; 智慧科技有限公司是一家拥有数百名员工的中型企业&#xff0c;随着业务的快速发展&#xff0c;公司面临着网络管理上的挑战。 员工在日常工作中需要频繁地访问…

微信小程序使用iconfont

进入iconfont&#xff0c;添加至项目 进入项目&#xff0c;点击生成代码&#xff0c;或更新代码 点击打开样式 复制内容到小程序的style文件夹下 最后引入到app.wxss

用ChatGPT读了几百篇文献,我总结出了文献综述这些经验

点击下方▼▼▼▼链接直达AIPaperPass &#xff01; AIPaperPass - AI论文写作指导平台 近期小编会将学术论文写作每一个流程需要了解的细节与ChatGPT在这细节的背景下如何提升我们的学术论文进行分章节讨论。最终汇总成一篇长文攻略。宝子们敬请期待哦。今天我们来详细聊聊文…

22 文件系统

了解了被打开的文件&#xff0c;肯定还有没被打开的文件&#xff0c;就是磁盘上的文件。先从磁盘开始认识 磁盘 概念 内存是掉电易失存储介质&#xff0c;磁盘是永久性存储介质 磁盘的种类有SSD&#xff0c;U盘&#xff0c;flash卡&#xff0c;光盘&#xff0c;磁带。磁盘是…

防止企业数据泄密的四种有效措施

防止企业数据泄密的四种有效措施 泄密大案每天都在上演&#xff0c;受害者既有几十人的小型企业&#xff0c;也有上万人的世界500强&#xff0c;为什么这些企业都难逃数据泄露的噩梦呢&#xff1f;我们应该采取什么措施来防止信息泄密呢&#xff1f; 首先我们来看看数据泄密的…

小肥柴慢慢手写数据结构(C篇)(5-5 Huffuman编码)

小肥柴慢慢学习数据结构笔记&#xff08;C篇&#xff09;&#xff08;5-5 Huffman编码&#xff09; 目录5-16 编码案例5-17 Huffman编码原理5-18 Huffman编码/解码实现5-18-1 大致思路5-18-2 编码实现5-18-3 解码实现5-18-4 测试 5-19 实际案例总结参考文献 目录 5-16 编码案例…

✌粤嵌—2024/4/11—合并区间

代码实现&#xff1a; /*** Return an array of arrays of size *returnSize.* The sizes of the arrays are returned as *returnColumnSizes array.* Note: Both returned array and *columnSizes array must be malloced, assume caller calls free().*/// 交换 void swap(i…

YOLOV5检测+追踪使用deepstream部署(c++版)

文章目录 一、Deepstream1.1 简介1.2 图架构&#xff08;Graph architecture&#xff09;1.3 应用架构&#xff08;Application Architecture&#xff09; 二、配置文件方式运行Deepstream2.1 环境准备2.2 主机运行2.3 配置文件解析2.4 docker运行 三、代码方式运行Deepstream3…

Python编程之旅:深入探索强大的容器——列表

在Python编程的世界中&#xff0c;容器&#xff08;Containers&#xff09;是一种用于存储多个项目的数据结构。其中&#xff0c;列表&#xff08;List&#xff09;是最常用且功能强大的容器之一。无论是初学者还是资深开发者&#xff0c;掌握列表的使用方法和技巧都是提升Pyth…

【Android】重温Activity生命周期

前言 Android中用得最多的组件是Activity&#xff0c;而它的生命周期也是最基础的知识&#xff0c;从刚接触Android到工作中会频繁依赖这部分知识。可能大多数人能说出页面新建到页面关闭会走的生命周期&#xff1a;onCreate、onStart、onResume、onPause、onStop、onDestory&…

Linux --- 高级IO

目录 1. 什么是IO 2. 阻塞的本质 3. 五种IO模型 3.1. 通过故事认识五种IO模型 3.2. 上述故事的总结 3.3. 具体的五种IO模型 3.3.1. 阻塞IO 3.3.2. 非阻塞轮询式IO 3.3.3. 信号驱动IO 3.3.4. 多路转接IO 3.3.5. 异步IO 4. 非阻塞IO 4.1. fcntl 系统调用 1. 什么是I…

抖店如何打造一款爆品?按照这三个阶段做,爆单很简单

大家好&#xff0c;我是电商笨笨熊 做抖音小店不懂得怎么选品&#xff0c;那还怎么出销量&#xff1f; 选品时很多新手最苦恼的问题&#xff0c;不知道从哪里选品更容易选中爆品、不懂得什么样的品才是爆品&#xff0c;更不懂得如何打造一款爆品。 那么今天&#xff0c;我们…

创建影子用户

文章目录 1.认识影子用户2.创建隐藏账户并加入管理员组3.修改注册表3.删除用户4.添加管理员权限 1.认识影子用户 影子用户通常指的是那些在系统用户列表中不可见&#xff0c;但在某些情况下可以进行操作的用户。在内网渗透过程中&#xff0c;当我们拿到shell时&#xff0c;肯定…

android11 如何修改状态栏的背景

修改status_bar.xml &#xff1a; <LinearLayout android:id"id/status_bar_contents"android:background"#1ABC9C"android:layout_width"match_parent"android:layout_height"match_parent"android:paddingStart"dimen/statu…

【重回王座】ChatGPT发布最新模型gpt-4-turbo-2024-04-09

今天&#xff0c;新版GPT-4 Turbo再次在大型模型排行榜上荣登榜首&#xff0c;成功超越了此前领先的Claude 3 Opus。另外&#xff0c;新模型在处理长达64k的上下文时&#xff0c;性能竟能够与旧版在处理26k上下文时的表现相当。 目前GPT-4 Turbo仅限于ChatGPT Plus的用户&…

Nginx服务 重写功能与反向代理

六、重写功能 rewrite Nginx服务器利用 ngx_http_rewrite_module 模块解析和处理rewrite请求&#xff0c;此功能依靠 PCRE(perl compatible regular expression)&#xff0c;因此编译之前要安装PCRE库&#xff0c;rewrite是nginx服务器的重要功能之一&#xff0c;用于实现URL的…

DBA面试总结(Mysql篇)

一、delete与trancate的区别 相同点 1.两者都是删除表中的数据&#xff0c;不删除表结构 不同点 1.delete支持按条件删除&#xff0c;TRUNCATE不支持。 2.delete 删除后自增列不会重置&#xff0c;而TRUNCATE会被重置。 3.delete是逐条删除&#xff08;速度较慢&#xff09…