推荐系统的必要性

推荐系统的必要性

      • 引言回顾
      • 你需要推荐系统吗?
      • 怎么做?

引言回顾

在专栏文章的引言中,我们讨论了推荐和推荐系统,以及推荐系统的应用。这里我感觉有必要再通俗地介绍下推荐系统。我们所存在的世界是不断发展的,发展是靠着越来越多的连接来进行的。从最原始的物物交换,到今天世界各国建立贸易关系,都是为了自身的发展。同样的,推荐系统的目的就是要建立物品和人之间的关系,把物品推荐给人。比较恰当的例子就是微博营销,他通过人与人之间的关系网络,将一个圈子里可能出现的热门物品推荐给这个圈子的每一个人。

你需要推荐系统吗?

如果你已经拥有了物品,又有了流量(人),这时候推荐系统的两个关键的要素都具备了,这时候你需要认真考虑是否要上推荐系统。在做一件事情之前,我们先要明确自己的目的,即我需要推荐系统,它能给我带来什么?能给我提升广告收入?能延长用户停留时长?能更多地购买我的产品?等等。在经过一系列的调研、讨论后,确定是需要搭建属于自己的推荐系统,期望能在业务、产品上带来一定的价值,那么你就可以动手做了。
这里重点关注下自己的物品和流量是否都达到了一定的量级,如果物品太少,是不需要做推荐的,找个运营就搞定了;如果流量太少,同样不适合做推荐。总结以上两点,如果能建立的物品和人之间的关系太少,那就不需要做推荐。直观一点,就是一个矩阵太稀疏了,能建立的关系太少了:
(1)X=[100000001000]X = \left[ \begin{matrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{matrix} \right] \tag{1} X=100000000010(1)
如果只能建立上述关系的矩阵,那么我们是不需要推荐的,这与推荐中的稀疏矩阵是两个问题,大家注意分辨。

怎么做?

确定了自己的确需要推荐系统,那么我们怎么做,需要考虑什么呢?首先,最重要的就是投入产出比。搭建自己的一套推荐系统,需要团队中有以下人才予以支持。

算法工程师(推荐方向最好)
开发工程师(需要java,spring cloud 微服务)
大数据工程师(flink, spark, hive)
大数据运维工程师
BI工程师(数据仓库、数据挖掘和数据分析)
推荐产品经理
测试工程师
算法架构师(可选)

那么,这样一个团队的组建是非常昂贵的,尤其是算法工程师比较稀缺,招到一个合适的是非常难的(ps:面试面到想吐,合适的、发了offer的还不一定来),hr和技术面试官都太累。算法架构师可选的原因是能力强一点的算法工程师是可以担任这个角色的。但是针对大型的机器学习平台等建设就必须要算法架构师了。

如果已经组建了算法团队,就不要在意硬件成本,人力成本是最昂贵的。该买的服务器,电脑,办公用品等都已具备,那么就可以开始你的推荐系统建设了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/576489.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JNI的方式调用DLL(SO)(上)

最近有个项目要调用原有的DLL文件,本来准备使用JNA,可是客户不同意,非要使用JNI的方式。万般无奈之下,只能重新使用JNI,现将JAVA调用动态链接库的一般方法总结如下。 JNI是Java Native Interface(JAVA本地调…

搭建推荐系统所需要的材料

搭建推荐系统所需要的材料人力物力推荐系统的原材料物品流量最后人力物力 在上一小节中《推荐系统的必要性》里已经讨论过一个推荐业务团队需要哪些人员储备,需要什么核心技术等。这里在重点说下物力,即机器资源设备。 往往从头开始搭建这样一个团队&a…

kafka:topic为什么要进行分区?副本机制是如何做的?

kafka为什么要在topic里加入分区的概念?如果没有分区,topic中的segment消息写满后,直接给订阅者不是也可以吗? Kafka可以将主题划分为多个分区(Partition),会根据分区规则选择把消息存储到哪个分区中,只要如…

将某字符串切割成阵列并排序列出

老师布置的另外一道题是将字符串"a;b;d;z;y;u"切割成阵列并排序列出。老师出这题也许是让Insus.NET掌握或复习Array.Sort()函数,不管怎样,先按自己的想法实现,然后是等老师的意见。protected void Page_Load(object sender, EventA…

Kafka史上最详细原理总结

原文链接:Kafka史上最详细原理总结_我是Alvin家鸡鸭鱼的小米米-CSDN博客_kafka史上最详细原理总结

关于管理,这5大误区你越早知道越好

关于管理,这5大误区你越早知道越好 原创: 陈春花 管理的常识 绝大部分人都感觉自己已经非常努力地工作,但结果却不尽如人意,到底问题出在哪里? 就让北京大学国家发展研究院管理学教授、北大国发院BiMBA商学院院长陈春…

大数据技术之 Kafka (第 3 章 Kafka 架构深入 ) Log存储解析

Kafka 工作流程 Kafka 中消息是以 topic 进行分类的,生产者生产消息,消费者消费消息,都是面向 topic的。 topic 是逻辑上的概念,而 partition 是物理上的概念,每个 partition 对应于一个 log 文件,该 log…

IIS上配置运行cgi,php,aspx运行环境

1、配置PHP程序运行环境: 把PHP解释程序安装到C:\php目录下,然后把此目录下的php4ts.dll文件复制到c:\windows\system32目录下。接着把PHP目录下的 php.ini.dist文件改名为php.ini,并编辑此文件,找到register_globals off这一项修…

推荐系统整体框架概览

推荐系统整体框架概览推荐系统整体架构 推荐系统的核心组成部分离线核心节点服务UI总结推荐系统整体架构 先说点题外话,最近在看的书中讲到了怎么进行自学的方法,分了十个层级。第一个便是要了解所学内容的概况,也就是轮廓,大的东…

大数据技术之 Kafka (第 3 章 Kafka 架构深入 ) Kafka 生产者

3.2.1 分区策略 1)分区的原因 (1)方便在集群中扩展,每个 Partition 可以通过调整以适应它所在的机器,而一个 topic又可以有多个 Partition 组成,因此整个集群就可以适应任意大小的数据了; &a…

大学(转载)

1. 别怕丢人,追求丢人是一种成功的尝试,至于为此笑话你的人,你可以把他们从你将来人生对手的名单中排除了,你也要为每一位上台唱歌的人鼓掌。2、你有足够的理由佩服每天早起的人,不信的话,你去做。做到后会…

自燃型员工的特点

自燃型员工的特点原文:https://mp.weixin.qq.com/s/SaQ_GG7CpPqdGc_l5jffag 稻盛和夫曾经说过,人分为三种: 一种是自燃型,自我驱动,自我燃烧; 第二种是点燃型,需要别人在背后推一把;…

MySQL定时备份实现

一、备份数据库 –all-databases 备份所有数据库 /opt/mysqlcopy/all_$(date “%Y-%m-%d %H:%M:%S”).sql 备份地址 docker exec -it 容器名称 sh -c "mysqldump -u root -ppassword --all-databases > /opt/mysqlcopy/all_$(date "%Y-%m-%d %H:%M:%S").sq…

POJ 1159 (DP)

题目:http://poj.org/problem?id1159 思路: 找出原串的最长回文子串,当然这里说的回文子串可以不连续。用原串的长度减去最长回文子串的长度即可得出结果。 设原串a[5001],它的反串为b[5001],求出a和b的最长公共子串的长度(可以不连续&#…

新版本ISR 为啥 移除replica.lag.max.messages这个参数

ISR 上节我们涉及到ISR (In-Sync Replicas),这个是指副本同步队列。副本数对Kafka的吞吐率是有一定的影响,但极大的增强了可用性。默认情况下Kafka的replica数量为1,即每个partition都有一个唯一的leader,为了确保消息的可靠性&am…

程序员健身的重要性

程序员健身的重要性人的身体就是人的灵魂最好的写照! --- 路德维系.维特根斯坦 健身不仅是保持健康体魄的关键要素之一,也是灵活的、具有创造性的脑力活动的基础。 --- 约翰.肯尼迪 …

Java 8 中的哈希表

JDK 的代码是开源的,我们打开idea开发工具,引入jdk1.8 找到hashmap HashMap 是基于 HashTable 的一种数据结构,在普通哈希表的基础上,它支持多线程操作以及空的 key 和 value。 在 HashMap 中定义了几个常量: static final in…

NSJSONSerialization介绍

ios5中apple增加了解析JSON的api——NSJSONSerialization。网上已经有人做过测试,NSJSONSerialization在效率上完胜SBJSON、TouchJSON、YAJL、JSONKit、NextiveJson。详情见这里。既然apple为我们提供了这么良好的工具,我们没理由不用吧。 NSJSONSeriali…

开始新的blog之旅--flash3,0涂鸦板保存,撤销功能

一直以来都是在百度写的博客,今天不知道百度是哪抽风。居然把我的博客给封了,上贴吧去发泄一番,结果帖子都给删了。 不得不说你百度厉害,你自己犯的错误。让我们这些用户跟着受罪。我看今天很多博客都被封了,都不知道原…

JDK8HashMap的扩容核心解读,尾插法

看懂了JDK7Hashmap的扩容头插法,及其可能产生的循环引用问题,今天看看JDK8的HashMap扩容实现。采取的是用四个结点,两条链表完成重新分配位置,比较简单有趣。解析如下: //如果原来的table等于null,直接返回…