用MySQL实现微博关注关系的方案分析

关注关系产生的四种关系状态

  • 关注
  • 粉丝
  • 双向关注(互粉)
  • 无关系

用词follower表示粉丝 -- 追随者
用词following表示关注 -- 追随

设计的结构必须能满足以下功能:

  • 查询关注列表
  • 查询粉丝列表
  • 查询双向关注列表
  • 判断两个用户的关系
  • 查询带关系状态的任一列表

第一种方案

用一行纪录表示关注和粉丝,字段u2的值表示粉丝,u1表示被关注者。

Table: user(用户表)
3.png

Table: follower(u2表示粉丝, u1表示被关注的人)
1.png

查询用户id = 1的关注列表

SELECT * FROM follower WHERE u2 = 1

查询用户id = 1的粉丝列表

SELECT * FROM follower WHERE u1 = 1

查询用户id = 1的双向关注列表

SELECT t1.* FROM (SELECT * FROM follower WHERE u2 = 1)  AS t1 INNER JOIN follower t2 ON t1.u1 = t2.u2 LIMIT 10

判断两个用户的关系(id = 1 --> id = 5)

SELECT * FROM follower WHERE (u2 = 1 or u1 = 1) AND (u2 = 5 or u1 = 5) LIMIT 3

id = 1的用户查询所有 id < 5的用户,并显示关系

2.png

如上图所示,要查询的用户的那个圈,被分成了四个部分(上面讲的四种状态):

  • 关注了我的用户
  • 和我互粉的用户
  • 我关注了的用户
  • 我未关注的用户

以上复杂的集合关系,通过单一SQL根本无法实现。

要查询的用户与粉丝集合的交集:

SELECT * FROM (SELECT * FROM user WHERE id < 5) AS t1
INNER JOIN(SELECT * FROM follower WHERE u1 = 1) AS t2ON t1.id = t2.u2

要查询的用户与关注集合的交集:

SELECT * FROM (SELECT * FROM user WHERE id < 5) AS t1
INNER JOIN(SELECT * FROM follower WHERE u2 = 1) AS t3ON t1.id = t3.u1

其他的部分可以通过以上两步查询出来的数据,在内存中作计算得出。

因为关注关系是互相的,用一行纪录即可表示。以上的设计其实是把关注和粉丝的概念用一行纪录表达。这样会引来一个缺点,当follower非常大的时候,对follower表进行分片,如果按u1或者u2分片,假设按u1分片,那么将导致关注列表,即下面的查询要做聚合。

SELECT * FROM follower WHERE u2 = 1

选择u1分片后,u2 = 1的数据行将会落到不同的分片上。

SELECT * FROM follower_0 WHERE u2 = 1
UNION 
SELECT * FROM follower_1 WHERE u2 = 1

而粉丝列表的查询不会受影响,同一个用户的所有粉丝分在一个片上。

SELECT * FROM follower_1 WHERE u1 = 1

如果按u2分片,同样也会导致粉丝列表会落在不同的分片上。两个查询不可能同时满足分片。

如果分片是跨数据库或者是跨主机的方案,问题会变得更复杂。

针对方片的优化方案

可以用冗余数据的办法来解决数据分片带来的问题,即将关注和粉丝分2个表存放。
用follower表存放粉丝
用following表存放关注

当用户Ub关注Ua,分别往follower, following写入一行纪录。 (Ua -> Ub) 只是他们表示的含义不同。

follower表示Ua的粉丝是Ub
following表示Ub关注Ua

分片的时候,同时对follower和following进行分片。同时上面分析的所有查询方法也要相应改变,思路还是一样,只是单个表的自联接变成2个表的联接。

以上方案缺点就是数据量会增加一倍,进行关注或者取消关注的写操作会多一次,要同时维护2个表的数据。

以上优化虽然解决了一些问题,但同时也带来一些问题。可见关系型数据库在处理用户关系的时候,表现得很吃力。我们不得不承认,虽然叫“关系”型数据库却不太懂得处理集合关系。

另一种方案

还有一种方案,即用一行纪录表示出两个用户之间的所有关系,此方案能节省很大的数据空占用。

字段: u1, u2, type

type=1 表示u2关注u1
type=2 表示u1,u2互相关注
type=0 表示u1,u2无关系(默认)

保证插入数据时,u1是被关注者,u2是粉丝(当然你也可以换过来,只是逻辑会变了)

每次写入数据时要检查当前的状态:

如果u1(1) -> u2(2)纪录已经存在(u2已经关注u1),这个时候u1再关注u2,只需要将type字段的值变为type = 2。

如果u1(1) -> u2(2) type(2)时,即u1和u2互相关注,如果有一个人取消关注,问题会很复杂,最坏的情况要修改整行纪录,交换u1,u2这两个字段的值,再修改type=1。

同时上面的方案查询也会变化。例如要查询id = 1的粉丝列表:

SELECT * FROM table WHERE u1 = 1 OR (u2 = 1 AND type = 2)

例如要查询id = 1的关注列表:

SELECT * FROM table WHERE u2 = 1 OR (u1 = 1 AND type = 2)

上面的方案只强调关注关系,双向关系只是在单一关系上用字段区分,关注的先后关系很明显,事务性更强。

查询id = 1的双向关注

SELECT * FROM table WHERE type = 2 AND (u1 = 1 OR u2 = 1)

这个方案虽然节省数据空间,但是不容易理解,而且写入时每次要检查判断当前的关系,逻辑上过于复杂。而且数据量大后,由于查询WHERE条件同时有u1和u2,很难进行分片。

其他一些问题

  • ua与ub的共同关注列表
  • ua与ub的共同粉丝列表
  • ua的关注列表里谁关注了ub

以上的关系计算大家可能很容易理解,但要在MySQL里实现,是非常难的。

id = 3与id = 2的共同关注列表:

SELECT  u1, COUNT(id) AS num FROM follower WHERE u2 = 3 OR u2 = 2
GROUP BY u1 HAVING num > 1

id = 3与id = 1的共同粉丝列表:

SELECT  u2, COUNT(id) AS num FROM follower WHERE u1 = 3 OR u1 = 1
GROUP BY u2 HAVING num > 1

当然你可以用集合的方法查询:

SELECT t1.u2 FROM 
(SELECT  u2 FROM follower WHERE u1 = 3) AS t1INNER JOIN
(SELECT  u2 FROM follower WHERE u1 = 1) AS t2ON t1.u2 = t2.u2

id = 1的关注列表里谁关注了id = 5

SELECT u2 FROM (SELECT u2 FROM follower WHERE u1 = 2) AS t1
INNER JOIN 
(SELECT u1 FROM follower WHERE u2 = 1) AS t2
ON t2.u1 = t1.u2

转载于:https://www.cnblogs.com/JockChou/p/4643649.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/405443.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

带你封装一个上传图片组件(ant design+react)

目录 需求实现 实现效果 代码封装 UploadImage组件 备注 BaseUploadImage组件 index.less 样式文件 父组件引用 需求实现 1可以支持上传最多九张图片 2图片支持预览 替换 删除 3支持自定义上传文件大小 格式 未上传提示 实现效果 代码封装 UploadImage组件 * Descri…

计算机面试的时候写过的代码,程序员悲催瞬间:来之不易的美团面试,我尽然挂了(还原真实场景)...

一面1、自我介绍答&#xff1a;自我介绍是面试中唯一的自己主动介绍自己的环节&#xff0c;一定要好好把握好&#xff0c;你数据结构学的号可以手撕一个红黑树你就说我数据结构掌握地很好&#xff0c;反正就是要把自己的优势凸显出来&#xff0c;比如自己对于java的知识较熟悉&…

C语言中return和exit的区别

1&#xff0c;exit用于在程序运行的过程中随时结束程序&#xff0c;exit的参数是返回给OS的。main函数结束时也会隐式地调用exit函数。exit函数运行时首先会执行由atexit()函数登记的函数&#xff0c;然后会做一些自身的清理工作&#xff0c;同时刷新所有输出流、关闭所有打开的…

华为IoT平台NB编解码插件开发详细教程【下篇】

上篇文章介绍了编解码开发汇总的环境搭建、Profile说明和插件编写&#xff0c;本篇教程就插件打包、插件质检和插件签名详解。 目录 四、插件打包 五、插件质检 六、插件签名 七、附件 四、插件打包 1、新建package文件&#xff0c;包含一个“preload”子文件夹&#xff…

【PostGIS】PostgreSQL15+对应PostGIS安装教程及空间数据可视化

一、PostgreSQL15与对应PostGIS安装 PostgreSQL15安装&#xff1a;下载地址PostGIS安装&#xff1a;下载地址&#xff08;选择倒数第二个&#xff09; 1、PostgreSQL安装 下载安装包&#xff1b;开始安装&#xff0c;这里使用默认安装&#xff0c;一直next直到安装完成&…

系统没有远程桌面,如何安装远程桌面

From: http://blog.sina.com.cn/s/blog_53657b280100avdb.html 系统没有远程桌面,如何安装远程桌面 可能是远程桌面对应的组件文件被删除&#xff0c;或是相关服务被停止而造成的&#xff0c;先单击“开始/运行”&#xff0c;输入&#xff1a;regsvr 32remotepg.dll并回车注…

su su - sudo

1.su只是切换了root身份&#xff0c;但是shell环境仍然是普通用户的shell&#xff0c;su切成root后&#xff0c;pwd工作目录仍然是普通用户的工作目录 2.su - 用户和shell环境一起切换到了root身份了。以root身份登录&#xff0c;执行实际用户login以后的所有操作&#xff08;包…

React实现图片自适应

数据格式 [1xxxx,2xxxx,3xxxx,4xxxx,5xxxx,6xxxx,7xxxx,8,xxxx,9xxxx] 运行效果 代码部分 <divgutter{24}style{{width: 100%,display: flex,justifyContent: space-between,flexWrap: wrap ,}}>{item.imgList &&item.imgList.map((itemList, index) > (<…

上交大计算机复试机师难不难,本科复旦,考研上海交大复试第一,我感觉难度并不大...

我本人去年考研上海交大凯原法学院法学硕士&#xff0c;初试370分&#xff0c;排名第四。复试182分&#xff0c;排名第一。本科复旦&#xff0c;有过转专业经历因此法学院课程只学了3年&#xff0c;比较匆忙&#xff0c;基础不算好。2020年国家法律职业资格考试和考研同时备考&…

C与C++中的extern与static、extern C与__cplusplus的作用

一、概述 以C语言编写的源文件后缀名为.c&#xff0c;以C语言编写的源文件后缀名为.cpp&#xff0c;C支持函数的重载&#xff0c;C和C编译器对函数的编译处理是不完全相同。C编译后的函数一般是以函数名和形参类型来命名&#xff0c;C则是直接利用函数名进行命名。 假设有函数…

共谋节点两个单列表

题目&#xff1a;输入两个单链表。找出公共结点。 思路&#xff1a;若两个单链表有公共结点。其形状必然为“Y”型&#xff0c;也就是说公共结点后的全部结点都是同样的。我们首先获得两个链表的长度。求得长度之差为n&#xff0c;再定义两个指针分别指向两个链表首部&#xff…

bzero, memset ,setmem 区别

From: http://blog.csdn.net/agathe/article/details/6066157 bzero 原型&#xff1a; extern void bzero(void *s, int n);用法&#xff1a; #include <string.h>功能&#xff1a;置字节字符串s的前n个字节为零。 说明&#xff1a;bzero无返回值。 举例&am…

OPENCV2.2移植说明

OPENCV2.2移植说明 系统&#xff1a;Ubuntu10.10  编译OPENCV2.2 reference URL: http://opencv.willowgarage.com/wiki/InstallGuide  安装库&#xff1a; apt-get install build-essential cmake pkg-config libpng12-0 libpng12-dev libpng-dev li…

前端问题记录1:debounce is not a function

目录 项目场景&#xff1a; 问题描述&#xff1a; 原因分析&#xff1a; 解决方案&#xff1a; 项目场景&#xff1a; 问题描述&#xff1a; 原因分析&#xff1a; 变量重名 解决方案&#xff1a; 变量重名 关注我 一起进入前端学习群 谢谢

计算机word求差函数,表格里怎么自动求差/怎样在word2010表格中求差

如何在Excel表格中求差你这15分貌似很好赚啊怎样在word2010表格中求差一步&#xff1a;打开Excel&#xff0c;单击第一排&#xff0c;第三个“格”&#xff0c;也就C1&#xff0c;在C1中输入“A1-B1”&#xff1b;第二步&#xff1a;这个公式的意思就是说&#xff1a;A1-B1C1&a…

Linux 使用fcntl c_cc[VMIN] c_cc[CTIME]设置串口阻塞与非阻塞读取数据

一、概述 Linux串口非常灵活&#xff0c;可以根据需要配置成标准串口和自定义串口模式&#xff0c;就Linux 串口读取数据来说&#xff0c;有有两种主要方式&#xff1a;阻塞与非阻塞。 阻塞&#xff1a;一直等待数据&#xff0c;直到退出条件成立&#xff1b;非阻塞&#xff…

CSS3选择器(二)--表单

:enabled 选择可用状态的表单元素 :disabled 选择不可用状态的表单元素 :checked 复选框、单选框选中状态的选项 ::selection 用来匹配突出显示的文本(用鼠标选择文本时的文本)。 :read-only 用来指定处于只读状态元素的样式.即元素中设置了“readonly’readonly’” :read…

Linux Shell 通配符、元字符、转义符使用实例介绍

From: http://www.cnblogs.com/chengmo/archive/2010/10/17/1853344.html 说到shell通配符&#xff08;wildcard&#xff09;&#xff0c;大家在使用时候会经常用到。下面是一个实例&#xff1a; ?1?1234[chengmolocalhost ~/shell]$ lsa.txt b.txt c.old#2?1234[chengmo…

ant design model实现图片预览

代码部分 <divgutter{16}style{{width: 100%,display: flex,justifyContent: space-between,flexWrap: wrap ,}}>{detailMsg.imgList &&detailMsg.imgList.map((item, index) > (<div style{{ width: 30% }} key{index} onClick{() > this.handleClick(…

VMware Workstation Pro 无法在Windows 上运行的 解决办法

一、问题描述 国庆期间window10来了一次更新&#xff0c;导致VMware Workstation 无法在windows上运行&#xff0c;我的虚拟机版本是VMware Pro14。有两种方法解决该问题&#xff0c;第一种是直接卸载新安装的windows安装包&#xff0c;然后重启。第二种方式是升级VMware到最新…