短网址系统设计与实战

🎨领域:Java后端开发



在这里插入图片描述


🔥收录专栏: 系统设计与实战
🐒个人主页:BreezAm
💖Gitee:https://gitee.com/BreezAm
✨个人标签:【后端】【大数据】【前端】【运维】

文章目录

    • 💖介绍
    • 💖一、相关概念及技术
      • 🌲1.1 Redis缓存
      • 🌲1.2 生成6位随机码算法
      • 🌲1.3 布隆过滤器
      • 🌲1.4 302和301
    • 💖二、系统设计
      • 🌲2.1 数据库设计
        • 🎄2.1.1 ER图
        • 🎄2.1.1 表设计
          • ⛅️1.用户表
          • ⛅️2.短链信息表
          • ⛅️3. 短链分组表
          • ⛅️4.短链访问统计表
    • 💖三、系统详细设计
      • 🌲3.1 短链生成
        • 🎄3.1.1 原理
        • 🎄3.1.2 流程图
      • 🌲3.2 短链访问网站
        • 🎄3.2.1 原理
        • 🎄3.2.2 流程图
    • 💖四、结论
    • 💖五、开源地址

💖介绍

今天介绍一个短网址系统的设计与实现。所谓的短链接就是不管你的链接有多么长,最终它都会生成一个固定长度的短链接。虽然说义务很简单,但是里面会涉及很多的细节。保证短链接唯一访问速度成为一个核心的问题,接下来就开始表演。
短链接的应用场景:

  • 营销推广:短信发送、移动端链接转发(哔哩哔哩)
  • 文章内容排版
  • 企业发送面试题
  • 投票和问卷

💖一、相关概念及技术

🌲1.1 Redis缓存

在本系统中,我们会用到redis数据类型Hash,用于存储我们要访问的长链接,我们都知道,Hash的查询时间复杂度O(1),故而采用其保存code和长链接的一个KV对应就可以提高短链到长链接的转发速度(302协议),存储模型如下所示:

在这里插入图片描述

🌲1.2 生成6位随机码算法

短网址实现的核心是必须保证生成的6位code必须唯一,使用该算法也不能够完全保证唯一,所以本人设计时在义务层引入redis高级数据类型布隆过滤器做了一个优化,以保证生成的6位编码唯一。

public class ShortUrlCodeUtil {private static final String randomStr = "hnmnd0d";public static String genShortCode(String url, String randomStr) {return shortUrl(url, randomStr)[0];}public static String genShortCode(String url) {return shortUrl(url, randomStr)[0];}private static String[] shortUrl(String url, String randomStr) {String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h","i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t","u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5","6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H","I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T","U", "V", "W", "X", "Y", "Z"};String encrypt = (MD5.encrypt(randomStr + url));String hex = encrypt;String[] resUrl = new String[4];for (int i = 0; i < 4; i++) {String t = hex.substring(i * 8, i * 8 + 8);long lHex = 0x3FFFFFFF & Long.parseLong(t, 16);String charTemp = "";for (int j = 0; j < 6; j++) {long index = 0x0000003D & lHex;charTemp += chars[(int) index];lHex = lHex >> 5;}resUrl[i] = charTemp;}return resUrl;}
}

🌲1.3 布隆过滤器

思考问题:

  • 为什么要使用布隆过滤器,不使用set集合?
  • 布隆过滤器有哪些义务场景?
  • 布隆过滤器的底层原理?
  1. 本系统使用布隆过滤器的目的是对生成的6位code去重,防止存在重复的编码,虽然说重复的概率很小,但是还是要防止,所以对其做了一个优化,至于同样是去重,为什么不用set,由于篇幅原因,不再展开。
  2. 其次,布隆过滤器在本系统还有一个作用,就是解决缓存击穿透问题,当一个用户发送一个短链接请求来的时候,首先系统会解析出6位code,然后先去布隆过滤器查找,如果存在再去缓存获取code对应的长链接,缓存不存在再去数据库查找;如果不存在的话,直接抛出异常,不在去数据库和缓存查询。

在这里插入图片描述

@Service
public class ShortURLService {/*** 预计要放入的值数量*/private Integer size=10_0000;/*** 期望的误判率*/private Double error=0.01;/*** 实例化布隆过滤器*/private BloomFilter<String> shortUrlCodeFilter = BloomFilter.create(Funnels.stringFunnel(Charset.defaultCharset()), size, error);/*** 放入短网址编码** @param code*/public void put(String code) {shortUrlCodeFilter.put(code);}/*** 判断布隆过滤器是否包含此元素** @param code 短网址编码* @return*/public boolean contain(String code) {return shortUrlCodeFilter.mightContain(code);}
}

🌲1.4 302和301

由于本系统需要将长链接在后台通过请求转发的方式转发出去,所以会用到请求转发协议。请求转发有两种,一种是301,另一种是302,那他们有什么区别呢?
1)301永久重定向
2)302临时重定向
由于我们需要做数据统计,也就是记录短链接访问量,所以需要使用302协议

💖二、系统设计

🌲2.1 数据库设计

本系统设计的是一个稍微简单的短链生成系统,所以表的设计不复杂,义务简单,主要的表是短链接信息表,用于存储生成的短链接。

🎄2.1.1 ER图

就4张表:用户表、数据统计表、短链分组表、短链接信息表。

  • 一个用户可以新建多个分组
  • 一个可以有多个短链接信息
  • 一条短链接可以有多个数据统计(每天的访问量)

在这里插入图片描述

🎄2.1.1 表设计

⛅️1.用户表

用于保存注册的用户信息

在这里插入图片描述

⛅️2.短链信息表

用于记录生成的短链接信息

在这里插入图片描述

⛅️3. 短链分组表

登录的用户可以为新建的短链接分组,每个用户注册成功都会有一个默认的分组至少有一个组

在这里插入图片描述

⛅️4.短链访问统计表

用于记录每条短链接每天的用户访问量

在这里插入图片描述

💖三、系统详细设计

🌲3.1 短链生成

🎄3.1.1 原理

短链接生成的流程大概就是,用户输入一个长链接,请求短链生成方法,首先该方法需要进行加锁,防止多线程多个用户同时请求该方法出现多线程问题,长链通过短链生成器后得到一个6为数的编码,然后去布隆过滤器去判断是否已经存在,如果已经存在的话需要重新调用生成器生成,接下来就是把这6位编码保存到数据库布隆过滤器

🎄3.1.2 流程图

在这里插入图片描述

🌲3.2 短链访问网站

🎄3.2.1 原理

短链的访问流程大致是:用户在浏览器输入一个短链接,系统解析出最后的6位编码,然后用这个编码去布隆过滤器查询是否存在,如果存在就去缓存获取长链,如果缓存不存在的话再去数据库查询,并将查询出来的短链解析刷新到缓存,接下来通过请求转发,将获取到的长链接通过302协议转发出去;如果布隆过滤器不存在6位编码的话直接抛出异常

🎄3.2.2 流程图

在这里插入图片描述

💖四、结论

短链接的应用场景非常的广泛,所以当面对这样的义务时,设计一个可靠的短链接变得很重要,由于本系统是本人设计和开发的第一个版本,设计也很简单,可能会出现些问题,欢迎大家在评论区留言指出,也可以提出问题和修改建议,感谢!。

💖五、开源地址

后端前端
https://gitee.com/BreezAm/TZ-SHORTURLhttps://gitee.com/BreezAm/shorturl-site

🌏线上地址:http://url.breez.work

🔥收录专栏:系统设计与实战
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517384.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“我,懂数据,不怕被裁”:这项核心能力到底有多香?

我见过市面上很多的 Python 讲解教程和书籍&#xff0c;他们大都这样讲 Python 的&#xff1a;先从 Python 的发展历史开始&#xff0c;介绍 Python 的基本语法规则&#xff0c;Python 的 list, dict, tuple 等数据结构&#xff0c;然后再介绍字符串处理和正则表达式&#xff0…

RuoYi-Cloud 登陆 /code 获取验证码出错

文章目录1. 异常信息2. 分析定位3. 解决方案1. 异常信息 [网关异常处理]请求路径:/code,异常信息:Invalid value ‘KaptchaTextCreator’ for config parameter ‘kaptcha.textproducer.impl’. 2. 分析定位 如果不修改包名的话&#xff0c;默认不会出现此问题&#xff0c;…

谁顶住双11的世界级流量洪峰?神龙架构负责人等9位大牛现场拆解阿里秘籍

阿里江湖中&#xff0c;很多资源和技术&#xff0c;如神龙服务器、OceanBase、POLARDB等等&#xff0c;在开源、自研、云这三架马车上形成协同效应&#xff0c;既是内功也是武器。 “不是任何一朵云都能撑住这个流量。中国有两朵云&#xff0c;一朵是阿里云&#xff0c;一朵叫…

如何回答性能优化的问题,才能打动阿里面试官?

阿里妹导读&#xff1a;日常工作中&#xff0c;我们多少都会遇到应用的性能问题。在阿里面试中&#xff0c;性能优化也是常被问到的题目&#xff0c;用来考察是否有实际的线上问题处理经验。面对这类问题&#xff0c;阿里工程师齐光给出了详细流程。来阿里面试前&#xff0c;先…

RuoYi-Cloud [网关异常处理]请求路径:/code,异常信息:null

文章目录1. 现象2. 分析定位3. 解决方案1. 现象 nacos配置文件中有值&#xff0c;但是代码初始化时未赋上值 2. 分析定位 既然nacos已经配置了&#xff0c;获取不到只能存在二种情况&#xff0c; 第一种&#xff1a;获取的不是最新的nacos的配置 第二种&#xff1a;没有…

这 10 行比较字符串相等的代码给我整懵了,不信你也来看看

来源 | 程序猿石头责编 | Carol 封图 | CSDN 下载自视觉中国先直接上代码&#xff1a;boolean safeEqual(String a, String b) {if (a.length() ! b.length()) {return false;}int equal 0;for (int i 0; i < a.length(); i) {equal | a.charAt(i) ^ b.charAt(i);}return …

SpringBoot整合websocket实现及时通信聊天

&#x1f3a8;领域&#xff1a;Java后端开发&#x1f525;收录专栏&#xff1a; 系统设计与实战 &#x1f412;个人主页&#xff1a;BreezAm &#x1f496;Gitee&#xff1a;https://gitee.com/BreezAm ✨个人标签&#xff1a;【后端】【大数据】【前端】【运维】 文章目录&am…

2019双11,支付宝有哪些“秘密武器”?

2019双11&#xff0c;支付宝参战的第十一年。 与十一年前相比&#xff0c;双11的许多东西都改变了。比如金额——2684亿&#xff0c;差不多是十一年前的5000倍&#xff1b;比如流量——订单峰值54.4万笔/秒&#xff0c;曾经是想都不敢想的数字&#xff1b;再比如层出不穷的新技…

一文看懂 K8s 日志系统设计和实践

导读&#xff1a;上一篇文章《6 个 K8s 日志系统建设中的典型问题&#xff0c;你遇到过几个&#xff1f;》中我们介绍了为什么需要一个日志系统、为什么云原生下的日志系统如此重要以及云原生背景下日志系统的建设难点&#xff0c;相信 DevOps、SRE、运维等同学看了之后深有体会…

如何在 Kubernetes 上配置 Jenkins?

作者 | Sudip Sengupta译者 | 火火酱&#xff0c;责编 | Carol封图 | CSDN 下载自视觉中国在本文中&#xff0c;我们将一起完成在Kubernetes上配置Jenkins的工作。作为一款被广泛使用的开源CI服务器&#xff0c;Jenkins提供了数百个插件&#xff0c;能够为我们项目的构建、部署…

MySQL做数据统计SQL语句整理大全(原理+实战)

&#x1f3a8;领域&#xff1a;Java后端开发&#x1f525;收录专栏&#xff1a; MySQL原理与实战 &#x1f412;个人主页&#xff1a;BreezAm &#x1f496;Gitee&#xff1a;https://gitee.com/BreezAm ✨个人标签&#xff1a;【后端】【大数据】【前端】【运维】 文章目录&a…

如何在一周内上线50个用户增长策略

在闲鱼用户增长业务上的实验 我们最先落地的业务是在用户增长上&#xff0c;闲鱼的用户增长业务有如下描述&#xff1a; 闲鱼的卖家都是普通小卖家&#xff0c;而非专业的B类商家。因此无法统一组织起来参加营销活动带来买家活跃。我们目前DAU已经突破到2000W&#xff0c;如何…

jstat gc各参数含义

参数说明S0C第一个幸存区的大小S1C第二个幸存区的大小S0U第一个幸存区的使用大小S1U第二个幸存区的使用大小EC伊甸园区的大小EU伊甸园区的使用大小OC老年代大小OU老年代使用大小MC方法区大小MU方法区使用大小CCSC压缩类空间大小CCSU压缩类空间使用大小YGC年轻代垃圾回收次数YGC…

MySQL用户如何构建实时数仓

依托数据库生态&#xff0c;AnalyticDB for MySQL可以给用户提供分析场景下的标准解决方案&#xff0c;尤其是在大数据和性能要求较高的情况下AnalyticDB for MySQL的价值可以更好的体现。 MySQL用户为什么要单独构建数据仓库 为什么要单独构建数据仓库&#xff0c;而不是直接…

138 张图带你 MySQL 入门!

作者 | cxuan来源 | Java建设者SQL 基础使用MySQL 是一种关系型数据库&#xff0c;说到关系&#xff0c;那么就离不开表与表之间的关系&#xff0c;而最能体现这种关系的其实就是我们接下来需要介绍的主角 SQL&#xff0c;SQL 的全称是 Structure Query Language &#xff0c;…

Centos/Red Hat6.8 安装、配置、启动Gitlab (内网环境)

文章目录一、软件和源准备1. Gitlab下载2. epel源下载二、环境配置2.1. 安装依赖项2.2. 安装epel源2.3. 安装Gitlab三、Gitlab和防火墙配置3.1. 设置external_url3.2. 重新加载配置3.3. 防火墙配置四、测试验证4.1. 浏览器访问Gitlab4.2. 重新设置密码4.3. Gitlab常用命令一、软…

Promise封装Ajax实现POST和GET请求

&#x1f3a8;领域&#xff1a;Java后端开发&#x1f525;收录专栏&#xff1a; 前端技术 &#x1f412;个人主页&#xff1a;BreezAm &#x1f496;Gitee&#xff1a;https://gitee.com/BreezAm ✨个人标签&#xff1a;【后端】【大数据】【前端】【运维】 文章目录介绍一、相…

轻松构建基于 Serverless 架构的弹性高可用视频处理系统

前言 随着计算机技术和 Internet 的日新月异&#xff0c;视频点播技术因其良好的人机交互性和流媒体传输技术倍受教育、娱乐等行业青睐&#xff0c;而在当前&#xff0c; 云计算平台厂商的产品线不断成熟完善&#xff0c; 如果想要搭建视频点播类应用&#xff0c;告别刀耕火种…

Centos/Red Hat6.8 安装、配置、启动Gitlab (内网环境)心得分享

文章目录一、Gitlab下载1. Gitlab官网下载二、分析思路2.1. 分析2.2. 代码托管平台2.3. 镜像站二、Gitlab 重新加载配置异常2.1. 异常现象2.2. 分析定位三、百度解决问题3.1. 百度类似异常3.2. 参考博文3.3. 解决方案3.4. 执行测试3.5. 结论四、官网issues 014.1. 找官网issues…

祝贺我的同事王坚当选院士!

刚刚&#xff0c; 收到一个激动人心的消息&#xff1a; 原文链接 本文为云栖社区原创内容&#xff0c;未经允许不得转载。