系统设计中的缓存技术:完整指南

529b5f17f2b35b70c928fc96bef26f47.jpeg

Image.png

缓存是软件工程中用于提高系统性能和用户体验的基本技术。它通过临时存储频繁访问的数据在缓存中,缓存比数据的原始来源更容易访问。

作为一名软件工程师,了解缓存以及它在不同类型的系统中的工作方式是至关重要的。在本文中,我们将涵盖关于缓存的一切,从定义和重要性到不同类型的缓存以及实施的最佳实践。

I. 什么是缓存?

缓存是位于应用程序和数据的原始来源之间的高速存储层,例如数据库、文件系统或远程Web服务。当应用程序请求数据时,首先检查缓存。如果在缓存中找到数据,它将被返回给应用程序。如果在缓存中找不到数据,它将从其原始来源检索,存储在缓存中以供将来使用,并返回给应用程序。

缓存可以用于各种类型的数据,如网页、数据库查询、API响应、图像和视频。缓存的目标是减少数据需要从其原始来源获取的次数,这可以导致更快的处理和较低的延迟。

可以通过不同的方式实现缓存,包括内存缓存、磁盘缓存、数据库缓存和CDN缓存。内存缓存将数据存储在计算机的主存中,比磁盘存储更快。磁盘缓存将数据存储在硬盘上,比从远程来源检索数据更快。数据库缓存将经常访问的数据存储在数据库中,减少了访问外部存储的需求。CDN缓存将数据存储在分布式服务器网络上,减少了从远程位置访问数据的延迟。

II. 为什么缓存很重要?

在软件工程中,缓存在提高系统性能和用户体验方面发挥着关键作用。通过将经常访问的数据存储在缓存中,应用程序可以减少操作的响应时间和延迟,从而实现更快速和更高效的处理。以下是一些缓存很重要的原因:

1.改善系统性能: 缓存可以通过减少数据需要从其原始来源获取的次数来显著改善应用程序的性能。由于缓存数据可以比从原始来源获取数据更快地检索,这导致了处理时间的显著减少,从而实现了更响应的应用程序。2.减少网络负载: 缓存还可以通过最小化需要通过网络传输的数据量来减少网络负载。由于缓存数据存储在本地,不需要从原始来源获取数据,从而减少了需要传输的数据量。3.提高可扩展性: 缓存可以通过减少对原始来源的负载来提高应用程序的可扩展性。通过将经常访问的数据存储在缓存中,原始来源不太可能被请求压倒,使其更具可扩展性。4.更好的用户体验: 更快的响应时间和降低的延迟可以提供更好的用户体验。快速加载并及时响应用户请求的应用程序更有可能被用户使用和偏爱。

III. 缓存的类型

根据特定用例和被缓存的数据类型,可以以各种方式实现缓存。以下是一些常见的缓存类型:

1.内存缓存: 内存缓存将数据存储在计算机的主存中,比磁盘存储更快。内存缓存适用于可以容纳在可用内存中的经常访问数据。这种类型的缓存通常用于缓存API响应、会话数据和网页片段。要实现内存缓存,软件工程师可以使用各种技术,包括使用缓存库,如Memcached或Redis,或在应用程序代码中实现自定义缓存逻辑。2.磁盘缓存: 磁盘缓存将数据存储在硬盘上,比从远程来源检索数据更快。磁盘缓存适用于太大无法容纳在内存中或需要在应用程序重新启动之间持久化的数据。这种类型的缓存通常用于缓存数据库查询和文件系统数据。3.数据库缓存: 数据库缓存将经常访问的数据存储在数据库中,减少了访问外部存储的需求。这种类型的缓存可以使用各种技术实现,包括数据库查询缓存和结果集缓存。4.CDN缓存: CDN缓存将数据存储在分布式服务器网络上,降低了从远程位置访问数据的延迟。这种类型的缓存适用于从世界各地访问的数据,如图像、视频和其他静态资源。CDN缓存通常用于内容交付网络和大规模Web应用程序。5.DNS缓存: DNS缓存是域名系统(DNS)中使用的一种缓存,用于在一段时间内存储DNS查询的结果。当用户请求访问网站时,他们的计算机发送DNS查询到DNS服务器,以将网站的域名解析为IP地址。DNS服务器以IP地址回应,然后用户的计算机可以使用IP地址访问网站。DNS缓存通过减少发送到DNS服务器的请求次数来提高DNS系统的性能。当DNS服务器收到对域名的请求时,它检查其本地缓存是否有该域名的IP地址。如果IP地址在缓存中,DNS服务器可以立即用IP地址回应,无需查询其他服务器。这可以显著减少DNS查询的响应时间,并提高系统的整体性能。

e874f70aa40dc3b3941fd771a83358db.jpeg

Image.png

IV. 缓存替换策略

在实施缓存时,有一个缓存替换策略非常重要,以确定缓存变满时应删除哪些项目。以下是一些最常见的缓存替换策略:

最近最少使用 (LRU): LRU 是一种缓存替换策略,当缓存变满时,它会删除最近最少使用的项目。这种策略假定最近访问的项目更有可能在将来再次被访问。•最不常使用 (LFU): LFU 是一种缓存替换策略,当缓存变满时,它会删除最不常使用的项目。这种策略假定更频繁访问的项目更有可能在将来再次被访问。•先进先出 (FIFO): FIFO 是一种缓存替换策略,当缓存变满时,它会删除最旧的项目。这种策略假定缓存中的最旧项目最不可能在将来再次被访问。•随机替换: 随机替换是一种缓存替换策略,当缓存变满时,它会随机删除一个项目。这种策略不做关于将来访问的可能性的任何假设,可以在访问模式不可预测时有用。

不同替换策略的比较

每种缓存替换策略都有其优点和缺点,选择使用哪种策略取决于具体的用例。通常情况下,LRU 和LFU比FIFO和随机替换更有效,因为它们考虑了缓存的访问模式。但是,LRU和LFU的实现可能更昂贵,因为它们需要维护额外的数据结构来跟踪访问模式。FIFO和随机替换更容易实现,但在优化缓存性能方面可能不如LRU和LFU有效。总之,应谨慎选择使用的缓存替换策略,以平衡性能和复杂性之间的权衡。

V. 缓存失效策略

缓存失效是在数据不再有效时从缓存中移除数据的过程。使缓存失效是确保缓存中存储的数据准确和最新的关键步骤。以下是一些常见的缓存失效策略:

写透缓存(Write-through cache): 在这种方案下,数据被写入缓存并同时写入相应的数据库。缓存的数据允许快速检索,并且由于相同的数据被写入永久存储,缓存和存储之间将具有完全的数据一致性。此外,这种方案确保在发生崩溃、断电或其他系统中断时不会丢失任何数据。尽管写透缓存减少了数据丢失的风险,因为每个写操作必须在返回成功给客户端之前执行两次,但这种方案的缺点是写操作的延迟较高。•写绕缓存(Write-around cache): 这种技术类似于写透缓存,但数据直接写入永久存储,绕过缓存。这可以减少缓存被写操作淹没的情况,后续不会被重新读取,但缺点是对最近写入的数据的读取请求将创建“缓存未命中”,必须从较慢的后端存储中读取并经历较高的延迟。•写回缓存(Write-back cache): 在这种方案下,数据只写入缓存,并立即向客户端确认完成。写入永久存储是基于某些条件进行的,例如,当系统需要一些空闲空间时。这会导致写入密集型应用程序的低延迟和高吞吐量;然而,这种速度伴随着在崩溃或其他不利事件发生时数据丢失的风险,因为写入的数据的唯一副本在缓存中。•写后缓存(Write-behind cache): 这与写回缓存非常相似。在这种方案下,数据写入缓存并立即向应用程序确认,但不会立即写入永久存储。相反,写操作被推迟,数据最终会在稍后的时间写入永久存储。写回缓存和写后缓存之间的主要区别在于数据何时写入永久存储。在写回缓存中,只有在需要缓存释放空间时才会将数据写入永久存储,而在写后缓存中,数据将在指定的时间间隔内写入永久存储。

总之,应该谨慎选择使用的缓存失效策略,以在性能和数据准确性之间取得平衡。通过了解可用的不同缓存失效策略,软件工程师可以选择适当的策略来优化缓存性能并减少延迟,同时确保缓存中存储的数据准确和最新。

VI. 缓存失效方法

以下是一些著名的缓存失效方法:

清除(Purge): 清除方法会移除特定对象、URL或一组URL的缓存内容。通常在内容更新或更改时使用,因为缓存版本不再有效。当接收到清除请求时,缓存内容会立即移除,下一个请求的内容将直接从源服务器提供。•刷新(Refresh): 即使有缓存内容可用,刷新方法也会从源服务器获取请求的内容。当接收到刷新请求时,缓存内容将被更新为源服务器的最新版本,以确保内容是最新的。与清除不同,刷新请求不会移除现有的缓存内容;相反,它会使用最新版本进行更新。•封禁(Ban): 封禁方法根据特定条件(例如URL模式或标头)使缓存内容无效。当接收到封禁请求时,任何匹配指定条件的缓存内容将立即被移除,随后的内容请求将直接从源服务器提供。•生存时间到期(TTL到期): 此方法涉及为缓存内容设置生存时间值,超过该值后,内容将被视为陈旧并需要进行刷新。当接收到内容请求时,缓存会检查生存时间值,并仅在该值未到期时提供缓存内容。如果该值已到期,缓存将从源服务器获取内容的最新版本并进行缓存。•同时陈旧时重新验证(Stale-while-revalidate): 此方法用于在Web浏览器和内容传递网络中提供陈旧内容,同时在后台更新内容。当接收到内容请求时,将立即提供缓存版本给用户,并异步请求源服务器以获取内容的最新版本。一旦最新版本可用,缓存版本将被更新。此方法确保用户始终能够快速获取内容,即使缓存版本略有陈旧。

470daae28f13c0f10e51e55b4276dfaf.jpeg

Image.png

VII. 缓存性能指标

在实施缓存时,测量缓存性能是非常重要的,以确保它在减少延迟和提高系统性能方面是有效的。以下是一些最常见的缓存性能指标:

命中率(Hit rate): 命中率是由缓存提供而不访问原始来源的请求的百分比。高命中率表示缓存在减少对原始来源请求的数量方面非常有效,而低命中率表示缓存可能无法提供显著的性能优势。•未命中率(Miss rate): 未命中率是未由缓存提供并需要从原始来源获取的请求的百分比。高未命中率表示缓存可能无法缓存正确的数据,或者缓存大小可能不足以存储所有频繁访问的数据。•缓存大小(Cache size): 缓存大小是为缓存分配的内存或存储容量。缓存大小可以影响缓存的命中率和未命中率。较大的缓存大小可能会导致更高的命中率,但也可能增加缓存解决方案的成本和复杂性。•缓存延迟(Cache latency): 缓存延迟是从缓存中访问数据所需的时间。较低的缓存延迟表示缓存更快,更有效地降低延迟并提高系统性能。缓存延迟可以受到所使用的缓存技术、缓存大小以及缓存替换和失效策略的影响。

VIII. 结论

主要观点

缓存是优化系统性能和减少延迟的软件工程中的重要工具。通过将频繁访问的数据存储在缓存中,可以减少对原始来源的请求次数,从而实现更快的响应时间和更好的可扩展性。缓存在各种软件应用程序中使用,从Web应用程序到数据库再到内容传递网络。

分布式系统中缓存的未来

随着分布式系统在软件工程中的普及,缓存将继续在优化系统性能方面发挥关键作用。像Redis和Memcached这样的分布式缓存解决方案变得越来越流行,允许数据在多个服务器和数据中心之间进行缓存。随着机器学习和人工智能的使用不断增长,缓存也将用于通过减少检索和处理数据所需的时间来优化这些应用程序的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/130870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NocoDB任意文件读取漏洞复现

简介 NocoDB是一个开源 Airtable 替代品,可以将 MySql、PostgreSql、Sql Server、Sqlite 和 MariaDb 等转换为智能电子表格。 (CVE-2023-35843) NocoDB 0.106.0版本及之前版本存在安全漏洞。攻击者利用该漏洞可以访问服务器上的任意文件。 漏洞复现 FOFA语法&…

Iceberg教程

目录 教程来源于尚硅谷1. 简介1.1 概述1.2 特性 2. 存储结构2.1 数据文件(data files)2.2 表快照(Snapshot)2.3 清单列表(Manifest list)2.4 清单文件(Manifest file)2.5 查询流程分析 3. 与Flink集成3.1 环境准备3.1.1 安装Flink3.1.2 启动Sql-Client 3.2 语法 教程来源于尚硅…

基于单片机的滚筒洗衣机智能控制系统设计

收藏和点赞,您的关注是我创作的动力 文章目录 概要 一、系统整体设计方案2.1控制系统的功能2.2设计的主要内容 二、硬件设计3.1 控制系统整体框图3.2 电源电路 三 软件设计主程序设计仿真设计 四、 结论 概要 因此我们需要一个完善的智能系统来设计一个全自动滚筒洗…

GCN火车票识别项目 P2 图卷积神经网络介绍

深度学习一直都是被几大经典模型统治着,常见的有CNN、RNN网络,它们在CV和NLP领域都取得了优异的效果。但人们发现了很多CNN、RNN无法解决,或者效果不好的问题——图结构数据,如社交网络、人物关系、分子结构等,所以就有…

VMware产品收集日志方法汇总

概述 vCenter日志是一个用于存储与vSphere环境相关的各种活动、事件和警告的日志系统。通过收集并分析vCenter日志,管理员可以获得有关其虚拟化环境的重要洞察和故障排除信息。 vCenter日志由多个组件组成,包括vCenter Server、ESXi主机和其他vSphere组…

Tomcat运行日志乱码问题/项目用tomcat启动时窗口日志乱码

文章目录 一、问题描述:二、产生原因三、解决方法 一、问题描述: 项目在idea中运行时日志是正常的,用Tomcat启动时发现一大堆看不懂的文字,如 二、产生原因 产生乱码的根本原因就是编码和解码不一致,举个例子就是翻…

SLAM从入门到精通(参数标定)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 标定是slam开发过程中很重要的一个环节。这部分内容涉及到很多方面,比如说传感器、比如说算法、比如说机械,总之好的标定不…

Ubuntu18.04系统镜像制作

安装使用systemback # 添加源 sudo add-apt-repository --remove ppa:nemh/systemback sudo add-apt-repository "deb http://ppa.launchpad.net/nemh/systemback/ubuntu xenial main"# 下载 sudo apt update sudo apt install systemback打开systemback,点击创建li…

树结构及其算法-二叉排序树

目录 树结构及其算法-二叉排序树 C代码 树结构及其算法-二叉排序树 事实上,二叉树是一种很好的排序应用模式,因为在建立二叉树的同时,数据已经经过初步的比较,并按照二叉树的建立规则来存放数据,规则如下&#xff1…

人们常常下定决心“不改变”

"因为我的性格很悲观" 有的人会觉得一些事情发生,是自己性格使然,改变不了。 但其实性格是可以改变的。 这听起来似乎不太现实,自己的性格就是这样,怎么会改变? 那换种表达,我们看待世界的方式可…

【蓝桥每日一题]-倍增(保姆级教程 篇1)

今天讲一下倍增 目录 题目:忠诚 思路: 题目:国旗计划 思路: 查询迭代类倍增: 本质是一个一个选区间使总长度达到 M,类似凑一个数。而我们会经常用不大于它最大的二的次幂,减去之后,再重复这…

《研发效能(DevOps)工程师》课程简介(三)丨IDCF

在研发效能领域中,【开发与交付】的学习重点在于掌握高效的开发工具和框架,了解敏捷开发方法,掌握持续集成与持续交付技术,以及如何保证应用程序的安全性和合规性等方面。 由国家工业和信息化部教育与考试中心颁发的职业技术证书…

leetCode 322.零钱兑换 完全背包 + 动态规划 + 记忆化搜索 + 递推 + 空间优化 + 画递归树

关于此题我的往期文章:LeetCode 322.零钱兑换 完全背包 动态规划_呵呵哒( ̄▽ ̄)"的博客-CSDN博客https://heheda.blog.csdn.net/article/details/133386579看本期文章时,可以先回顾一下动态规划入门知识和完全背包理论和实战…

面试算法50:向下的路径节点值之和

题目 给定一棵二叉树和一个值sum,求二叉树中节点值之和等于sum的路径的数目。路径的定义为二叉树中顺着指向子节点的指针向下移动所经过的节点,但不一定从根节点开始,也不一定到叶节点结束。例如,在如图8.5所示中的二叉树中有两条…

Nodejs和npm的使用方法和教程

Nodejs简介 Node.js 是一个开源和跨平台的 JavaScript 运行时环境。 它几乎是任何类型项目的流行工具! ( 运行环境,是不是很熟悉,对。就是 java JRE,Java 运行时环境) Node.js 在浏览器之外运行 V8 Java…

WSL 下载

可以使用单个命令安装运行 WSL 所需的一切内容。 在管理员模式下打开 PowerShell 或 Windows 命令提示符,方法是右键单击并选择“以管理员身份运行”,输入 wsl --install 命令,然后重启计算机。 首先查看可以下载的版本 最后再运行wsl --ins…

企业电脑屏幕监控有哪些?如何实现电脑屏幕监控

企业电脑屏幕监控有哪些?如何实现电脑屏幕监控 下载使用安企神电脑屏幕监控软件 企业电脑屏幕监控是一种监测和记录员工在工作时间内在他们的计算机上执行的活动的技术。这种监控可以有多种目的,包括确保员工的生产力、确保数据安全性,或满…

【Qt-22】Qt乱码问题解决

最近在Qt项目中遇到TCP通信接收数据乱码的问题,很是苦恼,经过多次尝试,终于得以解决。 感谢Qt TcpSocket 传递数据乱码显示_qt中socket接受到的客户端数据显示不出来-CSDN博客 彻底解决Qt中文乱码以及汉字编码的问题(UTF-8/GBK)_XX風的博客…

Open3D(C++) 最小二乘拟合平面(间接平差法)

目录 一、算法原理1、原理概述2、参考文献二、代码实现三、结果展示本文由CSDN点云侠原创,原文链接。 一、算法原理 1、原理概述 通过传统最小二乘法对点云数据进行平面拟合时,可将误差只归因于一个方向上,本文假设误差只存在于 Z Z

Spring源码编译步骤

Spring源码学习 一、Gradle 为什么下载gradle呢?我们平时不都是用maven吗?原因只有一个,spring源码是用gradle构建的,所以,你想看spring源码必须安装和学会使用gradle,那么,让我们开始gradle之…