java redis 流水线,Redis系列(1) —— 流水线

写在前面

去年下半年,出于学习Redis的目的,在看完《Redis in Action》一书后,开始尝试翻译Redis官方文档。尽管Redis中文官方网站有了译本,但是看别人翻译好的和自己翻译英文原文毕竟还是有很大的不同。这一系列文章之前发布在GitBook上,为了方便管理,跟其他文章一起放在同一个平台,遂全部迁移至简书。由于本人学习Redis时间不长,认识有限,同时也缺少实战经验,翻译中有任何不恰当之处,欢迎各位及时斧正,本人将不胜感激。对英文官方文档感兴趣的朋友也可以直接访问https://redis.io/ 进行获取。

使用流水线来提升redis的查询速度

请求/响应协议和RTT

Redis是一个使用客户端-服务端模型和请求/响应协议的TCP服务。这意味着完成一次请求通常需要经过以下步骤:

客户端向服务端发起一次查询请求并读取socket,这通常是以阻塞方式来等待服务端响应。

服务端处理命令并将响应发回给客户端。

例如下面是一个4条命令序列的执行情况:

客户端:INCR x

服务端:1

客户端:INCR x

服务端:2

客户端:INCR x

服务端:3

客户端:INCR x

服务端:4

客户端和服务端通过网络来连接。这样的连接可以很快(loopback接口)也可以很慢(两台主机之间建立的是一个经过了多次跳转的网络连接)。不管网络延迟如何,数据包从客户端发往服务端,然后携带响应从服务端发往客户端总是会消耗时间的。

这个时间被称为RTT(Round Trip Time)。当客户端需要一次性处理很多请求时很容易看到这是如何影响到性能的(比如说向一个列表中添加很多元素,或者用很多键值填充数据库)。例如假设RTT时间为250毫秒(在网络连接很慢的网络条件下),那么即使服务端每秒可以处理100000个请求,我们每秒最多也只能处理4个请求。

如果使用loopback接口,RTT时间就会短很多(例如在我的机器上ping127.0.0.1只需要0.044毫秒),但是如果我们需要批量处理很多写请求,这个时间仍然是很大的一笔开销。

好在我们还有一种方式可以来改善这种状况。

Redis流水线

即使客户端旧的请求还没有得到响应,一个请求/响应服务器也可以处理新的请求。这样一来我们就可以一次向服务端发送多条命令而根本不用等待响应,最后在一个步骤中读取所有回复。

这就是流水线,这是一种几十年来被广泛采用的技术。例如很多POP3协议的实现已经支持了这种特性,它极大地加快了从服务器下载新邮件的过程。

Redis很早就支持了流水线功能,所以无论你正在使用的是哪个版本,你都可以使用Redis的流水线技术。下面是一个使用这种原生能力的例子:

$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379

+PONG

+PONG

+PONG

这一次我们没有为每次调用都消耗RTT,而是4个命令只消耗一次时间。

更明确地说,通过使用流水线技术,我们第一个例子的操作顺序将会是下面这个样子:

客户端: INCR x

客户端: INCR x

客户端: INCR x

客户端: INCR x

服务端:1

服务端:2

服务端:3

服务端:4

重要提示:当客户端使用流水线技术来发送命令时,服务端将不得不使用内存来排队答复。所以如果你需要使用流水线来发送很多命令,最好是将他们按照合理的数量来分批处理,比如先发送10000条命令,读取响应,再发送另外10000条命令等等。速度几乎是一样的,但是将需要大量额外的内存来存储这10000条命令的答复。

这不仅仅关乎RTT

流水线不仅仅是一种用来减少RTT延迟成本的方式,实际上对于一台给定的Redis服务器,它极大地提高了每秒钟你所能处理的操作数量。一个事实是,当不采用流水线技术时,从访问数据结构并且产生响应的角度来看,每一条命令的时间消耗都是很少的,但是从处理socket IO的角度来看,这个时间消耗确是很大的。它涉及到调用read()和write()这些系统调用,这意味着要从用户侧到内核侧。而上下文切换是一个巨大的时间开销,会严重影响响应速度。

当使用流水线时,一个简单的read()系统调用就可以读取很多命令,同样的,一个简单的write()系统调用就可以将很多回复传送出去。正因为如此,每秒钟可以处理的查询命令的数量几乎随着管道长度的增加而呈线性增长,最终可以达到不使用流水线这种基本情况时的10倍,正如你从下图看到的那样:

a8325675a1c8

image.png

一些真实世界的代码样例

在下面这个基准测试中,我们将会使用基于Ruby的redis客户端,支持流水线操作,来测试流水线对于速度的提升效果:

require 'rubygems'

require 'redis'

def bench(descr)

start = Time.now

yield

puts "#{descr} #{Time.now-start} seconds"

end

def without_pipelining

r = Redis.new

10000.times {

r.ping

}

end

def with_pipelining

r = Redis.new

r.pipelined {

10000.times {

r.ping

}

}

end

bench("without pipelining") {

without_pipelining

}

bench("with pipelining") {

with_pipelining

}

在我的Mac OS X系统上执行上面这个简单的脚本将会得到如下的数据,开启流水线功能后,RTT已经被改善得相当低。

without pipelining 1.185238 seconds

with pipelining 0.250783 seconds

如你所见,开启流水线后,我们把传输速度提升了5倍。

流水线 VS 脚本

使用Redis脚本(2.6及以上版本的redis可用),很多使用流水线的场景可以获得更高效的处理,因为使用脚本可以在服务端执行大量工作。脚本的一大优势是它可以使读写数据只需要很小的时延,使得读、计算和写操作变得很快(流水线在这种场景下做不到这一点,因为客户端在调用写命令之前需要读命令的返回结果)

有时候应用也会需要向流水线发送EVAL或者EVALSHA命令。这完全是有可能的并且Redis已经通过SCRIPT LOAD命令明确支持了这一点(它保证EVALSHA命令会调用成功)。

附录:为什么即使在loopback接口上一个忙碌的循环也很慢

即使在这个页面的背景之下,你还是会想知道为什么即使在loopback接口上执行并且服务端和客户端运行在同一台物理机上时,一个一个像下面的Redis基准测试(伪代码)还是会很慢:

FOR-ONE-SECOND:

Redis.SET("foo","bar")

END

毕竟如果Redis过程和基准测试运行在一起时,难道它不是仅仅将信息在内存上从一个地方复制到另一个地方,中间没有任何真正的延时和网络参与进来吗?

原因在于系统上的过程不是一直在运行,实际上是内核调度器才让过程运行起来,所以基准测试开始运行时,从Redis服务端读取返回数据(跟最后一条执行的命令相关),并且写了一条新命令。现在命令存在于loopback接口的缓存里,但是为了能够被服务端读取到,内核会通过调度让服务端的过程(当前被阻塞在系统调用里)运行起来,等等。所以在实际场景下,因为内核调度器的工作机制,loopback接口还是涉及到了类网络延时。

基本上在网络服务器中测量性能时,一个忙碌的循环基准测试是最愚蠢的事情。明智的做法是避免使用这种方法进行基准测试。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/440464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【HDU - 6187】Destroy Walls(思维,最大生成树)

题干: Long times ago, there are beautiful historic walls in the city. These walls divide the city into many parts of area. Since it was not convenient, the new king wants to destroy some of these walls, so he can arrive anywhere from his castl…

【HDU - 6184】Counting Stars(三元环计数,二分,优化暴力,O(m*sqrt(m)),图论)

题干: Little A is an astronomy lover, and he has found that the sky was so beautiful! So he is counting stars now! There are n stars in the sky, and little A has connected them by m non-directional edges. It is guranteed that no edges connec…

php 取oracle图片,在PHP中将图片存放ORACLE中_php

我这里提供一个用php操纵blob字段的例子给你,希望能有所帮助!这个例子是把用户上传的图片文件存放到BLOB中。假设有一个表,结构如下:CREATE TABLE PICTURES (ID NUMBER,http://www.gaodaima.com/44856.html在PHP中将图片存放oracl…

【HDU - 6183】Color it(CDQ分治 或 动态开点线段树)

题干: Do you like painting? Little D doesnt like painting, especially messy color paintings. Now Little B is painting. To prevent him from drawing messy painting, Little D asks you to write a program to maintain following operations. The speci…

php create()方法,ThinkPHP中create()方法自动验证实例

ThinkPHP中create()方法自动验证实例2020-06-16 04:24:32自动验证是ThinkPHP模型层提供的一种数据验证方法,可以在使用create创建数据对象的时候自动进行数据验证。原理:create()方法收集表单($_POST)信息并返回,同时触发表单自动验证&#x…

【蓝桥杯官网试题 - 历届试题】格子刷油漆(dp)

题干: 问题描述 X国的一段古城墙的顶端可以看成 2*N个格子组成的矩形(如下图所示),现需要把这些格子刷上保护漆。   你可以从任意一个格子刷起,刷完一格,可以移动到和它相邻的格子(对角相邻也…

oracle软件静默安装程序,【oracle】静默安装 oracle 11gr2

【序言】oracle 提供了静默安装方法在不适用图形界面的情况下安装 oracle 软件 ,创建db,配置netca,快速完成oracle 的部署。在以下情形中可以使用静默安装a OUI 的 GUI 界面远程交互比较慢 .b 数据库服务器无法使用图形界面访问.c 批量部署oracle (标准环境统一情况下可以使用o…

【2050 Programming Competition - 2050 一万人码 】非官方部分题解(HDU)

1001 开场白 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 12147 Accepted Submission(s): 3502 Problem Description 来自世界各地的年青人在 https://2050.org.cn 握手团聚, 他们是航空…

oracle数据库建表视频,Oracle数据库的创建表全

CREATE TABLE "库名"."表名" ("FEE_ID" VARCHAR2(10 BYTE) constraint ABS_FEE_ID primary key,--主键,必须要有序列"BANK_GROUP_ID" VARCHAR2(5 BYTE),"ABS_PRODUCT_ID" VARCHAR2(30 BYTE))TABLESPACE "表…

oracle dump enq hw,经典故障分析 - ASSM引发的索引争用与 enq HW -contentio

作者介绍:孙加鹏 云和恩墨技术顾问六年Oracle技术顾问经验,所服务的行业包括电信运营商、金融业、制造业等。擅长Oracle的故障诊断、高可用架构、升级迁移等。目前主要服务于上海金融类客户。1故障概述2017年07月24日11:58左右,客户核心数据库…

【ZOJ - 3946】Highway Project(最短路子图,维护双权值,贪心,最小树形图)

题干: Edward, the emperor of the Marjar Empire, wants to build some bidirectional highways so that he can reach other cities from the capital as fast as possible. Thus, he proposed the highway project. The Marjar Empire has N cities (including…

【ZOJ - 3956】Course Selection System(01背包)

题干: There are n courses in the course selection system of Marjar University. The i-th course is described by two values: happiness Hi and credit Ci. If a student selects m courses x1, x2, ..., xm, then his comfort level of the semester can be…

Linux把文件移动到容器外,Docker容器与主机之间拷贝文件的方法

一般情况下,我们在启动Docker容器的时候可以使用-v参数映射宿主机的文件或者目录到容器里,这样的话,在宿主机相关目录下的文件修改会自动在容器里生效。但是,如果我们已经启动了一个容器的话,就只能使用下面的这种方式…

【计蒜客 - 2019南昌邀请赛网络赛 - H】Coloring Game(找规律,思维dp)

题干: David has a white board with 2 \times N2N grids.He decides to paint some grids black with his brush.He always starts at the top left corner and ends at the bottom right corner, where grids should be black ultimately. Each time he can mov…

【HDU - 6514】Monitor(二维差分,前缀和)

题干: Monitor Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 163840/163840 K (Java/Others) Total Submission(s): 872 Accepted Submission(s): 145 Problem Description Xiaoteng has a large area of land for growing crops, and the land…

【CodeForces - 1153D】Serval and Rooted Tree(树形dp)

题干: Now Serval is a junior high school student in Japari Middle School, and he is still thrilled on math as before. As a talented boy in mathematics, he likes to play with numbers. This time, he wants to play with numbers on a rooted tree. …

实验楼Linux基础挑战2答案,实验楼-Linux基础-实验二 Linux的基本概念及操作

一、实验介绍1.1 实验内容实验楼环境介绍常用 Shell 命令及快捷键Linux 使用小技巧1.2 实验知识点Linux 基本命令通配符的使用查看帮助文档二、桌面环境1.Linux 桌面环境介绍相对于现在的 Windows 系统,UNIX/Linux 本身是没有图形界面的,我们通常在 UNIX…

【HDU - 1533】Going Home(网络流,二分图最优匹配,KM算法)

题干: On a grid map there are n little men and n houses. In each unit time, every little man can move one unit step, either horizontally, or vertically, to an adjacent point. For each little man, you need to pay a $1 travel fee for every step h…

【ZOJ - 4029】Now Loading!!!(整除分块,思维,二分,前缀和)

题干: 其中 zi 是第i次询问后的z。 解题报告: 因为有取log运算,所以分母的取值肯定不会超过30种,所以分每一个分母的时候,用前缀和优化一个和,最后求乘积就行了。(其实不需要快速幂&#xff0c…

【ZOJ - 4032】Magic Points (思维,几何,构造)

题干: 解题报告: 想到了,这样绕圈构造。但是这样有个问题,最后一个点如何构造。 刚开始想的是n奇数 , 就8 10 这样的连一条,n偶数 就8 11 这样的连一条,随便构造一下就行,但是发…