三分钟看懂一致性哈希算法

 

一致性哈希算法,作为分布式计算的数据分配参考,比传统的取模,划段都好很多。

在电信计费中,可以作为多台消息接口机和在线计费主机的分配算法,根据session_id来分配,这样当计费主机动态伸缩的时候,因为session_id缓存缺失而需要放通的会话,会明显减少。

 

传统的取模方式

 

例如10条数据,3个节点,如果按照取模的方式,那就是

node a: 0,3,6,9

node b: 1,4,7

node c: 2,5,8

 

当增加一个节点的时候,数据分布就变更为

node a:0,4,8

node b:1,5,9

node c: 2,6

node d: 3,7

 

总结:数据3,4,5,6,7,8,9在增加节点的时候,都需要做搬迁,成本太高

 

一致性哈希方式

最关键的区别就是,对节点和数据,都做一次哈希运算,然后比较节点和数据的哈希值,数据取和节点最相近的节点做为存放节点。这样就保证当节点增加或者减少的时候,影响的数据最少。

还是拿刚刚的例子,(用简单的字符串的ascii码做哈希key):

十条数据,算出各自的哈希值

0:192

1:196

2:200

3:204

4:208

5:212

6:216

7:220

8:224

9:228

 

有三个节点,算出各自的哈希值

node a: 203

node g: 209

node z: 228

 

这个时候比较两者的哈希值,如果大于228,就归到前面的203,相当于整个哈希值就是一个环,对应的映射结果:

node a: 0,1,2

node g: 3,4

node z: 5,6,7,8,9

 

这个时候加入node n, 就可以算出node n的哈希值:

node n: 216

 

这个时候对应的数据就会做迁移:

node a: 0,1,2

node g: 3,4

node n: 5,6

node z: 7,8,9

 

这个时候只有5和6需要做迁移

另外,这个时候如果只算出三个哈希值,那再跟数据的哈希值比较的时候,很容易分得不均衡,因此就引入了虚拟节点的概念,通过把三个节点加上ID后缀等方式,每个节点算出n个哈希值,均匀的放在哈希环上,这样对于数据算出的哈希值,能够比较散列的分布(详见下面代码中的replica)

 

通过这种算法做数据分布,在增减节点的时候,可以大大减少数据的迁移规模。

 

下面转载的哈希代码,已经将gen_key改成上述描述的用字符串ascii相加的方式,便于测试验证。

 

 

 
  1. import md5

  2. class HashRing(object):

  3. def __init__(self, nodes=None, replicas=3):

  4. """Manages a hash ring.

  5. `nodes` is a list of objects that have a proper __str__ representation.

  6. `replicas` indicates how many virtual points should be used pr. node,

  7. replicas are required to improve the distribution.

  8. """

  9. self.replicas = replicas

  10. self.ring = dict()

  11. self._sorted_keys = []

  12. if nodes:

  13. for node in nodes:

  14. self.add_node(node)

  15. def add_node(self, node):

  16. """Adds a `node` to the hash ring (including a number of replicas).

  17. """

  18. for i in xrange(0, self.replicas):

  19. key = self.gen_key('%s:%s' % (node, i))

  20. print "node %s-%s key is %ld" % (node, i, key)

  21. self.ring[key] = node

  22. self._sorted_keys.append(key)

  23. self._sorted_keys.sort()

  24. def remove_node(self, node):

  25. """Removes `node` from the hash ring and its replicas.

  26. """

  27. for i in xrange(0, self.replicas):

  28. key = self.gen_key('%s:%s' % (node, i))

  29. del self.ring[key]

  30. self._sorted_keys.remove(key)

  31. def get_node(self, string_key):

  32. """Given a string key a corresponding node in the hash ring is returned.

  33. If the hash ring is empty, `None` is returned.

  34. """

  35. return self.get_node_pos(string_key)[0]

  36. def get_node_pos(self, string_key):

  37. """Given a string key a corresponding node in the hash ring is returned

  38. along with it's position in the ring.

  39. If the hash ring is empty, (`None`, `None`) is returned.

  40. """

  41. if not self.ring:

  42. return None, None

  43. key = self.gen_key(string_key)

  44. nodes = self._sorted_keys

  45. for i in xrange(0, len(nodes)):

  46. node = nodes[i]

  47. if key <= node:

  48. print "string_key %s key %ld" % (string_key, key)

  49. print "get node %s-%d " % (self.ring[node], i)

  50. return self.ring[node], i

  51. return self.ring[nodes[0]], 0

  52. def print_ring(self):

  53. if not self.ring:

  54. return None, None

  55. nodes = self._sorted_keys

  56. for i in xrange(0, len(nodes)):

  57. node = nodes[i]

  58. print "ring slot %d is node %s, hash vale is %s" % (i, self.ring[node], node)

  59. def get_nodes(self, string_key):

  60. """Given a string key it returns the nodes as a generator that can hold the key.

  61. The generator is never ending and iterates through the ring

  62. starting at the correct position.

  63. """

  64. if not self.ring:

  65. yield None, None

  66. node, pos = self.get_node_pos(string_key)

  67. for key in self._sorted_keys[pos:]:

  68. yield self.ring[key]

  69. while True:

  70. for key in self._sorted_keys:

  71. yield self.ring[key]

  72. def gen_key(self, key):

  73. """Given a string key it returns a long value,

  74. this long value represents a place on the hash ring.

  75. md5 is currently used because it mixes well.

  76. """

  77. m = md5.new()

  78. m.update(key)

  79. return long(m.hexdigest(), 16)

  80. """

  81. hash = 0

  82. for i in xrange(0, len(key)):

  83. hash += ord(key[i])

  84. return hash

  85. """

  86.  
  87.  
  88. memcache_servers = ['a',

  89. 'g',

  90. 'z']

  91. ring = HashRing(memcache_servers,1)

  92. ring.print_ring()

  93. server = ring.get_node('0000')

  94. server = ring.get_node('1111')

  95. server = ring.get_node('2222')

  96. server = ring.get_node('3333')

  97. server = ring.get_node('4444')

  98. server = ring.get_node('5555')

  99. server = ring.get_node('6666')

  100. server = ring.get_node('7777')

  101. server = ring.get_node('8888')

  102. server = ring.get_node('9999')

  103.  
  104. print '----------------------------------------------------------'

  105.  
  106. memcache_servers = ['a',

  107. 'g',

  108. 'n',

  109. 'z']

  110. ring = HashRing(memcache_servers,1)

  111. ring.print_ring()

  112. server = ring.get_node('0000')

  113. server = ring.get_node('1111')

  114. server = ring.get_node('2222')

  115. server = ring.get_node('3333')

  116. server = ring.get_node('4444')

  117. server = ring.get_node('5555')

  118. server = ring.get_node('6666')

  119. server = ring.get_node('7777')

  120. server = ring.get_node('8888')

  121. server = ring.get_node('9999')


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387029.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构09图

第七章 图 Graph 7.1 图的定义和术语 顶点 Vertex V 是顶点的有穷非空集合&#xff0c;顶点数 |V| n VR 两个顶点之间关系的集合&#xff0c;边数 |VR| e 有向图 Digraph <v, w> Arc v Tail / Inital node w Head / Terminal node 无向图 Undigraph <v, w> 必…

JVM调优-GC参数

一、Throughput收集器(吞吐量) -XX:UseParallelGC -XX:UseParallelOldGC *参数调整&#xff1a;通过调整堆大小&#xff0c;减少GC停顿时间&#xff0c;增大吞吐量 增强堆大小可以减少Full GC频率&#xff0c;但却会增加停顿时间 1.手动调整 -Xmn -Xms -XX:NewRatioN 手动指…

aspnetcore源码学习(一)

---恢复内容开始--- 笔者从事netcore相关项目开发已经大半年了&#xff0c;从netcore 1.0到现在3.0大概经过了3年左右的时间&#xff0c;记得netcore刚出来的时候国内相关的学习资料缺乏&#xff0c;限制于外语不大熟练的限制国外的相关书籍看起来相当吃力&#xff0c;于是在当…

评估一个垃圾收集(GC)

在实践中我们发现对于大多数的应用领域&#xff0c;评估一个垃圾收集(GC)算法如何根据如下两个标准&#xff1a; 吞吐量越高算法越好暂停时间越短算法越好 首先让我们来明确垃圾收集(GC)中的两个术语:吞吐量(throughput)和暂停时间(pause times)。 JVM在专门的线程(GC threads…

python数据分析常用包之Scipy

Scipy转载于:https://www.cnblogs.com/jacky912/p/10697853.html

docker容器状态跟踪及疑惑

一、 1 def status_test():2 container client.containers.create("comp")3 print ("create: ", container.status)4 container.start()5 print ("start: ", container.status)6 container.pause()7 print ("paus…

CAP和BASE理论

几个名词解释&#xff1a; 网络分区&#xff1a;俗称“脑裂”。当网络发生异常情况&#xff0c;导致分布式系统中部分节点之间的网络延时不断变大&#xff0c;最终导致组成分布式系统的所有节点中&#xff0c;只有部分节点之间能够进行正常通信&#xff0c;而另一些节点则不能…

Mysql案例5:取得平均薪资最高的部门的部门名称

一、要求&#xff1a;查询平均薪水最高部门的部门编号 二、背景&#xff1a;当前数据库有employee表和department表&#xff0c;数据分别如下&#xff1a; employee表&#xff1a; department表&#xff1a; 三、难点&#xff1a; 1、需要考虑最高平均薪资可能在多个部门同时出…

Spring 处理过程分析

一、处理过程分析 1、首先&#xff0c;Tomcat每次启动时都会加载并解析/WEB-INF/web.xml文件&#xff0c;所以可以先从web.xml找突破口&#xff0c;主要代码如下&#xff1a;<servlet ><servlet-name >spring-mvc</servlet-name><!-- servlet类 --><…

python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

python全栈开发笔记第二模块 第四章 &#xff1a;常用模块&#xff08;第二部分&#xff09; 一、os 模块的 详解 1、os.getcwd() &#xff1a;得到当前工作目录&#xff0c;即当前python解释器所在目录路径 import os j os.getcwd() # 返回当前pyt…

基于 Spring Cloud 完整的微服务架构实战

本项目是一个基于 Spring Boot、Spring Cloud、Spring Oauth2 和 Spring Cloud Netflix 等框架构建的微服务项目。 作者&#xff1a;Sheldon地址&#xff1a;https://github.com/zhangxd1989 技术栈 Spring boot - 微服务的入门级微框架&#xff0c;用来简化 Spring 应用的初…

mysql Invalid use of group function的解决办法

错误语句&#xff1a;SELECT s.SID, s.Sname, AVG(a.score)FROM student sLEFT JOIN sc a ON s.SID a.SID WHERE AVG(a.score) > 60GROUP BY s.SID正确语句&#xff1a; SELECTs.SID,s.Sname,AVG(a.score)FROMstudent sLEFT JOIN sc a ON s.SID a.SID GROUP BYs.SID HAVIN…

ipython notebook 中 wavefile, display, Audio的使用

基于ipython notebook的 wavefile以及display, Audio的使用首先是使用的库使用 wavfile 读取.wav文件使用display,Audio播放声音最近在做声音信号处理的时候&#xff0c;使用了ipython notebook。发现相较于matlab&#xff0c;python在有关生成wave文件和播放音频需要利用到sci…

spring 设计模式

设计模式作为工作学习中的枕边书&#xff0c;却时常处于勤说不用的尴尬境地&#xff0c;也不是我们时常忘记&#xff0c;只是一直没有记忆。 今天&#xff0c;螃蟹在IT学习者网站就设计模式的内在价值做一番探讨&#xff0c;并以spring为例进行讲解&#xff0c;只有领略了其设计…

Ansible-----循环

with_dict迭代字典项 使用"with_dict"可以迭代字典项。迭代时&#xff0c;使用"item.key"表示字典的key&#xff0c;"item.value"表示字典的值。 ---- hosts: localhosttasks:- debug: msg"{{item.key}} & {{item.value}}"with_di…

ROS(Robot Operating System)笔记 : 1.使用launch file在gazebo中生成urdf机器人

ROS(Robot Operating System) 1.使用launch file在gazebo中生成urdf机器人 最近接触了ROS(Robot Operating System),发现单单学习官网http://wiki.ros.org/上的教程&#xff0c;在实际操作过程中仍然会遭遇许多困难。这一系列关于ROS的文章记录了ROS学习过程中可能遇到的问题…

[asp.net] 利用WebClient上传图片到远程服务

一、客户端 1.页面 <form id"Form1" method"post" runat"server" enctype"multipart/form-data">     <input id"MyFile" type"file" runat"server" />     <br />     …

ROS project part 1: Ubuntu中安装opencv包以及相应的依赖

首先在ubuntu linux上安装opencv $ sudo apt-get install python-opencv使用ipython 验证 opencv的安装 $ import cv2 as cv $ print(cv.__version__)查看当前的ubuntu 版本 $ cat /etc/issue查看当前python版本 下列代码分别用于查看python3 python2的已安装版本 $ python…

FastReport4.6程序员手册_翻译

一、使用TfrxReport 组件工作1、加载并存储报表默认情况下&#xff0c;报表窗体同项目窗体构存储在同一个DFM文件中。多数情况下&#xff0c;无须再操作&#xff0c;因而你就不必采用特殊方法加载报表。如果你决定在文件中存储报表窗体或者是数据库的Blob字段&#xff08;他提供…

Python音频信号处理 1.短时傅里叶变换及其逆变换

短时傅里叶变换及其逆变换 本篇文章主要记录了使用python进行短时傅里叶变换&#xff0c;分析频谱&#xff0c;以及通过频谱实现在频域内降低底噪的代码及分析&#xff0c;希望可以给同样在学习信号处理的大家一点帮助&#xff0c;也希望大家对我的文章多提意见建议。 一. 短…