详解Golang官方中的一致性哈希组件

背景

在分布式缓存中,我们需要通过一组缓存节点来提高我们的缓存容量。比如我们有3个Redis节点:

-1

最简单的路由规则是我们计算`Key`的哈希值,然后取模计算目标节点,比如我们有5个Key,计算出以下哈希值及对应的目标节点:

Key的哈希值 模3的余 目标节点
10 1 Redis1
4 1 Redis1
6 0 Redis0
8 2 Redis2
15 0 Redis0

如果我们这时候加入一个新的Redis节点,这时候路由变化如下:

Key的哈希值 模3的余 目标节点(旧) 模4的余 目标节点(新) 是否变化
10 1 Redis1 2 Redis2
4 1 Redis1 0 Redis0
6 0 Redis0 2 Redis2
8 2 Redis2 0 Redis0
15 0 Redis0 3 Redis3

可以看到,我们只是加入了一个节点,就导致了所有Key的目标节点被改变了,这样会导致大量缓存失效,这时请求可能就会都打到数据库里,可能会导致数据库被击垮,这也就是缓存雪崩问题。

为了解决这个问题,一般我们会使用一致性哈希:

一致性哈希算法

一致性哈希算法经常被用于请求路由中,在处理节点不变的情况下,它能够把相同的请求路由到相同的处理节点上。同时还能在处理节点变动时,让相同请求尽可能的打到原先相同的处理节点上。

原理

一致性哈希的原理是把处理节点通过哈希映射到一个哈希环上,哈希环可以理解为一个连续编号的循环链表,一般会使用长度为32位的哈希值,也就是哈希环可以映射2^32个值。如下图所示:

图中有三个Redis节点,通过哈希映射到环上的某个位置。Key也是通过哈希映射到环上的某个位置,然后向前寻找计算节点,第一个遇到的就是Key的目标节点。

-2

这时候如果我们加入一个新的Redis3节点,可以看到只有Key4的路由改变了,其他的Key的路由都保持不变:

-3

也就是我们新加入的处理节点,只会影响前面的处理节点的路由。

改进

可以看到上面的Redis节点在环上分布得并不均匀,这样会导致每个节点的负载差距过大。为了让Redis节点在环上分布得更加均匀,我们还可以再加入虚拟节点。让一个Redis节点能够映射到哈希环上的多个位置,这样节点的分布会更加均匀。

-4

可以看到因为每个Redis节点的映射位置变多了,因此更有可能会分布得更加均匀。图里每个Redis节点只有两个虚拟节点,主要是不太好画,实际上我们可能会给每个Redis节点分配几十个虚拟节点,这样基本上就很均匀了。

实现方式

golang官方的groupcache库是一个嵌入式的分布式缓存库,它里面有一个一致性哈希的实现:https://github.com/golang/groupcache/blob/master/consistenthash/consistenthash_test.go

下面的代码对这个实现有一些修改。

结构和接口

第一件需要做的事情,就是我们需要把节点进行哈希得到一个整数值,这里默认是使用crc32计算一个字节序列的哈希值,当然也可以自己指定。

哈希环的结构里面有一个ring数组,我们使用这个数组模拟一个哈希环,当然数组并不会把最后一个元素链接到第一个元素,因此我们需要在逻辑上模拟。里面的nodes则是保存了哈希值到真实节点字符串的映射,这样我们在ring数组里面找到对应的哈希值时才能反过来找到真实节点。

  1. // 哈希函数
  2. type Hash func(data []byte) uint32
  3.  
  4. // 哈希环
  5. // 注意,非线程安全,业务需要自行加锁
  6. type HashRing struct {
  7.      hash Hash
  8.      // 每个真实节点的虚拟节点数量
  9.      replicas int
  10.      // 哈希环,按照节点哈希值排序
  11.      ring []int
  12.      // 节点哈希值到真实节点字符串,哈希映射的逆过程
  13.      nodes map[int]string
  14. }

添加节点

可以看到这个方法是把节点添加到哈希环里面,这里会为每个节点创建虚拟节点,这样可以分布的更加均匀。

当然这个方法存在一个问题,就是它没有判断加入的节点是否已经存在,这样可能会导致Ring上面存在相同的节点。

  1. // 添加新节点到哈希环
  2. // 注意,如果加入的节点已经存在,会导致哈希环上面重复,如果不确定是否存在请使用Reset
  3. func (*HashRing) Add(nodes string) {
  4.      for _, node := range nodes {
  5.          // 每个节点创建多个虚拟节点
  6.          for i := 0; i < m.replicas; i++ {
  7.              // 每个虚拟节点计算哈希值
  8.              hash := int(m.hash([]byte(strconv.Itoa(i) + node)))
  9.              // 加入哈希环
  10.              m.ring = append(m.ring, hash)
  11.              // 哈希值到真实节点字符串映射
  12.              m.nodes[hash] = node
  13.          }
  14.      }
  15.      // 哈希环排序
  16.      sort.Ints(m.ring)
  17. }

重置节点

为了解决上面的问题,我们额外实现了一个重置方法,也就是先清空哈希环,再添加。当然这样就必须每次都指定完整的节点列表。

  1. // 先清空哈希环再设置
  2. func (*HashRing) Reset(nodes string) {
  3.      // 先清空
  4.      r.ring = nil
  5.      r.nodes = map[int]string{}
  6.      // 再重置
  7.      r.Add(nodes…)
  8. }

获取Key对应的节点

这个方法的功能是查询Key应该路由到哪个节点,也就是计算Key的哈希值,然后找到哈希值对应的处理节点(这里需要考虑ring数组逻辑上是一个环),然后再根据这个哈希值去寻找真实处理节点的字符串。

  1. // 获取Key对应的节点
  2. func (*HashRing) Get(key string) string {
  3.      // 如果哈希环位空,则直接返回
  4.      if r.Empty() {
  5.          return “”
  6.      }
  7.  
  8.      // 计算Key哈希值
  9.      hash := int(r.hash([]byte(key)))
  10.  
  11.      // 二分查找第一个大于等于Key哈希值的节点
  12.      idx := sort.Search(len(r.ring), func(int) bool { return r.ring[i] >= hash })
  13.  
  14.      // 这里是特殊情况,也就是数组没有大于等于Key哈希值的节点
  15.      // 但是逻辑上这是一个环,因此第一个节点就是目标节点
  16.      if idx == len(r.ring) {
  17.          idx = 0
  18.      }
  19.  
  20.      // 返回哈希值对应的真实节点字符串
  21.      return r.nodes[r.ring[idx]]
  22. }

总结

这个一致性哈希的实现非常简单,功能上也非常简单(官方的实现甚至没有Reset()方法),可以通过这个实现理解一致性哈希的原理。也可以直接在业务中使用它,如果功能不够再根据需求进行扩展。

上面代码地址:https://github.com/jiaxwu/gommon/blob/main/consistenthash/consistenthash.go

到此这篇关于详解Golang官方中的一致性哈希组件的文章就介绍到这了,更多相关Golang一致性哈希内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

标签

发表评论