负载均衡 | 一致性hash算法

技术全沾 · · 457 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

v2-3244e076d29c02565e07a29be205e91a_1440w.jpg

讲一致性hash算法前,先简述一下求余hash算法:

hash(object)%N

  1. 一个缓存服务器宕机了,这样所有映射到这台服务器的对象都会失效,我们需要把属于该服务器中的缓存移除,这时候缓存服务器是 N-1 台,映射公式变成了 hash(object)%(N-1) ;

  2. 由于QPS升高,我们需要添加多一台服务器,这时候服务器是 N+1 台,映射公式变成了 hash(object)%(N+1) 。

1 和 2 的改变都会出现所有服务器需要进行数据迁移。

一致性HASH算法

一致性HASH算法的出现有效的解决了上面普通求余算法在节点变动后面临全部缓存失效的问题:

type Consistent struct {
    numOfVirtualNode int
    hashSortedNodes  []uint32
    circle           map[uint32]string
    nodes            map[string]bool
}

简单地说,一致性哈希将整个哈希值空间组织成一个虚拟的圆环,如假设某空间哈希函数H的值空间是0-2^32-1(即哈希值是一个32位无符号整形),整个哈希空间如下:

image

下一步将各个服务器使用哈希算法计算出每台机器的位置,具体可以使用服务器的IP地址或者主机名作为关键字,并且是按照顺时针排列:

//这里我选择crc32,具体情况具体安排
func hashKey(host string) uint32 {
    scratch := []byte(host)
    return crc32.ChecksumIEEE(scratch)
}

这里我们假设三台节点memcache经计算后位置如下:

image
//add the node
c.Add("Memcache_server01")
c.Add("Memcache_server02")
c.Add("Memcache_server03")
func (c *Consistent) Add(node string) error {
    if _, ok := c.nodes[node]; ok {
        return errors.New("host already existed")
    }
    c.nodes[node] = true
    // add virtual node
    for i := 0; i < c.numOfVirtualNode; i++ {
        virtualKey := getVirtualKey(i, node)
        c.circle[virtualKey] = node
        c.hashSortedNodes = append(c.hashSortedNodes, virtualKey)
    }

    sort.Slice(c.hashSortedNodes, func(i, j int) bool {
        return c.hashSortedNodes[i] < c.hashSortedNodes[j]
    })
    return nil
}

接下来使用相同算法计算出数据的哈希值,并由此确定数据在此哈希环上的位置

假如我们有数据A、B、C和D,经过哈希计算后位置如下:

image

根据一致性哈希算法,数据A就被绑定到了server01上,D被绑定到了server02上,B、C在server03上,是按照顺时针找最近服务节点方法

这样得到的哈希环调度方法,有很高的容错性和可扩展性:

假设server03宕机

image

可以看到此时A、C、B不会受到影响,只是将B、C节点被重定位到Server 1。一般的,在一致性哈希算法中,如果一台服务器不可用,则受影响的数据仅仅是此服务器到其环空间中前一台服务器(即顺着逆时针方向行走遇到的第一台服务器)之间数据,其它不会受到影响。

考虑另外一种情况,如果我们在系统中增加一台服务器Memcached Server 04:

image

此时A、D、C不受影响,只有B需要重定位到新的Server 4。一般的,在一致性哈希算法中,如果增加一台服务器,则受影响的数据仅仅是新服务器到其环空间中前一台服务器(即顺着逆时针方向行走遇到的第一台服务器)之间数据,其它不会受到影响。

综上所述,一致性哈希算法对于节点的增减都只需重定位环空间中的一小部分数据,具有较好的容错性和可扩展性。

我用golang做了个简单版,官方也有package大家可以参考讨论一下:

链接Consistent Hashing

关注公众号【技术全沾】,分享更多技术好文,还有不定期派书活动。


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:技术全沾

查看原文:负载均衡 | 一致性hash算法

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

457 次点击  
加入收藏 微博
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传