DockOne微信分享（一零三）：Kubernetes 有状态集群服务部署与管理

DarkForces. · · 875 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

【编者的话】本次分享将深入介绍Kubernetes如何满足有状态集群服务对容器编排系统提出的新需求，包括如何使用Kubernetes的动态存储请求与分配机制来实现服务状态的持久化存储，以及与高效部署和运行有状态集群服务相关的Kubernetes新特性，如Init Container、PetSet （StatefulSet）等。最后通过一个MySQL集群实例详解在Kubernetes中如何轻松部署一个高可用的有状态集群服务并实现自动化管理。

在容器化时代，除了无状态的容器服务，比如Web服务器，用户也越来越多地使用容器部署有状态的应用，这就对容器编排系统提出了新的需求。

我今天要和大家分享的主题就是如何在目前主流的容器云平台Kubernetes 上部署和管理有状态集群服务。

这次分享的关键词有两个：一个是Kubernetes，另一个是有状态集群服务。

我们会在第一部分了解一下什么是 Kubernetes，以及运行有状态集群服务面临的一些挑战。

接下来的两部分我们会重点介绍 Kubernetes 是如何应对这些挑战，以及 通过哪些特性来解决有状态集群服务所特有的一些问题。

最后一部分是实战，通过一个MySQL集群的例子来展示如何在Kubernetes上轻松地部署和管理一个有状态集群服务。

Kubernetes简介和运行有状态集群服务的挑战

首先来看什么是Kubernetes？

简单一句话来说，Kubernetes是一个运行和管理容器的平台。它在Docker、rkt等容器运行时之上，实现了容器的集群化和高可用。

Kubernetes简称K8S，来自Google，支持多种云计算环境，并且100% 开源，是云原生计算基金会的一部分，用Go语言开发的。

这里是Kubernetes的一些基本概念。

其中最核心的一个概念是Pod，它是Kubernetes对容器进行的封装，是Kubernetes管理的最小单位。

Pod通过Deployment来部署，Deployment会创建一个Replica Set 来保证Pod的个数始终是一个指定的值。

Pod一般不直接对外提供服务，而是通过Service对外提供一个稳定的访问接口，一个Service后面可以挂多个Pod实例。

Service是如何找到它匹配的Pod呢？靠的是Label。Label是联系各个Kubernetes资源的纽带。Replica Set 和它管理的Pod之间也是通过 Label 来关联的。

如果Pod里的容器运行的是有状态服务，如数据库与缓存等，还需要挂载存储卷，用于存储服务状态。

讲完原理，我们来看一个实例。

这是一个在Kubernetes集群里运行的容器化应用案例，这个应用有自己的Web 客户端，同时还从Twitter采集数据，处理完后存储到自己的DB。

可以看到容器里跑的服务有两类，无状态和有状态。像Web服务器，流处理器等无状态服务出现问题后，直接杀掉，新建一个，管理起来非常简单。

但是对有状态服务，像数据库，它要求有更长的生命周期。在一个集群的情况下，集群成员之间如何能保持稳定的成员关系？这都对容器编排系统提出了新的挑战。

那么Kubernetes是如何应对这些挑战的呢？

Kubernetes运行的服务，从简单到复杂可以分成三类：无状态服务、普通有状态服务和有状态集群服务。下面分别来看Kubernetes是如何运行这三类服务的。

首先无状态服务，Kubernetes使用RC（或更新的Replica Set）来保证一个服务的实例数量。通过Service来对外提供一个稳定的访问接口。

然后是普通有状态服务，它多了状态保存的需求。Kubernetes提供了以Volume和Persistent Volume为基础的存储系统，可以实现服务的状态保存。

最后是有状态集群服务，它又多了集群管理的需求。Kubernetes为此开发了一套以Pet Set为核心的全新特性，方便了有状态集群服务在Kubernetes上的部署和管理。

Kubernetes 存储系统

下面我们首先来看Kubernetes如何满足“状态保存”的需求。

Kubernetes的存储系统大致分为三个层次：普通Volume，Persistent Volume 和动态存储供应。

对普通Volume，最简单的一种是“单节点存储卷”。它和Docker的存储卷类似，使用的是Pod所在Kubernetes节点的本地目录。

具体有两种，一种是 emptyDir，是一个匿名的空目录，由Kubernetes在创建Pod时创建，删除Pod时删除。

另外一种是 hostPath，与emptyDir的区别是，它在Pod之外独立存在，由用户指定路径名。

这类和节点绑定的存储卷在Pod迁移到其它节点后数据就会丢失，所以只能用于存储临时数据或用于在同一个Pod里的容器之间共享数据。

普通Volume的第二种类型是“跨节点存储卷”。这种存储卷不和某个具体的Kubernetes节点绑定，而是独立于Kubernetes节点存在的。

跨节点存储卷由于可以在任何一个Kubernetes节点上都能够被访问到，比较灵活，所以应用比较广泛。

Kubernetes上的Volume是通过插件方式来实现的，所以可扩展性很强。

目前来说几乎所有主流的存储在Kubernetes上都有相应的插件来支持。如果已有的存储不能满足要求，还可以开发自己的volume插件。

Kubernetes存储系统的第二种存储方式叫persistent volume。它和普通volume的区别是什么呢？

普通Volume和使用它的Pod之间是一种静态绑定关系，我们无法单独创建一个普通volume，因为它不是一个独立的Kubernetes资源对象。

而Persistent Volume 简称PV是一个Kubernetes资源对象，所以我们可以单独创建。它不和Pod直接发生关系，而是通过Persistent Volume Claim，简称PVC来实现动态绑定。

接下来我们看一下这个动态绑定过程是怎样的？

这是PV的生命周期，首先是Provision，即创建PV，这里创建PV有两种方式，静态和动态。

所谓静态，是管理员手动创建一堆PV，组成一个PV池，供PVC来绑定。动态方式是通过一个叫 storage class的对象由存储系统根据PVC的要求自动创建。

一个PV创建完后状态会变成Available，等待被PVC绑定。一旦被PVC邦定，PV的状态会变成Bound，就可以被相应的Pod使用。Pod使用完后会释放PV，PV的状态变成Released。

变成Released的PV会根据定义的回收策略做相应的回收工作。有三种回收策略，Retain、Delete 和 Recycle。

Retain就是保留现场，Kubernetes什么也不做。Delete 策略，Kubernetes会自动删除该PV及里面的数据。Recycle方式，Kubernetes会将PV里的数据删除，然后把PV的状态变成Available，又可以被新的PVC绑定使用。

刚才提到PV的供给有两种方式，静态和动态。其中动态方式是通过StorageClass来完成的，这是一种新的存储供应方式。

使用StorageClass有什么好处呢？除了由存储系统动态创建，节省了管理员的时间，还有一个好处是可以封装不同类型的存储供PVC选用。

比如这里就有两个StorageClass，它们都是用谷歌的存储系统，但是一个使用的是普通磁盘，名字为slow。另一个使用的是SSD，名字为fast。

在PVC里通过annotation指定了storage class的名字为fast，这样这个PVC就会绑定一个SSD，而不会绑定一个普通的磁盘。

好，到这里Kubernetes的整个存储系统就都介绍完了。

Kubernetes有状态集群服务相关特性

下面进入Kubernetes与有状态集群服务相关的两个新特性。Init Container 和 Pet Set。

什么是Init Container？

从名字来看就是做初始化工作的容器。可以有一个或多个，这些 Init Container 按照定义的顺序依次执行，只有所有的Init Container 执行完后，主容器才启动。

由于一个Pod里的存储卷是共享的，所以 Init Container 里产生的数据可以被主容器使用到。

这是Init Container的一个使用样例。

这个例子创建一个Pod，这个Pod里跑的是一个Nginx容器，Pod里有一个叫workdir的存储卷，访问Nginx容器服务的时候，就会显示这个存储卷里的index.html 文件。

而这个index.html 文件就是通过一个 busybox的初始化容器获得的。

介绍完Init Container，千呼万唤始出来，该今天的主角Pet Set出场了。

什么是Pet Set？顾名思义是Pet的集合，那什么是Pet呢？它是一种需要特殊照顾的Pod。它有状态、有身份、当然也比普通的Pod要复杂一些。

具体来说，一个Pet有三个特征：

一是有稳定的存储，这是通过我们前面介绍的PV/PVC 来实现的。

二是稳定的网络身份，这是通过一种叫 Headless Service 的特殊Service来实现的。和普通Service相比，Headless Service没有Cluster IP，用于为一个集群内部的每个成员提供一个唯一的DNS名字，用于集群内部成员之间通信。

Pet的第三个特征是序号命名规则。比如 Pet Set 的名字叫 mysql，那么第一个启起来的Pet就叫mysql-0，第二个叫mysql-1，如此下去。

当一个Pet down 掉后，新创建的Pet 会被赋予跟原来Pet一样的名字，通过这个名字就能匹配到原来的存储，实现状态保存。

好，与有状态服集群服务相关的Kubernetes特性就介绍到这里。

实战：在Kubernetes上部署和管理MySQL集群

理论讲完了，下面进入实战，以Galera MySQL集群为例子，介绍如何在 Kubernetes如何上部署和管理一个有状态集群服务。

首先大致了解一下Galera MySQL。

它不是那种主从式的集群，而是多Master集群，通过 Galera Replication 把多个MySQL实例关联起来组成一个集群。由Galera Replication 负责节点间的数据同步。

用户访问时可以连接到任何一个节点进行读写操作。每次写入的数据会被Galera Replication同步到整个集群，才算写入成功。

节点之间没有数据延迟，在某个节点失效后，直接退出集群即可，无需失效转移。

对Galera MySQL集群有了基本了解后，我们来看看如何在Kubernetes上部署和运行它。这是整体结构图：

左边的Headless Service用于为每个MySQL Pet实例提供一个DNS名字，右边的PV池为MySQL提供存储。

这里有两个初始化容器，第一个用于安装需要的文件，第二个做MySQL的初始化工作。

一个Pet Set里有多个Pet，每个Pet对应MySQL集群里的一个节点。通过Pet Set可以管理整个MySQL集群。

这是部署MySQL集群具体的YAML文件。

右边是一个Headless Service，名字是galera。

左边是Pet Set，它用到了右边的Headless service。Replicas的数目为3，会创建3个Pet。

在 Pet Set 的annotation里定义了两个初始化容器。

Install容器安装的文件可以被bootstrap容器使用到；同时bootstrap容器生成的MySQL配置文件会放到config存储卷里，供后面的MySQL 容器使用。

这是主容器 Galera MySQL 的定义：

除了常规的3306端口外，它还暴露了其它一些端口，用于集群内部的数据同步和状态转移等操作。

这里MySQL启动参数里用到的文件，是在初始化容器里生成的，通过共享存储卷传递过来。

最后是数据存储卷的定义。

这里定义了三个存储卷，其中config、workdir就是简单的本地目录，而 datadir是一个PVC，它可以去绑定PV来存储MySQL数据库的数据。

所以部署一个集群总共就需要两个YAML文件就可以了，一个Headless Service，一个 Pet Set。其中Pet Set里定义了初始化容器和存储卷。

用上面的方式部署完MySQL集群后，后面的运维工作是比较简单的。

假如某个集群节点由于某种原因Crash掉了，Kubernetes 会自动创建一个新的Pet来替代，实现自动恢复。

如果要扩容或缩容，也是一条命令、指定一下这个Pet Set 的Replicas的数目就行了。

如果要升级，只需要修改Pet Set 定义里 podTemplate 的image值，然后把老的Pet删除，新创建的Pet，就是最新版本的了。

对于在Kubernetes上部署有状态集群服务，我们补充两点：

第一点是在最新发布的 Kubernetes 1.5 里 PetSet 重新命名为StatefulSet。所以根据你使用的Kubernetes版本不同，可能看到的名字也不一样。

第二点是简单介绍一下时速云提供的有状态集群服务：数据库与缓存。

如上图所示，这项服务最大程度的简化了有状态集群服务的创建工作，用户不再需要了解我们前面介绍的所有技术术语，只需要指定一下副本数目，存储的大小就可以了。

最后以下面这张图做为今天分享内容的总结。

有状态集群服务的两个需求，一个是存储需求。另一个是集群需求 。

对存储需求，Kubernetes的解决方案是Volume、Persistent Volume 。对PV，除了手动创建PV池外，还可以通过Storage Class来让存储系统自动创建。

对集群需求，Kubernetes的解决方案是Pet Set。Pet Set 又通过Init Container来做集群初始化，通过Headless Service来为集群成员提供稳定的网络身份。

最后我们以MySQL集群为例，说明了如何在Kubernetes上部署和运行一个有状态集群服务。

目前有状态集群服务在Kubernetes上的部署还不是正式版，但完全可用。如果您的项目中有容器化的需求，可以尝试。

今天的分享到此结束，谢谢大家！

Q&A

Q：前面提到Init Container，Kubernetes里Pod初始化是基于GCR的pause，这个初始化镜像是自定义的吗？

A：Init Container和GCR的Pause是不同的概念，一个是初始化容器（运行完就结束），一个是基础容器（一直运行）。

Q：你介绍的Kubernetes存储技术都是比较新的，能否适应企业生产大规模使用，有没有什么性能和稳定性问题？

A：性能和稳定性上我们也在不断尝试，先使用起来看看效果，目前创建过几百个集群，暂时没有碰到太多稳定性问题。

Q：存储系统如何动态创建StorageClass，如果 Headless Service没有Cluster IP，服务如何调用？

A：Kubernetes通过StorageClass 让存储系统动态创建PV，不是动态创建StorageClass。Headless Service 用于集群内部通信，外部调用，再建普通Service，二者并存。

Q：有状态集群还有其他的实现方式吗？

A：在容器云里比较好的方式是用PetSet，当然也能自己做，相当于自己实现PetSet的一些功能。

Q：同步到整个集群才算写入成功，是不是意味着不适合高负载的项目使用？有可能增加其它策略供选择吗？

A：由于采用多主方式，对外只写入一个，内部扩散同步可以并行，而且每个节点都能对外提供服务，相当于增加了服务带宽，所以性能不是问题。

Q：您好，你们是采用什么分布式存储的，io性能如何？好像一些开源分布式的存储写io的性能普遍比较低，能撑得住一些io高性能的应用吗？

A：性能上要等到支持host 模式后，才能满足一些IO要求比较高的场景

以上内容根据2017年01月10日晚微信群分享内容整理。分享人张寿红，时速云架构师。从事软件研发工作十余年，目前从事基于Docker和Kubernetes的企业级容器云平台研发工作，主要包括容器服务、存储服务、CI/CD和镜像服务等。在加入时速云之前，先后在CA Technologies和Symantec担任Tech Lead和Principal Software Engineer。参与研发的软件产品有：企业数据保护软件、云平台上的服务管理系统、企业客户服务平台等。 DockOne每周都会组织定向的技术分享，欢迎感兴趣的同学加微信：liyingjiesz，进群参与，您有想听的话题或者想分享的话题都可以给我们留言。

有疑问加站长微信联系（非本文作者）

本文来自：DockOne.io

感谢作者：DarkForces.

查看原文：DockOne微信分享（一零三）：Kubernetes 有状态集群服务部署与管理

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

875 次点击

加入收藏微博

收入我的专栏

上一篇：DockOne微信分享( 一零二）：基于容器的日志管理实践

下一篇：DockOne微信分享（一零四）：艺龙部署体系的演进

mysql

动态创建

io

docker

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

DockOne微信分享（一零三）：Kubernetes 有状态集群服务部署与管理

Kubernetes简介和运行有状态集群服务的挑战

Kubernetes 存储系统

Kubernetes有状态集群服务相关特性

实战：在Kubernetes上部署和管理MySQL集群

Q&A

用户登录

今日阅读排行

一周阅读排行

关注我

Kubernetes简介和运行有状态集群服务的挑战

Kubernetes 存储系统

Kubernetes有状态集群服务相关特性

实战：在Kubernetes上部署和管理MySQL集群

Q&A

DockOne微信分享（一零三）：Kubernetes 有状态集群服务部署与管理

Kubernetes简介和运行有状态集群服务的挑战

Kubernetes 存储系统

Kubernetes有状态集群服务相关特性

实战：在Kubernetes上部署和管理MySQL集群

Q&A

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

Kubernetes简介和运行有状态集群服务的挑战

Kubernetes 存储系统

Kubernetes有状态集群服务相关特性

实战：在Kubernetes上部署和管理MySQL集群

Q&A

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏