golang实现对docker容器心跳监控

aside section ._1OhGeD · · 790 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

自己写的go程序放到线上本来编译成二进制扔上去就行啦,但是怀着一颗docker的心,最终还是将它放到docker容器中运行起来了,运行起来也ok,一个最小容器64M,统一管理起来也方便,但是毕竟是个线上长驻内存的服务程序,万一跑挂了怎么办,如何才能监控它,直接上go代码,网上代码,略微做了下注释,但实测过,真实有效:

package main

import (
    "encoding/json"
    "errors"
    "flag"
    "fmt"
    "io/ioutil"
    "log"
    "net"
    "os"
    "strings"
    "time"
)

// 镜像结构
type Image struct {
    Created  uint64
    Id string
    ParentId string
    RepoTags []string
    Size uint64
    VirtualSize uint64
}

// 容器结构
type Container struct {
    Id string `json:"Id"`
    Names []string `json:"Names"`
    Image string `json:"Image"`
    ImageID string `json:"ImageID"`
    Command string `json:"Command"`
    Created uint64 `json:"Created"`
    State string `json:"State"`
    Status string `json:"Status"`
    Ports []Port `json:"Ports"`
    Labels map[string]string `json:"Labels"`
    HostConfig map[string]string `json:"HostConfig"`
    NetworkSettings map[string]interface{} `json:"NetworkSettings"`
    Mounts []Mount `json:"Mounts"`
}

// docker 端口映射
type Port struct {
    IP string `json:"IP"`
    PrivatePort int `json:"PrivatePort"`
    PublicPort int `json:"PublicPort"`
    Type string `json:"Type"`
}

// docker 挂载
type Mount struct {
    Type string `json:"Type"`
    Source string `json:"Source"`
    Destination string `json:"Destination"`
    Mode string `json:"Mode"`
    RW bool `json:"RW"`
    Propatation string `json:"Propagation"`
}

// 连接列表
var SockAddr = "/var/run//docker.sock"   //这可不是随便写的,是docker官网文档的套接字默认值,当然守护进程通讯方式还有tcp,fd等方式,各自都有适用场景。。。
var imagesSock = "GET /images/json HTTP/1.0\r\n\r\n"   //docker对外的镜像api操作
var containerSock = "GET /containers/json?all=true HTTP/1.0\r\n\r\n"       //docker对外的容器查看api
var startContainerSock = "POST /containers/%s/start HTTP/1.0\r\n\r\n"  //docker对外的容器启动api

// 白名单
var whiteList []string

func main() {
    // 读取命令行参数
    // 白名单列表
    list := flag.String("list", "", "docker white list to restart, eg: token,explorer")
    // 轮询的时间间隔,单位秒
    times := flag.Int64("time", 10, "time interval to set read docker containers [second], default is 10 second")

    flag.Parse()

    // 解析list => whiteList
    whiteList = strings.Split(*list, ",")   //将我们命令行中list参数的容器列表解析到代码中

    log.SetOutput(os.Stdout)
    log.Println("start docker watching...")
    log.Printf("Your whiteList: %v\n", *list)
    log.Printf("Your shedule times: %ds\n", *times)
        //接下来的这个for循环就是每隔一定时间监控docker容器是否正常运行,不正常就重新启动它
    for {
        // 轮询docker
        err := listenDocker()   
        if err != nil {
            log.Println(err.Error())
        }

        time.Sleep(time.Duration(*times)*time.Second)
    }

}

func listenDocker() error {
    // 获取容器列表,拿到所有的容器信息
    containers, err := readContainer()  
    if err != nil {
        return errors.New("read container error: " + err.Error())
    }
    // 先遍历白名单快,次数少
    for _, name := range whiteList {
    Name:
        for _, container := range containers {
            for _, cname := range container.Names {
                // 如果匹配到白名单
                if cname[1:] == name {
                    // 关心一下容器状态
                    log.Printf("id=%s, name=%s, state=%s", container.Id[:12], container.Names, container.Status)
                    if strings.Contains(container.Status, "Exited") {
                        // 如果出现异常退出的容器,启动它
                        log.Printf("find container: [%s] has exited, ready to start it. ", name)
                        e := startContainer(container.Id)
                        if e != nil {
                            log.Println("start container error: ", e.Error())
                        }
                        break Name
                    }
                }
            }
        }
    }
    return nil
}

// 获取 unix sock 连接
func connectDocker() (*net.UnixConn, error) {
    addr := net.UnixAddr{SockAddr, "unix"}     // SockAddr 这个变量的值被设定为docker的/var/run/docker  套接字路径值,也就是说此处就是拨通与docker的daemon通讯建立的关键处,其他处的代码就是些正常的逻辑处理了
    return net.DialUnix("unix", nil, &addr)
}

// 启动容器
func startContainer(id string) error {
    conn, err := connectDocker()
    if err != nil {
        return errors.New("connect error: " + err.Error())
    }

    start := fmt.Sprintf(startContainerSock, id)
    fmt.Println(start)
    cmd := []byte(start)
    code, err := conn.Write(cmd)
    if err != nil {
        return err
    }
    log.Println("start container response code: ", code)
    // 启动容器等待20秒,防止数据重发
    time.Sleep(20*time.Second)
    return nil
}

// 获取容器列表
func readContainer() ([]Container, error) {
    conn, err := connectDocker()  //建立一个unix连接,这其实是一个关键点,需要你了解unix   套接字   建立连接
    if err != nil {
        return nil, errors.New("connect error: " + err.Error())
    }

    _, err = conn.Write([]byte(containerSock))
    if err != nil {
        return nil, err
    }

    result, err := ioutil.ReadAll(conn)
    if err != nil {
        return nil, err
    }

    body := getBody(result)
    var containers []Container
    err = json.Unmarshal(body, &containers)
    if err != nil {
        return nil, err
    }

    log.Println("len of containers: ", len(containers))
    if len(containers) == 0 {
        return nil, errors.New("no containers")
    }
    return containers, nil
}

// 获取镜像列表
func readImage(conn *net.UnixConn) ([]Image, error) {
    _, err := conn.Write([]byte(imagesSock))
    if err != nil {
        return nil, err
    }

    result, err := ioutil.ReadAll(conn)
    if err != nil {
        return nil, err
    }

    body := getBody(result[:])

    var images []Image
    err = json.Unmarshal(body, &images)
    if err != nil {
        return nil, err
    }
    return images, nil
}

// 从返回的 http 响应中提取 body
func getBody(result []byte) (body []byte) {
    for i:=0; i<=len(result)-4; i++ {
        if result[i] == 13 && result[i+1] == 10 && result[i+2] == 13 && result[i+3] == 10 {
            body = result[i+4:]
            break
        }
    }
    return
}


/*
error log :
    1、write unix @->/var/run/docker.sock: write: broken pipe
        建立的tcp连接不能复用,每次操作都建立连接
 */

使用方法

  1. 编译
    go build -o main main.go
    2.linux下直接当可执行文件执行便可
    ./main -list="容器名称1,容器名称2..."

思路分析:

原来docker这个软件对外是提供了一些列api用来管理容器的增删该查的 官方api文档,既然提供了api了那么任何语言都能实现对其的管理控制及动态部署了。

但其实这里面真要弄明白还是有很多话要讲了

docker这个服务已经已进程的形式运行在linux的系统中了,为什么我们输入docker有关的命令能够与之交互,这好像是一个习以为常的行为,貌似理应如此,但是要知道我们是在与一个正在运行的进程发生通讯,若仍不以为然,请接以下问:
1.进程间都是如何通讯的?进程通讯间方式
在明白了进程之间的通讯方式之后,我明白了docker的这个daemon通讯原理,瞬间就打通了之前对k8管理docker的疑惑(老实讲只知道kubernetes很强大,却没想明白它是如何能动态增容我的容器配置,负载等等等),套接字(socket) /var/run/docker 这个我们使用起来不会接触到,理解起来却必须打通的关键点请务必了解它。


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:aside section ._1OhGeD

查看原文:golang实现对docker容器心跳监控

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

790 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传