Golang中的字节序列化操作

gotaly · · 1521 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

在写网络程序的时候,我们经常需要将结构体或者整数等数据类型序列化成二进制的buffer串。或者从一个buffer中解析出来一个结构体出来,最典型的就是在协议的header部分表征head length 或者body length在拼包和拆包的过程中,需要按照规定的整数类型进行解析,且涉及到大小端序的问题。

1.C中是怎么操作的

在C中我们最简单的方法是用memcpy来一个整形数或者结构体等其他类型复制到一块内存中,然后在强转回需要的类型。如:

聽聽聽聽//聽produce
聽聽聽聽int聽a聽=聽32;
聽聽聽聽char聽*buf聽聽=聽(char聽*)malloc(sizeof(int));
聽聽聽聽memcpy(buf,&a,sizeof(int));

聽聽聽聽//聽consume
聽聽聽聽int聽b聽;
聽聽聽聽memcpy(&b,buf,sizeof(int))

必要的时候采用ntoh/hton系列函数进行大小端序的转换。

2.golang中操作

通过"encoding/binary"可以提供常用的二进制序列化的功能。该模块主要提供了如下几个接口:

func聽Read(r聽io.Reader,聽order聽ByteOrder,聽data聽interface{})聽error
func聽Write(w聽io.Writer,聽order聽ByteOrder,聽data聽interface{})聽error
func聽Size(v聽interface{})聽int

var聽BigEndian聽bigEndian
var聽LittleEndian聽littleEndian
/*
type聽ByteOrder聽interface聽{
Uint16([]byte)聽uint16
Uint32([]byte)聽uint32
Uint64([]byte)聽uint64
PutUint16([]byte,聽uint16)
PutUint32([]byte,聽uint32)
PutUint64([]byte,聽uint64)
String()聽string
}
/*

通过Read接口可以将buf中得内容填充到data参数表示的数据结构中,通过Write接口可以将data参数里面包含的数据写入到buffer中。 变量BigEndian和LittleEndian是实现了ByteOrder接口的对象,通过接口中提供的方法可以直接将uintx类型序列化(uintx())或者反序列化(putuintx())到buf中。

2.1将结构体序列化到一个buf中

在序列化结构对象时,需要注意的是,被序列化的结构的大小必须是已知的,可以通过Size接口来获得该结构的大小,从而决定buffer的大小。

i聽:=聽uint16(1)
size聽:=聽聽binary.Size(i)

固定大小的结构体,就要求结构体中不能出现[]byte这样的切片成员,否则Size返回-1,且不能进行正常的序列化操作。

type聽A聽struct聽{
聽聽聽聽//聽should聽be聽exported聽member聽when聽read聽back聽from聽buffer
聽聽聽聽One聽int32
聽聽聽聽Two聽int32
}

var聽a聽A


a.One聽=聽int32(1)
a.Two聽=聽int32(2)

buf聽:=聽new(bytes.Buffer)
fmt.Println("a's聽size聽is聽",binary.Size(a))
binary.Write(buf,binary.LittleEndian,a)
fmt.Println("after聽write聽,buf聽is:",buf.Bytes())

对应的输出为:

a's聽size聽is聽聽8
after聽write聽,buf聽is聽:聽[1聽0聽0聽0聽2聽0聽0聽0]

通过Size可以得到所需buffer的大小。通过Write可以将对象a的内容序列化到buffer中。这里采用了小端序的方式进行序列化(x86架构都是小端序,网络字节序是大端序)。

对于结构体中得“_”成员不进行序列化。

2.2从buf中反序列化回一个结构

从buffer中读取时,一样要求结构体的大小要固定,且需要反序列化的结构体成员必须是可导出的也就是必须是大写开头的成员,同样对于“_”不进行反序列化:

type聽A聽struct聽{
聽聽聽聽//聽should聽be聽exported聽member聽when聽read聽back聽from聽buffer
聽聽聽聽One聽int32
聽聽聽聽Two聽int32
}

var聽aa聽A

buf聽:=聽new(bytes.Buffer)
binary.Write(buf,binary.LittleEndian,a)
binary.Read(buf,binary.LittleEndian,&aa)
fmt.Println("after聽aa聽is聽",aa)

输出为:

after聽write聽,bufis聽:聽[1聽0聽0聽0聽2聽0聽0聽0]
before聽aa聽is聽:聽{0聽0}
after聽aa聽is聽聽{1聽2}

这里使用Read从buffer中将数据导入到结构体对象aa中。如果结构体中对应的成员不是可导出的,那么在转换的时候会panic出错。

2.3将整数序列化到buf中,并从buf中反序列化出来

我们可以通过Read/Write直接去读或者写一个uintx类型的变量来实现对整形数的序列化和反序列化。由于在网络中,对于整形数的序列化非常常用,因此系统库提供了type ByteOrder接口可以方便的对uint16/uint32/uint64进行序列化和反序列化:

int16buf聽:=聽new(bytes.Buffer)
i聽:=聽uint16(1)
binary.Write(int16buf,binary.LittleEndian,i)
fmt.Println(“write聽buf聽is:”int16buf.Bytes())

var聽int16buf2聽[2]byte
binary.LittleEndian.PutUint16(int16buf2[:],uint16(1))
fmt.Println("put聽buffer聽is聽:",int16buf2[:])

ii聽:=聽binary.LittleEndian.Uint16(int16buf2[:])
fmt.Println("Get聽buf聽is聽:",ii)

输出为:

write聽buffer聽is聽:聽[1聽0]
put聽buf聽is:聽[1聽0]
Get聽buf聽is聽:聽1

通过调用binary.LittleEndian.PutUint16,可以按照小端序的格式将uint16类型的数据序列化到buffer中。通过binary.LittleEndian.Uint16将buffer中内容反序列化出来。

3. 一个实在的例子

我们来看一个网络包包头的定义和初始化:

type聽Head聽struct聽{
聽聽聽聽Cmd聽byte
聽聽聽聽Version聽byte
聽聽聽聽Magic聽聽聽uint16
聽聽聽聽Reserve聽byte
聽聽聽聽HeadLen聽byte
聽聽聽聽BodyLen聽uint16
}

func聽NewHead(buf聽[]byte)*Head{
聽聽聽聽head聽:=聽new(Head)

聽聽聽聽head.Cmd聽聽聽聽聽=聽buf[0]
聽聽聽聽head.Version聽=聽buf[1]
聽聽聽聽head.Magic聽聽聽=聽binary.BigEndian.Uint16(buf[2:4])
聽聽聽聽head.Reserve聽=聽buf[4]
聽聽聽聽head.HeadLen聽=聽buf[5]
聽聽聽聽head.BodyLen聽=聽binary.BigEndian.Uint16(buf[6:8])
聽聽聽聽return聽head
}

这个是一个常见的在tcp 拼包得例子。在例子中通过binary.BigEndian.Uint16将数据按照网络序的格式读出来,放入到head中对应的结构里面。


本文出自 “Done_in_72_hours” 博客,请务必保留此出处http://gotaly.blog.51cto.com/8861157/1539119

本文来自:51CTO博客

感谢作者:gotaly

查看原文:Golang中的字节序列化操作

入群交流(和以上内容无关):加入Go大咖交流群,免费领全套学习资料或添加微信:muxilin131420 备注:入群;或加QQ群:729884609

1521 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传