go语言的字符和字符串

davidsu33 · · 1528 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

Go语言中的字符

在Go语言中，没有字符类型，字符类型是rune类型，rune是int32的别称。

下面用一个简单的程序来演示字符类型：

package main
import (
	"fmt"
	"reflect"
)
func main() {
	r := '我'
	fmt.Printf("%q的类型为：%t 二进制为：%b\n", r, r, r)
	rType := reflect.TypeOf(r).Kind()
	fmt.Printf("r的实际类型为：%s\n", rType)
}

程序输出：

'我'的类型为：%!t(int32=25105) 二进制为：110001000010001
r的实际类型为：int32

那我产生一个问题：Unicode字符的长度是多少？这个问题的问法有没有问题？其实仔细想想，这样问是有问题的。首先，Unicode的基础是一个有编号的字符集，在字符集之上又规定了模块化的编码等等技术层次，各种具体的编码形式并不一致。因此，严格来说，Unicode是没有“长度”这一说的，它是抽象的字符，只有Unicode的编码才有具体的字节长度。而且不同的编码实现，长度也不一样。

Unicode 目前规划的总空间是17个平面（平面0至16），每个平面有 65536 个码点。我们常用的平面0（「Basic Multilingual Plane」，即「BMP」）码点范围为0x0000 至 0xFFFF，这并不是 Unicode 的全部。

BMP 的字符是 Unicode 中最基础和最常用的一部分，以 UTF-16 编码时使用2字节，以 UTF-8编码时使用1至3字节。超出 BMP 的字符以 UTF-16 或 UTF-8 编码都需要4字节。另外还有一个比较少用的编码形式，UTF-32，它编码任何 Unicode 字符都需要4个字节。

Go语言中的字符串

Go语言的字符串有两种方式来表示：

双引号，可以使用转义字符，如 s := "Go语言字符串\n不能跨行赋值"
反引号，字符串跟反引号中的格式一样，即Raw Type

s := Go原格式字符串可以跨行

Go语言的字符串是以UTF-8格式编码并存储的，下面有一个简单的例子：

package main
import (
	"fmt"
)
func main() {
	s := "我"
	fmt.Printf("s的类型为：%t, 长度为：%d, 16进制为：%x\n", s, len(s), s)
	for i, b := range []byte(s) {
		fmt.Printf("第%d个字节为：%b\n", i, b)
	}
}

程序输出：

s的类型为：%!t(string=我), 长度为：3, 16进制为：e68891
第0个字节为：11100110
第1个字节为：10001000
第2个字节为：10010001

变量s中存放的是这个字符串的UTF-8编码，当你使用len(s)函数获取字符串的长度时，获取的是该字符串的UTF-8编码长度，存储一个字符可能需要 2个、3个或者4个字节，它是不固定的。

UTF-8的编码遵循如下2条规则：

对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。
对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

根据这两条简单的规则，我们可以把UTF-8编码转换为Unicode的码点:

//utf8转为unicode
          1110 0110 1000 1000 1001 0001 // s
               0110   00 1000   01 0001 // s utf8 -> unicode
          0000 0000 0110 0010 0001 0001 // s utf8 -> unicode
0000 0000 0000 0000 0110 0010 0001 0001 // r

我们可以看到上面推导的结果跟程序的输出结果相符。

有疑问加站长微信联系（非本文作者）

本文来自：CSDN博客

感谢作者：davidsu33

查看原文：go语言的字符和字符串

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

1528 次点击

加入收藏微博

收入我的专栏

上一篇：golang 结构体

下一篇：go-tour

跨行

单字节

二进制位

变量

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

go语言的字符和字符串

Go语言中的字符

Go语言中的字符串

用户登录

今日阅读排行

一周阅读排行

关注我

Go语言中的字符

Go语言中的字符串

go语言的字符和字符串

Go语言中的字符

Go语言中的字符串

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

Go语言中的字符

Go语言中的字符串

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏