golang中的string

XITEHIP · 2019-07-02 23:32:41 · 17313 次点击 · 预计阅读时间 2 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-07-02 23:32:41 的文章，其中的信息可能已经有所发展或是发生改变。

一个字符串是一个不可改变的字节序列。字符串可以包含任意的数据，但是通常是用来包含人类可读的文本。

len()返回字符串字节数目（不是rune数）。
通过索引可以访问某个字节值，索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节，因为有有非ASCII的UTF8字符有多个字节。

s := "hello, world"
fmt.Println(len(s))     // "12" 英文字符占一个字节
fmt.Println(s[0], s[7]) // "104 119" ('h' and 'w')

字符串截取与链接

fmt.Println(s[:5]) // "hello"
fmt.Println(s[7:]) // "world"
fmt.Println(s[:])  // "hello, world"
fmt.Println("hi" + s[5:]) //hi world

比较

1 字符串可以用==和<进行比较。通过逐个字节比较完成的，因此比较的结果是字符串自然编码的顺序。

2 原生字符

使用`反引号括起来，没有转义操作。
应用：HTML模板、JSON面值、命令行提示信息等。

编码

1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值，\Uhhhhhhhh对应32bit的码点值，其中h是一个十六进制数字，每一个对应码点的UTF8编码。以下表示相同字符：

"世界"
"\xe4\xb8\x96\xe7\x95\x8c"
"\u4e16\u754c"
"\U00004e16\U0000754c"

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然这三个字节对应一个有效的UTF8编码的码点。

参见【utf-8 Wikipedia】
参见Unicode官网

3 字符串长度用utf8.RuneCountInString(s)

rune

1 Unicode码点对应Go语言中的rune整数类型。

2 因为 rune大小一致，所以支持数组索引和方便切割。

string与[]rune转换

r := []rune("你好 world!")
fmt.Printf("%x\n",  r) // "[4f60 597d 20 77 6f 72 6c 64 21]"
fmt.Println(string(r)) // "你好 world"
}
fmt.Println(string(65)) // "A", not "65" 整形字符串输出为unicode码点的utf8字符串。
fmt.Println(string(0x4eac)) // "京"

对字符串操作的4个包bytes、strings、strconv、unicode包

bytes包操作[]byte。因为字符串是只读的，因此逐步构创建字符串会导致很多分配和复制。使用 bytes.Buffer类型会更高。
strings包提供切割，索引，前缀,查找替换等功能。
strconv包提供了布尔型、整型数、浮点数和对应字符串的相互转换，还提供了双引号转义相关的转换。
unicode包提供了IsDigit、IsLetter、IsUpper和IsLower等类似功能，它们用于给字符分类。

字符串与数字转换

将一个整数转为字符串

x := 123
fmt.Println(strconv.Itoa(x)) // "123"

将一个字符串解析为整数

x, err := strconv.Atoi("123") // x is an int
y, err := strconv.ParseInt("123", 10, 64)

FormatInt和FormatUint函数可以用不同的进制来格式化数字:

fmt.Println(strconv.FormatInt(int64(23), 2)) //将64转换成2进制

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：XITEHIP

查看原文：golang中的string

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

17313 次点击

加入收藏微博

收入我的专栏

上一篇：zero down-time update服务的方案

下一篇：Golang实践----跳表

函数

命令行

信息

提示信息

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

golang中的string

len()返回字符串字节数目（不是rune数）。

通过索引可以访问某个字节值，索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节，因为有有非ASCII的UTF8字符有多个字节。

字符串截取与链接

比较

1 字符串可以用==和<进行比较。通过逐个字节比较完成的，因此比较的结果是字符串自然编码的顺序。

2 原生字符

编码

1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值，\Uhhhhhhhh对应32bit的码点值，其中h是一个十六进制数字，每一个对应码点的UTF8编码。以下表示相同字符：

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然这三个字节对应一个有效的UTF8编码的码点。

3 字符串长度用utf8.RuneCountInString(s)

rune

1 Unicode码点对应Go语言中的rune整数类型。

2 因为 rune大小一致，所以支持数组索引和方便切割。

string与[]rune转换

对字符串操作的4个包bytes、strings、strconv、unicode包

字符串与数字转换

用户登录

今日阅读排行

一周阅读排行

关注我

len()返回字符串字节数目（不是rune数）。

通过索引可以访问某个字节值，索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节，因为有有非ASCII的UTF8字符有多个字节。

字符串截取与链接

比较

1 字符串可以用==和<进行比较。通过逐个字节比较完成的，因此比较的结果是字符串自然编码的顺序。

2 原生字符

编码

1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值，\Uhhhhhhhh对应32bit的码点值，其中h是一个十六进制数字，每一个对应码点的UTF8编码。以下表示相同字符：

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然这三个字节对应一个有效的UTF8编码的码点。

3 字符串长度用utf8.RuneCountInString(s)

rune

1 Unicode码点对应Go语言中的rune整数类型。

2 因为 rune大小一致，所以支持数组索引和方便切割。

string与[]rune转换

对字符串操作的4个包bytes、strings、strconv、unicode包

字符串与数字转换

golang中的string

len()返回字符串字节数目（不是rune数）。

通过索引可以访问某个字节值，索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节，因为有有非ASCII的UTF8字符有多个字节。

字符串截取与链接

比较

1 字符串可以用==和<进行比较。通过逐个字节比较完成的，因此比较的结果是字符串自然编码的顺序。

2 原生字符

编码

1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值，\Uhhhhhhhh对应32bit的码点值，其中h是一个十六进制数字，每一个对应码点的UTF8编码。以下表示相同字符：

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然 这三个字节对应一个有效的UTF8编码的码点。

3 字符串长度用utf8.RuneCountInString(s)

rune

1 Unicode码点对应Go语言中的rune整数类型。

2 因为 rune大小一致，所以支持数组索引和方便切割。

string与[]rune转换

对字符串操作的4个包bytes、strings、strconv、unicode包

字符串与数字转换

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

len()返回字符串字节数目（不是rune数）。

通过索引可以访问某个字节值，索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节，因为有有非ASCII的UTF8字符有多个字节。

字符串截取与链接

比较

1 字符串可以用==和<进行比较。通过逐个字节比较完成的，因此比较的结果是字符串自然编码的顺序。

2 原生字符

编码

1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值，\Uhhhhhhhh对应32bit的码点值，其中h是一个十六进制数字，每一个对应码点的UTF8编码。以下表示相同字符：

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然 这三个字节对应一个有效的UTF8编码的码点。

3 字符串长度用utf8.RuneCountInString(s)

rune

1 Unicode码点对应Go语言中的rune整数类型。

2 因为 rune大小一致，所以支持数组索引和方便切割。

string与[]rune转换

对字符串操作的4个包bytes、strings、strconv、unicode包

字符串与数字转换

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然这三个字节对应一个有效的UTF8编码的码点。

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏

2 对于小于256码点值可以写在一个十六进制转义字节中，例如'\x41'对应字符'A'，但是对于更大的码点则必须使用\u或\U转义形式。因此，'\xe4\xb8\x96'并不是一个合法的rune字符，虽然这三个字节对应一个有效的UTF8编码的码点。