Go语言字符串浅析

肖楠 · 2017-06-24 19:16:27 · 1194 次点击 · 预计阅读时间 1 分钟 · 大约8小时之前开始浏览

这是一个创建于 2017-06-24 19:16:27 的文章，其中的信息可能已经有所发展或是发生改变。

在Go语言中，字符串就是一个只读（read-only）的，可以包含任意字节（byte）的切片（slice）。由于Go源码文件都是使用UTF-8编码的，所以直接在源码中输入的字符串也都是用UTF-8编码的（前提是字符串里没有byte-level escapes，即字节层面上的转义）。请看下面这个例子：

package main
import "fmt"

func main() {
    s := "日志log"

    fmt.Println(len(s))
}

执行结果：

s是一个UTF-8编码的字符串，“日志”两个汉字各占3个字节，所以一共是9个字节。

再看一个例子：

package main
import "fmt"

func main() {
    s:="\xFF\xFF"

    fmt.Println(len(s))
}

执行结果：

虽然0xFF不是一个合法的UTF-8编码字符，但是因为字符串可以包含任意字节，所以s仍是一个合法的字符串。

Go语言引入rune类型（实际就是int32）来表示字符（character），“日志log”这个字符串包含了5个字符，9个字节。可以用for range循环来遍历UTF-8编码字符串的每个字符：

package main
import "fmt"

func main() {
    s := "日志log"
    for index, runeValue := range s {
        fmt.Printf("%#U starts at byte position %d\n", runeValue, index)
    }
}

执行结果：

U+65E5 '日' starts at byte position 0
U+5FD7 '志' starts at byte position 3
U+006C 'l' starts at byte position 6
U+006F 'o' starts at byte position 7
U+0067 'g' starts at byte position 8

参考资料：
Strings, bytes, runes and characters in Go。

有疑问加站长微信联系（非本文作者）

本文来自：nanxiao

感谢作者：肖楠

查看原文：Go语言字符串浅析

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

1194 次点击

加入收藏微博

收入我的专栏

上一篇：Go语言数组浅析

下一篇：golang

浅析

切片

slice

个字符

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

Go语言字符串浅析

用户登录

今日阅读排行

一周阅读排行

关注我

Go语言字符串浅析

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏