Go中字符串的遍历

波涛澎湃 · · 5485 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

首先说一下go中的字符串类型:
字符串就是一串固定长度的字符连接起来的字符序列。Go的字符串是由单个字节连接起来的。Go语言的字符串的字节使用UTF-8编码标识Unicode文本。

  • Go语言的字符串的字节使用UTF-8编码标识Unicode文本,这样Golang统一使用UTF-8编码,中文乱码问题不会再困扰程序员。
  • 字符串一旦赋值了,字符串就不能修改了:在Go中字符串是不可变的。

下面介绍字符串的三种遍历方式,根据实际情况选择即可。

常规遍历方式:

    var str = "Hello world!"
    for i := 0; i < len(str); i++ {
        fmt.Printf("str[%d]=%c\n", i, str[i])
    }

运行结果:

image

该遍历方式==缺点==:遍历是按照字节遍历,因此如果有中文等非英文字符,就会出现乱码,比如要遍历"abc北京"这个字符串,效果如下:

image

可见这不是我们想要的效果,根据utf-8中文编码规则,我们要str[3]str[4]str[5]三个字节合起来组成“北”字及 str[6]str[7]str[8]合起来组成“京”字。由此引出下面第二种遍历方法。

for-range遍历方式:

该方式是按照字符遍历的,所以不会出现乱码,如下:

    var str = "abc北京"
    for i, ch := range str {
        fmt.Printf("str[%d]=%c\n", i, ch)
    }

运行结果:

image

从图中可以看到第二个汉子“京”的开始下标是6,直接跳过了4和5,可见确实依照utf8编码方式将三个字节组合成了一个汉字,str[3]-str[5]组合成“北”字,str[6]-str[8]组合成了“京”字。
由于下标的不确定性,所以引出了下面的遍历方式。

切片遍历方式

1 可以先将字符串转成 []rune 切片
2 再用常规方法进行遍历

//示例
    var str = "abc北京"
    str2 := []rune(str)
    for i := 0; i < len(str2); i++ {
        fmt.Printf("str[%d]=%c\n", i, str2[i])
    }

运行效果:

image

由此可见下标是按1递增的,没有产生跳跃现象。


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:波涛澎湃

查看原文:Go中字符串的遍历

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

5485 次点击  
加入收藏 微博
2 回复  |  直到 2018-07-16 21:11:17
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传