golang 基础（19）字符串

zidea · 2019-03-24 21:34:41 · 840 次点击 · 预计阅读时间 2 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-03-24 21:34:41 的文章，其中的信息可能已经有所发展或是发生改变。

square-gopher.png

字符和字符串处理

func main(){
    s := "Yes我爱Go!"
    fmt.Printf("%s\n",[]byte(s))
}

这样打印出是就是 "Yes我爱Go!"、打印一下（fmt.Println(len(s))）输出 s 长度为 12 。那么这个 12 是怎么来的呢。

fmt.Printf("%X\n",[]byte(s))

可以打印出里面具体字节的数字，会使用 %X 来打印字节

596573E68891E788B1476F21

这样并不便于观察，我们可以通过 for 循环来讲字符一个一个打印出来

for _, b := range []byte(s){
        
    fmt.Printf("%X ",b)
}

fmt.Println()

59      65      73      E6      88      91      E7      88      B1      47      6F      21

这个是 ASC码，（ E6 88 91）每个中文占三个字节，这个就是 utf-8 编码，是一个可变长的编码形式，那么每一个英文字母占一个字节。

上面我们是看字符串的字节是怎么放置的

我们换一种方式进行遍历打印，打印出没个字符的 unicode

for i, ch := range s{
        fmt.Printf("(%d %X) ", i,ch)
    }

从索引 3 开始值是 6211 ch 是一个 int32 类型，也就是 rune，rune 就是 int32 的别名 UTF-8 转 unicode，E6 88 91 是 uft-8 的编码转成了 unicode 编码 6211,下一字是从 6 开始转为 unicode 7231。这样打印出来索引并不连续。

(0 59) (1 65) (2 73) (3 6211) (6 7231) (9 47) (10 6F) (11 21)

可以使用 go 语言 utf8 标准库提供的 RuneCountInString 来进行打印。

fmt.Println("Rune count: ", utf8.RuneCountInString(s))

使用 RuneCountInString 这回输出为 9 对了

Rune count:  9

这样我们就可以通过遍历一个一个打印出来字符

bytes := []byte(s)
    //拿到字节
    for len(bytes) > 0 {
        ch, size := utf8.DecodeRune(bytes)
        //字符 中文字符size 3
        bytes = bytes[size:]
        fmt.Printf("%c ", ch)
    }

package main

import (
    "fmt"
    "unicode/utf8"
)
func main(){
    s := "Yes我爱Go!"
    fmt.Println(len(s)) // 12
    fmt.Println(s)
    fmt.Printf("%X\n",[]byte(s))//596573E68891E788B1476F21
    for _, b := range []byte(s){
        
        fmt.Printf("%X\t",b)
    }
    //59      65      73      E6      88      91      E7      88      B1      47      6F      21
    //每个中文是 3 字节 3 * 2 + 6 = 12 字节
    fmt.Println()

    for i, ch := range s{
        fmt.Printf("(%d %X) ", i,ch)
    }
    //(0 59) (1 65) (2 73) (3 6211) (6 7231) (9 47) (10 6F) (11 21)
    // 3 6211 ch 本身是 int 32 那就是 rune unicode 编码
    //(6) utf-8 进行解码为 unicode 
    fmt.Println()

    fmt.Println("Rune count: ", utf8.RuneCountInString(s))
    //9 这个对了
    bytes := []byte(s)
    //拿到字节
    for len(bytes) > 0 {
        ch, size := utf8.DecodeRune(bytes)
        //字符 中文字符size 3
        bytes = bytes[size:]
        fmt.Printf("%c ", ch)
    }
    //我们
    fmt.Println()

    for i,ch := range []rune(s) {
        fmt.Printf("(%d %c)",i,ch)
        //(0 Y)(1 e)(2 s)(3 我)(4 爱)(5 G)(6 o)(7 !)
    }
    //转为 rune 数组或 slice
    //range 遍历 pos rune 对 pos 是不连续
    // utf8 RuneCountInString 获取字符数
    // 使用len获得字节长度
    // 使用 byte 获取字节
    
}

highres_442654178.jpeg

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：zidea

查看原文：golang 基础（19）字符串

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

840 次点击

加入收藏微博

收入我的专栏

上一篇：深入理解 Go map：赋值和扩容迁移

下一篇：golang 基础（18）字符串

标准库

slice

个字符

英文字母

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

golang 基础（19）字符串

字符和字符串处理

用户登录

今日阅读排行

一周阅读排行

关注我

字符和字符串处理

golang 基础（19）字符串

字符和字符串处理

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

字符和字符串处理

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏