golang字符、字符串的那些事儿

DarkWingBoy · · 3301 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

通过下边的代码可以看出,r实质是int32,占用4个字节,值是25105;s是string,占用3个字节,值是e68891.

推断r应该是unicode编码的,s是utf8编码的.

package main
           
import(
    "fmt"
)
           
func main() {
    r := '我' 
    fmt.Printf("%t\n", r)
    // %!t(int32=25105)
           
    s := "我"
    fmt.Printf("%t, %d %x\n", s, len(s), s)
    // %!t(string=我) 3 e68891
           
    fmt.Printf("%b\n", int32(r))
    // 110001000010001
    // 0000 0000 0000 0000 0110 0010 0001 0001
               
    for _, b := range []byte(s) {
        fmt.Printf("%b\n", b)
    }
    // 11100110
    // 10001000
    // 10010001
}

现在打印出二进制的值进行比较,整理如下:

0000 0000 0000 0000 0110 0010 0001 0001 // r
          1110 0110 1000 1000 1001 0001 // s

然后转换s转换为r,也就是utf8转换为unicode

          1110 0110 1000 1000 1001 0001 // s
               0110   00 1000   01 0001 // s utf8 -> unicode
          0000 0000 0110 0010 0001 0001 // s utf8 -> unicode
0000 0000 0000 0000 0110 0010 0001 0001 // r

转换成功 得出结论 r是unicode编码 s是utf8 编码

golang和java一样 字符是unicode编码 字符串是utf8编码

底层这些东东一定要弄明白,不然会经常害人的.


有疑问加站长微信联系(非本文作者)

本文来自:ITEYE博客

感谢作者:DarkWingBoy

查看原文:golang字符、字符串的那些事儿

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

3301 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传