Golang 统计字符串字数

nfwater · 2018-05-09 11:14:03 · 5809 次点击 · 预计阅读时间 1 分钟 · 大约8小时之前 开始浏览    
这是一个创建于 2018-05-09 11:14:03 的文章,其中的信息可能已经有所发展或是发生改变。

比如新浪微博发微博的输入框有一个已输入字数的统计,它的规则推测是:汉字和中文标点算 1 个字数,英文和其他符号算 0.5 个字数。不足 1 个字算 1 个。大家可以去微博体验一下计算方式。

golang 可以使用正则和 unicode 包的方法判断。

以下函数 GetStrLength 返回输入的字符串的字数,每个汉字和中文标点算 1 个字数,英文和其他字符算半个字数,不足 1 个字算 1 个。

// GetStrLength 返回输入的字符串的字数,汉字和中文标点算 1 个字数,英文和其他字符 2 个算 1 个字数,不足 1 个算 1个
func GetStrLength(str string) float64 {
	var total float64
 
	reg := regexp.MustCompile("/·|,|。|《|》|‘|’|”|“|;|:|【|】|?|(|)|、/")
 
	for _, r := range str {
		if unicode.Is(unicode.Scripts["Han"], r) || reg.Match([]byte(string(r))) {
			total = total + 1
		} else {
			total = total + 0.5
		}
	}
 
	return math.Ceil(total)
}

原文:https://blog.tanteng.me/2018/05/golang-str-length/


有疑问加站长微信联系(非本文作者)

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

5809 次点击  
加入收藏 微博
2 回复  |  直到 2018-05-10 16:25:26
alphayan
alphayan · #1 · 7年之前

这个功能一般由前端统计;汉字是英文的2倍,这个是之前的编码问题;而自从用了unicode之后,汉字和英文都一样了,一个字符。

nfwater
nfwater · #2 · 7年之前
alphayanalphayan #1 回复

这个功能一般由前端统计;汉字是英文的2倍,这个是之前的编码问题;而自从用了unicode之后,汉字和英文都一样了,一个字符。

但是后端也要判断是否超出字数限制,前后端要一样的判断规则。

添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传