regexp 正则包

直立猿 · · 506 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

正则对象

正则使用都是通过创建对应的正则对象,调用对象方法所实现。

type Regexp struct {
    // 内含隐藏或非导出字段
}

新建正则对象

func Print(title string, data ...interface{}) {


    if len(data) == 1 {
        fmt.Printf("%s: %v \n", title, data[0])
        return
    }


    for i, v := range data {
        fmt.Printf("%s(%d): %v \n", title, i, v)
    }


}


// 新建正则对象
func CreateRegex() {

    r1, _ := regexp.Compile(`\w`)
    Print("r1", r1.MatchString("1d1d"))

    // POSIX ERE 语法
    r2, _ := regexp.CompilePOSIX(`[a-z]`)
    Print("r2", r2.MatchString("1234"))

    // 功能与Complie 相同,解析错误是抛出 panic
    r3 := regexp.MustCompile(`[1-9]`)
    Print("r3", r3.MatchString("13"))

    // 功能与CompilePOSIX 相同,解析错误是抛出 panic
    r4 := regexp.MustCompilePOSIX(`^_`)
    Print("r4", r4.MatchString("_prop"))

}

正则对象属性方法

// 属性方法
func Prop() {


    r1 := regexp.MustCompile(`^[a-z]`)


    // 获取正则字符串
    regStr := r1.String()
    Print("String", regStr)


    // 返回一个字符串字面值prefix
    prefix, complete := r1.LiteralPrefix()
    Print("LiteralPrefix", prefix, complete)


    // 捕获分组的数量
    // 正则分组名称规则 (?P<name>rgx),注意这里为大写 P
    r2 := regexp.MustCompile(`(?P<number>[1-4]?) (?P<string>[a-z]?)`)
    groupNum := r2.NumSubexp()
    Print("NumSubexp", groupNum)


    // 获取分组名称
    groupNames := r2.SubexpNames()
    Print("SubexpNames", groupNames)


    // 使用 "leftmost-longest"模式
    r2.Longest()

正则方法

一般正则方法可以分为正对不同类型的三类方法

  • []byte 针对字节输入,例如 Match
  • string 针对字符输入, 例如 MathString
  • reader 针对reader 接口 ,例如MatchReader

校验方法

func Match() {
    r1 := regexp.MustCompile(`[a-z]`)


    // 字节校验
    Print("Match", r1.Match([]byte("1f23c")))


    // 字符校验
    Print("MatchString", r1.MatchString("1f23c"))


    // reader 数据校验
    rd := bytes.NewReader([]byte("call me"))
    Print("MatchReader", r1.MatchReader(rd))

查询

查询分为两大类:

  • 内容查询, 例如 Find
  • 位置查询, 例如 FindIndex
func Find() {
    r1 := regexp.MustCompile(`[a-z]+`)


    // 字节查询
    Print("Find", r1.Find([]byte("1f23c")))


    // 字符查询
    Print("FindString", r1.FindString("1f23c"))


    // 获取匹配字节的起始位置, 左闭右开
    Print("FindIndex", r1.FindIndex([]byte("1f23c")))


    // 获取匹配字符的起始位置
    Print("FindStringIndex", r1.FindStringIndex("1f23c"))


    // 获取 reader 匹配数据的起始位置
    rd := bytes.NewReader([]byte("call me"))
    Print("FindReaderIndex", r1.FindReaderIndex(rd))


    r2 := regexp.MustCompile(`([a-z]+)([0-9]+)`)


    // 返回分组匹配的字节集切片
    Print("FindSubmatch", r2.FindSubmatch([]byte("1f23c")))


    // 返回分组匹配的字符切片
    Print("FindStringSubmatch", r2.FindStringSubmatch("1ff0ee"))


    // 返回分组匹配字节集位置切片
    Print("FindSubmatchIndex", r2.FindSubmatchIndex([]byte("1f23c")))


    // 返回分组匹配字符位置切片
    Print("FindStringSubmatchIndex", r2.FindStringSubmatchIndex("1ff0ee"))


    // 返回字节全匹配
    Print("FindAll", r1.FindAll([]byte("11ff0rr"), 2))


    // 字符全匹配
    Print("FindAllString", r1.FindAllString("11ff0rr", 2))


    // 返回全匹配字节位置
    Print("FindAllIndex", r1.FindAllIndex([]byte("11ff0rr"), 2))


    // 返回全匹配字符位置
    Print("FindAllStringIndex", r1.FindAllStringIndex("11ff0rr", 2))


    // 返回分组全匹配的字节集切片
    Print("FindAllSubmatch", r2.FindAllSubmatch([]byte("1f23c"), 10))


    // 返回分组全匹配的字符切片
    Print("FindAllStringSubmatch", r2.FindAllStringSubmatch("1ff0ee", 10))


    // 返回分组全匹配字节集位置切片
    Print("FindAllSubmatchIndex", r2.FindAllSubmatchIndex([]byte("1f23c"), 10))


    // 返回分组全匹配字符位置切片
    Print("FindAllStringSubmatchIndex", r2.FindAllStringSubmatchIndex("1ff0ee", 10))

分割

// 分割
func Split() {
    r1 := regexp.MustCompile(`0`)


    // 正则分割
    Print("Split", r1.Split("0f0r110l0", 3))  // 返回len = 3 切片,最后一个元素为剩余字符
    Print("Split", r1.Split("0f0r110l0", 0))  // 返回 nil
    Print("Split", r1.Split("0f0r110l0", -1)) // 全分割
}

追加

func Expand() {
    // 将模式匹配的字符拼接为模板,追加到字节集后
    r2 := regexp.MustCompile(`(?P<name>[a-z]+)(?P<age>[0-9]+)`)
    str1 := "jeck12"
    mt := r2.FindStringSubmatchIndex(str1)
    s := r2.ExpandString([]byte("man: "), "($name/$age)", str1, mt)
    Print("ExpandString", string(s))


    // ExpandString 字节版, 既输入内容类型不同
    s = r2.Expand([]byte("man: "), []byte("($name/$age)"), []byte(str1), mt)
    Print("Expand", string(s))



替换

func Replace() {


    // 非扩展替换
    r3 := regexp.MustCompile(`[a-z]+`)
    Print("ReplaceAllLiteral", r3.ReplaceAllLiteral([]byte("1fff"), []byte("z")))
    Print("ReplaceAllLiteralString", r3.ReplaceAllLiteralString("1fff", "z"))


    // 扩展替换
    r4 := regexp.MustCompile(`(?P<name>[a-z]+)(?P<age>[0-9]+)`)
    Print("ReplaceAll", r4.ReplaceAll([]byte("coco24,jeck12"), []byte("{name: $name, age: $age}")))
    Print("ReplaceAllString", r4.ReplaceAllString("coco24,jeck12", "{name: $name, age: $age}"))


    // 自定义替换
    r5 := regexp.MustCompile(`[a-z]+`)
    Print("ReplaceAllFunc", r5.ReplaceAllFunc([]byte("coco,jeck"), func(data []byte) []byte {
        fmt.Println(data)
        return []byte("oo")
    }))


    Print("ReplaceAllStringFunc", r5.ReplaceAllStringFunc("coco,jeck", func(data string) string {
        fmt.Println(data)
        return "00"
    }))

golang 标准库文档


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:直立猿

查看原文:regexp 正则包

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

506 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传