正则表达式的贪婪模式和非贪婪模式

王小二黑 · · 5383 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

一直听说过正则表达式存在贪婪和非贪婪模式，大概就是最少匹配和最多匹配的区别，看到的例子大多是下面这个例子
源字符串： aabab
贪婪模式串： a.b
非贪婪模式串： a.?b
贪婪模式结果： aabab
非贪婪模式结果： aab

上面这个例子虽然简单，但是感觉代表性不强，实现今天在解析postgres 逻辑复制的输入时，刚好碰到一个例子，特来记录下：
输出如下：
table public.t_02: UPDATE: id[integer]:1 name[text]:'name[text]:' create_date[date]:'2020-11-01' bbb[bytea]:null

在通过split之后，得到待处理的字符串,。
源字符串：name[text]:'name[text]:'
其中name是字段名，text是字符类型， 'name[text]:'是字段的值，现在要通过正则表达式来提取字段名，类型以及字段值。
[]中包含的是类型， :后面的是字段值，因此很自然的想到这个模式串：
^(.*)\[(.*)\]:(.*)$
代码如下：

parttern = `^(.*)\[(.*)\]:(.*)$` 
reg = regexp.MustCompile(parttern)
result = reg.FindStringSubmatch(v)
col := Column{
            Name:  result[1],
            Type:  result[2],
            Value: result[3],
        }

匹配结果分为三组，

1. name[text]:'name
2. text
3. '

完全不是我想要的结果 -_-!!!
出现问题的原因是值里面也出现name[type]:value的模式，所以刚好踩到了贪婪模式的坑。
这里其实golang给了一个迷惑性的说法， regexp.MustCompile是最左、最短匹配，而regexp.MustCompilePOSIX是最左、最长匹配，因此，我还以为MustCompile已经是非贪婪匹配了。不过好在golang提供了匹配标志（?U）来表示非贪婪匹配，修改之后的代码如下：

parttern = `^(?U)(.*)\[(.*)\]:(.*)$`  // (?U)非贪婪模式
reg = regexp.MustCompile(parttern)
result = reg.FindStringSubmatch(v)
col := Column{
            Name:  result[1],
            Type:  result[2],
            Value: result[3],
        }

匹配结果:

1. name
2. text
3. 'name[text]:'

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：王小二黑

查看原文：正则表达式的贪婪模式和非贪婪模式

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

5383 次点击

加入收藏微博

收入我的专栏

上一篇：Go语言实现一个区块链

下一篇：golang阿里云的goproxy的使用

字段

字段名

代码

待处理

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

正则表达式的贪婪模式和非贪婪模式

用户登录

今日阅读排行

一周阅读排行

关注我

正则表达式的贪婪模式和非贪婪模式

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏