在Go中使用正则表达式

mb6008e8d3f0fac · · 711 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

本文将带大家了解一下在Go中如何使用正则表达式

一、演示案例

在这个案例中声明了常量text

然后使用了regexp这个包的regexp.Compile这个方法。

这种方式是不确定用户输入的值是否符合匹配规则。

当然也可以看到结果是返回了我们需要的数据。演示案例一

但是在一般情况下,如果确定了用户输入的内容是正确的是完全符合的就可以使用下方案例。

在这个案例中可以看到regexp.MustCompile使用了这个方法,并且返回的值也是一样的。

这个方法没有返回错误,但是在自己的内部方法进行了异常处理。

根据注释可以得知使用这个方法给的参数表达式是不必须可以解析的,如果不能解析则就会抛出异常。

二、正则匹配

接下来我们使用正则进行匹配, 也就是在上图方法中进行正则表达式的匹配。

案例跟上图使用的一致都是用来匹配邮箱。

那么接下来先写第一版本。

可以看到返回结果就是我们想要的。

关于正则表达式的写法这部分内容在这里就说明了, 本文主要是针对go如何使用正则表达式。

此时就会反映出第一个问题,那就是FindString这个方法只能匹配一个值。

那如何匹配多个值呢!请看下方案例

三、匹配多个值

可以看到返回结果是将所有可以匹配的邮箱都给匹配了出来。

匹配多个值需要使用FindAllString这个方法。

第一个参数为匹配的字符,第二个参数是寻找多少个,-1是全找

在go中给提供了一种非常好的方式可以直接将邮箱名、邮箱域名、和邮箱后缀给提取出来,那么应该怎么做呢!

四、正则表达式提取内容

在这里就不能继续使用上述案例的方法了,需要使用FindAllStringSubmatch这个方法

在这个方法中可以得知返回的是一个二维的字符串,从上图的返回结果也可以得知返回的就是一个二维的字符串。

既然返回的是二维的字符串切片,那么我们就可以进行循环来获取每一个提取出来的内容。

可以看到返回了四个匹配,第一个就是完整的,后边的三个都是我们获取出来的内容。

五、总结

通过以上四个案例简单的了解一下在Go中如何使用正则表达式,进行了模拟了几个场景,和go中的正则表达式包的使用。

这个案例也算是对go的一个练习,没有多深的内容,主要就是关于正则包的使用,最重要的就是最后一个案例,这种正则表达式提取内容在爬虫的项目中是非常常见的。

坚持学习、坚持写博、坚持分享是咔咔从业以来一直所秉持的信念。希望在偌大互联网中咔咔的文章能带给你一丝丝帮助。我是咔咔,下期见。


有疑问加站长微信联系(非本文作者)

本文来自:51CTO博客

感谢作者:mb6008e8d3f0fac

查看原文:在Go中使用正则表达式

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

711 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传