现想用正则清洗HTML .但发现有一种代码用正则会出问题,不会写了,求大神指导。 HTMLCODE
<meta name="author" content="polaris <polaris@studygolang.com>">
我匹配标签的方法 是re,_ = regexp.Compile("\<[\S\s]+?\>") 但现在有一个问题,第一行代码内包含“>” 结果造成只匹配到<meta name="author" content="polaris polaris@studygolang.com 这明显是错的, 求方法 ,谢谢。
有疑问加站长微信联系(非本文作者)

你用了懒惰模式,改为:
如果<meta name="author" content="polaris <polaris@studygolang.com>"> 后边还有HTML标签呢?
论坛回复好像不能带特殊符号。。。。
上面的符合格式要求吗?
go 代码语法高亮请使用:
```go 开始
谢谢,我能看明白
MustCompile 与.Compile有什么分别
还有一个问题 网上写的<> 这两个匹配 都是写成 \ \ < \ \ > 前边有两个斜线,但我在测试试,不加前边的 \ \ 也是可以。。。所以 加两斜线与不加有什么差别吗
你好,如何整行匹配,比如我有一个字符串,全是空白符号。如果判断这里全是空白符号。
不是很清楚,用""来匹配的话需要转移,比如\w,你要写成regexp.MustCopile("\w")来转义,如果里面有带多个"双引号的话你就得用\"来转移匹配的内容了。 空白字符的话你直接用(""|XXX其它内容)试一试,具体看例子
MustCompile返回一个值,Compile返回俩个值
谢谢