现想用正则清洗HTML .但发现有一种代码用正则会出问题,不会写了,求大神指导。 HTMLCODE
<meta name="author" content="polaris <polaris@studygolang.com>">
我匹配标签的方法 是re,_ = regexp.Compile("\<[\S\s]+?\>") 但现在有一个问题,第一行代码内包含“>” 结果造成只匹配到<meta name="author" content="polaris polaris@studygolang.com 这明显是错的, 求方法 ,谢谢。