安装:
go get github.com/antchfx/htmlquery
func ParseTagList(contents []byte) {
// 解析URL
// doc, err := htmlquery.LoadURL("http://example.com/")
// 解析html
doc, err := htmlquery.Parse(strings.NewReader(string(contents)))
if err != nil{
log.Printf("htmlquery parse err :", err)
}
// <a href="https://xxxx.org/sss.html" target="_blank">唐诗三百</a>
for _, n := range htmlquery.Find(doc, "/html/body/div[2]/div[2]/div[1]/div[2]/a") {
// 获取href中的链接
fmt.Printf("%s\n", htmlquery.SelectAttr(n, "href"))
// 获取a标签中的text值
fmt.Printf("%s\n", htmlquery.OutputHTML(n, false))
}
}
有疑问加站长微信联系(非本文作者)