Golang中的Xpath解析

发条家的橙子 · · 2778 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

安装:

go get github.com/antchfx/htmlquery

func ParseTagList(contents []byte) {
    // 解析URL
    // doc, err := htmlquery.LoadURL("http://example.com/")
   // 解析html
   doc, err := htmlquery.Parse(strings.NewReader(string(contents)))
   if err != nil{
      log.Printf("htmlquery parse err :", err)
   }
   // <a href="https://xxxx.org/sss.html" target="_blank">唐诗三百</a>
   for _, n := range htmlquery.Find(doc, "/html/body/div[2]/div[2]/div[1]/div[2]/a") {
      // 获取href中的链接
      fmt.Printf("%s\n", htmlquery.SelectAttr(n, "href"))
      // 获取a标签中的text值
      fmt.Printf("%s\n", htmlquery.OutputHTML(n, false))
   }
}

有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:发条家的橙子

查看原文:Golang中的Xpath解析

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

2778 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传