golang chromedriver 解决反爬

tglmm · · 1505 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

reference:

https://github.com/tebeka/selenium
https://godoc.org/github.com/tebeka/selenium/chrome#Capabilities
https://segmentfault.com/a/1190000016594806

environment:

os: mac
chromedriver: 88.x(http://chromedriver.storage.googleapis.com/)
chrome:89.x

package spider
import (
    "fmt"
    "github.com/tebeka/selenium"
    "github.com/tebeka/selenium/chrome"
)

func SeleniumTest() {

    const (
        seleniumPath = `./chromedriver`
        port            = 9515
    )

    opts := []selenium.ServiceOption{

    }


    selenium.SetDebug(true)

    service, err := selenium.NewChromeDriverService(seleniumPath, port, opts...)
    if nil != err {
        fmt.Println("start a chromedriver service falid", err.Error())
        return
    }

    ////server关闭之后,chrome窗口也会关闭
    defer service.Stop()

    //链接本地的浏览器 chrome
    caps := selenium.Capabilities{
        //"browserName": "/Applications/Google Chrome Dev.app/Contents/MacOS/Google Chrome Dev",
        "browserName": "Google Chrome Dev",
    }

    //禁止图片加载,加快渲染速度
    imagCaps := map[string]interface{}{
        "profile.managed_default_content_settings.images": 2,
    }
    chromeCaps := chrome.Capabilities{
        Prefs: imagCaps,
        Path:  "/Applications/Google Chrome Dev.app/Contents/MacOS/Google Chrome Dev",
        Args: []string{
            //静默执行请求
            "--headless", // 设置Chrome无头模式,在linux下运行,需要设置这个参数,否则会报错
            "--no-sandbox",
            "--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36", // 模拟user-agent,防反爬
        },
    }
    //以上是设置浏览器参数
    caps.AddChrome(chromeCaps)


    url := "xxx"
    w_b1, err := selenium.NewRemote(caps, fmt.Sprintf("http://localhost:%d/wd/hub", port))
    if err != nil {
        fmt.Println("connect to the webDriver faild", err.Error())
        return
    }

    err = w_b1.Get(url)
    //获取网页源码
    pageSource , err  := w_b1.PageSource()
    if err != nil {
        fmt.Println("get page faild", err.Error())
        return
    }
    fmt.Print(pageSource)
    return
}

有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:tglmm

查看原文:golang chromedriver 解决反爬

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1505 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传