Go开发工程师:迎接上升风口,踏入蓝海行业!

mb60806736b3414 · · 1796 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

download:Go开发工程师:迎接上升风口,踏入蓝海行业!

//实现使用curl模拟百度蜘蛛进行采集
class Curlcontent{

protected function _GetContent( $url )
{

    $this->ch = curl_init();
    $this->ip = '220.181.108.'.rand(1,255);  // 百度蜘蛛
    $this->timeout = 15;
    curl_setopt($this->ch,CURLOPT_URL,$url);
    curl_setopt($this->ch,CURLOPT_TIMEOUT,0);
    //伪造百度蜘蛛IP  
    curl_setopt($this->ch,CURLOPT_HTTPHEADER,array('X-FORWARDED-FOR:'.$this->ip.'','CLIENT-IP:'.$this->ip.'')); 
    //伪造百度蜘蛛头部
    curl_setopt($this->ch,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)");
    curl_setopt($this->ch,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($this->ch,CURLOPT_HEADER,0);
    curl_setopt($this->ch,CURLOPT_CONNECTTIMEOUT,$this->timeout);
    curl_setopt($this->ch,CURLOPT_SSL_VERIFYPEER,false);
    $content = curl_exec($this->ch);

    if($content === false)
    {//输出错误信息
        $no = curl_errno($this->ch);
        switch(trim($no))
        {
            case 28 : $this->error = '访问目标地址超时'; break;
            default : $this->error = curl_error($this->ch); break;
        }
        echo $this->error;
    }
    else
    {
        $this->succ = true;
        return $content;
    }
}
public  function getcurl($url){
return $this->_GetContent($url);
}

}
$api = "https://www.maihuangjin.com/mobile/";
$Curlcontent = new Curlcontent();
$data = $Curlcontent->getcurl($api);


有疑问加站长微信联系(非本文作者)

本文来自:51CTO博客

感谢作者:mb60806736b3414

查看原文:Go开发工程师:迎接上升风口,踏入蓝海行业!

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1796 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传