手摸手教你用go写爬虫

收录了 3 篇文章 · 0 人关注

  • 手摸手教你用go写爬虫之三(单任务版爬虫1.0)

    > 本文介绍爬虫相关流程和搭建 ### 1. 项目需求 > 我们的需求分三步: 1. 从租房网站上获取到杭州市的所有区的链接和名称 2. 根据每个区的链接抓取第一页列表内容,找到房屋的链接和名称 3. 根据第2步中获取的链接,抓取对应的房屋的具体信息 ### 2. 项目流程 > step 1 从项目需求中可以分解出俩个信息 三步中均需要抓取 那么就要提供 url 三步中均需要解析 那么需要提供解析函数 func > 每一步解析到的结果我们需要暂存下来,...

  • 手摸手教你用go写爬虫之二(准备知识:正则解析有效信息)

    > 本文介绍正则提取字符串中的相关信息 ### 1. 正则 > 字符串中的信息提取我们使用`regexp`包的相关函数来解决 >假设有一段html代码如下 ```html <a target="_blank" title="钱江国际商务中心蛋壳公寓直租 月付无压力 无 南星" ...

  • 手摸手教你用go写爬虫之一(准备知识:网页抓取)

    > 本文介绍网页抓取相关的知识 ### 1. 获取网页内容 > 我们使用 `http.Get()` 方法来获取网页的内容,它相当于`PHP`中的`file_get_contents` ```go url := "https://hz.zu.anjuke.com/" response,err := http.Get(url) ``` >可以看到,该方法返回了一个`response`相应信息的指针以及错误信息 该响应信息中我们要获取的是请求体的内容,可以使用: ...