之前写过一个爬取电影网站的项目,里面有有电影海报的爬取,今天就把这个爬取的功能提取成为一个小例子拿出来。
package main
import (
"bytes"
"fmt"
"io"
"io/ioutil"
"net/http"
"os"
"regexp"
)
func main() {
imagPath := "http://img2.bdstatic.com/img/image/166314e251f95cad1c8f496ad547d3e6709c93d5197.jpg"
reg, _ := regexp.Compile(`(\w|\d|_)*.jpg`)
name := reg.FindStringSubmatch(imagPath)[0]
fmt.Print(name)
resp, _ := http.Get(imagPath)
body, _ := ioutil.ReadAll(resp.Body)
out, _ := os.Create(name)
io.Copy(out, bytes.NewReader(body))
}
可以先用爬虫得到网页的原代码,然后再用正则等手段分析出图片的地址,最后用以上代码爬取图片。
原文地址:http://www.1025m.com/33.html