# Go Movies
> 一个基于golang的爬虫电影站,效果站: [https://go-movies.hezhizheng.com/](https://go-movies.hezhizheng.com/)
> Github: [https://github.com/hezhizheng/go-movies](https://github.com/hezhizheng/go-movies)
![img](https://cdn.learnku.com/uploads/images/201912/05/6843/gQa6CgVZ7G.png!large)
## 使用安装
```
# 下载
git clone https://github.com/hezhizheng/go-movies
# 进入目录
cd go-movies
# 启动
go run main.go
or
# 安装 bee 工具
bee run
访问
http://127.0.0.1:8899
```
### 开启爬虫
- 直接访问链接http://127.0.0.1:8899/movies-spider
- 消耗:Windows 下 cup 10% 左右,内存 30mb 左右
- 网络正常的情况下,爬虫完毕耗时大概21分钟左右(存在部分爬取失败的记录)
## Tools
- [https://github.com/gocolly/colly](https://github.com/gocolly/colly) 爬虫框架
- html/template 模板引擎
- 数据库 redis 缓存/持久 [https://github.com/Go-redis/redis](https://github.com/Go-redis/redis)
- 路由 [https://github.com/julienschmidt/httprouter](https://github.com/julienschmidt/httprouter)
- json解析 jsoniter [github.com/json-iterator/go](github.com/json-iterator/go)
## 目录结构参考beego设置
## TODO
- [ ] 跨平台打包,模板路径不正确
- [ ] goroutine 并发数控制
- [ ] 爬取数据的完整性
- [ ] redis查询问题?
## Other
许多Go的原理还没弄懂,有精力会慢慢深究下。写得很潦草,多多包涵。
有疑问加站长微信联系(非本文作者))