一个基于golang的爬虫电影站

hezhizheng · · 1796 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

# Go Movies > 一个基于golang的爬虫电影站,效果站: [https://go-movies.hezhizheng.com/](https://go-movies.hezhizheng.com/) > Github: [https://github.com/hezhizheng/go-movies](https://github.com/hezhizheng/go-movies) ![img](https://cdn.learnku.com/uploads/images/201912/05/6843/gQa6CgVZ7G.png!large) ## 使用安装 ``` # 下载 git clone https://github.com/hezhizheng/go-movies # 进入目录 cd go-movies # 启动 go run main.go or # 安装 bee 工具 bee run 访问 http://127.0.0.1:8899 ``` ### 开启爬虫 - 直接访问链接http://127.0.0.1:8899/movies-spider - 消耗:Windows 下 cup 10% 左右,内存 30mb 左右 - 网络正常的情况下,爬虫完毕耗时大概21分钟左右(存在部分爬取失败的记录) ## Tools - [https://github.com/gocolly/colly](https://github.com/gocolly/colly) 爬虫框架 - html/template 模板引擎 - 数据库 redis 缓存/持久 [https://github.com/Go-redis/redis](https://github.com/Go-redis/redis) - 路由 [https://github.com/julienschmidt/httprouter](https://github.com/julienschmidt/httprouter) - json解析 jsoniter [github.com/json-iterator/go](github.com/json-iterator/go) ## 目录结构参考beego设置 ## TODO - [ ] 跨平台打包,模板路径不正确 - [ ] goroutine 并发数控制 - [ ] 爬取数据的完整性 - [ ] redis查询问题? ## Other 许多Go的原理还没弄懂,有精力会慢慢深究下。写得很潦草,多多包涵。

有疑问加站长微信联系(非本文作者))

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1796 次点击  
加入收藏 微博
4 回复  |  直到 2019-12-06 22:33:59
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传