Go语言爬取网站磁力链接

fyxichen · · 2564 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

package main

import (
	"bufio"
	"fmt"
	"io"
	"io/ioutil"
	"net/http"
	"os"
	"regexp"
	"strconv"
	"strings"
	"time"
)

func main() {
	fmt.Print("输入要查询的字符:")
	reader := bufio.NewReader(os.Stdin)
	input, _ := reader.ReadBytes('\n')
	x := string(input[0 : len(input)-2])
	const url, page string = "http://www.btcherry.com/search?keyword=", "&p="
	var Find string
	FileResult, _ := os.OpenFile("re.txt", os.O_RDWR|os.O_CREATE|os.O_TRUNC, 777)
	defer func() {
		time.Sleep(1e9 * 2)
		FileResult.Sync()
		FileResult.Close()
	}()

	for i := 1; i < 101; i++ {
		Find = url + x + page + strconv.Itoa(i)
		h := strings.Repeat("#", i/2) + strings.Repeat(" ", 50-i/2)
		fmt.Printf("\r%02d%%[%s]", i, h)
		time.Sleep(1e6 * 5)
		go Resolve(Find, FileResult)
	}
}

func Resolve(Find string, FileResult io.Writer) {
	Re0, _ := regexp.Compile("<h5.*h5>")
	Re1, _ := regexp.Compile(`^<h5 class="h" name="rsrc"`)
	Re2, _ := regexp.Compile("<span class='highlight'>")
	Re3, _ := regexp.Compile("</span")
	Re4, _ := regexp.Compile("</h5>")
	Re5, _ := regexp.Compile(">")
	Re6, _ := regexp.Compile(`data-hash="`)
	Resp, err := http.Get(Find)
	if err != nil {
		fmt.Println(err)
	}
	Buf, _ := ioutil.ReadAll(Resp.Body)
	buf := Re0.FindAll(Buf, 1000)
	for _, line := range buf {
		line = Re1.ReplaceAll(line, []byte(""))
		line = Re2.ReplaceAll(line, []byte(""))
		line = Re3.ReplaceAll(line, []byte(""))
		line = Re4.ReplaceAll(line, []byte(""))
		line = Re5.ReplaceAll(line, []byte(""))
		line = Re6.ReplaceAll(line, []byte("magnet:?xt=urn:btih:"))
		FileResult.Write(line)
		FileResult.Write([]byte("\n"))
	}
}


有疑问加站长微信联系(非本文作者)

本文来自:CSDN博客

感谢作者:fyxichen

查看原文:Go语言爬取网站磁力链接

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

2564 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传