有关peek在实际应用中的疑问

XYZ0901 · 2019-05-26 16:47:12 · 1377 次点击 · 大约8小时之前 开始浏览    置顶
这是一个创建于 2019-05-26 16:47:12 的主题,其中的信息可能已经有所发展或是发生改变。

请问在这一串代码中resp.body为什么会从第1025个字符开始读取 但是bodyReader就没事呢,感觉resp.body也没被处理呀

package fetcher

import (
    "bufio"
    "fmt"
    "golang.org/x/net/html/charset"
    "golang.org/x/text/encoding"
    "golang.org/x/text/encoding/unicode"
    "golang.org/x/text/transform"
    "io/ioutil"
    "log"
    "net/http"
)

const url = "http://www.zhenai.com/zhenghun"

func Fetch(url string) ([]byte, error) {
    resp, err := http.Get(url)
    if err != nil {
        return nil, err
    }
    defer resp.Body.Close()

    if resp.StatusCode != http.StatusOK {
        return nil,
            fmt.Errorf("wrong status code: %d", resp.StatusCode)
    }

    bodyReader := bufio.NewReader(resp.Body)
    e := determinEncoding(bodyReader)
    utf8Reader := transform.NewReader(resp.Body, e.NewDecoder())  // !!!!!问题出在这里
    return ioutil.ReadAll(utf8Reader)

}

func determinEncoding(
    r *bufio.Reader) encoding.Encoding {
    bytes, err := r.Peek(1024)
    if err != nil {
        log.Printf("Fetcher error: %v", err)
        return unicode.UTF8
    }
    e, _, _ := charset.DetermineEncoding(bytes, "")
    return e
}

有疑问加站长微信联系(非本文作者)

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1377 次点击  
加入收藏 微博
1 回复  |  直到 2019-05-27 21:05:04
Kingnoil
Kingnoil · #1 · 6年之前

因为peek是读取1024个字节,所以下次读取这个文件的时候是从1025开始,利用bufio.NewReader可以使这个文件下次从头开始读

添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传