io.EOF设计的缺陷和改进

光谷码农 · 2019-05-14 17:08:24 · 6468 次点击 · 预计阅读时间 4 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-05-14 17:08:24 的文章，其中的信息可能已经有所发展或是发生改变。

1. 认识io.EOF

io.EOF是io包中的变量, 表示文件结束的错误:

1package io23var EOF = errors.New("EOF")

也通过以下命令查看详细文档:

1$ go doc io.EOF
2var EOF = errors.New("EOF")
3EOF is the error returned by Read when no more input is available. Functions
4should return EOF only to signal a graceful end of input. If the EOF occurs
5unexpectedly in a structured data stream, the appropriate error is either
6ErrUnexpectedEOF or some other error giving more detail.
7$

io.EOF大约可以算是Go语言中最重要的错误变量了, 它用于表示输入流的结尾. 因为每个文件都有一个结尾, 所以io.EOF很多时候并不能算是一个错误, 它更重要的是一个表示输入流结束了.

2. io.EOF设计的缺陷

可惜标准库中的io.EOF的设计是有问题的. 首先EOF是End-Of-File的缩写, 根据Go语言的习惯大写字母缩写一般表示常量. 可惜io.EOF被错误地定义成了变量, 这导致了API权限的扩散. 而最小化API权限是任何一个模块或函数设计的最高要求. 通过最小化的权限, 可以尽早发现代码中不必要的错误.

比如Go语言一个重要的安全设计就是禁止隐式的类型转换. 因此这个设计我们就可以很容易发现程序的BUG. 此外Go语言禁止定义没有被使用到的局部变量(函数参数除外, 因此函数参数是函数接口的一个部分)和禁止导入没有用到的包都是最小化权限的最佳实践. 这些最小API权限的设计不仅仅改进了程序的质量, 也提高了编译工具的性能和输出的目标文件.

因为EOF被定义成一个变量, 这导致了该变量可能会被恶意改变. 下面的代码就是一种优雅的埋坑方式:

1func init() {2    io.EOF = nil3}

这虽然是一个段子, 但是却真实地暴漏了EOF接口的设计缺陷: 它存在严重的安全隐患. 变量的类型似乎也在暗示用户可以放心地修改变量的值. 因此说EOF是一个不安全也不优雅的设计.

3. io.EOF改为常量

一个显然的改进思路是将io.EOF定义为常量. 但是因为EOF对应一个表示error接口类型, 而Go语言目前的常量语法并不支持定义常量类型的接口. 但是我们可以通过一些技巧绕过这个限制.

Go语言的常量有bool/int/float/string/nil这几种主要类型. 常量不仅仅不包含接口等复杂类型, 甚至连常量的数组或结构体都不支持! 不过常量有一个重要的扩展规则: 以bool/int/float/string/nil为基础类型定义的新类型也支持常量.

比如, 我们重新定义一个字符串类型, 它也可以支持常量的:

1type MyString string2const name MyString = "chai2010"

这个例子中MyString是一个新定义的类型, 可以定义这种类型的常量, 因为它的底层的string类型是支持常量的.

那么io.EOF的底层类型是什么呢? EOF是通过errors.New("EOF")定义的, 下面是这个函数的实现:

 1package errors 2 3// New returns an error that formats as the given text. 4func New(text string) error { 5    return &errorString{text} 6} 7 8// errorString is a trivial implementation of error. 9type errorString struct {10    s string11}1213func (e *errorString) Error() string {14    return e.s15}

因此io.EOF底层的类型是errors.errorString结构体. 而结构体类型是不支持定义常量的. 不过errors.errorString结构体中只有一个字符串类型, io.EOF对应的错误字符串正是"EOF".

我们可以为EOF重新实现一个以字符串为底层类型的新错误类型:

1package io23type errorString string45func (e errorString) Error() string {6    return string(e7}

这个新的io.errorString实现了两个特性: 首先是满足了error接口; 其次它是基于string类型重新定义, 因此支持定义常量. 因此我们可以基于errorString重新将io.EOF定义为常量:

1const EOF = errorString("EOF")

这样EOF就变成了编译时可以确定的常量类型, 常量的值依然是“EOF”字符串. 但是也带来了新的问题: EOF已经不再是一个接口类型, 它会破坏旧代码的兼容性吗?

4. EOF常量到error接口的隐式转换

重新将EOF从error类型的变量改定义为errorString类型的常量并不会带来兼容问题!

首先io.EOF虽然被定义为变量, 但是从语义角度看它其实是常量, 换言之我们只会读取这个值. 其次读取到io.EOF之后, 我们是将其作为error接口类型使用, 唯一的用处是和用户返回的错误进行相等性比较.

比如有以下的代码:

1func Foo(r io.Reader) {2    var p []byte3    if _, err := r.Read(p); err != io.EOF {4        // ...5    }6}

这里和io.EOF进行比较的err变量必然是error类型, 或者是满足error接口的其他类型. 如果err是接口类型, 那么将io.EOF换成errorString("EOF")常量也是可以工作的:

1func Foo(r io.Reader) {2    var p []byte3    if _, err := r.Read(p); err != errorString("EOF") {4        // ...5    }6}

这是因为Go语言中一个普通类型的值在和接口类型的值进行比较运算时, 会被隐式转会为接口类型(开这个后门的原因时为了方便接口代码的编写). 或则说在进行比较的时刻, errorString("EOF")已经被替换成error(errorString("EOF")).

普通类型到接口的隐式转会虽然方便, 但是也带来了很多坑. 比如以下的例子:

1func Foo() error {2    var p *SomeError = nil3    return p4}

以上代码的nil其实是*SomeError(nil). 而if err != nil 中的nil其实是error(nil).

而定义为常量的io.EOF常量在和error接口类型的值比较时, io.EOF常量会被转化为对应的接口类型. 这样新的io.EOF错误常量就可以和以前的代码无缝兼容了.

5. 总结

普通类型到接口类型的隐式转换、常量的默认类型和基础类型是Go语言中比较隐晦的特性, 很多人虽然在使用这些规则但是并没有意识到它们的细节. 本文从分析io.EOF设计缺陷为起点, 讨论了将常量用于接口值定义的一种思路.

有疑问加站长微信联系（非本文作者）

本文来自：微信公众平台

感谢作者：光谷码农

查看原文：io.EOF设计的缺陷和改进

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

6468 次点击

加入收藏微博

收入我的专栏

上一篇：这位大牛讲了啥？让数百位 gopher 现场跪求PPT

下一篇：Go有趣，5.20用Go做一个表白图/让文字跳舞

io

变量

代码

接口类型

1 回复 | 直到 2019-12-10 17:06:46

keguoxin · #1 · 5年之前

谢谢

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

io.EOF设计的缺陷和改进

1. 认识io.EOF

2. io.EOF设计的缺陷

3. io.EOF改为常量

4. EOF常量到error接口的隐式转换

5. 总结

用户登录

今日阅读排行

一周阅读排行

关注我

1. 认识io.EOF

2. io.EOF设计的缺陷

3. io.EOF改为常量

4. EOF常量到error接口的隐式转换

5. 总结

io.EOF设计的缺陷和改进

1. 认识io.EOF

2. io.EOF设计的缺陷

3. io.EOF改为常量

4. EOF常量到error接口的隐式转换

5. 总结

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

1. 认识io.EOF

2. io.EOF设计的缺陷

3. io.EOF改为常量

4. EOF常量到error接口的隐式转换

5. 总结

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏