小文件用os.ReadFile(Go1.16+)或ioutil.ReadFile(旧版),大文件用bufio.Scanner或bufio.Reader,二进制文件用os.Open+io.ReadFull或binary.Read,GBK等编码需用golang.org/x/text/encoding处理。

直接用 ioutil.ReadFile 读小文件最省事
Go 1.16 之前推荐用 ioutil.ReadFile,它把打开、读取、关闭全包了,一行搞定。但注意:它会把整个文件一次性加载进内存,只适合小文件(比如配置、JSON、模板等)。
常见错误是拿它读几百 MB 的日志或二进制文件,结果程序 OOM 或卡死。
- 文件路径必须存在且有读权限,否则返回
error,别忽略它 - 返回的
[]byte是原始字节,如果要字符串,手动转:string(data) - Go 1.16+ 警告:该函数已移到
os.ReadFile,ioutil包被弃用
data, err := os.ReadFile("config.json")
if err != nil {
log.Fatal(err)
}
content := string(data)
大文件必须用 bufio.Scanner 或 bufio.Reader
逐行处理日志、CSV、文本流时,bufio.Scanner 是首选。它默认单行上限 64KB,超限会报 scanner: token too long 错误——这是新手最常踩的坑。
用 bufio.Reader 更底层、更灵活,适合按块读、跳过 BOM、处理不定长记录等场景。
-
Scanner不适合读二进制或含 null 字节的内容 - 调
Scan()前必须检查Err(),否则可能漏掉最后一次扫描失败的错误 - 想改单行长度限制?用
Scanner.Buffer(make([]byte, 4096), 1 设置最大 token 长度为 1MB
file, _ := os.Open("access.log")
scanner := bufio.NewScanner(file)
for scanner.Scan() {
line := scanner.Text() // 不是 Bytes(),除非你要保留换行符
process(line)
}
if err := scanner.Err(); err != nil {
log.Fatal(err)
}
os.Open + io.ReadFull 适合固定结构二进制文件
读取图片头、协议帧、自定义二进制格式时,你往往知道字段长度和顺序。这时候别用字符串或 Scanner,直接用 os.Open 打开,配合 binary.Read 或 io.ReadFull 控制精度。
典型错误是用 ReadAll 读 PNG 头却忘了前 8 字节固定,导致解析失败;或者没检查 ReadFull 返回的 io.ErrUnexpectedEOF。
-
io.ReadFull要求「必须读满」指定字节数,少一个字节就报错 - 读结构体推荐
binary.Read(r, binary.BigEndian, &header),比手撕位移更安全 - 记得用
defer f.Close(),文件描述符泄漏在长期运行服务中很致命
f, _ := os.Open("image.bin")
defer f.Close()
var header [8]byte
if _, err := io.ReadFull(f, header[:]); err != nil {
log.Fatal(err) // 可能是 EOF,也可能是磁盘错误
}
带编码转换得用 golang.org/x/text/encoding
Go 标准库不原生支持 GBK、Shift-JIS、Big5 等编码。遇到 Windows 记事本保存的 ANSI 文件(其实是 GBK),直接用 os.ReadFile 读出来就是乱码。
别试图用 strings.ToValidUTF8 补救——那是修显示,不是解码。必须在读取时做正确解码。
- 先用
encoding.RegisterPseudoEncoding注册别名(如 “gbk” → “GBK”) - 用
charmap.GBK.NewDecoder().Bytes(data)解码原始字节 - 流式读取时,把
Decoder套在Reader上:transform.NewReader(f, gbkDecoder)
import "golang.org/x/text/encoding/charmap"
// ...
f, _ := os.Open("readme_gbk.txt")
defer f.Close()
reader := charmap.GBK.NewDecoder().Reader(f)
content, _ := io.ReadAll(reader) // content 是合法 UTF-8 []byte
实际项目里,选哪种方式不取决于“看起来高级”,而取决于:文件多大、有没有编码问题、要不要流式处理、是否需随机访问。很多 bug 出在把日志文件当小配置读,或把 GBK 文本当 UTF-8 解析——这两类错误几乎占了 Go 文件读取问题的七成。
