如何在Go中读取文件内容_Go文件读取常见方式汇总

小文件用os.ReadFile(Go1.16+)或ioutil.ReadFile(旧版),大文件用bufio.Scanner或bufio.Reader,二进制文件用os.Open+io.ReadFull或binary.Read,GBK等编码需用golang.org/x/text/encoding处理。

如何在go中读取文件内容_go文件读取常见方式汇总

直接用 ioutil.ReadFile 读小文件最省事

Go 1.16 之前推荐用 ioutil.ReadFile,它把打开、读取、关闭全包了,一行搞定。但注意:它会把整个文件一次性加载进内存,只适合小文件(比如配置、JSON、模板等)。

常见错误是拿它读几百 MB 的日志或二进制文件,结果程序 OOM 或卡死。

  • 文件路径必须存在且有读权限,否则返回 error,别忽略它
  • 返回的 []byte 是原始字节,如果要字符串,手动转:string(data)
  • Go 1.16+ 警告:该函数已移到 os.ReadFileioutil 包被弃用
data, err := os.ReadFile("config.json")
if err != nil {
    log.Fatal(err)
}
content := string(data)

大文件必须用 bufio.Scannerbufio.Reader

逐行处理日志、CSV、文本流时,bufio.Scanner 是首选。它默认单行上限 64KB,超限会报 scanner: token too long 错误——这是新手最常踩的坑。

bufio.Reader 更底层、更灵活,适合按块读、跳过 BOM、处理不定长记录等场景。

  • Scanner 不适合读二进制或含 null 字节的内容
  • Scan() 前必须检查 Err(),否则可能漏掉最后一次扫描失败的错误
  • 想改单行长度限制?用 Scanner.Buffer(make([]byte, 4096), 1 设置最大 token 长度为 1MB
file, _ := os.Open("access.log")
scanner := bufio.NewScanner(file)
for scanner.Scan() {
    line := scanner.Text() // 不是 Bytes(),除非你要保留换行符
    process(line)
}
if err := scanner.Err(); err != nil {
    log.Fatal(err)
}

os.Open + io.ReadFull 适合固定结构二进制文件

读取图片头、协议帧、自定义二进制格式时,你往往知道字段长度和顺序。这时候别用字符串或 Scanner,直接用 os.Open 打开,配合 binary.Readio.ReadFull 控制精度。

魔珐星云

魔珐星云

无需昂贵GPU,一键解锁超写实/二次元等多风格3D数字人,跨端适配千万级并发的具身智能平台。

下载

典型错误是用 ReadAll 读 PNG 头却忘了前 8 字节固定,导致解析失败;或者没检查 ReadFull 返回的 io.ErrUnexpectedEOF

  • io.ReadFull 要求「必须读满」指定字节数,少一个字节就报错
  • 读结构体推荐 binary.Read(r, binary.BigEndian, &header),比手撕位移更安全
  • 记得用 defer f.Close(),文件描述符泄漏在长期运行服务中很致命
f, _ := os.Open("image.bin")
defer f.Close()
var header [8]byte
if _, err := io.ReadFull(f, header[:]); err != nil {
    log.Fatal(err) // 可能是 EOF,也可能是磁盘错误
}

编码转换得用 golang.org/x/text/encoding

Go 标准库不原生支持 GBK、Shift-JIS、Big5 等编码。遇到 Windows 记事本保存的 ANSI 文件(其实是 GBK),直接用 os.ReadFile 读出来就是乱码。

别试图用 strings.ToValidUTF8 补救——那是修显示,不是解码。必须在读取时做正确解码。

  • 先用 encoding.RegisterPseudoEncoding 注册别名(如 “gbk” → “GBK”)
  • charmap.GBK.NewDecoder().Bytes(data) 解码原始字节
  • 流式读取时,把 Decoder 套在 Reader 上:transform.NewReader(f, gbkDecoder)
import "golang.org/x/text/encoding/charmap"
// ...
f, _ := os.Open("readme_gbk.txt")
defer f.Close()
reader := charmap.GBK.NewDecoder().Reader(f)
content, _ := io.ReadAll(reader) // content 是合法 UTF-8 []byte

实际项目里,选哪种方式不取决于“看起来高级”,而取决于:文件多大、有没有编码问题、要不要流式处理、是否需随机访问。很多 bug 出在把日志文件当小配置读,或把 GBK 文本当 UTF-8 解析——这两类错误几乎占了 Go 文件读取问题的七成。

https://www.php.cn/faq/2019455.html

发表回复

Your email address will not be published. Required fields are marked *