mimetype
一个基于魔数检测MIME类型和扩展名的包
协程安全,可扩展,无C语言绑定
特性
- 快速精确的MIME类型和文件扩展名检测
- 支持大量MIME类型
- 可以扩展其他文件格式
- 优先检测常见文件格式
- 区分文本和二进制文件
- 支持并发安全使用
安装
go get github.com/gabriel-vasile/mimetype
使用
mtype := mimetype.Detect([]byte)
// 或
mtype, err := mimetype.DetectReader(io.Reader)
// 或
mtype, err := mimetype.DetectFile("/path/to/file")
fmt.Println(mtype.String(), mtype.Extension())
使用建议
只在万不得已的情况下使用像mimetype这样的库。使用魔数进行内容类型检测速度慢、不准确且非标准。大多数情况下,协议都有指定此类元数据的方法;例如,HTTP和SMTP中的Content-Type
头。
常见问题
问:我的文件在支持的MIME类型列表中,但未被正确检测。我该怎么办?
答:某些文件格式(通常是Microsoft Office文档)将其签名保存在文件末尾。尝试增加用于检测的字节数:
mimetype.SetLimit(1024*1024) // 将限制设置为1MB。
// 或
mimetype.SetLimit(0) // 无限制,使用整个文件内容。
mimetype.DetectFile("file.doc")
如果增加限制不起作用,请提交问题。
结构
mimetype使用层级结构来保持MIME类型检测逻辑。这减少了检测文件类型所需的调用次数。选择这种结构的原因是有些文件格式用作其他文件格式的容器。例如,Microsoft Office文件只是包含特定元数据文件的zip压缩包。一旦文件被识别为zip,就不需要检查它是否为文本文件,但值得检查它是否为Microsoft Office文件。
为防止将整个文件加载到内存中,当从reader或文件检测时,mimetype仅限于读取输入的头部。
性能
得益于层级结构、优先搜索常见格式以及仅限于文件头部,mimetype的性能与标准库http.DetectContentType
相匹配,同时优于替代包。
mimetype http.DetectContentType filetype
BenchmarkMatchTar-24 250 ns/op 400 ns/op 3778 ns/op
BenchmarkMatchZip-24 524 ns/op 351 ns/op 4884 ns/op
BenchmarkMatchJpeg-24 103 ns/op 228 ns/op 839 ns/op
BenchmarkMatchGif-24 139 ns/op 202 ns/op 751 ns/op
BenchmarkMatchPng-24 165 ns/op 221 ns/op 1176 ns/op
贡献
请参阅CONTRIBUTING.md。