Google Magika 用 AI 深度学习革新文件类型检测,提供快速精准的内容类型识别解决方案。
仅几 MB 模型大小,在单 CPU 上毫秒级响应,支持 200+ 内容类型,平均准确率高达 99%,训练于上亿样本数据集。
GitHub:github.com/google/magika
主要功能:
- AI 驱动的文件内容类型检测,支持二进制和文本格式;
- 超高准确率 ~99%,远超传统方法,尤其擅长文本内容;
- 毫秒级推理速度,独立于文件大小,仅分析文件片段;
- 支持批量处理数千文件,递归扫描目录功能;
- 多模式预测(高置信、中置信、最佳猜测),灵活控制容错;
- 输出详细标签、MIME 类型、置信分数,支持 JSON 等格式。
提供 Rust CLI、Python API、JavaScript、Go 等多语言绑定,通过 pip/brew/cargo 一键安装,支持 Web 演示。
##