❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

google

google/magika

Python
228
2026-04-18
545
+545
#6
0

项目介绍

快速准确的AI驱动文件内容类型检测。

Fast and accurate AI powered file content types detection

智能解读

智能解读 自动生成

Magika是一款由谷歌开发的AI驱动文件类型检测工具。它利用深度学习技术,能够快速且准确地识别超过200种文件格式,包括二进制和文本文件。其核心是一个高度优化的轻量级AI模型,体积仅数MB,即使在单CPU上运行也能在毫秒级完成检测,平均准确率高达约99%。 该工具已大规模应用于谷歌的Gmail、Drive和Safe Browsing等服务中,每周处理数百亿个文件,将其准确路由至相应的安全和内容策略扫描器,以提升用户安全。此外,Magika也被VirusTotal等安全平台集成。它提供命令行工具、Python API以及多种语言绑定,方便开发者集成到各类应用中,适用于需要高精度、高性能文件内容识别的场景,如安全分析、数据分类和系统自动化处理。

智能标签

使用场景

使用场景 自动生成

最适合需要高精度、高性能文件内容类型识别的安全扫描、文件处理和自动化分类场景。

1

邮件附件安全扫描

邮件系统需要准确识别上传附件的真实类型,防止恶意文件伪装成安全格式绕过安全检查。

使用Magika的AI模型快速检测附件真实内容类型,准确率高达99%,确保文件被路由到正确的安全扫描器。

Gmail使用Magika处理用户上传的附件,识别出看似是.jpg但实际是恶意脚本的文件,将其送入脚本扫描器而非图片处理器。

2

云盘文件分类

云存储服务需要自动识别用户上传文件的类型以便正确预览、处理和存储,传统方法对文本和二进制文件识别不准。

集成Magika的Python API,在文件上传时毫秒级识别200+种文件类型,特别是对文本格式(如代码、配置文件)有高精度识别。

Google Drive使用Magika识别用户上传的.log、.conf、.py等文本文件,即使没有扩展名也能准确分类,支持正确的预览和搜索。

3

批量文件格式检测

安全分析平台需要快速扫描大量可疑文件(如病毒样本库),传统工具速度慢或准确率不足。

使用Magika命令行工具,单次调用可处理数千个文件,每个文件仅需约5ms,且支持递归目录扫描。

VirusTotal集成Magika,每周处理数百亿个文件样本,快速识别未知二进制或混淆文本文件的真实类型,辅助威胁分析。

4

Web应用文件上传验证

Web应用需要在前端或后端验证用户上传文件的真实类型,防止恶意文件上传攻击。

使用Magika的JavaScript/TypeScript绑定或Python API,在浏览器或服务器端快速验证文件内容,而非仅依赖文件扩展名。

在线表单应用在用户选择文件后,使用Magika的Web演示版技术实时检测文件真实类型,阻止伪装成PDF的EXE文件上传。

项目健康度

D
35/100
较差
活跃度人气增长社区文档
活跃度 0/23

从未记录更新时间

人气 14/25

平台 Star TOP 28% · Forks 0

增长 3/25

本周 +5 ⭐ · 本月 +21 ⭐

社区 10/17

41 位贡献者 · 0 条平台评论

文档 8/10

缺少 1 项内容

2 项改进建议
  • 活跃度:暂无最后推送时间记录,建议重新采集仓库元数据
  • 增长:近期 Star 增长缓慢,项目热度有待提升
在 GitHub 上查看

项目信息

作者 google
来源 GitHub
周期 每日
仓库ID google/magika
第一收录 2026-04-19 08:01:51
最后更新 2026-04-19 08:01:51

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手