❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 1 贡献者 97 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

google-ai-edge/mediapipe

C++ 活跃

635

最后更新2026-06-26

35k

+16

#12

项目介绍

面向直播与流媒体的跨平台可定制机器学习解决方案

Cross-platform, customizable ML solutions for live and streaming media.

智能解读

点击生成更详细的项目介绍

正在分析项目...

原始标签

android audio-processing c-plus-plus calculator computer-vision deep-learning framework graph-based graph-framework inference machine-learning mediapipe mobile-development perception pipeline-framework stream-processing video-processing

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

使用场景自动生成

最适合需要在移动端、边缘设备或跨平台环境中部署实时、高效的机器学习感知功能（如视觉、音频处理）的场景。

移动端实时手势识别

开发者需要在Android/iOS应用中实现实时手势识别功能，但担心传统方案计算量大、延迟高，影响用户体验。

使用MediaPipe的手势识别解决方案，它提供了预训练模型和跨平台API，可以直接集成到移动应用中，实现低延迟、高精度的手势跟踪。

在视频会议应用中，用户可以通过手势控制静音/取消静音、切换摄像头等操作，无需触摸屏幕。

直播美颜与滤镜

直播应用需要实时处理视频流，添加美颜、虚拟背景等效果，但需要保证处理效率，避免卡顿。

利用MediaPipe的计算机视觉管道框架，构建自定义的视频处理流水线，将人脸检测、特征点跟踪、滤镜渲染等步骤高效组合。

在直播软件中，实时检测主播面部，添加瘦脸、大眼等美颜效果，并支持动态贴纸跟随面部移动。

边缘设备人体姿态估计

在智能摄像头或IoT设备上运行人体姿态估计模型，但设备计算资源有限，需要轻量级、高效的推理方案。

使用MediaPipe Framework构建定制化机器学习管道，优化模型推理流程，充分利用设备硬件加速（如GPU、DSP），实现实时姿态估计。

智能健身镜通过摄像头实时分析用户运动姿势，提供动作纠正反馈，所有计算在设备端完成，保护用户隐私。

跨平台音频事件检测

开发一个需要在Web、移动端和桌面端都能运行的音频应用，希望统一音频处理逻辑，减少平台适配工作。

采用MediaPipe Tasks提供的跨平台音频处理API，使用统一的代码库处理音频流，实现如关键词检测、音频分类等功能。

语音助手应用在Web浏览器、手机和电脑上都能实时检测用户说出的唤醒词（如“Hey Siri”），触发后续语音指令处理。

项目健康度

75/100

良好

活跃度 15/23

距上次更新 19 天

人气 25/25

平台 Star TOP 2% · Forks 6,037

增长 15/25

本周 +117 ⭐ · 本月 +460 ⭐

社区 12/17

97 位贡献者 · 0 条平台评论

文档 8/10

缺少 1 项内容

在 GitHub 上查看

项目信息

作者 google-ai-edge

来源 GitHub

周期每日

仓库ID google-ai-edge/mediapipe

最新提交 2026-06-26 19:35:40

第一收录 2026-06-27 08:02:10

最后更新 2026-06-27 08:02:10

赞赏支持

如果本站对你有帮助，欢迎打赏支持

微信

支付宝

Widget 徽章

预览

Markdown

HTML

登录后发表评论

加载评论中...