google-ai-edge

google-ai-edge/mediapipe

C++ 活跃
264
2026-04-09
34k
+23
#15
5.9k

项目介绍

面向直播与流媒体的跨平台可定制机器学习解决方案

Cross-platform, customizable ML solutions for live and streaming media.

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

使用场景 自动生成

最适合需要在移动端、边缘设备或跨平台环境中部署实时、高效的机器学习感知功能(如视觉、音频处理)的场景。

1

移动端实时手势识别

开发者需要在Android/iOS应用中实现实时手势识别功能,但担心传统方案计算量大、延迟高,影响用户体验。

使用MediaPipe的手势识别解决方案,它提供了预训练模型和跨平台API,可以直接集成到移动应用中,实现低延迟、高精度的手势跟踪。

在视频会议应用中,用户可以通过手势控制静音/取消静音、切换摄像头等操作,无需触摸屏幕。

2

直播美颜与滤镜

直播应用需要实时处理视频流,添加美颜、虚拟背景等效果,但需要保证处理效率,避免卡顿。

利用MediaPipe的计算机视觉管道框架,构建自定义的视频处理流水线,将人脸检测、特征点跟踪、滤镜渲染等步骤高效组合。

在直播软件中,实时检测主播面部,添加瘦脸、大眼等美颜效果,并支持动态贴纸跟随面部移动。

3

边缘设备人体姿态估计

在智能摄像头或IoT设备上运行人体姿态估计模型,但设备计算资源有限,需要轻量级、高效的推理方案。

使用MediaPipe Framework构建定制化机器学习管道,优化模型推理流程,充分利用设备硬件加速(如GPU、DSP),实现实时姿态估计。

智能健身镜通过摄像头实时分析用户运动姿势,提供动作纠正反馈,所有计算在设备端完成,保护用户隐私。

4

跨平台音频事件检测

开发一个需要在Web、移动端和桌面端都能运行的音频应用,希望统一音频处理逻辑,减少平台适配工作。

采用MediaPipe Tasks提供的跨平台音频处理API,使用统一的代码库处理音频流,实现如关键词检测、音频分类等功能。

语音助手应用在Web浏览器、手机和电脑上都能实时检测用户说出的唤醒词(如“Hey Siri”),触发后续语音指令处理。

项目健康度

A
81/100
优秀
活跃度人气增长社区文档
活跃度 23/23

距上次更新 1 天

人气 24/25

平台 Star TOP 5% · Forks 5,895

增长 14/25

本周 +158 ⭐ · 本月 +632 ⭐

社区 12/17

97 位贡献者 · 0 条平台评论

文档 8/10

缺少 1 项内容

在 GitHub 上查看

项目信息

来源 GitHub
周期 每日
仓库ID google-ai-edge/mediapipe
最新提交 2026-04-08 19:47:08
第一收录 2026-04-10 08:07:25
最后更新 2026-04-10 08:07:25

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手