学习目标:学会搭建一个连接Claude AI助手与个人WhatsApp账户的桥梁,实现通过AI助手搜索、读取和发送WhatsApp消息
前置知识
需要在终端中执行克隆仓库、运行命令等基本操作
需要克隆GitHub仓库到本地
项目主要组件用Go编写,需要安装Go来运行
MCP服务器部分使用Python,需要Python 3.6+环境
需要手机上的WhatsApp应用来扫描二维码认证
学习步骤
环境准备与安装
30-45分钟安装必备软件
按照README要求安装Go、Python 3.6+、UV包管理器。如果使用Windows,还需按照指南安装MSYS2和C编译器
Windows用户特别注意CGO启用问题,这是常见失败点
安装Anthropic Claude Desktop或Cursor
选择并安装一个支持MCP的AI助手客户端,这是使用该项目的最终界面
Claude Desktop是官方推荐,Cursor是代码编辑器内置AI助手
克隆项目仓库
使用git clone命令将whatsapp-mcp项目下载到本地
确保网络通畅,仓库地址为:https://github.com/lharries/whatsapp-mcp
启动WhatsApp桥接服务
20-30分钟进入桥接目录并运行
导航到whatsapp-bridge目录,运行Go应用程序。首次运行会生成二维码
确保在正确的目录下执行命令,Windows用户需要设置CGO_ENABLED=1
扫码认证WhatsApp
使用手机WhatsApp扫描终端显示的二维码,完成设备链接
确保手机和电脑在同一网络,二维码有时效性,需尽快扫描
等待初始同步
认证成功后,桥接服务会自动开始同步历史消息到本地SQLite数据库
首次同步可能需要几分钟,取决于消息数量,请耐心等待
配置MCP服务器连接
15-25分钟创建MCP配置文件
根据README中的JSON模板,创建claudedesktop-config.json或mcp.json配置文件,填入正确的路径
注意{{PATH}}需要替换为实际的项目路径,路径中的反斜杠可能需要转义
放置配置文件到正确目录
将配置文件放到Claude Desktop或Cursor的配置目录中
不同操作系统的配置目录路径不同,请仔细核对README中的路径
重启AI客户端
完全关闭并重新打开Claude Desktop或Cursor,使配置生效
确保之前的进程完全退出,有时需要强制结束任务管理器中的进程
基础功能验证
20-30分钟检查集成是否成功
在Claude Desktop中查看是否出现WhatsApp集成,或在Cursor中测试MCP连接
如果没出现,检查桥接服务和MCP服务器是否都在运行,查看终端是否有错误日志
尝试基础搜索
在AI助手界面尝试使用searchcontacts工具搜索联系人,验证数据读取功能
从最简单的查询开始,如搜索一个你知道的常用联系人姓名
测试消息读取
使用listmessages或listchats工具查看最近的聊天记录
如果看不到消息,可能是初始同步未完成,等待几分钟再试
进阶功能尝试
30-45分钟发送文本消息
使用sendmessage工具向一个联系人发送测试消息,验证发送功能
首次发送建议选择一个熟悉的联系人,并说明是测试消息
尝试媒体功能
如果有FFmpeg,尝试使用sendaudiomessage发送语音消息;或使用sendfile发送图片
音频文件需要.ogg格式,或依赖FFmpeg转换。可以先从发送小图片开始
探索其他工具
逐一尝试getchat、getmessagecontext、downloadmedia等其他MCP工具
每个工具都有特定参数,参考项目描述了解各工具用途
推荐资源
了解MCP协议的基本概念和工作原理
如果对Go完全不熟悉,可以了解基本语法和运行机制
查看其他人遇到的问题和解决方案,特别是Windows兼容性问题
了解WhatsApp设备链接限制和会话管理
常见错误与避坑指南
Windows用户未启用CGO
运行Go应用前必须设置CGO_ENABLED=1环境变量,并确保已安装C编译器
配置文件路径错误
仔细检查JSON中的路径,使用绝对路径,确保转义正确,特别是Windows的反斜杠
未同时运行两个服务
WhatsApp桥接服务(Go应用)和MCP服务器(Python)必须同时运行,缺一不可
二维码扫描失败或超时
确保手机和电脑网络连通,快速扫描,如果失败可重启桥接服务重新生成二维码
设备链接数超限
WhatsApp限制最多4个链接设备,需在手机WhatsApp的"设置 > 链接设备"中移除不用的设备
消息不同步或缺失
首次同步需要时间,耐心等待。如果长期不同步,可尝试删除store/目录下的数据库文件重新认证
下一步探索
学完基础后可以继续探索:1) 深入研究MCP协议,开发自定义工具;2) 了解whatsmeow库,扩展WhatsApp功能;3) 将项目部署到服务器,实现远程访问;4) 集成其他AI助手或自动化工作流;5) 贡献代码,修复问题或添加新功能
相关项目推荐
avelino/awesome-go
一份精选的Go语言优秀框架、库及软件列表
ollama/ollama
开始使用OpenAI gpt-oss、DeepSeek-R1、Gemma 3及其他模型。
golang/go
Go 编程语言
kubernetes/kubernetes
生产级容器调度与管理平台
fatedier/frp
一款快速反向代理,可帮助您将NAT或防火墙后的本地服务器暴露至互联网。
gin-gonic/gin
Gin 是一个用 Go (Golang) 编写的 HTTP Web 框架。它提供了类似 Martini 的 API,但性能更优——速度提升高达 40 倍。如果您需要出色的性能,请使用 Gin。