你可以把奶黄包看作是 OpenClaw 的手机版本,拥有强大的工具调用能力,可以在手机上以 AI Agent 的方式与系统深度交互,完成从对话、自动化操作到代码执行等各种任务。
关于名字:奶黄包,是为了纪念一只因心脏病离开的加菲猫而命名。
特殊授权许可声明:本项目所有代码仅面向中国大陆地区授权(不含港澳台海南)可免费使用。如有使用在中国大陆之外地区,需缴纳一千万人民币的一次性使用授权费。本使用定义为对源代码、图片资源、及其衍生编译的文本和二进制产物的所有行为,包括不限于学习、教育、商业使用。
本特殊许可在与开源许可冲突部分,以本许可为准。本人对本特殊许可享有最终解释权。
本许可自2026年3月23日11时00分生效。
注意:第二代 Custard 暂时仅支持邀请试用,当然如果您愿意花钱试用,只需200块,你就是金主爸爸,微信:kymjs123。
开放生态,让其他 Agent 也能直接控制手机。
Custard 用 H.264 硬件编码 画面跟手、延迟低。你在 Mac 上用鼠标点、键盘打,手机立刻响应——像在用一块外接触摸屏。
- USB 连接:数据线插上,点「USB 连接」,免配网
- WiFi 直连:同一局域网也行
两种通道都支持远程触控和键盘输入,日常开发、演示、远程协助都顺手。
电脑上复制的链接、代码、文字,手机粘贴就有;手机复制的内容,Mac 也能直接拿到。跨设备协作少切一次屏。
Custard 不只是投屏工具,它给 AI 装上了:
| 能力 | 说明 |
|---|---|
| 读屏 | 获取当前界面结构、前台应用,可选附带截图 |
| 点击 / 滑动 | 百分比坐标,AI 不用猜像素 |
| 输入文字 | 支持中文(奶黄包输入法) |
| 开应用 | 说「打开微信」就行 |
| Home / 返回 | 系统导航一键完成 |
| 剪贴板读写 | 跨设备传内容 |
内置聊天、Cursor Skill、MCP、本地 HTTP API——同一套能力,多种用法,你用什么 AI 工具都能接上。
Agent API 只监听 127.0.0.1,不暴露到公网。Token 鉴权、工具开关、操作审计日志——你能控什么、AI 能做什么,一目了然。
- Mac 打开 CustardMac,连接手机会自动安装 Custard Android
- 手机开启无障碍服务,授权屏幕录制
- USB 或 WiFi 连接成功(CustardMac 显示已连接)
在 CustardMac 的 Agent 端口 页面:
- 开启 Agent API
- 点击 「安装 Skill」
或手动:
git clone --depth 1 https://github.com/kymjs/Custard-Skill.git \
~/.cursor/skills/custard-phone-control然后在 scripts/config.env 里填入 CustardMac 显示的 Token。
bash ~/.cursor/skills/custard-phone-control/scripts/custard-tool status看到 phone_connected: true,就可以在 Cursor 里让 AI 操作手机了。
在 Cursor 对话里直接说(需本机 Agent,Cloud Agent 无法访问 localhost):
帮我看一下手机现在在什么界面
打开微信,点搜索框,输入「奶黄包」
把手机剪贴板的内容读给我
AI 会自动调用读屏、点击、输入等能力——你描述目标,它执行步骤。
Q:iPhone 手机能用吗?
目前仅支持 Android,也在做 iOS、Harmony版本,但iOS复杂度更高,需要等一段时间。
Q:必须安装 Agent 才能用 Custard 吗?
不必须,Custard 本身就是一个 Agent,完全不需要其他 Agent。
Q:支持哪些三方 Agent?
Custard 已适配的 Agent 有:Hermes、OpenClaw、Cursor、Codex。其他国产Agent没有做单独测试,但理论上也能支持。
Q:Cloud Agent 能用吗?
不能。API 在本机,请用 本机 Agent。
Q:银行或股票证券 App 能调用吗?
部分安全界面(FLAG_SECURE)无法截图或读 UI,这是系统限制。大部分证券 APP 都能正常使用。
