[译] 我所知道的全部智能体工程技巧(2026 年 6 月)
作者:Matt Van Horn | 发布于 2026 年 6 月 4 日
三个月前我发过一篇《我所知道的全部 Claude Code 技巧》,拿到了 91.3 万阅读。当时 Kevin Rose 问我该用哪个 IDE,我的回答是:”不用 IDE,只用 plan.md 文件加语音。”
这种做法过去叫 vibe coding。大约在去年感恩节前后,模型强到让这个”玩具”变成了真家伙,也就是现在大家说的 Agentic Engineering(智能体工程)。它是我现在还能持续交付产品的唯一原因。今年我做出了 last30days(2.7 万 star)、Printing Press(4000+ star)、刚上线的 Agent Cookie,还成了几个超大型开源项目的头部贡献者:Python、Go、GStack、Paperclip。上一次我做出别人觉得有价值的软件,还是高中时候的事。下面这些就是我的技巧。
YOLO 极速版技巧:把这整篇文章粘贴给你的 AI 智能体,让它据此做一份”把文中所有东西都搭起来”的计划,然后一条一条照着执行。这就是我的全套工作流,你连读都不用读。
1. 有想法的那一刻,就用 CE 做一个 plan.md
依然是第一条铁律,也依然是我学到的最重要的一件事。
我一有想法,就立刻 /ce-plan 生成一个 plan.md【译注:/ce-plan 是下文 Compound Engineering 插件提供的”斜杠命令”,作用是自动生成计划文件】。不是”让我想想”,也不是”先开始写代码”,而是每次都 /ce-plan。它还能吃图片,所以任何你能截下来的东西都能当起点:
- 脑洞产品点子:
/ce-plan。 - GitHub 上的某个 bug:复制 issue 链接,粘贴,
/ce-plan。 - 终端报错:Cmd+Shift+4 截图,Ctrl+V 粘贴,
/ce-plan fix this(修一下这个)。 - 截图、报错信息、设计稿、Slack 对话串,随便哪个,丢进去就行。
当想法还很模糊、我自己都不知道想要什么时,我会先用 /ce-brainstorm 跟智能体一起把它想清楚,等思路锐利了再 /ce-plan。
/ce-plan 的内部机制是:并行地扇出多个研究型智能体。一个读你的代码库、找出其中的模式、核对你的代码规范;一个翻你过去的解决方案、提炼经验;如果话题需要,还会有更多智能体去查外部文档和最佳实践。全部同时进行。然后它汇总成果,写出一份结构化的 plan.md:问题出在哪、采用什么思路、要改哪些文件、带勾选框的验收标准、以及从你自己代码里总结出的可遵循模式。一切都扎根于你的仓库、你的规范、你的历史,而不是泛泛而谈的建议。
/ce-work 则拿这份计划去落地。上下文爆了?新开一个会话,指向那份计划,从断点继续。计划就是那个能扛过一切的存档点。
传统开发是 80% 写代码、20% 做规划,这套打法把它反了过来:思考全压进计划里,执行就成了机械活。
让这一切真正跑起来的,是 Kieran Klaassen 和 Trevin Chow 的 Compound Engineering(复利工程) 插件【译注:”复利工程”取义于每次积累都让后续更省力,像利滚利】。我从它的铁粉变成了贡献者,如今是仅次于核心团队的第三大贡献者。我现在的规矩是:除非真的只是改一行字,否则永远先有一个 plan.md。
技巧
- 安装 Compound Engineering:
/plugin marketplace add EveryInc/compound-engineering-plugin- 粘贴截图、bug 链接或报错,然后
/ce-plan,再/ce-work。- 想法模糊?先
/ce-brainstorm。
2. 别去读那个 plan.md
我总是会做 plan.md,但几乎从不读它。计划是给智能体看的,傻乎乎的人类。
强制一份计划存在,能让智能体不偷懒:逼它去研究、敲定一个思路、写下验收标准,然后真的去逐条达成。有计划的编码智能体交付的是完整成品;没计划的会偷工减料、半途收手。计划就是那根牵狗绳。
所以我让它写计划,我只扫一眼标题,然后就跑 /ce-work。有疑问我就当场在会话里直接问:”等等,为什么用这个思路?”或者要个 TLDR。实在看不懂时就说”eli5 这个计划”【译注:eli5 = “Explain Like I’m 5”,”像跟五岁小孩解释一样”,要求把复杂内容讲到极简】。我拿到一段话版本,点点头,继续往下走。我绝不会坐那儿读 300 行 Markdown,那是智能体的作业,不是我的。
做计划。信计划。别读计划。
技巧:管住自己别去读计划。要看就当场追问:
TLDR?、eli5 这个计划,或者”等等,为什么用这个思路?”
3. 把 /ce-plan 用在你最硬核的非工程工作上——给计划做个计划
大家以为 /ce-plan 和 /ce-work 是写代码用的。我从三月以来学到的最大一件事是:它们不止于此。我现在最深度的知识工作都跑在同一个循环里,而诀窍是——让第一份计划成为”给计划做的计划”。这也不是我硬把一个写代码的工具掰去干别的:/ce-plan 内置了一个通用规划模式,本来就是为这种非代码工作设计的。
而且不只是商业问题。策略文档、产品规格书、竞品分析、董事会汇报,全都走同一个循环。
举个真实例子。我去见了 Michael Margolis——前 GV【译注:GV = Google Ventures,谷歌旗下的风险投资基金】的研究合伙人,以”靶心客户法”闻名——聊我正在酝酿的一个商业难题。他让我读他的书,他网站上有免费 PDF。换作过去,我会大致翻翻就过去了。这次我打开 Claude Code,大意是这么说的:
“
/ce-plan,给计划做个计划。我马上要给你两样东西:Margolis 的书(PDF),以及我刚和他开的那场两小时会议的 Granola 转录全文【译注:Granola 是一款自动记录、转录会议的工具】,里面有我们讨论的全部上下文。我想要一份深思熟虑的计划,说明如何把我的商业难题、那场对话、和书里的洞见融合成我真正能用的东西。现在先别写那份文档。写出来才是真正的活。此刻我只要计划:你打算怎么读这本书、怎么从转录里挖料、怎么产出一份出色的文档。”
接下来它花了 45 分钟,做出了一份史诗级的计划。
这也是我所知最能让大语言模型不偷懒的单一诀窍。直接叫它出成品,它会偷工减料;叫它先规划”我将如何产出这个成品”、再去执行那份规划,它每次都会给你下足功夫的深度版。
技巧:深度非代码工作——
/ce-plan给计划做个计划,把你所有上下文和转录都喂给它,然后/ce-work。
4. 被”语音化”
语音转 LLM 跟语音转其他任何东西都不一样。转录不必完美,因为听的那一方懂上下文,它会猜出麦克风听错的地方。你可以含糊、可以说一半停掉、可以一句话重说。语音之所以终于好用,是因为对面那东西聪明到能补上空缺。
我的配置:
- Mac:Monologue(来自 Every)或 Wispr Flow,二选一,把语音直接灌进当前聚焦的任何 App,对着 Claude Code 说话就行。我还给办公室买了个鹅颈麦。
- 手机:跳过 Monologue 和 Wispr Flow,在 iOS 上切换它们太烦。苹果自带的听写就够用了,因为你是在跟 LLM 说话,不是跟人。它把一半词都识别错,智能体照样能懂。潦草的笔记没关系。
老实交代一点:我独处时用语音如鱼得水,在办公室就费劲。大家说你可以对着麦克风小声说,但我发现自己其实做不到,因为不想显得没礼貌、不想打扰旁边的人。所以合用办公室里的一张桌子,至今仍是我整套工作流的软肋。如果你能在开放式办公室里搞定语音又不变成”那种人”,请告诉我怎么做,我是真心求教。
技巧:Mac 装 Monologue 或 Wispr Flow;手机用苹果听写;搞一个鹅颈麦。
5. 在 cmux 里开一大堆标签页
这就是我真实的一天。四到六个 cmux【译注:cmux 是一款终端会话管理/多路复用工具,能在一个窗口里管理多个独立终端会话】标签页,有时更多,每个都是一个独立会话:
- 一个在写计划。
- 一个在照另一份计划搭东西。
- 一个在跑 last30days。
- 一个在修我测上一件东西时发现的 bug。
当 /ce-plan 在一个窗口里跑研究时,我切到另一个窗口去 /ce-work 一份已经写好的计划;趁那个在搭建,第三个窗口又贴进来一个新 bug。等我转一圈回来,第一个已经做完、在那儿等着了。
我听说 Orca 在移动端做得很棒。我以前也是 Ghostty【译注:Ghostty、Orca 都是终端模拟器软件】的纯粹主义者,但在 Ghostty 里我老是漏掉太多通知。
技巧:用 cmux(来自 Manaflow);常开 4 到 6 个标签页,每个跑一件不同的任务。
6. 让终端默认打开就是 Claude 或 Codex,而不是 Shell
新标签页应该直接进入 Claude Code,而不是一个 Shell。开一个标签页,你就已经在跟智能体对话了。不用 cd,不用敲 claude。当开一个新会话只要一个按键时,你就会开很多很多个。我也不用文件夹,你的智能体自己能找到项目。
技巧:把下面这段粘给你的智能体:
“让每个新终端标签页都直接打开 Claude Code。在~/.config/ghostty/config里加一行command = ~/.local/bin/claude-launcher.sh,不要动该文件里已有的任何其他设置。然后创建~/.local/bin/claude-launcher.sh,让它运行claude --dangerously-skip-permissions,并在 Claude 退出后打印一句简短提示、把我丢进一个交互式登录 zsh。给脚本chmod +x。这对 Ghostty 和 cmux 都管用,因为 cmux 读的是同一份 Ghostty 配置。”
7. 远程控制每一个窗口,并给 Claude Code 或 Codex 配个邮箱
两个让每个会话从任何地方都能触达的技巧。
每次开新窗口都打开远程控制:把远程控制设成对每个会话自动开启。这样每个窗口都能从 Claude 手机 App 触达。在桌前开个会话,起身走人,在手机上接着同一个正在跑的任务继续。某种意义上,你是在遥控你家 Mac 上正埋头干活的东西。
给你的 Claude 配个邮箱:Claude Code 可以借助 AgentMail 拥有一个邮箱地址【译注:AgentMail 是专门给 AI 智能体用的邮箱服务】。创始人 Adi Singh 教我的。给那个收件箱发邮件,一个全新会话就会打开,并开始处理邮件主题和正文里的内容,附件也能按路径调用。晚饭时发现个 bug?用手机把它发过去,你还没回到电脑前,一个会话就已经在跑了。我把整套东西开源了:github.com/mvanhorn/agentmail-to-claude-code。
三个部件:
- 一个守护进程通过 WebSocket【译注:一种保持长连接、能实时收推送的网络协议】盯着一个 AgentMail(YC S25 项目【译注:YC = Y Combinator,知名创业孵化器;S25 指 2025 年夏季批次】)收件箱。每收到一封在白名单上的邮件,它就开一个全新 Claude 会话,把邮件写进一个提示词文件,让 Claude 读取并据此行动。
- 两个终端后端,cmux 或独立的 Ghostty,让它能驱动你本来就在用的那个。
- 一个发送器。我把它接到了我 Hermes 里的一个
cc命令上,于是在手机上跑cc <任务>,它就会作为一个正在干活的会话落到我的 Mac 上,不用 VPN,不用 SSH。
白名单是那道闸门。只有你自己掌控的地址能进,任何过不了 DKIM 或 SPF【译注:DKIM、SPF 是验证邮件”真的来自所声称发件人”的反伪造机制】的邮件,在会话开启前就被丢弃。
技巧
- 常开远程控制:在
~/.claude/settings.json里加"remoteControlAtStartup": true。- 给 Claude 配邮箱:把这段粘给你的智能体——“用
github.com/mvanhorn/agentmail-to-claude-code给 Claude Code 配个邮箱。克隆它,建一个 AgentMail 收件箱,在cc.env里填我的 API key、收件箱、只含我自己地址的白名单、以及我的终端(cmux 或 Ghostty),然后跑守护进程并把它装成一个 launchd 任务【译注:launchd 是 macOS 管理后台常驻任务的系统服务】。当我给那个收件箱发邮件时,这台 Mac 上应该打开一个全新 Claude Code 会话,开始处理主题和正文。”
8. 危险地跳过权限确认——对,我是认真的
Claude Code 每次编辑、每条命令都要请示许可。开着六个会话时你没法盯着它。两个设置能让它变得可用。有人说”auto”模式是更”安全”的做法,但它把我拖得太慢。
skipDangerousModePermissionPrompt: true 是关键。没有它,Claude 每个会话都要你确认一遍。你也可以用 Shift+Tab 来回切换。有人跟我说较新的”auto”模式能在更安全的前提下达到差不多效果。也许吧。我选 YOLO。这是我自己的电脑。真把一切搞砸了,还有 GitHub 兜底【译注:指代码都提交到了 GitHub,出事能回滚】。我给一个朋友配 Claude Code 时,那 AI 还主动劝他别开这个模式。你得对它态度强硬点。
另一个设置是声音钩子【译注:hook,”钩子”,指在某事件发生时自动触发的小程序】,开六个会话时它不可或缺:
走开,听到声音再回来。六个会话都在跑时,靠声音你才知道是哪个刚做完。
技巧
粘进~/.claude/settings.json:
1 { "permissions": { "allow": [ "WebSearch", "WebFetch", "Bash", "Read", "Write", "Edit", "Glob", "Grep", "Task", "TodoWrite" ], "deny": [], "defaultMode": "bypassPermissions" }, "skipDangerousModePermissionPrompt": true }
1 { "hooks": { "Stop": [ { "hooks": [ { "type": "command", "command": "afplay /System/Library/Sounds/Blow.aiff" } ] } ] } }【译注:
afplay是 macOS 播放音频的命令,这里在会话停止时播一声提示音】Codex 有同样的 YOLO 模式。在
~/.codex/config.toml:
1
2 approval_policy = "never"
sandbox_mode = "danger-full-access"或者用
codex --yolo临时起一个。
9. 我如何让大部分代码都跑在 Codex 上,却从不打开 Codex CLI
我一整天都在把活派给 Codex,却几乎从不为此打开 Codex 的 CLI。Claude 做规划,Codex 来搭建,而我从不离开我的 Claude 会话。
不离开 Claude 就把活交给 Codex 的三种方式:
- Codex IDE 扩展:派一个任务,应用结果,从不掉进 Codex 终端里。
/ce-work --codex:在 Compound Engineering 循环里把搭建直接委托给 Codex。- Printing Press 的 Codex 模式:在生成新 CLI 的提示词末尾加上
codex,它就把搭建交给 Codex。
我的设置,两个引擎都拉满到超高推理强度:
- Codex:推理 xhigh,快速模式常开。
- Claude Code:推理 xhigh,快速模式关闭。它的快速模式会在你那 200 美元的 Max 套餐之外按 token 另收费,所以我跳过。
两个各 200 美元的套餐并排开,等于一整套第二引擎。我把大规模并行搭建推给 Codex,让 Claude 专注规划和品味。有些朋友反着用:Codex 搭建,Claude 审查。
技巧
- Codex:推理 xhigh,快速模式开。Claude Code:xhigh,快速模式关。
- 把活交给 Codex:用 Codex IDE 扩展、
/ce-work --codex,或在 Printing Press 提示词末尾加codex。
10. 规划之前先做研究:last30days
在 /ce-plan 之前,我通常会先对它跑一遍 /last30days。
我当时在 Vercel 的 agent-browser 和 Playwright【译注:两者都是让程序自动操作网页/浏览器的工具】之间纠结。我没去读文档,而是跑了 /last30days Vercel agent browser vs Playwright。几分钟内:几十条 Reddit 帖、X 帖、YouTube 视频、HN【译注:HN = Hacker News,技术圈高人气的新闻社区】话题。结论是 agent-browser 每次调用占用的上下文少得多,Playwright 光是工具定义就要灌进去几千个 token。我把整份输出喂进 /ce-plan integrate agent-browser。出来的计划扎根于社区此刻真正掌握的认知,而不是半年前的训练数据。
last30days 是开源项目,现在已超过 2.6 万 star。它并行搜索 Reddit、X、YouTube、TikTok、Instagram、HN、Polymarket【译注:Polymarket 是一个预测市场平台,用下注价格反映大众对未来事件的判断】、GitHub 以及全网。我会在挑库之前、做功能之前、见商业伙伴之前、写文章之前都跑一遍。本文里有几样东西我就跑过它。研究、规划、搭建,这才是真正的循环。
技巧:安装 last30days(@slashlast30days)。在
/ce-plan之前,跑/last30days <主题>。记得配好 ScrapeCreators 的 key【译注:ScrapeCreators 是抓取社交平台内容的第三方接口,需要 API 密钥】。
11. 万物皆 Granola,并把原始转录丢进你的 LLM
我和一位候选人吃了顿午饭,聊产品、聊吃的、聊孩子,九十分钟的正常闲聊,中间穿插着一个产品点子。
Granola 一直开着。事后我把完整的原始转录粘进 Claude Code:/ce-plan 把这个变成一份产品提案。
诀窍在于原始。我不先做摘要,把整段乱糟糟的转录原样丢进去——连那些关于寿司的跑题也一起——让 Claude 对着我真实的代码库和我写过的每一份历史策略计划去做提取。Granola 的上下文 + 代码库 + 历史计划 = 金子。它一次就产出了一份提案【译注:原文 one-shotted,指 AI 一遍到位、无需返工】,自动忽略了餐厅闲聊,我当晚就发了出去。那位现在全职和我们一起干。
而三月以来的升级是:Printing Press 的 Granola CLI,简直魔法。我能把任何一场会议作为干净的结构化数据直接拉进会话,搜遍我开过的每一场会,找出三周前某人说过的那一句话,再把它接进一份计划。再也不用复制粘贴。每一场会议的上下文,都只差一条命令。
技巧:把 Granola(@meetgranola)的原始转录丢进
/ce-plan,别先做摘要。安装 Printing Press 的 Granola CLI。
12. 人类信号
这是我花了最久才完成的心态转变。当你同时跑六个智能体时,你的工作不是去干活,而是去当那个信号。
智能体提供产量,你提供品味、方向,以及”看一眼—再纠偏”的循环。你看它交回什么,你说”方案二更接近,但用方案一的措辞”、”先解决最大的风险”、”这段太长了”,它们就动起来。这个循环里稀缺而宝贵的东西,是你的判断力,不是你的打字。我越是投入去当那个”人类信号”、越是不再试图同时也当那只亲手干活的手,我交付得就越多。
去当品味,让它们当手。
技巧:用你的脑子去指挥你的智能体,以此给世界创造价值。这件事仍然有价值。
13. 用 HyperFrames 做视频,做任何东西
视频曾经是我要么外包、要么干脆跳过的东西。现在我用做其他一切的同样方式做它:我说,智能体搭,我反馈。
HyperFrames 让我把视频当成 HTML 来做,所以智能体能写它【译注:HyperFrames 是一种把视频用 HTML/代码方式生成的工具】。循环和写代码一模一样,只不过产出是一个 MP4 而不是一个 PR。每个视频是一个文件夹,里面有逐场景的 script.md,动态文字排版【译注:kinetic typography,让文字带动画地出现/运动的设计手法】,每个节拍都靠字幕承载。智能体把那份脚本变成画面合成并渲染出来。没有剪辑软件,没有时间轴。
我用这种方式做的上线短片:Granola CLI 演示、Agent Cookie 上线片。
做一个视频的成本降到了一次对话,于是任何值得配视频的东西现在都配上了:上线短片、产品演示、动画讲解、带字幕的片段。它们也不只发 X:我会把渲染好的演示直接丢进一个 PR,比如我给 atlas-lean(Facebook 的 AI 研究项目)提的那一个。
技巧
- 在 HyperFrames 里做视频:写一个
script.md,让你的智能体渲染成 MP4。- 把 GIF 上传到 catbox【译注:catbox 是一个免费的文件/图片托管站】,它们在 GitHub、PR、README 和 issue 里都能漂亮地显示。
14. 你的笔记就是你的智能体的知识库
三月那个”策略文件夹”技巧被推广了。计划之所以一次比一次好,是因为 Claude 能访问我写过的每一份历史计划——上下文在复利。于是我把它指向了我的整个大脑。
我让它对接的工具:
- Bear,配 Bear CLI。十年的笔记、会议、半成品点子和决定,一个智能体都能读能写。这就是个人版 RAG,只是不叫这个名字而已。我放进去的越多,每个会话就越聪明。
- Obsidian。我自己不用,但很多人爱用它干这个,而且它的插件生态很深。
- gbrain。我跨机器、跨智能体同步的”大脑”。
- supermemory。一个面向智能体的记忆层,很多人极力推荐。我正在深入试用,结论待出。
这个技巧的形态本身才是重点:挑一个带 CLI 或 API 的笔记工具,把你的智能体指向它,让你自己的知识产生复利。
技巧:让你的智能体同时对接两类:你亲手写的记事工具(Bear、Obsidian),以及替你记忆的智能体大脑(gbrain,作者 @garrytan;supermemory,@supermemory)。挑带 CLI 或 API 的,这样它才能读取。
15. 随处办公——我的 Mac mini
技巧
- Mosh,当你不得不 SSH 登入时用它。它能在糟糕的 wifi 和漫游切换中让会话感觉仍像在本地、保持响应灵敏【译注:Mosh 是一种比传统 SSH 更耐网络抖动的远程登录工具】。用普通 SSH 时,Claude Code 会卡成蜗牛,每一次敲键都要等一个往返。在远程机器上,这就是”能用”和”痛苦”之间的差别。
- Tmux,坐飞机时用【译注:Tmux 是终端会话管理器,能让程序在远程机器上持续运行、断线后重新接回】。在 tmux 会话里 SSH 进你的远程机器,活就跑在那台机器上,而不是你的笔记本上。飞越大西洋时 wifi 断了二十分钟,重连、attach(接回),它就停在你离开时的原处。我曾在从欧洲回家的整段航程里交付功能。
- Hermes
- Agent Cookie
16. Proof:把计划发给同事
一个 plan.md 对我来说完美,但要递给一个不住在终端里的人就毫无用处。这是最后一个真正的缺口,而 Proof(同样来自 Every Inc.)把它补上了。
在 Proof 里打开一份计划、像读文档一样读它,是不错。但它变得不可或缺,是在”把计划发给同事”这件事上。我把一个 plan.md 或一份规格书丢进 Proof,发出链接,一个不碰终端的普通人就能干净地读它、逐行评论,而那些评论又会回流进我和智能体的循环里。再也不用把 Markdown 粘进 Slack、眼看它渲染成一坨乱码。这是给整个”计划文件工作流”加上的”人在回路”审查【译注:human-in-the-loop,”人在回路”,指在自动化流程里保留人来把关、审核的环节】,也是头一回,把智能体工作分享给一个普通同事不再让人觉得别扭。
写这篇文章时我就把它装进了 Proof,它就是这么被审阅的。而我整篇文章是在 cmux 里写的,旁边就并排开着 Proof 审阅。
技巧:分享计划——把
.md丢进 Proof(@EveryInc),发出链接,把评论拉回循环里。
17. 自己写 Skills(技能)
最大的升级不是用智能体,而是教会它们能记住的招式。任何我做超过两次的事,我都把它变成一个 skill:一个我的智能体可以永久调用的可复用命令【译注:skill 在此指给 AI 智能体写的、可重复调用的自定义命令/能力包】。要自动化你的工作流,先从写你自己的 skill 开始。
你不用从零写。让我打通这件事的诀窍是:把你的智能体指向一个已经能用的 skill,让它照着那个形态仿一个。原话就是:”看看 Compound Engineering 那个 skill,帮我照它做一个用来自动化〔我要自动化的某事〕的。”它读一个优秀范例,学会结构,给我搭好脚手架【译注:scaffold,”脚手架”,指自动生成项目的基础框架代码,后续往里填内容】。我用这种方式攒了一大堆 skill。
这现在也是我开源生活的主要部分。看我的 GitHub,工作内容就是各种 skill 和围绕它们的工具。last30days 一开始就是我想给自己用的一个 skill,如今开源、超过 2.6 万 star。Printing Press 是一整座”生成 agent 原生 CLI”的工厂,是我个人用得最多的工具,被合并进它的 PR 超过 320 个。我是 Compound Engineering 本身的头部贡献者之一。这些都不是什么宏大计划。每一块都是我跑得足够频繁、值得让智能体在这件事上永久变强的工作流。
skill 写一次,之后每个会话都更快。这就是 Compound Engineering 里”复利”的那部分。
技巧:任何你做超过两次的事,做成一个 skill:”看看 Compound Engineering 那个 skill,帮我照它做一个用于〔X〕的。”
18. 开源:为你热爱的项目做贡献
让我自己的项目得以交付的同一个循环,也能交付别人的项目。我有数百个 PR 被合并进开源,包括 Python、Go、OpenCV、Vercel 的 Agent Browser、OpenClaw。不是顺手改个错别字那种,而是我每天都在用的工具上的真实功能。
不知不觉间,我开始登上贡献者榜单的前列:
- Compound Engineering、Superpowers、Emdash 上排第 3
- GStack 和 Paperclip 上排第 4
- Vercel 的 Agent Browser 上排第 6
- Camoufox 上排第 2
Pejman Pour-Moezzi 开玩笑说,每次他打开一个仓库,在贡献者头像墙里找我的脸,已经成了他个人版的”威利在哪里”【译注:”Where’s Waldo”,《威利在哪里》,一套在密集人群图里找特定人物的找人游戏】。
但被合并的 PR 并不是真正的奖赏,人才是。我跳进项目的 Discord,结识维护者,交到真朋友。这对招人也帮助巨大,我刚为我的新公司招到一位就是这样认识的工程师。你为热爱的东西做贡献,认识那些同样热爱它的人,然后它就复利滚动起来。
技巧:挑一个你每天都用的工具,找出它真正缺的一样东西,用同样的
/ce-plan+/ce-work循环把它做出来。出现在项目的 Discord 里。PR 让你进门,而人,才是你留下来的原因。
在 X 上创造价值:在 X 上花每月 1–3 美元订阅你敬重的人。我每月给 @garrytan 付 1 美元,当我提交一个 PR 时,我能给他发一条 X 帖,他会收到一个”我是付费用户”的特别通知。我也付费订阅 @jason、@teknium。
19. 我目前的笔记本配置
我那台两年前的笔记本,在我塞给它的所有负载下——一整天六个 Claude 会话外加 Codex——几乎要罢工了。于是我升级到了 64GB 内存的 M5 Max。它是头猛兽,我很爱它。可它照样被这套负载折腾得够呛:我这台全新机器的电池有时只撑得了一小时。
所以我恐慌性地囤了电。我现在到哪都带一块 Anker 充电宝,还在特斯拉里常备一个 Anker 充电器,让车一路给我补电。
技巧:永不休眠——
sudo pmset -a disablesleep 1【译注:pmset 是 macOS 的电源管理命令,这条意为禁用睡眠】。随身带一块 Anker 充电宝;车里放一个充电器。
20. Printing Press:能跑真实生活的 CLI
前面这些技巧大多活在终端里。这一个,是会走出终端的那个。
Printing Press 是一支 CLI 舰队,把现实世界的各种服务包起来,让一个智能体能直接去跑腿办事。它现在是自己独立的项目了(@ppressdev),star 超过 3700,我和 @trevin 一起在做。
让它们真正可用的那块拼图是鉴权,而它昨晚刚上线:Agent Cookie。它把你真实的浏览器会话交给一个 CLI,让它以你的身份行事,不用粘任何密码,也不用重新登录【译注:浏览器会话/cookie 是你登录某网站后的”在线凭证”,把它交给程序,程序就能假装是已登录的你】。它就是把”一个知道某服务的智能体”变成”一个已经登录了该服务的智能体”的东西。
一个真实的下午,从头到尾:
- 特斯拉预热。十分钟后孩子要上车:”把车预热到 72 度。”特斯拉 CLI 触发,我们出门时车已经暖了。
- Instacart【译注:美国生鲜代买/配送平台】。”按老样子再下一单,加上咖啡滤纸。”它把购物车建好,我确认,杂货就在路上。对话进行到一半顺手办的,节奏都没断。
- ESPN 轮询【译注:ESPN 是体育赛事平台;轮询指程序定时反复查询状态】。一个会话替我盯着一场比赛,只在比分接近时才提醒我。我什么都没刷,只收到了那一条真正重要的提醒。
- 阿拉斯加航空,给孩子的旅行。它拉出票价和”肩部日期”【译注:shoulder dates,旺季与淡季之间、价格相对划算的出行日期】,查了我们的 Atmos 里程余额,喂进
/ce-plan,给出一套订票策略:最便宜的日期加上购买提醒。这些都是我在足球场边搞定的。
不是”AI 替我写代码”。智能体工程会替你跑腿、替你看比赛、替你暖车、替你订行程,而你正在做别的事。
技巧
- 从
printingpress.dev的库里装一个现成 CLI,把一件差事直接交给你的智能体。- 无痛鉴权:Agent Cookie 把你真实的浏览器会话交给 CLI,让它以你的身份行事。
- 真正的技巧:印你自己的。挑一件你成天在做的事、一个你天天泡在里面的 API 或服务,让 Printing Press 给它生成一个 agent 原生的 CLI。你为自己工作流亲手造的那一个,才是真正改变你工作方式的那个。
21. 实话部分:AI 精神病
智能体本该替我们干掉所有的活。结果,我认识的每一个朋友都在以这辈子最拼的状态工作。
容易脱口而出的回应是”歇歇吧,去外面走走”【译注:touch grass,英文网络流行语,字面”去摸摸草”,劝沉迷屏幕的人离开电脑去现实世界走走】。但这件事说的不是那个,说的是成瘾。用智能体搭东西,是有史以来最棒的电子游戏,而那个循环就是这么上头。
我有几个朋友我是真心担心。他们被”能造出任何东西”点燃,以至于别的什么都不干。然后他们上线了,没有用户。这没关系。我也上线过一堆没用户的东西。陷阱不在于那场空荡荡的上线,而在于消失在搭建里、弄丢了你身边的人。
所以小心点。和你爱的人说说话。问问自己,到底有没有人真的想要你在做的这个东西。如果诚实的答案是”它就是个给我自己用的工具”,那也没关系。我做过的一些最棒的东西,本来就只是给我自己的。
如果你确实想要受众,那就走 Gary Vaynerchuk【译注:知名营销人/创业者,长期布道”持续做内容、慢慢积累受众”的路径】一直为内容布道的那条路。你从某个地方起步,对着虚空发帖,盼着有一个人注意到。然后三个、十个、一百个,你一路做到上千。没人一上来就是上千。你搭的任何东西也一样。
技巧
- 歇一歇。去外面走走。
- 和你爱的人说说话。
- 做人们真正想要的东西,哪怕”人们”只是你自己。
22. 这篇文章就是这么写出来的
这是一个 Markdown 文件。Claude Code 跑在 cmux 里,我对着 Monologue 说话:”把’不用 IDE’那个开头进化一下”、”把’别读计划’那节写得更辣一点”、”加上特斯拉和 Instacart 的故事”。它重写,我反馈,然后它进 Proof 接受审阅。last30days 喂来新鲜素材。顺便说,这次没用 Zed【译注:Zed 是一款编辑器/IDE】。我不再用它了。不用 IDE。不手打代码。说话、规划、搭建。从一张桌子、一张沙发、一辆车、一片足球场边。
这就是我在六月所知道的一切:一个语音 App、一个计划文件插件、几处配置改动、一堆标签页、一台 Mac Mini、两台远程机器,以及一支能跑真实生活的 CLI 舰队。
技巧:复制这整篇文章,粘进你的智能体,让它把能搭的都搭起来。好事会降临到你的智能体工程工作流上。