harness.thinker

研究 Harness
而不只是用 Agent

我是刘维祺。7 年产品,近 1.5 年把多 Agent 系统跑进美团骑手招聘生产环境。我更在意一件事:用户通过什么「面」跟 Agent 协作,以及协作过程中能不能 steering。

生产 Agent
美团招聘全链路
Harness 实践
200+ CC sessions · OpenClaw
核心判断
人定目标函数,Agent 找路径

01 · thesis

IM 是被低估的
第五种 Harness Surface

为什么是现在

CLI、IDE、Web、Desktop 四种面,官方都在铺。但 IM 才是大多数人全天候在线的界面:移动优先、零安装、天然异步、每个对话框就是一个项目上下文。

这不是「做个聊天机器人」,而是把 队列、打断、流式编辑、多会话路由 当成 harness 的一等公民来设计。

我做过什么

  • feishu-bot:项目路由、连发 debounce、流式卡片、打断处理 — 跑了几个月的私人 harness 原型
  • interrupt & steering 深研:对照 Claude Code 官方文档 + GitHub issues,梳理 Enter 队列 vs Esc 硬中断 vs tool-boundary 注入
  • OpenClaw 生态:多模型网关、记忆分层、向 larksuite/openclaw-lark 提 PR
「人定目标函数,Agent 找路径。」

在美团「招聘小龙虾」里验证过:运营不再写 SOP、调参数,而是定义「什么是赢」— 约面、入职 — Agent 在闭环里自己探索策略。

02 · five surfaces

五种交互面,
一种产品判断

点选 surface,看各自的用户场景与 harness 设计要点。

CLI · 流式输入与 tool-boundary 注入

Claude Code CLI 用 stream-json 跑引擎。用户 Enter 排队、Esc 硬中断、消息在 tool call 之间注入 — 这是 steering 的参考实现。

  • Enter → queue,不中断当前 turn
  • Esc → cancel in-flight tool
  • Ctrl+C → 真中断 + 处理队列

IDE · 代码上下文即 harness

Cursor / VS Code 扩展把文件树、diff、terminal 绑进上下文。优势是代码级 grounding;挑战是多面板注意力与 long-horizon 任务的状态可见性。

Web · 最广的分发面

Kimi、Minimax 网页端、Honey 类产品的主战场。关键不是聊天框 UI,而是会话恢复、工具调用可视化、多模态输入是否让用户敢把长任务交出去。

Desktop · 系统级集成

全局快捷键、文件系统、通知中心。适合「随时打断、随时继续」的 power user — 但要解决权限与安全边界。

IM · 我押注的第五种面

飞书 / 微信 / Telegram — 用户本来就在这儿。每个群、每个私聊天然是一个 worktree。移动场景下的 long-horizon agent,IM 比 IDE 更现实。

  • 连发 debounce → 合并 steering 意图
  • post-then-edit 流式卡片 → 感知「Agent 还在想」
  • /project 路由 → 多项目并行不串台

→ 详见下方 Lab:feishu-bot

02b · steering lab

Harness 的隐形战场:
打断与转向

我深研过 Claude Code 的 interrupt 机制 — 这是 Kimi / DeepSeek / Honey 类产品 long-horizon 体验的分水岭。

simulate_turn
1tool: read_filedone
2tool: bash (running…)in-flight
3tool: writepending

Agent 正在执行 bash… 试试按 Enter 或 Esc。

软转向 · Enter 队列

消息不中断当前 tool call,在 tool-boundary 注入上下文。非破坏性纠偏 — CLI 已实现,Desktop 仍有 parity gap。

硬中断 · Esc 取消

立刻 cancel in-flight 动作,保留已完成的工作。适合「这条路完全错了」的场景。

产品启示

官方文档写「Enter 可随时打断」,实际行为是排队注入 — docs vs. implementation gap。Harness 产品要把 steering 语义设计清楚,否则用户会失去对 long-horizon 任务的信任。

→ IM 场景的等价物:连发 debounce + 流式卡片 post-then-edit

03 · production proof

不只写 harness,
也把它跑进生产

美团 · 骑手 AI 招聘 ROI 转正 · 扩量中

「招聘小龙虾」— 自进化 Agent + 多 Agent 全链路

作为产品负责人从 0 到 1:BOSS 插件 / 语音外呼 / 企微约面三段 Agent,把「1 专员 : 1 账号」升级为「1 专员 : N Agent」。上层叠加自进化 Agent — 读全量业务表、设计预测模型、批量回测、灰度上线,用约面/入职真实结果反哺策略。

~7×话术成功率
~6×圈选命中率
2条种子进化环路已上线
  • 圈选 Autoresearch(小时级) — 主 Agent 派子 Agent 并发探索特征 + SQL 回测
  • 话术 Prompt 进化(天级) — 冠军组 vs 实验组自动竞争,达标即灰度全量
  • AI-native 交付 — 运营后台 / 数据看板 / 迭代机制,Claude Code 一个人端到端交付,没走传统 PRD
→ 打开分享 Deck · deck.vickyv7.com
滴滴国际化

俄罗斯「时长买断」

计件→计时机制创新,运力 +10%,人均工时翻倍。同一套打法:深扎人群 → 机制重构 → 可验证结果。

度小满

信贷老客增长

等级会员 3.0,在贷率 +5%,客单 +71%。带 5 人小团队,负责制 + ROI 思维。

04 · builder lab

业余时间也在
造 harness

📬

Newsletter 双语日报

news.vickyv7.com · AI 资讯自动策展 + 部署流水线

🤝

接住 Catch

catch.vickyv7.com · 奇绩申请 demo,带访问监控

🦞

feishu-bot · IM Harness

私人飞书 Agent:/project 路由、debounce、流式卡片、打断 — 200+ sessions 迭代中

👆

Chwazi 手指选人

微信小程序已上架 · Claude Code 独立完成 0→上架

🐦

Mingle Bird

肩上 AI 小鸟 · 影石 Insta360 特别奖(黑客松)

GitHub · Vicky-v7

开源贡献与实验代码

05 · about

产品人,
也是 builder

南京大学信息管理本科(985/C9)。路径:网易严选 → 滴滴国际化 → 度小满 → 美团。横跨电商、出行、金融、本地生活,接手新业务能快速吃透并拿结果。

我不是科班工程师,但能用 Claude Code / Cursor / OpenClaw 独立交付可上线的产品。我相信下一波 AI 产品的分水岭,是谁真懂 harness — 而不只是谁模型更大。

  • 求职方向:AI Agent PM / Harness 产品 / AI-native PM
  • 微信同号:13776697994
  • 邮箱:[email protected]
发邮件给我