为什么是现在
CLI、IDE、Web、Desktop 四种面,官方都在铺。但 IM 才是大多数人全天候在线的界面:移动优先、零安装、天然异步、每个对话框就是一个项目上下文。
这不是「做个聊天机器人」,而是把 队列、打断、流式编辑、多会话路由 当成 harness 的一等公民来设计。
█ harness.thinker
我是刘维祺。7 年产品,近 1.5 年把多 Agent 系统跑进美团骑手招聘生产环境。我更在意一件事:用户通过什么「面」跟 Agent 协作,以及协作过程中能不能 steering。
01 · thesis
CLI、IDE、Web、Desktop 四种面,官方都在铺。但 IM 才是大多数人全天候在线的界面:移动优先、零安装、天然异步、每个对话框就是一个项目上下文。
这不是「做个聊天机器人」,而是把 队列、打断、流式编辑、多会话路由 当成 harness 的一等公民来设计。
「人定目标函数,Agent 找路径。」
在美团「招聘小龙虾」里验证过:运营不再写 SOP、调参数,而是定义「什么是赢」— 约面、入职 — Agent 在闭环里自己探索策略。
02 · five surfaces
点选 surface,看各自的用户场景与 harness 设计要点。
Claude Code CLI 用 stream-json 跑引擎。用户 Enter 排队、Esc 硬中断、消息在 tool call 之间注入 — 这是 steering 的参考实现。
Cursor / VS Code 扩展把文件树、diff、terminal 绑进上下文。优势是代码级 grounding;挑战是多面板注意力与 long-horizon 任务的状态可见性。
Kimi、Minimax 网页端、Honey 类产品的主战场。关键不是聊天框 UI,而是会话恢复、工具调用可视化、多模态输入是否让用户敢把长任务交出去。
全局快捷键、文件系统、通知中心。适合「随时打断、随时继续」的 power user — 但要解决权限与安全边界。
飞书 / 微信 / Telegram — 用户本来就在这儿。每个群、每个私聊天然是一个 worktree。移动场景下的 long-horizon agent,IM 比 IDE 更现实。
/project 路由 → 多项目并行不串台→ 详见下方 Lab:feishu-bot
02b · steering lab
我深研过 Claude Code 的 interrupt 机制 — 这是 Kimi / DeepSeek / Honey 类产品 long-horizon 体验的分水岭。
Agent 正在执行 bash… 试试按 Enter 或 Esc。
消息不中断当前 tool call,在 tool-boundary 注入上下文。非破坏性纠偏 — CLI 已实现,Desktop 仍有 parity gap。
立刻 cancel in-flight 动作,保留已完成的工作。适合「这条路完全错了」的场景。
官方文档写「Enter 可随时打断」,实际行为是排队注入 — docs vs. implementation gap。Harness 产品要把 steering 语义设计清楚,否则用户会失去对 long-horizon 任务的信任。
→ IM 场景的等价物:连发 debounce + 流式卡片 post-then-edit
03 · production proof
作为产品负责人从 0 到 1:BOSS 插件 / 语音外呼 / 企微约面三段 Agent,把「1 专员 : 1 账号」升级为「1 专员 : N Agent」。上层叠加自进化 Agent — 读全量业务表、设计预测模型、批量回测、灰度上线,用约面/入职真实结果反哺策略。
计件→计时机制创新,运力 +10%,人均工时翻倍。同一套打法:深扎人群 → 机制重构 → 可验证结果。
等级会员 3.0,在贷率 +5%,客单 +71%。带 5 人小团队,负责制 + ROI 思维。
04 · builder lab
news.vickyv7.com · AI 资讯自动策展 + 部署流水线
catch.vickyv7.com · 奇绩申请 demo,带访问监控
私人飞书 Agent:/project 路由、debounce、流式卡片、打断 — 200+ sessions 迭代中
微信小程序已上架 · Claude Code 独立完成 0→上架
肩上 AI 小鸟 · 影石 Insta360 特别奖(黑客松)
开源贡献与实验代码
05 · about
南京大学信息管理本科(985/C9)。路径:网易严选 → 滴滴国际化 → 度小满 → 美团。横跨电商、出行、金融、本地生活,接手新业务能快速吃透并拿结果。
我不是科班工程师,但能用 Claude Code / Cursor / OpenClaw 独立交付可上线的产品。我相信下一波 AI 产品的分水岭,是谁真懂 harness — 而不只是谁模型更大。