Skip to content

Thesis

digital-twin 的核心 thesis 是:

AI engineering 的下一层,不只是更强的模型,不只是更多 tool use,也不只是更完整的 harness,而是把一个人的长期工作方式外化成 agent 能继承、执行、修正、沉淀的系统。

1. Prompt Engineering 解决了什么

最早大家关注的是 prompt engineering。

这一步解决的是单次任务的表达问题:

  • 你想让模型干什么
  • 你希望它按什么结构输出
  • 你怎样减少歧义和幻觉

它非常重要,因为这是人和模型之间最基础的接口。

但它的局限也很明显:它主要优化的是当前这一轮。

2. Context / Tools 解决了什么

后来大家逐渐意识到,光有 prompt 不够。

如果模型看不到正确的资料,读不到文件,碰不到真实环境,它再聪明也只能停留在想象层。

所以大家开始做:

  • retrieval
  • tools
  • MCP
  • 文件系统访问
  • 外部 API 调用

这一步的本质,是让 AI 从“只能回答”变成“可以接触现实系统”。

3. Skills 解决了什么

再后来,大家开始把 prompt、模板、文档、工具用法、质量要求组合起来,做成 skill。

这一步解决的是复用问题:

  • 高频任务不必每次重讲
  • 一类工作可以有稳定套路
  • 团队或个人可以沉淀自己的方法论

skill 本质上是在说:好的 AI 使用方式,不应该只存在于某个人脑子里。

4. Harness Engineering 解决了什么

最近更进一步的趋势,是 harness engineering。

重点已经不再只是“怎么描述任务”,而是“怎么给 agent 一个能稳定工作的系统”。

这层会关心:

  • 执行环境
  • 权限边界
  • 状态管理
  • 计划和审查
  • 验证和反馈回路
  • 错误恢复

这一步非常关键,因为它让 agent 从 demo 走向 production。

5. 但还缺一层:Personalization Over Time

即使有了 skill 和 harness,大多数 agent 依然存在一个根本问题:

它们是通用的。

它们会做事,但不够“像一个具体的人在做事”。

具体表现在:

  • 它们每次都像第一次认识你
  • 它们不知道你过去已经形成了哪些判断
  • 它们不会天然遵守你的目录结构、写作声音、质量标准
  • 它们完成任务之后,往往也不会把经验变成下次直接可复用的资产

于是你会发现,AI 虽然越来越能干,但仍然不够复利。

6. 为什么 Digital Twin 值得存在

因为人的工作,本来就不是一次性的。

真正重要的工作,几乎都跨时间展开:

  • 写作会积累观点
  • 研究会积累判断框架
  • 网站会积累定位和表达方式
  • 知识库会积累概念和连接
  • 项目会积累规则、失败模式和 skip 条件

如果 AI 不能继承这些东西,它就只能在每一次任务里局部聪明,而不能在长期里越来越有用。

所以 digital twin 的 big why 是:

让 AI 不只是“完成任务”,而是“逐步进入一个人的长期工作系统,并且随着使用越来越贴近这个人的 operating model”。

7. Digital Twin 不是 Persona,而是 Operating Model

很多人一提到 digital twin,就容易想到角色扮演:

  • 说话像不像
  • 风格像不像
  • 人设像不像

这些都太表层了。

这里的 twin,更准确地说是一个 gradually externalized operating model:

  • 它知道先读什么
  • 它知道该调用哪类能力
  • 它知道结果应该写回哪里
  • 它知道哪些规则该沉淀下来
  • 它知道什么算“像这个人做出来的工作”

也就是说,它的“像”,来自工作痕迹,而不是语言模仿。

8. 这件事最有意思的地方

我觉得 digital twin 最有意思的点,不是它有拟人感,而是它让很多原本只存在于脑子里的东西,逐渐变成 agent 也能继承的结构。

比如:

  • 写作偏好可以变成 style guide
  • 命名习惯可以变成规则
  • 常见错误可以变成 skip condition
  • 研究方法可以变成 capability
  • 一次项目复盘可以变成下次默认动作

这很像是在把“个人方法论”从隐性知识,转成可执行系统。

9. 这个 Repo 公开的是什么

这个 repo 公开的不是个人隐私或私人知识库内容。

它公开的是方法:

  • 如何让 AI 先 retrieval 再行动
  • 如何把 skills 组织成面向个人工作流的能力层
  • 如何让 output 写回文件系统,而不是停在聊天里
  • 如何通过 learning loop 让 agent 逐步形成稳定方法
  • 如何让 personalization 来自长期积累,而不是一次性设定

10. 一句话总结

如果说:

  • prompt engineering 是在优化一次对话
  • skills 是在复用一类任务
  • harness engineering 是在构建 agent 的工作系统

那么 digital twin 想做的,就是:

构建一个会随着时间越来越像“这个人如何工作”的 agent operating layer。