Thesis
digital-twin 的核心 thesis 是:
AI engineering 的下一层,不只是更强的模型,不只是更多 tool use,也不只是更完整的 harness,而是把一个人的长期工作方式外化成 agent 能继承、执行、修正、沉淀的系统。
1. Prompt Engineering 解决了什么
最早大家关注的是 prompt engineering。
这一步解决的是单次任务的表达问题:
- 你想让模型干什么
- 你希望它按什么结构输出
- 你怎样减少歧义和幻觉
它非常重要,因为这是人和模型之间最基础的接口。
但它的局限也很明显:它主要优化的是当前这一轮。
2. Context / Tools 解决了什么
后来大家逐渐意识到,光有 prompt 不够。
如果模型看不到正确的资料,读不到文件,碰不到真实环境,它再聪明也只能停留在想象层。
所以大家开始做:
- retrieval
- tools
- MCP
- 文件系统访问
- 外部 API 调用
这一步的本质,是让 AI 从“只能回答”变成“可以接触现实系统”。
3. Skills 解决了什么
再后来,大家开始把 prompt、模板、文档、工具用法、质量要求组合起来,做成 skill。
这一步解决的是复用问题:
- 高频任务不必每次重讲
- 一类工作可以有稳定套路
- 团队或个人可以沉淀自己的方法论
skill 本质上是在说:好的 AI 使用方式,不应该只存在于某个人脑子里。
4. Harness Engineering 解决了什么
最近更进一步的趋势,是 harness engineering。
重点已经不再只是“怎么描述任务”,而是“怎么给 agent 一个能稳定工作的系统”。
这层会关心:
- 执行环境
- 权限边界
- 状态管理
- 计划和审查
- 验证和反馈回路
- 错误恢复
这一步非常关键,因为它让 agent 从 demo 走向 production。
5. 但还缺一层:Personalization Over Time
即使有了 skill 和 harness,大多数 agent 依然存在一个根本问题:
它们是通用的。
它们会做事,但不够“像一个具体的人在做事”。
具体表现在:
- 它们每次都像第一次认识你
- 它们不知道你过去已经形成了哪些判断
- 它们不会天然遵守你的目录结构、写作声音、质量标准
- 它们完成任务之后,往往也不会把经验变成下次直接可复用的资产
于是你会发现,AI 虽然越来越能干,但仍然不够复利。
6. 为什么 Digital Twin 值得存在
因为人的工作,本来就不是一次性的。
真正重要的工作,几乎都跨时间展开:
- 写作会积累观点
- 研究会积累判断框架
- 网站会积累定位和表达方式
- 知识库会积累概念和连接
- 项目会积累规则、失败模式和 skip 条件
如果 AI 不能继承这些东西,它就只能在每一次任务里局部聪明,而不能在长期里越来越有用。
所以 digital twin 的 big why 是:
让 AI 不只是“完成任务”,而是“逐步进入一个人的长期工作系统,并且随着使用越来越贴近这个人的 operating model”。
7. Digital Twin 不是 Persona,而是 Operating Model
很多人一提到 digital twin,就容易想到角色扮演:
- 说话像不像
- 风格像不像
- 人设像不像
这些都太表层了。
这里的 twin,更准确地说是一个 gradually externalized operating model:
- 它知道先读什么
- 它知道该调用哪类能力
- 它知道结果应该写回哪里
- 它知道哪些规则该沉淀下来
- 它知道什么算“像这个人做出来的工作”
也就是说,它的“像”,来自工作痕迹,而不是语言模仿。
8. 这件事最有意思的地方
我觉得 digital twin 最有意思的点,不是它有拟人感,而是它让很多原本只存在于脑子里的东西,逐渐变成 agent 也能继承的结构。
比如:
- 写作偏好可以变成 style guide
- 命名习惯可以变成规则
- 常见错误可以变成 skip condition
- 研究方法可以变成 capability
- 一次项目复盘可以变成下次默认动作
这很像是在把“个人方法论”从隐性知识,转成可执行系统。
9. 这个 Repo 公开的是什么
这个 repo 公开的不是个人隐私或私人知识库内容。
它公开的是方法:
- 如何让 AI 先 retrieval 再行动
- 如何把 skills 组织成面向个人工作流的能力层
- 如何让 output 写回文件系统,而不是停在聊天里
- 如何通过 learning loop 让 agent 逐步形成稳定方法
- 如何让 personalization 来自长期积累,而不是一次性设定
10. 一句话总结
如果说:
- prompt engineering 是在优化一次对话
- skills 是在复用一类任务
- harness engineering 是在构建 agent 的工作系统
那么 digital twin 想做的,就是:
构建一个会随着时间越来越像“这个人如何工作”的 agent operating layer。