从 ChatGPT 到 Agent 时代——一个工程师亲历的 AI 40 个月
两个世界
2022 年 11 月:ChatGPT 刚发布,大多数开发者的反应是"有意思,但不靠谱"。AI 写的代码十行里五行有 bug,没有人会把它放进生产环境。
2026 年 3 月:AI 每天贡献 GitHub 上约 13.5 万个 commit(占比 4%)。Cursor 2.0 支持 8 个并行 Agent 在独立 worktree 中工作。DeepSeek 的 API 成本是 GPT-4 的 1/20。开源模型在 Hugging Face 上累计下载超过 7 亿次。
40 个月。五个阶段。一场软件工程的范式转移。
这个系列是我对这 40 个月的个人记录——不是新闻综述,不是论文引用,而是一个每天都在用 AI 写代码、做架构、推动团队落地的工程师,亲历的五个阶段。
第一阶段:ChatGPT 震撼(2022.11 – 2023.06)
核心叙事:AI 从实验室走进大众视野。
2022 年 11 月 30 日,OpenAI 发布 ChatGPT。5 天 100 万用户,2 个月 1 亿用户——人类历史上增长最快的消费级应用。紧接着 2023 年 3 月,GPT-4 发布,在律师资格考试中拿到前 10% 的成绩,在编程竞赛中表现远超 GPT-3.5。
这个阶段的关键词是**"震撼"**。所有人都在问同一个问题:AI 真的要来了吗?
标志性事件:GPT-4 发布当天,整个科技圈的讨论从"AI 能不能用"变成了"AI 会不会取代我"。
第二阶段:开源觉醒(2023.07 – 2024.03)
核心叙事:闭源垄断被打破,AI 的权力开始去中心化。
2023 年 7 月,Meta 发布 LLaMA 2,以开源协议让任何人都能下载和部署大模型。Mistral 和 Mixtral 证明了小团队也能做出顶级模型。2023 年 11 月的 Sam Altman 被解雇事件暴露了 OpenAI 的治理危机,让行业意识到押注单一闭源公司的风险。与此同时,Google 推出 Gemini,Anthropic 发布 Claude 3——AI 市场从一家独大变成群雄逐鹿。
标志性事件:LLaMA 2 开源后的三个月内,基于它的社区微调模型超过 1000 个,开源 AI 生态正式成型。
第三阶段:多模态元年(2024.04 – 2024.12)
核心叙事:AI 从"能读文字"进化到"能看、能听、能说",编程模型迎来质变。
2024 年 5 月,GPT-4o 实现原生多模态——不是把语音转文字再处理,而是一个模型同时理解文本、图像和语音。同年 6 月,Claude 3.5 Sonnet 发布,在编程基准测试中大幅领先,成为开发者公认的最强编程模型。12 月,OpenAI 发布 o1 推理模型,首次引入"思考链"机制,在数学和复杂推理任务上实现飞跃。
标志性事件:Claude 3.5 Sonnet 让"AI 辅助编程"从"补全代码片段"升级到"理解整个代码库并给出架构级建议"。
第四阶段:推理革命与中国力量(2025.01 – 2025.09)
核心叙事:中国开源模型以十分之一的成本达到了前沿水平,全球 AI 格局被重写。
2025 年 1 月,DeepSeek 发布 R1 推理模型——训练成本约 600 万美元,性能对标 OpenAI o1,全部开源。硅谷震动。Qwen 系列以 Apache 2.0 协议发布,支持 201 种语言,在 Hugging Face 上累计下载量全球第一。开源 vs 闭源的格局从"开源追赶"变成了"开源平替甚至反超"。
标志性事件:DeepSeek R1 发布当天,OpenAI 市值蒸发数百亿美元,硅谷第一次认真对待来自中国的 AI 竞争。
第五阶段:Agent 时代(2025.10 – 2026.03)
核心叙事:AI 从"辅助工具"变成"自主执行者",软件工程进入人机协作新范式。
Claude Code 实现了一个 while 循环驱动的自主 Agent 架构——调模型、执行工具、循环,没有复杂编排。Cursor 2.0 支持最多 8 个并行 Agent,每个在独立 git worktree 中操作。AI 每天贡献 GitHub 上约 4% 的公开 commit(约 13.5 万个),预计到年底超过 20%。与此同时,技术民族主义持续升温——芯片出口管制、API 封锁、云算力管控,AI 成为全球权力博弈的核心战场。
标志性事件:当 AI 从"帮你写代码"变成"替你提 commit",软件工程师的工作定义正在被重写。
为什么写这个系列
这不是一份行业报告,也不是一篇新闻综述。
这是一个工程师的个人记录。我在这 40 个月里,从最初对 ChatGPT 的好奇,到把 AI 融入每天的编程工作流,到读完 Claude Code 的全部源码,到推动团队的 AI 工程化落地。我经历了模型从"玩具"到"工具"到"同事"的完整进化。
写这个系列,是因为变化太快了。快到很多人已经忘记 2023 年初 AI 还不能稳定写出一个排序函数。快到 2024 年的热门模型在 2025 年就已经过时。快到你不记录下来,就会觉得一切理所当然。
每一篇深度回顾都围绕三个问题展开:
- 发生了什么 — 关键事件、发布、数据
- 为什么重要 — 这个变化对软件工程意味着什么
- 我的实际体感 — 作为一个每天用 AI 的工程师,我真实的工作流变化
如果你和我一样,是一个正在被 AI 改变工作方式的工程师——这个系列是写给你的。
作者:Steven Chou · GitHub · X @StevenChouAI