侧边栏壁纸
  • 累计撰写 10 篇文章
  • 累计创建 19 个标签
  • 累计收到 4 条评论

从一行代码到整个项目,AI正在重新定义写代码这件事

janyxe
2026-04-26 / 0 评论 / 0 点赞 / 5 阅读 / 5,335 字
温馨提示:
本文最后更新于 2026-04-26,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

故事是这样的。

上周三晚上十一点,我还在公司加班,手头有个紧急的权限系统要改。本来想着随便写个中间件糊弄过去,结果鬼使神差地在Cursor里敲了句注释「实现一个带缓存的用户权限校验中间件」,然后按了Cmd+K。

十秒钟后,我愣住了。

不是因为它写对了代码,而是因为它同时改了三个文件。权限模型、中间件逻辑、还有对应的单元测试,全自动生成,连测试都跑过了。我扫了一眼diff,就改了俩变量名,测试全绿。

三年前我第一次用Copilot的时候,它只能补全当前行的代码,连隔壁文件里定义的函数都不认识。现在它已经能理解整个项目的结构,自己决定要改哪些文件,改完还能自己跑测试验证。

从「补全一行」到「改完整个项目」,AI Coding平台走了多远?这个赛道现在是什么格局?那些最聪明的人做了什么关键决策?以及,这一切会把我们这些写代码的人带向哪里?

我花了点时间把这件事从头到尾捋了一遍,今天跟大家聊聊。

规则时代:IntelliSense的点号补全

先把时间线拉回到九十年代。

微软在Visual Studio 5.0里塞了个叫IntelliSense的功能。你敲一个点号,弹出一个列表,显示当前对象的所有成员。就这么个东西,放在今天看来平淡无奇到不值一提,但它是代码补全这个品类的起点。

IntelliSense的原理极其朴素,解析代码的语法树,根据类型信息推导出当前上下文里有哪些可用的成员。它不需要任何「智能」,只需要编译器提供精确的类型信息。这种基于规则和类型系统的补全统治了IDE长达十五年,从Visual Studio到Eclipse到IntelliJ IDEA,每一代IDE都在补全的精确度上做文章,但底层逻辑没变过,它是一个确定性的查表过程,不是概率性的推断。

说白了,就是帮你查字典,不是帮你写文章。

统计时代:Kite的云端检索

然而,规则系统的能力天花板很快就显现出来了。

2013年前后有个叫Kite的创业公司想改变这个局面。Kite的思路是,既然本地类型信息有限,为什么不把整个互联网上的开源代码都拿来当参考?它通过云端索引海量的GitHub代码,当你在编辑器里敲代码时,从云端返回跟你当前上下文最相似的代码片段。

思路比IntelliSense前进了一步,从「语法正确的补全」到「别人写过的补全」,但说到底还是基于检索和模式匹配,没有真正的「理解」。

Kite在2022年关闭了。创始人Parth Doshi在告别信里写了一句话,「AI代码补全的市场已经被大模型彻底改变了,我们无法在新的范式下竞争。」

这句话像一枚时间胶囊,封存了一个时代的终结。

深度学习时代:Tabnine的预测式补全

真正的转折发生在2017年。两个以色列人Doron Somech和Eran Yahav创办了一家叫Codota的公司,同时推出了一个面向个人开发者的产品,Tabnine。

Tabnine做了一件之前没人做过的事,用深度学习模型替代规则引擎来做代码补全。它最初基于GPT-2的架构,在代码数据上做了微调。这是第一次有人把Transformer架构用于代码补全。

效果怎么样?说实话,一般。GPT-2只有1.5B参数,上下文窗口只有1024个token,代码补全的准确率远不如今天的工具。但Tabnine证明了一件事,代码补全可以从「查表」变成「预测」。模型不需要精确知道你的类型定义,它可以从上下文中「猜」出你接下来要写什么。

这个「猜」的过程,用更学术的话说,叫因果语言建模,给定前面的token序列,预测下一个token的概率分布。这个看似简单的目标,后来成了所有代码大模型的训练范式。

但Tabnine和Codota都面临同一个问题,模型太小,上下文太短,补全太浅。它们能预测你下一行写什么,但无法理解你整个函数的意图,更不用说理解整个项目的架构了。

这个瓶颈,要等到大模型时代才能突破。

大模型时代:Copilot与Cursor的代码生成

2020年6月,OpenAI发布了GPT-3。1750亿参数,在自然语言任务上展现了惊人的few-shot能力。但GPT-3发布时,很少有人注意到它在代码生成上的潜力,因为那不是它的设计目标。

转折发生在2021年。OpenAI的研究人员Mark Chen和团队做了一件事,把GPT-3在代码数据上继续训练。他们从GitHub上收集了5400万个公共代码仓库,筛选出包含Python、JavaScript、TypeScript等语言的代码,用这些数据对GPT-3进行continual pretraining。

结果出来了。这个被命名为Codex的模型,在代码生成任务上的表现远超GPT-3。他们同时提出了一个评估基准HumanEval,包含164个手写的Python编程题,每个题都有单元测试。Codex在HumanEval上的pass@1达到了28.8%,而GPT-3只有0%,GPT-3根本不会写代码。

28.8%这个数字在今天看来微不足道,但当时它意味着一件事,大模型可以写代码了。不是那种「补全一行」的写代码,而是「给你一个需求描述,生成一个完整函数」的写代码。

说到这里,有必要把大模型在AI Coding中扮演的角色讲清楚。

大语言模型是一个基于Transformer架构的神经网络,通过「预测下一个token」的方式在海量文本上训练。它不是数据库,不是搜索引擎,不是规则引擎,它是一个概率性的序列生成器。给它一段上下文,它能输出统计意义上最可能的后续序列。

这个特性在代码生成中恰好是优势而非劣势。因为代码虽然比自然语言更结构化,但同样存在大量的「模式」和「惯例」,一个排序函数大概率会用到比较操作,一个HTTP请求大概率会包含URL和请求方法。大模型通过训练学会了这些模式,在生成时能「猜」出符合惯例的代码。

但「猜」就是猜。大模型没有真正的「理解」,它不知道你的业务逻辑,不知道你的系统架构,甚至不知道它自己生成的代码能不能编译通过。这是AI Coding平台需要大量工程手段来弥补的根本缺陷。

Copilot的诞生与爆发

2021年6月29日,GitHub在官方博客上宣布了一个项目,GitHub Copilot技术预览版。这是OpenAI和GitHub的联合项目,底层模型就是Codex。

Copilot的诞生背后有一个关键的决策,为什么GitHub选择与OpenAI合作,而不是自己做?

答案在于路径依赖。GitHub在2020年被微软收购后,拥有了庞大的代码托管数据和开发者社区,但它没有AI研发能力。而OpenAI有最先进的代码模型,但缺乏分发渠道和用户场景。两者的结合是互补性的,OpenAI提供模型,GitHub提供场景和数据飞轮。

Copilot最初以VS Code扩展的形式发布,只支持补全功能。你敲代码的时候,它会以灰色幽灵文本的形式显示建议,按Tab键接受。这个交互范式,幽灵补全加Tab接受,后来成了整个行业的标准。

2022年6月Copilot正式发布,个人版定价$10/月。这个定价在当时引发了争议,「一个补全工具凭什么收钱?」但Copilot提供的远不止补全。它能根据注释生成函数体,能根据函数签名生成实现,能根据上下文推断你的意图。它不是IntelliSense那种「查表式补全」,而是「理解式补全」,虽然这个「理解」是统计意义上的。

Copilot发布后的增长速度超出所有人预期。到2022年底,已有超过100万开发者注册使用。

Cursor的颠覆性决策

然后2023年来了,AI Coding平台的「寒武纪大爆发」。

2月,一个叫Anysphere的创业公司发布了Cursor的公测版。Cursor做了一个极其大胆的决策,不做成VS Code插件,而是直接fork VS Code做一个独立IDE。

这个决策的逻辑是,VS Code的扩展API有根本性的限制,插件无法做到多文件同时编辑、无法在编辑器中内联显示diff、无法深度控制编辑器的渲染管线。要实现这些功能,必须改编辑器内核。

Cursor的创始人Michael Truell、Sualeh Asif、Arvid Lunnemark和Aman Sanger都是MIT的本科生或刚毕业的年轻人。他们选择fork VS Code而非从零构建编辑器,是因为VS Code已经拥有了庞大的扩展生态,用户迁移到Cursor后,原来的主题、快捷键、语言服务都能正常工作。

Cursor的杀手锏是Cmd+K,一个快捷键触发整个项目的代码生成。你不需要像Copilot那样边写边补全,而是直接描述你的需求,AI生成整个函数或文件。这个交互范式,后来被证明更适合复杂任务的代码生成。

Cursor的另一个关键决策是,底层模型不绑定OpenAI,而是支持多个模型提供商。最初支持GPT-4,后来陆续增加了Claude、Gemini等。这个决策让Cursor在模型选择上保持了灵活性,避免了被单一供应商锁定的风险。

Cursor的定价策略也很有意思,个人版免费,企业版收费。这个策略让它迅速获得了大量个人开发者用户,形成了社区效应。

到2023年底,Cursor的用户数突破了100万,成为Copilot最有力的竞争者。

智能体时代:Devin与Trae的自主编程

如果说Cursor代表了AI Coding平台的「寒武纪大爆发」,那么2024年3月发布的Devin则开启了「智能体时代」。

Devin是Cognition AI推出的AI工程师,号称能端到端地完成软件开发任务。你给它一个需求,它不仅能写代码,还能自己设置环境、运行测试、调试错误、部署上线。

Devin的底层技术是Agent架构,具体来说是ReAct(Reasoning and Acting)框架。模型在生成代码的同时,还会生成思考过程(Reasoning)和执行动作(Acting),比如「我需要先安装依赖」「这个函数需要测试」「这里有个bug需要修复」。

这种Agent架构让AI Coding平台从「代码生成器」变成了「虚拟工程师」。它不再是被动地响应你的指令,而是主动地规划、执行、验证整个开发流程。

Devin发布后引发了巨大的关注和争议。有人认为它代表了AI编程的未来,有人质疑它的实际效果和安全性。但无论如何,Devin证明了AI Coding平台可以做得比代码补全更多。

2024年8月,Cursor完成了A轮融资,a16z领投,$6000万,估值约$4亿。11月,Cursor又完成了B轮,$1亿,估值飙升至约$25亿。同月,Codeium完成了C轮$1.5亿融资,估值$12亿。Devin的母公司Cognition也完成了$1.75亿C轮融资,估值$20亿。

GitHub Copilot这边,到2024年底付费订阅用户约180万,企业客户约7.7万家。按ARPU估算,Copilot的年收入约$4-8亿美元。

2025年,Cursor完成了23亿美元的D轮融资,估值达到293亿美元。2026年初,GitHub Copilot付费用户已突破470万,覆盖90%的财富100强企业。Claude Code持续迭代,成为终端用户的首选。

国产力量的崛起:Trae与通义灵码

聊完国际玩家,必须把镜头转向国内。因为2025年的中国AI编程市场,正在发生一件很多人没注意到的事——本土工具正在快速崛起。

根据IDC 2025年的数据,中国AI编程工具市场规模达到45亿元,同比增长87%。市场份额排名显示:字节跳动的Trae以25%位居第一,GitHub Copilot28%第二,Cursor22%第三。

Trae是2025年1月字节跳动发布的AI原生IDE,核心策略是免费。个人版完全免费,无次数限制,核心功能全开放。它采用豆包1.5-Pro + DeepSeek R1/V3的双模型架构,月活超过160万,总用户突破600万。Trae对中文技术文档的理解准确率达到了92%,专门优化了中国主流技术栈的支持。Builder模式可以自然语言一键生成完整项目,3分钟出Demo。

通义灵码是阿里云推出的AI编程助手,基于自研的Qwen3模型(235B参数,MoE架构)。到2025年,通义灵码已服务超过百万开发者、上万家企业,开发者满意率87%。它的独特优势在于「工程记忆」——能够自动总结项目历史、技术栈和代码结构,形成对整个工程的宏观认知。2025年5月发布的2.5版本还新增了智能体模式,集成魔搭MCP广场3000+工具,可以端到端地完成编码任务。

百度文心快码基于文心大模型4.0,在代码生成准确率上达到78.3%,在HumanEval基准测试中超过GPT-4。智谱的CodeGeeX2在代码补全任务上表现出色,支持130多种编程语言。华为的盘古Coder在特定行业场景(如通信、金融)有优势。

但国产工具也有明显的短板。模型层的原创性不足——大多数国产工具的核心模型要么基于开源模型微调(如DeepSeek),要么在特定场景优化(如Qwen-Coder),在底层架构创新上还没有出现类似GPT-4或Claude的突破性模型。产品体验的精细度也有差距——Cursor的多文件编辑丝滑程度、Claude Code的终端交互自然度,国产工具还需要时间追赶。

不过,市场数据说明了一切。Trae用不到1年时间获取了160万月活用户,总用户突破600万,覆盖近200个国家和地区。当免费、中文、合规这三个因素叠加在一起,国产AI Coding工具的崛起几乎是必然的。

横纵交汇:你的优势就是你的陷阱

聊了这么多技术演进和市场格局,最后想聊聊一个更本质的问题:AI Coding平台的未来在哪里?

从技术角度看,AI Coding平台的核心矛盾是「理解深度」与「生成广度」的trade-off。模型越大,上下文越长,理解越深,但生成速度越慢,成本越高。如何在保持理解深度的同时提高生成效率,是所有平台都在探索的方向。

从市场角度看,AI Coding平台的核心矛盾是「免费策略」与「商业化路径」的trade-off。Trae的免费策略让它快速获得了用户,但如何在不伤害用户体验的前提下实现商业化,是一个巨大的挑战。Cursor的个人版免费企业版收费的模式看起来更可持续,但能否在激烈的竞争中保持优势,还有待观察。

从生态角度看,AI Coding平台的核心矛盾是「封闭生态」与「开放生态」的trade-off。GitHub Copilot依托GitHub的庞大生态,形成了强大的网络效应。Cursor通过支持多个模型提供商保持了开放性。Trae依托字节跳动的技术栈和用户基础,形成了独特的竞争优势。哪种生态策略更优,可能没有标准答案。

但我觉得,AI Coding平台最大的挑战不是技术,不是市场,不是生态,而是「信任」。

当AI生成的代码比例越来越高,当AI开始参与架构设计,当AI开始自主调试和部署,我们还能信任它吗?当AI犯了一个致命的错误,谁来负责?当AI「学会」了公司的核心业务逻辑,数据安全如何保障?

这些问题没有简单的答案,但它们决定了AI Coding平台能走多远。

结语

写代码这件事,正在被AI重新定义。

从IntelliSense的点号补全,到Copilot的代码生成,到Cursor的多文件编辑,到Devin的自主编程,再到Trae的中文优化,AI Coding平台用三十年时间走完了从「工具」到「伙伴」的进化。

这个过程不是线性的,而是跳跃的。每一次跳跃都伴随着技术的突破、商业模式的创新、用户习惯的改变。

但在这个过程中,有些东西没有变。代码仍然是人类思想的表达,软件仍然是解决现实问题的工具。AI可以帮我们写代码,但不能替我们思考。AI可以帮我们提高效率,但不能替我们做决策。

说到底,AI Coding平台的价值不在于它有多智能,而在于它能让多少人更轻松地表达自己的想法,解决自己的问题。

这或许就是技术进步的真正意义。

如果你觉得这篇文章对你有启发,欢迎在评论区聊聊你的想法。如果觉得有用,也欢迎分享给身边可能需要的朋友。

我是哲辰,一个对AI充满好奇的普通人。我们下次再见。


总结

如果本文对你们的开发之路有所帮助,请帮忙点个赞,您的支持是我坚持写博客的动力。

初次见面,也不知道送你们啥。干脆就送几百本电子书和最新面试资料,祝你们找到更好的工作。微信扫描下面公众号或微信搜索公众号 javaxe666
在这里插入图片描述
回复 电子书 送你 1000+ 本编程电子书;
回复 面试 获取 最新大厂面试题;
在这里插入图片描述

在这里插入图片描述

0

评论区