初试AI-加班没技术-跑路准备中
本文最后更新于 2025年7月15日 晚上
After intensive AI chats, I’ve stopped writing English blogs. The interactive grammar corrections during our conversations prove that dialogue-based learning trumps one-way content creation.
高强度 chat with AI 后发现没必要坚持写英文博客了,因为和 AI 用英文对话后,人家会用标准的语法重复整理一遍我的问题,有交互的学习比单方面的输出效果好多了。
2026-05-08 update: 当时我还没有习惯使用 Agent Coding Workflow,倒是熟悉在 Chat 中得到代码然后粘贴回去。
后来慢慢开始使用 Cursor 和百度内部 zulu (文心快码自动编程智能体),还是经过了一段时间的实践才开始入门。
说实话,在这个没有门槛的过程中,还是经历了特别多迷茫和怀疑自己的时候,尤其是当时在百度经历了小半年的 On call 24小时 打电话当客服,说实话已经基本丧失了探索边界甚至是学习的能力了。
现在时
现在是 2025年的7月, 号称当前最强代码大模型的 Claude 4 Opus 也已经上线了一个月,而我也高强度使用了两个月百度更早发布的 ERINE-4.5-Turbo-128K-Preview。
2026-05-08 update: 那个时候特别像刚工作在一个没有章法的草台班子里面仰望正规公司,总是雾里看花,却连尝试的勇气的提不起来,现在看来确实是很可笑,所谓 “困境” 的 “困”,正是于此。
而且进百度之后,发现自己就是一个答疑摇人客服,完全得不到业务上的锻炼,更别提技术提升。持续的睡眠不足和工作压力也早就榨干了人生所有的精力,未来也堵死了。
Claude 4 Opus
Claude 4 Opus 必须开启不计成本的 MAX Mode 才能使用,因此我只能用在新的小项目中,除非公司报销,但是众所周知我现在的公司是有相关自研的,因此报销是更不可能报销的。
2026-05-08 update: 上下文:
- 并非开发岗,自然没有机会锻炼 AI coding;
- 参加了一个做 AI浏览器 的面试,前期被看好,却因为没有 AI coding 的经验,相关概念也不熟悉,被质疑学习能力,说 “应该总结最强的 模型 的能力,而不是困在不够好用的工具上”;
- 【扩宽视野】还介绍了最强的 Claude 模型,和 “你知不知道现在 Cursor 能把你全部的代码放到上下文了!”
当时觉得这种概念是很神圣的,甚至产生了 “羡慕他们真懂” 的想法,这种事情在我不同的,人生学新东西的阶段,出现过好几次了。
后来我到了那个创业公司深度使用 Cursor, 加上现在这半年享受了不限量的最强模型(比如能第二时间用上 GPT-5.5 + Claude Opus 4.7)之后会看,所以说知识一定要常看常新。
这里提到的 MAX Mode 实际上就是 Cursor 自己的一个商品上的权限开关,开了之后就能把更多的 Project 内容塞到上下文,直到很激进的达到所选择模型的 MAX Context Windows 为止,就这么一句话。
这是由于 Cursor 的模型也是他提供的,计费也是自己算的,自然会提供不同的 Token 消费级别,而我现在更习惯用的 Goose、Hermes 这种开源 Agent 本身是不提供模型,自然不会计费,所以没有这个开关,不过当然也会有自己的管理机制这里不展开。
而 Opus 这个问题就很值得说了,我也是来了现在这个公司才开始深度使用,才能体会到其中一些精妙之处,这个甚至可以引申到为什么家里条件好的人普遍会混得更好一样,就是单纯的机会更多罢了,还是不展开了。
震撼
去年半自动
在去年2024年底的时候,一次我有个需要在24h做一个前后端 + LLM chat 的任务,当时肯定是没有 DeepSeek, 用的哪个模型我已经记不得了,但是清楚的记得我是没有做完的,从零开始生成的代码总有点小问题,然后上去一调试半个小时一个小时就没有,整个只能叫脚手架半自动生成工具。
2026-05-08 update: 那个时候还会有很多所谓的 “硅谷回国创业公司” 的面试,然后做各种 Homework。现在真的是第一次有了想在一个公司安稳的想法了,工作快9年了,这是真的第一次。 但如果不幸真的又被裁了的话,可能就只会看失之交臂的英伟达了吧,所以学习更不能断。
当前全自动
但是在 2025年中 的时候,Claude 4 很猛了,我试了一下 “失业程序员副业开发做应用三件套”:记账、todo list和番茄时钟的代码生成,不算思考和填写代码的时间,已经达到了分钟级,本来我还抱着还要亲自上去改的刻板印象,结果前后端代码是直接可以运行的!
这可以说是很震撼了,毕竟不是演示视频中那种小玩具,我看到生成出来的代码规模和架构已经可以当成完整的商业项目的 demo 了,这可是传统需要一个新手学习半年甚至更久的时间,只有自己亲眼看到才会有这种感觉。
期间只出现了一个跨域问题,而且都没有我去排查,直接就 fix 了,不禁逼着我想起当年学习的时候花了很多时间才能梳理相关的问题。
怯魅
通用知识集
但是话又说回来,AI 无法写出使用者和普遍知识并集以上水平的代码。
“失业程序员副业开发做应用三件套”这种设计已然是和 “外包公司商业代码模版” 一样成熟的套路。
特定领域
需求与 prompt
昨晚我让它生成我的一个需求: 在性能低下无法联网的电子书上生成一个 .js 的浏览器插件脚本,实现离线的词典划词翻译,对标欧路词典。
我尝试过这种不含技术细节,只描述的 prompt, 也试过 step by step 的指定技术栈甚至把离线词典文件都预先下载好了,让他用 js 解析的 prompt,但是很遗憾,这种小众需求它连理解都有非常大的困难。
2026-05-08 update: 我那个时候根本不知道什么叫做自注意力机制,还处于不断许愿的状态,更别提 sepc 和边界的概念了。
主要还是市场需要的技术能力其实并不高,很多像我这样的人就浑水摸鱼地浑浑噩噩地干了很多年直到再也没有工作。
分析与优化
在需求上,因为我常年从事的 web backend 相关开发,没有浏览器插件相关的开发经验,我特别好奇的是假如我把 好几个M 大小的文件打包或者说当成静态资源放到某个路径,浏览器是否或者说应该如何读取;
此外我还一直在问它,我这个需求是否有其他的实现方式,希望他能去帮我搜索一下;
最后我还亲自找了好几个 GitHub 上已经实现了的 js 或者 python 的离线划词或者词典工程,就让它照着参考如何解析词典文件。
斗智斗勇
但是以上前2点直接装死,不管我怎么问它都是在车轱辘话,我是不知道是训练模型的时候对我这种落后时代的离线小众需求不敏感,还是因为网上没有那么多现成的相应的实现导致它避重就轻,我个人是觉得我已经拆解描述清楚了,但是它就一直再演我,消极罢工。
对于第三点就更摸鱼了,即使我提供了参照的情况并且加了 “please check the download dictionary file, storge and cache complete and usable for js” 等等一大堆换着花样哄它的 prompt,并且也在一直强调和表述我的应用场景,我一直需要离线的。
最后它回馈我的描述词里面是清晰了写明了我的每一个需求点的,但是我最后看它生成出来的代码,里面还是有大量的 http 外部的请求;
于此同时,还会不厌其烦的自己去生成一个 all English to Chinese dictionary,根本看不到去 parse file 的代码片段。
斗智斗勇了一个晚上,我发现我的电纸书能装欧路词典,并且它会自动装浏览器划词翻译插件,只是不能用全局屏幕取词罢了。
结论
至少在 2025年总 我的感受是: 当前的 AI 能干掉很多通用领域的新手们了,但是资料少的特定领域还是只能当一个高级搜索引擎。
2026-05-08 update: 实践一年后,尤其是看了一些原理后对这个场景理解更深刻了,信息熵是不能消失的,只能从一个地方转移到另一个地方,所有问题的根源甚至来源于自然语言本身就是充满歧义,无法清晰描述的,没有银弹。
其实一切的工程最重要的是理清需求,其次是技术选型,在学有余力的情况下再结合原理进行分析。
后来我也面试了不少候选人,其实无非看重的就是是不是真的扎实的做过事情,再加上有没有对中间的实现进行过深入思考。
说起来轻飘飘的两句话,越是深入理解,越发现坚持不易,值得我一生去实践。