Mid-2025: Struggling with AI
本文最后更新于 2025年11月11日 下午
After intensive AI chats, I’ve stopped writing English blogs. The interactive grammar corrections during our conversations prove that dialogue-based learning trumps one-way content creation.
高强度 chat with AI 后发现没必要坚持写英文博客了,因为和 AI 用英文对话后,人家会用标准的语法重复整理一遍我的问题,有交互的学习比单方面的输出效果好多了。
现在时
现在是 2025年的7月, 号称当前最强代码大模型的 Claude 4 Opus 也已经上线了一个月,而我也高强度使用了两个月百度更早发布的 ERINE-4.5-Turbo-128K-Preview。
Claude 4 Opus
Claude 4 Opus 必须开启不计成本的 MAX Mode 才能使用,因此我只能用在新的小项目中,除非公司报销,但是众所周知我现在的公司是有相关自研的,因此报销是更不可能报销的。
震撼
去年半自动
在去年2024年底的时候,一次我有个需要在24h做一个前后端 + LLM chat 的任务,当时肯定是没有 DeepSeek, 用的哪个模型我已经记不得了,但是清楚的记得我是没有做完的,从零开始生成的代码总有点小问题,然后上去一调试半个小时一个小时就没有,整个只能叫脚手架半自动生成工具。
当前全自动
但是在 2025年中 的时候,Claude 4 很猛了,我试了一下 “失业程序员副业开发做应用三件套”:记账、todo list和番茄时钟的代码生成,不算思考和填写代码的时间,已经达到了分钟级,本来我还抱着还要亲自上去改的刻板印象,结果前后端代码是直接可以运行的!
这可以说是很震撼了,毕竟不是演示视频中那种小玩具,我看到生成出来的代码规模和架构已经可以当成完整的商业项目的 demo 了,这可是传统需要一个新手学习半年甚至更久的时间,只有自己亲眼看到才会有这种感觉。
期间只出现了一个跨域问题,而且都没有我去排查,直接就 fix 了,不禁逼着我想起当年学习的时候花了很多时间才能梳理相关的问题。
怯魅
通用知识集
但是话又说回来,AI 无法写出使用者和普遍知识并集以上水平的代码。
“失业程序员副业开发做应用三件套”这种设计已然是和 “外包公司商业代码模版” 一样成熟的套路。
特定领域
需求与 prompt
昨晚我让它生成我的一个需求: 在性能低下无法联网的电子书上生成一个 .js 的浏览器插件脚本,实现离线的词典划词翻译,对标欧路词典。
我尝试过这种不含技术细节,只描述的 prompt, 也试过 step by step 的指定技术栈甚至把离线词典文件都预先下载好了,让他用 js 解析的 prompt,但是很遗憾,这种小众需求它连理解都有非常大的困难。
分析与优化
在需求上,因为我常年从事的 web backend 相关开发,没有浏览器插件相关的开发经验,我特别好奇的是假如我把 好几个M 大小的文件打包或者说当成静态资源放到某个路径,浏览器是否或者说应该如何读取;
此外我还一直在问它,我这个需求是否有其他的实现方式,希望他能去帮我搜索一下;
最后我还亲自找了好几个 GitHub 上已经实现了的 js 或者 python 的离线划词或者词典工程,就让它照着参考如何解析词典文件。
斗智斗勇
但是以上前2点直接装死,不管我怎么问它都是在车轱辘话,我是不知道是训练模型的时候对我这种落后时代的离线小众需求不敏感,还是因为网上没有那么多现成的相应的实现导致它避重就轻,我个人是觉得我已经拆解描述清楚了,但是它就一直再演我,消极罢工。
对于第三点就更摸鱼了,即使我提供了参照的情况并且加了 “please check the download dictionary file, storge and cache complete and usable for js” 等等一大堆换着花样哄它的 prompt,并且也在一直强调和表述我的应用场景,我一直需要离线的。
最后它回馈我的描述词里面是清晰了写明了我的每一个需求点的,但是我最后看它生成出来的代码,里面还是有大量的 http 外部的请求;
于此同时,还会不厌其烦的自己去生成一个 all English to Chinese dictionary,根本看不到去 parse file 的代码片段。
斗智斗勇了一个晚上,我发现我的电纸书能装欧路词典,并且它会自动装浏览器划词翻译插件,只是不能用全局屏幕取词罢了。
结论
至少在 2025年总 我的感受是: 当前的 AI 能干掉很多通用领域的新手们了,但是资料少的特定领域还是只能当一个高级搜索引擎。
MCP
todo