前言#
假名私塾(kana juku)是我第一个制作及上架的 app,
心得比较有完整的来龙去脉,
本系列包括制作的过程,使用 AI 辅助及变化、使用公开语料与版权等等…
其他 app 有值得一提的点也会另外刊登。
本篇主要讲**[25 年第四季]** 开始从聊天机器人到 agent 的转变过程,
相关产品变化很快,重要时间点直接很生硬的标注了。
App 简介#
有 apple device 的朋友可以下载来玩看看,
后面应该会有几篇也是用这个当例子:
整理 ETL 语料、apple create ML、pytorch、voicevox、手机本地大语言模型等等…
假名私塾: URL
开发时间轴#
动机#
我跟家人都有兴趣学日语,很久以前就想要完全符合自己需求的日语学习 app。
家人的痛点是不会英文,看不懂大部分教材跟其他 app 的罗马拼音。
我自己则是很想要假名可以跟字源对照(例如"あ"的字源为"安"),
然后痛点是安装系统安装日文键盘偶尔会用到,但是每天打字切换输入法都被干扰,要多跳过一次日文的键盘。
前期准备#
[24 年第四季]
这段时间换工作不用上班,因此有时间看 Udemy 的课程,因为接触过 javascript 所以先看的 reactjs & expo。
这时候就是跟着上课内容做很简单的网页式内容,以及多一些 GPS、相机控制、抓取远端数据之类的,
但是非苹果自家生态,需要额外管理很多东西。
[25 年第一季]
犹豫很久买了 mac mini 之后就完全改用苹果自家的 swiftUI,也是找 Udemy 的课程来看,
时间主要花在熟悉基本 UI 原件以及布局,还有所有基本功能数据持久化、抓取数据、导入地图等在 swiftUI 对应的写法。
swiftUI 比较现代也不像 UIkit 跟 xcode 完全绑定,但是也比较难预期 swifiUI 的布局最后长相,一开始很在意花很多时间尝试。
[25 年第三季]
因为平常要上班只有晚上可以写,也不是每天都有空,所以进度很慢,就是把基本的雏形做出来,把日文的数据塞进去。
第一个 app 比较难预期后面的长相,所以经常修改,或是确定要用到的部分跑回去仔细看视频,大致上是在交学费的状态。
到这时候包括**[24 年第一季]**开始,其实单纯 chatpgt 那种聊天机器人就对写程序有很大的帮助了,
但是复制粘贴以及解释一大堆背景非常花时间,结果往往不是一次过又或者方向偏差,
又要回到复制粘贴的步骤,难以进入正向循环,只能作为学习参考。
这时候最流行的其实是 cursor 编辑器,使用 tab 键自动补全,但是因为用量有限需要订阅,所以没有尝试。
同时 claude 也已经是因为写程序表现最好开始流行,并且推出了 claude code 在本机电脑上执行的 ai agent,但是因为需要订阅所有没有尝试。
转向 AI 代理#
[25 年第四季]
这时我预期我最多只会同时只会订阅一个聊天机器人,并且刚从 chatgpt 转到 google gemini,
此时因为 Spec-Driven Development (SDD) 很红,gemini 也推出对标 claude code 的 agent: gemni cli,所以我终于尝试了。
我发现 agent 省去复制粘贴的步骤效率大幅提升,以及修改后贴回去找要修改哪几行的步骤也不用了。
这时我已经确信写程序应该使用 agent 而不是 chatbot,所以又跑去订阅 claude 使用 claude code(以下简称 CC)。
CC 的模型能力的确比较强,对于对话的理解与执行符合预期的概率已经很高。
操作电脑与 opus4.5#
有一次我 mac mini 硬盘爆满无法使用,我直接问 CC 怎么办?就像我在聊天机器人的网页那样问。
CC 直接给出具体的方案:可以清除哪些目录、哪些搬移到外接硬盘等等…
我担心他把电脑搞坏,所以一步步允许他操作,最后全部都顺利完成了。
我对麦金塔还有 xcode 编译环境不熟,这时我发现 AI 对所有事情包括我不熟悉的都有八十分以上的理解,并且会写程序大约等于会操控电脑。
因为 CC 可以直接操作电脑,他自由的在目录之间穿梭,写完程序自己看到错误,再自己修复,完全进入正向循环。
使用 agent 的开发速度不可同日而语,并且让我晚三个月才开始改用 CC 的显得十分无知。
这在主客观的时间浪费都是非常可观的,
主观上如果及早采用最新的工具,前三个月的工作量完全两到三周就可以完成。
客观上使用最新工具的其他人,效率比你高也比你更早推出产品。
我前面的没有尝试,省去了半个或一个小时的时间,省去了几百块的订阅,但反而浪费大把人生。
这也许也是现在许多人热衷追逐 AI 最新产品消息的原因,
至少我是这样,我不得不一直关注最新产品,做时间管理的风险对冲。
[2025 年 11 月 24 日]
opus4.5 释出。opus 是 claude 收费最高的旗舰模型,此时 4.5 释出,
相比前一代它除了各方面性能显著提升,差别最大的是他对于意图的理解。
旧版只是指哪打哪(实际上也已经很不错了),从 4.5 版开始,他收到你的需求后,会先做一定程度的总结跟规划,用人格套用的话就是,更机灵更有经验了。
不用再很具体的说哪个文件要怎么修改,只需要像主管或老板描述最终需求,他就会展开并规划下一两个步骤的事。
这种规划的能力对效率的提升又更大了,前面说过 AI 对所有事情都知道八成以上,他会主动做下一两步的工作,并且做好。
搭配这点大幅增加抽象的程度,更多东西外包给了 CC,逐渐的开始不用自己查看跟修改代码了。
自从 opus4.5 问世后,社交媒体对于 AI 写程序的争论到此结束,
对于对于全职软件工程师跟高手们,我无法想象,
至少跟我自己比较,原本自己花一两年做得到的事情,变成两三个月内完成,
成品停留在我认知边界往外扩散一些,我反而是最大的瓶颈所在。
此篇完
