Table of Contents

前言
#

假名私塾(kana juku)是我第一个制作及上架的 app，

心得比较有完整的来龙去脉，

本系列包括制作的过程，使用 AI 辅助及变化、使用公开语料与版权等等…

其他 app 有值得一提的点也会另外刊登。

本篇主要讲**[25 年第四季]** 开始从聊天机器人到 agent 的转变过程，

相关产品变化很快，重要时间点直接很生硬的标注了。

App 简介
#

有 apple device 的朋友可以下载来玩看看，

后面应该会有几篇也是用这个当例子：

整理 ETL 语料、apple create ML、pytorch、voicevox、手机本地大语言模型等等…

假名私塾: URL

开发时间轴
#

动机
#

我跟家人都有兴趣学日语，很久以前就想要完全符合自己需求的日语学习 app。

家人的痛点是不会英文，看不懂大部分教材跟其他 app 的罗马拼音。

我自己则是很想要假名可以跟字源对照(例如"あ"的字源为"安")，

然后痛点是安装系统安装日文键盘偶尔会用到，但是每天打字切换输入法都被干扰，要多跳过一次日文的键盘。

前期准备
#

[24 年第四季]

这段时间换工作不用上班，因此有时间看 Udemy 的课程，因为接触过 javascript 所以先看的 reactjs & expo。

这时候就是跟着上课内容做很简单的网页式内容，以及多一些 GPS、相机控制、抓取远端数据之类的，

但是非苹果自家生态，需要额外管理很多东西。

[25 年第一季]

犹豫很久买了 mac mini 之后就完全改用苹果自家的 swiftUI，也是找 Udemy 的课程来看，

时间主要花在熟悉基本 UI 原件以及布局，还有所有基本功能数据持久化、抓取数据、导入地图等在 swiftUI 对应的写法。

swiftUI 比较现代也不像 UIkit 跟 xcode 完全绑定，但是也比较难预期 swifiUI 的布局最后长相，一开始很在意花很多时间尝试。

[25 年第三季]

因为平常要上班只有晚上可以写，也不是每天都有空，所以进度很慢，就是把基本的雏形做出来，把日文的数据塞进去。

第一个 app 比较难预期后面的长相，所以经常修改，或是确定要用到的部分跑回去仔细看视频，大致上是在交学费的状态。

到这时候包括**[24 年第一季]**开始，其实单纯 chatpgt 那种聊天机器人就对写程序有很大的帮助了，

但是复制粘贴以及解释一大堆背景非常花时间，结果往往不是一次过又或者方向偏差，

又要回到复制粘贴的步骤，难以进入正向循环，只能作为学习参考。

这时候最流行的其实是 cursor 编辑器，使用 tab 键自动补全，但是因为用量有限需要订阅，所以没有尝试。

同时 claude 也已经是因为写程序表现最好开始流行，并且推出了 claude code 在本机电脑上执行的 ai agent，但是因为需要订阅所有没有尝试。

转向 AI 代理
#

[25 年第四季]

这时我预期我最多只会同时只会订阅一个聊天机器人，并且刚从 chatgpt 转到 google gemini，

此时因为 Spec-Driven Development (SDD) 很红，gemini 也推出对标 claude code 的 agent: gemni cli，所以我终于尝试了。

我发现 agent 省去复制粘贴的步骤效率大幅提升，以及修改后贴回去找要修改哪几行的步骤也不用了。

这时我已经确信写程序应该使用 agent 而不是 chatbot，所以又跑去订阅 claude 使用 claude code(以下简称 CC)。

CC 的模型能力的确比较强，对于对话的理解与执行符合预期的概率已经很高。

操作电脑与 opus4.5
#

有一次我 mac mini 硬盘爆满无法使用，我直接问 CC 怎么办？就像我在聊天机器人的网页那样问。

CC 直接给出具体的方案：可以清除哪些目录、哪些搬移到外接硬盘等等…

我担心他把电脑搞坏，所以一步步允许他操作，最后全部都顺利完成了。

我对麦金塔还有 xcode 编译环境不熟，这时我发现 AI 对所有事情包括我不熟悉的都有八十分以上的理解，并且会写程序大约等于会操控电脑。

因为 CC 可以直接操作电脑，他自由的在目录之间穿梭，写完程序自己看到错误，再自己修复，完全进入正向循环。

使用 agent 的开发速度不可同日而语，并且让我晚三个月才开始改用 CC 的显得十分无知。

这在主客观的时间浪费都是非常可观的，

主观上如果及早采用最新的工具，前三个月的工作量完全两到三周就可以完成。

客观上使用最新工具的其他人，效率比你高也比你更早推出产品。

我前面的没有尝试，省去了半个或一个小时的时间，省去了几百块的订阅，但反而浪费大把人生。

这也许也是现在许多人热衷追逐 AI 最新产品消息的原因，

至少我是这样，我不得不一直关注最新产品，做时间管理的风险对冲。

[2025 年 11 月 24 日]

opus4.5 释出。opus 是 claude 收费最高的旗舰模型，此时 4.5 释出，

相比前一代它除了各方面性能显著提升，差别最大的是他对于意图的理解。

旧版只是指哪打哪(实际上也已经很不错了)，从 4.5 版开始，他收到你的需求后，会先做一定程度的总结跟规划，用人格套用的话就是，更机灵更有经验了。

不用再很具体的说哪个文件要怎么修改，只需要像主管或老板描述最终需求，他就会展开并规划下一两个步骤的事。

这种规划的能力对效率的提升又更大了，前面说过 AI 对所有事情都知道八成以上，他会主动做下一两步的工作，并且做好。

搭配这点大幅增加抽象的程度，更多东西外包给了 CC，逐渐的开始不用自己查看跟修改代码了。

自从 opus4.5 问世后，社交媒体对于 AI 写程序的争论到此结束，

对于对于全职软件工程师跟高手们，我无法想象，

至少跟我自己比较，原本自己花一两年做得到的事情，变成两三个月内完成，

成品停留在我认知边界往外扩散一些，我反而是最大的瓶颈所在。

此篇完

前言#

App 简介#

开发时间轴#

动机#

前期准备#

转向 AI 代理#

操作电脑与 opus4.5#