快轉到主要內容
  1. 博客/

假名私塾开发笔记(一):从聊天机器人到 AI 代理

QQder 核舟记部落格
作者
QQder 核舟记部落格
这里有八款 iOS App,全部免费、无广告、无追踪——直接挑一款来用。同时记录一个文科背景的系统管理员,如何靠 AI vibe coding 从零把想法做进 App Store。

前言
#

假名私塾(kana juku)是我第一个制作及上架的 app,

心得比较有完整的来龙去脉,

本系列包括制作的过程,使用 AI 辅助及变化、使用公开语料与版权等等…

其他 app 有值得一提的点也会另外刊登。

本篇主要讲**[25 年第四季]** 开始从聊天机器人到 agent 的转变过程,

相关产品变化很快,重要时间点直接很生硬的标注了。

App 简介
#

有 apple device 的朋友可以下载来玩看看,

后面应该会有几篇也是用这个当例子:

整理 ETL 语料apple create MLpytorchvoicevox、手机本地大语言模型等等…

假名私塾: URL


开发时间轴
#

动机
#

我跟家人都有兴趣学日语,很久以前就想要完全符合自己需求的日语学习 app。

家人的痛点是不会英文,看不懂大部分教材跟其他 app 的罗马拼音。

我自己则是很想要假名可以跟字源对照(例如"あ"的字源为"安"),

然后痛点是安装系统安装日文键盘偶尔会用到,但是每天打字切换输入法都被干扰,要多跳过一次日文的键盘。

前期准备
#

[24 年第四季]

这段时间换工作不用上班,因此有时间看 Udemy 的课程,因为接触过 javascript 所以先看的 reactjs & expo

这时候就是跟着上课内容做很简单的网页式内容,以及多一些 GPS、相机控制、抓取远端数据之类的,

但是非苹果自家生态,需要额外管理很多东西。

[25 年第一季]

犹豫很久买了 mac mini 之后就完全改用苹果自家的 swiftUI,也是找 Udemy 的课程来看,

时间主要花在熟悉基本 UI 原件以及布局,还有所有基本功能数据持久化、抓取数据、导入地图等在 swiftUI 对应的写法。

swiftUI 比较现代也不像 UIkit 跟 xcode 完全绑定,但是也比较难预期 swifiUI 的布局最后长相,一开始很在意花很多时间尝试。

[25 年第三季]

因为平常要上班只有晚上可以写,也不是每天都有空,所以进度很慢,就是把基本的雏形做出来,把日文的数据塞进去。

第一个 app 比较难预期后面的长相,所以经常修改,或是确定要用到的部分跑回去仔细看视频,大致上是在交学费的状态。

到这时候包括**[24 年第一季]**开始,其实单纯 chatpgt 那种聊天机器人就对写程序有很大的帮助了,

但是复制粘贴以及解释一大堆背景非常花时间,结果往往不是一次过又或者方向偏差,

又要回到复制粘贴的步骤,难以进入正向循环,只能作为学习参考。

这时候最流行的其实是 cursor 编辑器,使用 tab 键自动补全,但是因为用量有限需要订阅,所以没有尝试

同时 claude 也已经是因为写程序表现最好开始流行,并且推出了 claude code 在本机电脑上执行的 ai agent,但是因为需要订阅所有没有尝试。


转向 AI 代理
#

[25 年第四季]

这时我预期我最多只会同时只会订阅一个聊天机器人,并且刚从 chatgpt 转到 google gemini,

此时因为 Spec-Driven Development (SDD) 很红,gemini 也推出对标 claude code 的 agent: gemni cli,所以我终于尝试了。

我发现 agent 省去复制粘贴的步骤效率大幅提升,以及修改后贴回去找要修改哪几行的步骤也不用了。

这时我已经确信写程序应该使用 agent 而不是 chatbot,所以又跑去订阅 claude 使用 claude code(以下简称 CC)。

CC 的模型能力的确比较强,对于对话的理解与执行符合预期的概率已经很高。

操作电脑与 opus4.5
#

有一次我 mac mini 硬盘爆满无法使用,我直接问 CC 怎么办?就像我在聊天机器人的网页那样问。

CC 直接给出具体的方案:可以清除哪些目录、哪些搬移到外接硬盘等等…

我担心他把电脑搞坏,所以一步步允许他操作,最后全部都顺利完成了。

我对麦金塔还有 xcode 编译环境不熟,这时我发现 AI 对所有事情包括我不熟悉的都有八十分以上的理解,并且会写程序大约等于会操控电脑。

因为 CC 可以直接操作电脑,他自由的在目录之间穿梭,写完程序自己看到错误,再自己修复,完全进入正向循环。

使用 agent 的开发速度不可同日而语,并且让我晚三个月才开始改用 CC 的显得十分无知。

这在主客观的时间浪费都是非常可观的,

主观上如果及早采用最新的工具,前三个月的工作量完全两到三周就可以完成。

客观上使用最新工具的其他人,效率比你高也比你更早推出产品。

我前面的没有尝试,省去了半个或一个小时的时间,省去了几百块的订阅,但反而浪费大把人生。

这也许也是现在许多人热衷追逐 AI 最新产品消息的原因,

至少我是这样,我不得不一直关注最新产品,做时间管理的风险对冲。

[2025 年 11 月 24 日]

opus4.5 释出。opus 是 claude 收费最高的旗舰模型,此时 4.5 释出,

相比前一代它除了各方面性能显著提升,差别最大的是他对于意图的理解。

旧版只是指哪打哪(实际上也已经很不错了),从 4.5 版开始,他收到你的需求后,会先做一定程度的总结跟规划,用人格套用的话就是,更机灵更有经验了。

不用再很具体的说哪个文件要怎么修改,只需要像主管或老板描述最终需求,他就会展开并规划下一两个步骤的事。

这种规划的能力对效率的提升又更大了,前面说过 AI 对所有事情都知道八成以上,他会主动做下一两步的工作,并且做好。

搭配这点大幅增加抽象的程度,更多东西外包给了 CC,逐渐的开始不用自己查看跟修改代码了。

自从 opus4.5 问世后,社交媒体对于 AI 写程序的争论到此结束,

对于对于全职软件工程师跟高手们,我无法想象,

至少跟我自己比较,原本自己花一两年做得到的事情,变成两三个月内完成,

成品停留在我认知边界往外扩散一些,我反而是最大的瓶颈所在。

此篇完