前言#
假名私塾(kana juku)是我第一個製作及上架的app,
心得比較有完整得來龍去脈,
本系列包括製作的過程,使用AI輔助及變化、使用公開語料與版權等等…
其他app有值得一提的點也會另外刊登。
本篇主要講**[25年第四季]** 開始從聊天機器人到agent 的轉變過程,
相關產品變化很快,重要時間點直接很生硬的標注了。
App簡介#
有apple device 的朋友可以下載來玩看看,
後面應該會有幾篇也是用這個當例子:
整理ETL語料、apple create ML、pytorch、voicevox、手機本地大語言模型等等…
假名私塾: URL
開發時間軸#
動機#
我跟家人都有興趣學日語,很久以前就想要完全符合自己需求的日語學習app。
家人的痛點是不會英文,看不懂大部分教材跟其他app的羅馬拼音。
我自己則是很想要假名可以跟字源對照(例如"あ"的字源為"安"),
然後痛點是安裝系統安裝日文鍵盤偶爾會用到,但是每天打字切換輸入法都被干擾,要多跳過一次日文的鍵盤。
前期準備#
[24年第四季]
這段時間換工作不用上班,因此有時間看Udemy 的課程,因為接觸過javascript所以先看的reactjs & expo。
這時候就是跟著上課內容做很簡單的網頁式內容,以及多一些GPS、相機控制、抓取遠端資料之類的,
但是非蘋果自家生態,需要額外管理很多東西。
[25年第一季]
猶豫很久買了mac mini之後就完全改用蘋果自家的swiftUI,也是找Udemy的課程来看,
時間主要花在熟悉基本UI原件以及佈局,還有所有基本功能資料持久化、抓取資料、導入地圖等在swiftUI對應的寫法。
swiftUI 比較現代也不像UIkit跟xcode完全綁定,但是也比較難預期swifiUI 的佈局最後長相,一開始很在意花很多時間嘗試。
[25年第三季]
因為平常要上班只有晚上可以寫,也不是每天都有空,所以進度很慢,就是把基本的雛形做出來,把日文的資料塞進去。
第一個app比較難預期後面的長相,所以經常修改,或是確定要用到的部分跑回去仔細看影片,大致上是在交學費的狀態。
到這時後包括**[24年第一季]**開始,其實單純chatpgt那種聊天機器人就對寫程式有很大的幫助了,
但是複製貼上以及解釋一大堆背景非常花時間,結果往往不是一次過又或者方向偏差,
又要回到複製貼上的步驟,難以進入正向循環,只能作為學習參考。
這時後最流行的其實是cursor編輯器,使用tab鍵自動補全,但是因為用量有限需要訂閱,所以沒有嘗試。
同時claude也已經是因為寫程式表現最好開始流行,並且推出了claude code在本機電腦上執行的ai agent,但是因為需要訂閱所有沒有嘗試。
轉向AI代理#
[25年第四季]
這時我預期我只最多只會同時只會訂閱一個聊天機器人,並且剛從chatgpt轉到google gemini,
此時因為 Spec-Driven Development (SDD) 很紅,gemini也推出對標claude code的agent: gemni cli,所以我終於嘗試了。
我發現agent 省去複製貼上的步驟效率大幅提升,以及修改後貼回去找要修改哪幾行的步驟也不用了。
這時我已經確信寫程式應該使用agent 而不是chatbot,所以又跑去訂閱claude 使用claude code(以下簡稱CC)。
CC的模型能力的確比較強,對於對話的理解與執行符合預期的機率已經很高。
操作電腦與opus4.5#
有一次我mac mini硬碟爆滿無法使用,我直接問CC怎麼辦?就像我在聊天機器人的網頁那樣問。
CC直接給出具體的方案:可以清除哪些目錄、哪些搬移到外接硬碟等等…
我擔心他把電腦搞壞,所以一步步允許他操作,最後全部都順利完成了。
我對麥金塔還有xcode編譯環境不熟,這時我發現AI對所有事情包括我不熟悉的都有八十分以上的理解,並且會寫程式大約等於會操控電腦。
因為CC可以直接操作電腦,他自由的在目錄之間穿梭,寫完程式自己看到錯誤,再自己修復,完全進入正向循環。
使用agent 的開發速度不可同日而語,並且讓我晚三個月才開始改用CC的顯得十分無知。
這在主客觀的時間浪費都是非常可觀的,
主觀上如果及早採用最新的工具,前三個月的工作量完全兩到三週就可以完成。
客觀上使用最新工具的其他人,效率比你高也比你更早推出產品。
我前面的沒有嘗試,省去了半個或一個小時的時間,省去了幾百塊的訂閱,但反而浪費大把人生。
這也許也是現在許多人熱衷追逐AI最新產品消息的原因,
至少我是這樣,我不得不一直關注最新產品,做時間管理的風險對沖。
[2025年11月24日]
opus4.5釋出。opus是claude 收費最高的旗艦模型,此時4.5釋出,
相比前一代它除了各方面性能顯著提升,差別最大的是他對於意圖的理解。
舊版只是指哪打哪(實際上也已經很不錯了),從4.5版開始,他收到你的需求後,會先做一定程度的總結跟規劃,用人格套用的話就是,更機靈更有經驗了。
不用再很具體的說哪個檔案要怎麼修改,只需要像主管或老闆描述最終需求,他就會展開並規劃下一兩個步驟的事。
這種規劃的能力對效率的提升又更大了,前面說過AI對所有事情都知道八成以上,他會主動做下一兩步的工作,並且做好。
搭配這點大幅增加抽象的程度,更多東西外包給了CC,逐漸的開始不用自己查看跟修改程式碼了。
自從opus4.5 問世後,社群媒體對於AI寫程式的爭論到此結束,
對於對於全職軟體工程師跟高手們,我無法想像,
至少跟我自己比較,原本自己花一兩年做得到的事情,變成兩三個月內完成,
成品停留在我認知邊界往外擴散一些,我反而是最大的瓶頸所在。
此篇完
