[閒聊] 為了追停止代理的小說做了個翻譯工具

看板C_Chat (希洽)作者 (觀測代號1095)時間5天前 (2026/02/04 17:18), 2天前編輯推噓43(43051)
留言94則, 45人參與, 3天前最新討論串1/2 (看更多)
如題 為了追停止代理的小說 我做了個AI翻譯工具 幾週前去了趟日本玩 逛書店時赫然發現 國中開始追的小說還在更新 就是號稱羅馬數字教學,女主存在感越來越稀薄的,男主金次的奇妙冒險,<<緋彈的亞莉 亞>> 台灣尖端出版只到39,日本已經出到44了 尋思現在AI翻譯水準已經不差了,也買得到日文電子書 心一橫,就買了39~44的日文電子書,回來開發個翻譯工具 最初的想法很簡單 讓AI對照39集的中日版本,建立角色、招式、專用術語的翻譯字典 再讓AI參考字典對40~44進行翻譯即可 自然踩了許多坑 * 許多句子會翻譯失敗 * 翻譯夾雜著註解&思考過程 * 新角色&招式因為不在字典裡,翻譯會不連貫 最後花了數天改成以下流程: 1. 對照39集中日兩版建立字典 2. 讓AI掃一遍新書,抓出容易翻譯不一致的名詞加入字典 3. 手動調整字典裡新詞彙的翻譯 https://i.mopix.cc/KYvGbx.jpg
4. 讓AI將日文新書翻譯一遍 https://i.mopix.cc/NRK0zG.jpg
5. 用UI對照原文,人工檢查翻譯品質,輔以AI& Google 翻譯逐句修正 https://i.mopix.cc/QUlgcE.jpg
6. 合成電子書譯本 https://i.mopix.cc/QgDm2R.jpg
根據我自己的閱讀&語文能力,從頭完成一本輕小說的翻譯要花大約5小時上下 運氣差的話在第5步驟會發現重大人物名稱翻譯問題 得修改字典後退回第4步驟重新跑一遍 ====以下有雷==== 比方說40集退回幼童的拉斯普京娜 自稱チナ 一開始不知道是人名翻成“支那” AI的譯文裡就不斷出現中國人 還有42、43出現的,貝瑞塔創辦的NGO的特工 Giusto 5號 的代號是The Father 一開始以為是義大利黑手黨,翻成父親 實際上是聖職者,要翻作神父 最頭痛的是44集的地雷女 自稱、稱呼他人、講話內容到處都是奇怪的變體簡稱 金次 kinji > 金P kinpi 響 hibiki > 響P hibipi 割腕 arm cut > 阿母卡 amuka 由於44集主角在男公關俱樂部臥底 一堆酒都不寫全名,都是簡稱 AI的翻譯品質明顯下降 ====防雷結束==== 總之,小說翻譯看完了後 為了讓這工具能多派上用場 又花了幾天改成多語種的翻譯工具,不再侷限於日翻中 興許能成為小說推廣工具? 發這邊看看有沒有出版社之類的有興趣 或是有類似斷更困擾的都可以留言或私我 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.70.138.212 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1770196738.A.EC3.html

02/04 17:20, 5天前 , 1F
你為什麼不要乾脆去學日文
02/04 17:20, 1F
我自己的日文程度大約只能在日本自由行 讀小說會超卡XD

02/04 17:21, 5天前 , 2F
學日文看小說要花的時間一定比搞ai 久
02/04 17:21, 2F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:24:12

02/04 17:23, 5天前 , 3F
幫推 看起來是直接 call API?
02/04 17:23, 3F
call API 太貴 借了一台dgx spark 本地跑LLM

02/04 17:24, 5天前 , 4F
原來停止代理了喔
02/04 17:24, 4F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:25:10

02/04 17:25, 5天前 , 5F
AI就是斷更救星
02/04 17:25, 5F

02/04 17:25, 5天前 , 6F
之前看別人有問過說還會繼續出,結果出了1本又沒下文
02/04 17:25, 6F

02/04 17:25, 5天前 , 7F
02/04 17:25, 7F

02/04 17:26, 5天前 , 8F
你能借到 DGX Spark也不容易啊XD 這台不便宜耶
02/04 17:26, 8F
真的不便宜 但老實說不需要用那麼好 單純開發時想測多種不同的模型才借 最後用的是Qwen2.5 32b int4量化 理論上可以用3090跑 ※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:27:52

02/04 17:26, 5天前 , 9F
居然dgx跑千問 羨慕QQ
02/04 17:26, 9F

02/04 17:26, 5天前 , 10F
ai翻日文小說的對話應該是缺主詞的問題最大 加上幻覺問題
02/04 17:26, 10F

02/04 17:26, 5天前 , 11F
就變成連原文不在場的人都進來插話了
02/04 17:26, 11F

02/04 17:26, 5天前 , 12F
你借得東西也不便宜啊
02/04 17:26, 12F

02/04 17:26, 5天前 , 13F
Ai再發展下去我看台灣出版社會完 進度慢又容易斷尾
02/04 17:26, 13F

02/04 17:27, 5天前 , 14F
出版社早就死得差不多了
02/04 17:27, 14F

02/04 17:27, 5天前 , 15F
小說用API真的很貴 漫畫還好
02/04 17:27, 15F

02/04 17:28, 5天前 , 16F
上個月騰訊有出開源翻譯工具
02/04 17:28, 16F

02/04 17:29, 5天前 , 17F
那麼大量的字不用本地LLM跑真的不便宜...是TranslateGemma
02/04 17:29, 17F

02/04 17:29, 5天前 , 18F
嗎?
02/04 17:29, 18F

02/04 17:29, 5天前 , 19F
之前看地錯新本有人丟ai翻的試看版 看了沒幾段滿腦問號、
02/04 17:29, 19F

02/04 17:29, 5天前 , 20F
自己對照完原文發現問題在哪後 就乖乖回去啃日文直到看完
02/04 17:29, 20F

02/04 17:29, 5天前 , 21F
那兩本了
02/04 17:29, 21F

02/04 17:29, 5天前 , 22F
阿推完文才看到用的模型,抱歉
02/04 17:29, 22F

02/04 17:30, 5天前 , 23F
DGX Spark 可以跑比 32B 強很多的模型吧
02/04 17:30, 23F
主要是希望能壓低硬體需求 畢竟這台dgx spark 是借來的 這週就得還 ※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:31:05

02/04 17:30, 5天前 , 24F
長久地來說,看得懂日文當然是比較好的 因為日中轉換總是
02/04 17:30, 24F

02/04 17:30, 5天前 , 25F
避免地會因為語言結構不同而有失真的部分
02/04 17:30, 25F

02/04 17:31, 5天前 , 26F
如果有 Ground truth + 文意表的話
02/04 17:31, 26F

02/04 17:31, 5天前 , 27F
好像其實不太需要本地 LLM,用上下文窗口大一點的 LLM 含
02/04 17:31, 27F

02/04 17:31, 5天前 , 28F
糾錯的成本及效率,也許比直接架 Qwen 更好?
02/04 17:31, 28F

02/04 17:31, 5天前 , 29F
這個有沒有辦法翻譯一些日文遊戲的文本呀,之前一直很想
02/04 17:31, 29F

02/04 17:31, 5天前 , 30F
把梅露可物語的劇情補完但礙於沒有翻譯(
02/04 17:31, 30F
台版梅路可玩家+1 理論上做得到 但目前這個工具是用來處理epub電子書的 從遊戲裡抓文字檔出來我還沒研究過 我知道有些解決方案是加上ocr ※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:34:11

02/04 17:33, 5天前 , 31F
就算用 4090 甚至以上 GPU 跑模型,VRAM & RAM 太低的話
02/04 17:33, 31F

02/04 17:33, 5天前 , 32F
單次 Response 的速度也挺慢的吧 QQ
02/04 17:33, 32F
還有 26 則推文
還有 4 段內文
02/04 17:46, 5天前 , 59F
Lunartanslator可以翻譯一些unity的小黃遊
02/04 17:46, 59F

02/04 17:47, 5天前 , 60F
holo en、holo id他們會日文的也幾乎都這樣學來的
02/04 17:47, 60F

02/04 17:47, 5天前 , 61F
說錯,LunaTranslator
02/04 17:47, 61F

02/04 17:51, 5天前 , 62F
02/04 17:51, 62F

02/04 17:55, 5天前 , 63F
可以去看對岸sakura翻譯相關的社群
02/04 17:55, 63F

02/04 17:55, 5天前 , 64F
ai翻日文小說這塊蠻成熟了
02/04 17:55, 64F

02/04 17:56, 5天前 , 65F
不過問題還是跟你遇到的一樣 躲不掉XD
02/04 17:56, 65F

02/04 18:00, 5天前 , 66F
我也是靠ai翻譯追很多台版斷尾的作品
02/04 18:00, 66F

02/04 18:00, 5天前 , 67F
只是精準度還是不夠高 有些地方還是要配合原文
02/04 18:00, 67F

02/04 18:02, 5天前 , 68F
話說古板在問AI有沒有殺手級應用...我也只能笑笑w
02/04 18:02, 68F

02/04 18:03, 5天前 , 69F
可以問問GPT如何把AI翻譯的演算法進一步優化(
02/04 18:03, 69F

02/04 18:06, 5天前 , 70F
AI好用+1
02/04 18:06, 70F

02/04 18:10, 5天前 , 71F
推,每次都有鍵盤語言家叫人學日文,真的躁==
02/04 18:10, 71F

02/04 18:15, 5天前 , 72F
現在學日文不如學ai 還能自產小說色圖
02/04 18:15, 72F

02/04 18:15, 5天前 , 73F
推設計與分享
02/04 18:15, 73F

02/04 18:24, 5天前 , 74F
推分享
02/04 18:24, 74F

02/04 18:27, 5天前 , 75F
想自己看 還要花5hr==
02/04 18:27, 75F
5hr裡3hr是閱讀&校正用時 2hr是AI 逐句翻譯 或許AI翻譯的迴圈有優化空間,但現在有點懶

02/04 18:28, 5天前 , 76F
這麼大量 除非你錢很多 用api跑 根本像燒紙錢一樣
02/04 18:28, 76F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:34:10

02/04 18:30, 5天前 , 77F
BW的可以嗎 我也買了一些台版斷尾日文小說
02/04 18:30, 77F
沒用過bw不太清楚 印象中能下載epub ,那就可以用沒問題 ※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:36:24

02/04 18:36, 5天前 , 78F
用api應該品質提升會減少那個校稿時間
02/04 18:36, 78F

02/04 18:42, 5天前 , 79F
校正真的很費時,如果沒有要分享給別人看,我都sakura翻一
02/04 18:42, 79F

02/04 18:42, 5天前 , 80F
翻自己爽就好了
02/04 18:42, 80F

02/04 18:45, 5天前 , 81F
不過亞莉亞這種長青樹,去對岸社群找找可能有熱心的小精
02/04 18:45, 81F

02/04 18:45, 5天前 , 82F
靈用Ai翻好跟校正好的
02/04 18:45, 82F

02/04 18:49, 5天前 , 83F
哇 哇靠
02/04 18:49, 83F

02/04 18:51, 5天前 , 84F
應該說原文不是不能啃但是很燒腦沒辦法放鬆看
02/04 18:51, 84F

02/04 19:26, 5天前 , 85F
個人經驗翻譯前的prompt也很重要 可參考些開源工具的寫法
02/04 19:26, 85F

02/04 20:13, 5天前 , 86F
好厲害 推推
02/04 20:13, 86F

02/04 20:20, 5天前 , 87F
推開發,太厲害了
02/04 20:20, 87F

02/04 20:36, 5天前 , 88F
我是有買GPT的API額度啦 換算流量費沒很貴 跟Sakura一起
02/04 20:36, 88F

02/04 20:36, 5天前 , 89F
使用當兩邊對照
02/04 20:36, 89F

02/04 20:37, 5天前 , 90F
喔對了 我是用Luna Translator
02/04 20:37, 90F

02/04 20:59, 5天前 , 91F
github找sakurallm
02/04 20:59, 91F

02/05 04:23, 4天前 , 92F
有自訂翻譯字典和生成電子書版本真是幫了大忙了
02/05 04:23, 92F

02/06 23:48, 3天前 , 93F
qwen2.5翻起來有比gemma好嗎?最近在嘗試用來翻直播字
02/06 23:48, 93F

02/06 23:48, 3天前 , 94F
幕,感覺gemma好一點?
02/06 23:48, 94F
沒用gemma是沒更新資訊 還停留在VLM的gemma3 想說單純翻譯不用視覺模塊 考慮到中文能力要強,才直接用qwen 前面也有大大提到TranslateGemma存在 之後又有翻譯需求再來比較看看 畢竟亞莉亞已經在軟體開發測試期間看完了XD ※ 編輯: kumahead (114.36.198.57 臺灣), 02/07/2026 04:28:26
文章代碼(AID): #1fWmy2x3 (C_Chat)
文章代碼(AID): #1fWmy2x3 (C_Chat)