[閒聊] 為了追停止代理的小說做了個翻譯工具
如題
為了追停止代理的小說
我做了個AI翻譯工具
幾週前去了趟日本玩
逛書店時赫然發現
國中開始追的小說還在更新
就是號稱羅馬數字教學,女主存在感越來越稀薄的,男主金次的奇妙冒險,<<緋彈的亞莉
亞>>
台灣尖端出版只到39,日本已經出到44了
尋思現在AI翻譯水準已經不差了,也買得到日文電子書
心一橫,就買了39~44的日文電子書,回來開發個翻譯工具
最初的想法很簡單
讓AI對照39集的中日版本,建立角色、招式、專用術語的翻譯字典
再讓AI參考字典對40~44進行翻譯即可
自然踩了許多坑
* 許多句子會翻譯失敗
* 翻譯夾雜著註解&思考過程
* 新角色&招式因為不在字典裡,翻譯會不連貫
最後花了數天改成以下流程:
1. 對照39集中日兩版建立字典
2. 讓AI掃一遍新書,抓出容易翻譯不一致的名詞加入字典
3. 手動調整字典裡新詞彙的翻譯
https://i.mopix.cc/KYvGbx.jpg

4. 讓AI將日文新書翻譯一遍
https://i.mopix.cc/NRK0zG.jpg

5. 用UI對照原文,人工檢查翻譯品質,輔以AI& Google 翻譯逐句修正
https://i.mopix.cc/QUlgcE.jpg

6. 合成電子書譯本
https://i.mopix.cc/QgDm2R.jpg

根據我自己的閱讀&語文能力,從頭完成一本輕小說的翻譯要花大約5小時上下
運氣差的話在第5步驟會發現重大人物名稱翻譯問題
得修改字典後退回第4步驟重新跑一遍
====以下有雷====
比方說40集退回幼童的拉斯普京娜
自稱チナ
一開始不知道是人名翻成“支那”
AI的譯文裡就不斷出現中國人
還有42、43出現的,貝瑞塔創辦的NGO的特工
Giusto 5號 的代號是The Father
一開始以為是義大利黑手黨,翻成父親
實際上是聖職者,要翻作神父
最頭痛的是44集的地雷女
自稱、稱呼他人、講話內容到處都是奇怪的變體簡稱
金次 kinji > 金P kinpi
響 hibiki > 響P hibipi
割腕 arm cut > 阿母卡 amuka
由於44集主角在男公關俱樂部臥底
一堆酒都不寫全名,都是簡稱
AI的翻譯品質明顯下降
====防雷結束====
總之,小說翻譯看完了後
為了讓這工具能多派上用場
又花了幾天改成多語種的翻譯工具,不再侷限於日翻中
興許能成為小說推廣工具?
發這邊看看有沒有出版社之類的有興趣
或是有類似斷更困擾的都可以留言或私我
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.70.138.212 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1770196738.A.EC3.html
推
02/04 17:20,
5天前
, 1F
02/04 17:20, 1F
我自己的日文程度大約只能在日本自由行
讀小說會超卡XD
推
02/04 17:21,
5天前
, 2F
02/04 17:21, 2F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:24:12
推
02/04 17:23,
5天前
, 3F
02/04 17:23, 3F
call API 太貴
借了一台dgx spark 本地跑LLM
推
02/04 17:24,
5天前
, 4F
02/04 17:24, 4F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:25:10
→
02/04 17:25,
5天前
, 5F
02/04 17:25, 5F
推
02/04 17:25,
5天前
, 6F
02/04 17:25, 6F
推
02/04 17:25,
5天前
, 7F
02/04 17:25, 7F
推
02/04 17:26,
5天前
, 8F
02/04 17:26, 8F
真的不便宜
但老實說不需要用那麼好
單純開發時想測多種不同的模型才借
最後用的是Qwen2.5 32b int4量化
理論上可以用3090跑
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:27:52
推
02/04 17:26,
5天前
, 9F
02/04 17:26, 9F
推
02/04 17:26,
5天前
, 10F
02/04 17:26, 10F
→
02/04 17:26,
5天前
, 11F
02/04 17:26, 11F
推
02/04 17:26,
5天前
, 12F
02/04 17:26, 12F
推
02/04 17:26,
5天前
, 13F
02/04 17:26, 13F
→
02/04 17:27,
5天前
, 14F
02/04 17:27, 14F
→
02/04 17:27,
5天前
, 15F
02/04 17:27, 15F
→
02/04 17:28,
5天前
, 16F
02/04 17:28, 16F
推
02/04 17:29,
5天前
, 17F
02/04 17:29, 17F
→
02/04 17:29,
5天前
, 18F
02/04 17:29, 18F
→
02/04 17:29,
5天前
, 19F
02/04 17:29, 19F
→
02/04 17:29,
5天前
, 20F
02/04 17:29, 20F
→
02/04 17:29,
5天前
, 21F
02/04 17:29, 21F
→
02/04 17:29,
5天前
, 22F
02/04 17:29, 22F
推
02/04 17:30,
5天前
, 23F
02/04 17:30, 23F
主要是希望能壓低硬體需求
畢竟這台dgx spark 是借來的
這週就得還
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:31:05
→
02/04 17:30,
5天前
, 24F
02/04 17:30, 24F
→
02/04 17:30,
5天前
, 25F
02/04 17:30, 25F
推
02/04 17:31,
5天前
, 26F
02/04 17:31, 26F
→
02/04 17:31,
5天前
, 27F
02/04 17:31, 27F
→
02/04 17:31,
5天前
, 28F
02/04 17:31, 28F
推
02/04 17:31,
5天前
, 29F
02/04 17:31, 29F
→
02/04 17:31,
5天前
, 30F
02/04 17:31, 30F
台版梅路可玩家+1
理論上做得到
但目前這個工具是用來處理epub電子書的
從遊戲裡抓文字檔出來我還沒研究過
我知道有些解決方案是加上ocr
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:34:11
→
02/04 17:33,
5天前
, 31F
02/04 17:33, 31F
→
02/04 17:33,
5天前
, 32F
02/04 17:33, 32F
還有 26 則推文
還有 4 段內文
推
02/04 17:46,
5天前
, 59F
02/04 17:46, 59F
→
02/04 17:47,
5天前
, 60F
02/04 17:47, 60F
→
02/04 17:47,
5天前
, 61F
02/04 17:47, 61F
推
02/04 17:51,
5天前
, 62F
02/04 17:51, 62F
→
02/04 17:55,
5天前
, 63F
02/04 17:55, 63F
→
02/04 17:55,
5天前
, 64F
02/04 17:55, 64F
→
02/04 17:56,
5天前
, 65F
02/04 17:56, 65F
推
02/04 18:00,
5天前
, 66F
02/04 18:00, 66F
→
02/04 18:00,
5天前
, 67F
02/04 18:00, 67F
→
02/04 18:02,
5天前
, 68F
02/04 18:02, 68F
推
02/04 18:03,
5天前
, 69F
02/04 18:03, 69F
推
02/04 18:06,
5天前
, 70F
02/04 18:06, 70F
推
02/04 18:10,
5天前
, 71F
02/04 18:10, 71F
推
02/04 18:15,
5天前
, 72F
02/04 18:15, 72F
推
02/04 18:15,
5天前
, 73F
02/04 18:15, 73F
推
02/04 18:24,
5天前
, 74F
02/04 18:24, 74F
→
02/04 18:27,
5天前
, 75F
02/04 18:27, 75F
5hr裡3hr是閱讀&校正用時
2hr是AI 逐句翻譯
或許AI翻譯的迴圈有優化空間,但現在有點懶
→
02/04 18:28,
5天前
, 76F
02/04 18:28, 76F
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:34:10
推
02/04 18:30,
5天前
, 77F
02/04 18:30, 77F
沒用過bw不太清楚
印象中能下載epub ,那就可以用沒問題
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:36:24
→
02/04 18:36,
5天前
, 78F
02/04 18:36, 78F
推
02/04 18:42,
5天前
, 79F
02/04 18:42, 79F
→
02/04 18:42,
5天前
, 80F
02/04 18:42, 80F
推
02/04 18:45,
5天前
, 81F
02/04 18:45, 81F
→
02/04 18:45,
5天前
, 82F
02/04 18:45, 82F
推
02/04 18:49,
5天前
, 83F
02/04 18:49, 83F
→
02/04 18:51,
5天前
, 84F
02/04 18:51, 84F
推
02/04 19:26,
5天前
, 85F
02/04 19:26, 85F
推
02/04 20:13,
5天前
, 86F
02/04 20:13, 86F
推
02/04 20:20,
5天前
, 87F
02/04 20:20, 87F
推
02/04 20:36,
5天前
, 88F
02/04 20:36, 88F
→
02/04 20:36,
5天前
, 89F
02/04 20:36, 89F
→
02/04 20:37,
5天前
, 90F
02/04 20:37, 90F
推
02/04 20:59,
5天前
, 91F
02/04 20:59, 91F
推
02/05 04:23,
4天前
, 92F
02/05 04:23, 92F
推
02/06 23:48,
3天前
, 93F
02/06 23:48, 93F
→
02/06 23:48,
3天前
, 94F
02/06 23:48, 94F
沒用gemma是沒更新資訊
還停留在VLM的gemma3
想說單純翻譯不用視覺模塊
考慮到中文能力要強,才直接用qwen
前面也有大大提到TranslateGemma存在
之後又有翻譯需求再來比較看看
畢竟亞莉亞已經在軟體開發測試期間看完了XD
※ 編輯: kumahead (114.36.198.57 臺灣), 02/07/2026 04:28:26
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
43
94
C_Chat 近期熱門文章
PTT動漫區 即時熱門文章