[閒聊] Gemini的ACG超自信幻覺更嚴重了

看板C_Chat (希洽)作者 (談崩專家 康普尼)時間1小時前 (2026/04/24 11:19), 編輯推噓114(1162213)
留言331則, 114人參與, 16分鐘前最新討論串1/4 (看更多)
在今年1-2月 我還讚歎Gemini對於ACG知識量超過其它家的 對於較老的或冷門作品也能找出來 但最近越來越多幻覺 而且還很有自信 舉例1 我問他寶可夢pokopia的小型遺失物有何用途 它回答我可以給寶可夢裝備 會增強某些技能 這分明是和其他寶可夢遊戲搞混了 然後我要糾正它兩次 它才認錯 舉例2 我問他為何Holo的風真168 最近常常需要跑公司的工作室 還需要住在工作室 它回答我因為要準備HoloX的Live 然後還捏造了「博衣和虎鯨最近常連動開直播」 我只好忍痛告訴它 「沙花叉クロヱ已經畢業了」 它才認錯 雖然別家的多多少少也會出現對ACG不熟的狀況 但Gemini最近則是 非常有自信的瞎掰 怎麼會這樣? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.8.160.72 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777000767.A.A43.html

04/24 11:20, 1小時前 , 1F

04/24 11:21, 1小時前 , 2F
一直都有幻覺
04/24 11:21, 2F

04/24 11:21, 1小時前 , 3F
原來你說的是AI阿,我還以為是雲仔
04/24 11:21, 3F

04/24 11:21, 1小時前 , 4F
這幾家AI風水輪流轉,輪流失智
04/24 11:21, 4F

04/24 11:22, 1小時前 , 5F
笑死
04/24 11:22, 5F

04/24 11:22, 1小時前 , 6F
ai現在還是錯誤百出,
04/24 11:22, 6F

04/24 11:22, 1小時前 , 7F
問他歷史問題沒幾次全對的
04/24 11:22, 7F

04/24 11:22, 1小時前 , 8F
問他日本職棒有那幾隊都能講錯
04/24 11:22, 8F

04/24 11:22, 1小時前 , 9F
你如果沒加一堆限制他就像跟公園阿伯聊天一樣 靠記憶唬爛
04/24 11:22, 9F

04/24 11:23, 1小時前 , 10F
不過我覺得可能語言也有差,
04/24 11:23, 10F

04/24 11:23, 1小時前 , 11F
可能你用哪一種語言問
04/24 11:23, 11F

04/24 11:23, 1小時前 , 12F
它就優先從同語言資料來源找解答
04/24 11:23, 12F

04/24 11:27, 1小時前 , 13F
AI同一個問題問他兩次,可能答案都不一樣
04/24 11:27, 13F

04/24 11:27, 1小時前 , 14F
一直都有幻覺 從來沒有減輕
04/24 11:27, 14F

04/24 11:27, 1小時前 , 15F
你們用AI的方式都好奇怪
04/24 11:27, 15F

04/24 11:27, 1小時前 , 16F
AI就網路亂爬的資料 還能爬錯也是很誇張 之前50顯卡朋友
04/24 11:27, 16F

04/24 11:28, 1小時前 , 17F
網路上面本來就一堆亂說的,AI自己不知道阿
04/24 11:28, 17F

04/24 11:28, 1小時前 , 18F
貼給我她問AI的結果 明明都上市了AI還在未上市
04/24 11:28, 18F

04/24 11:28, 1小時前 , 19F
幻覺率一直都很高
04/24 11:28, 19F

04/24 11:28, 1小時前 , 20F
他的模型裡面可能沒有包含到最近的資訊 如果你請他搜尋搞
04/24 11:28, 20F

04/24 11:28, 1小時前 , 21F
不好會比較對
04/24 11:28, 21F

04/24 11:28, 1小時前 , 22F
你光用各 是嗎? 是否? 他回你的答案就差很多了
04/24 11:28, 22F

04/24 11:28, 1小時前 , 23F
然後你還要有能力辨別回答,才能知道是幻覺
04/24 11:28, 23F

04/24 11:28, 1小時前 , 24F
我用來邊玩遊戲 邊問攻略 錯誤率大概25%吧
04/24 11:28, 24F

04/24 11:28, 1小時前 , 25F
現在綜合能力最強又回到GPT了,訂閱挺划算的
04/24 11:28, 25F

04/24 11:29, 1小時前 , 26F
NOTEBOOKLM才是正確使用AI問問題的方法
04/24 11:29, 26F

04/24 11:29, 1小時前 , 27F
只是gpt看不到水管
04/24 11:29, 27F

04/24 11:29, 1小時前 , 28F
Gemini最扯的是歌詞,討論歌詞他都跟你亂掰,自創亂寫,
04/24 11:29, 28F

04/24 11:29, 1小時前 , 29F
明明一搜就有
04/24 11:29, 29F

04/24 11:29, 1小時前 , 30F
先把資料餵給AI,讓AI依據資料內容分析回答
04/24 11:29, 30F

04/24 11:29, 1小時前 , 31F
AI就從現有資料做文字接龍而已 中文沒有有系統的整理最新
04/24 11:29, 31F

04/24 11:29, 1小時前 , 32F
資料出來就會變這樣
04/24 11:29, 32F

04/24 11:30, 1小時前 , 33F
Gemini更扯是,請它產生完程式後,它順便講程式跑完結果
04/24 11:30, 33F

04/24 11:30, 1小時前 , 34F
AI本來就不查證又愛瞎掰 你2026才知道?
04/24 11:30, 34F

04/24 11:31, 1小時前 , 35F
結果把它給的程式自己跑一遍,根本不是它說的答案...
04/24 11:31, 35F

04/24 11:31, 1小時前 , 36F
gemini的幻覺率基準測試是倒數的,還輸一堆開源模型
04/24 11:31, 36F

04/24 11:31, 1小時前 , 37F
或者至少你要先指定他去看完某個攻略網站再來回答問題 會
04/24 11:31, 37F

04/24 11:31, 1小時前 , 38F
比較準一點
04/24 11:31, 38F

04/24 11:32, 1小時前 , 39F
好窩 下次叫它先去讀攻略網
04/24 11:32, 39F
還有 252 則推文
04/24 12:20, 42分鐘前 , 292F
叫AI查法規或爬database再給我來源就很好用
04/24 12:20, 292F

04/24 12:21, 41分鐘前 , 293F
用AI我是叫他把他查得資料的連結給我 我點進去再親自
04/24 12:21, 293F

04/24 12:21, 41分鐘前 , 294F
看 我怕他會唬爛XD
04/24 12:21, 294F

04/24 12:24, 38分鐘前 , 295F
請AI用我冠軍中現有的PM組雙打隊伍結果配出一堆不能
04/24 12:24, 295F

04/24 12:24, 38分鐘前 , 296F
學的配招跟不能用的道具
04/24 12:24, 296F

04/24 12:28, 34分鐘前 , 297F
我上禮拜問電影時刻表都可以唬爛了 懷疑根本沒在更新資料庫
04/24 12:28, 297F

04/24 12:30, 32分鐘前 , 298F
你的問題怎麼都那麼油?
04/24 12:30, 298F

04/24 12:31, 31分鐘前 , 299F
Prompt超過五十字很正常吧,除非你在隨意閒聊,不然問問題
04/24 12:31, 299F

04/24 12:31, 31分鐘前 , 300F
肯定要訂好規則阿
04/24 12:31, 300F

04/24 12:31, 31分鐘前 , 301F
他現在的幻覺越來越強了 我幫鄉民算夢境 它給的除了 結合過
04/24 12:31, 301F

04/24 12:31, 31分鐘前 , 302F
去我討論 更加強命理 我真的怕有人會信
04/24 12:31, 302F

04/24 12:32, 30分鐘前 , 303F
這個絕對不是只有他們這樣而已,你如果去問遊戲的攻
04/24 12:32, 303F

04/24 12:32, 30分鐘前 , 304F
略每一家都會跟你一本正經的說幹話
04/24 12:32, 304F

04/24 12:33, 29分鐘前 , 305F
prompt沒打好吧 所以他會唬爛
04/24 12:33, 305F

04/24 12:33, 29分鐘前 , 306F

04/24 12:33, 29分鐘前 , 307F
花token的才信 免費版ai搞不好公司內部指令是亂回覆避
04/24 12:33, 307F

04/24 12:33, 29分鐘前 , 308F
免消耗算力
04/24 12:33, 308F

04/24 12:33, 29分鐘前 , 309F
如果你拿這套給你家人用 要記得提醒它
04/24 12:33, 309F

04/24 12:35, 27分鐘前 , 310F
之前在找輕爵士音樂,germini(pro)直接推薦了蛋堡和日
04/24 12:35, 310F

04/24 12:35, 27分鐘前 , 311F
本什麼DJ合作的歌曲「蛋餅人」,和他確定還硬凹,後面
04/24 12:35, 311F

04/24 12:35, 27分鐘前 , 312F
說我找不到這首歌才承認亂講
04/24 12:35, 312F

04/24 12:35, 27分鐘前 , 313F
它幻覺越來越強 把我前幾個月 加 前一週討論的套路全部搬出
04/24 12:35, 313F

04/24 12:35, 27分鐘前 , 314F
來 然後再跟你講解釋
04/24 12:35, 314F

04/24 12:35, 27分鐘前 , 315F
不只幻覺還有無法辨識真實資訊的問題
04/24 12:35, 315F

04/24 12:35, 27分鐘前 , 316F
他一直認為咒術迴戰modulo是二創,哪怕它都已經搜尋到了
04/24 12:35, 316F

04/24 12:35, 27分鐘前 , 317F
大量圖片和讀者評論也覺得外星人太離譜了一定是二創
04/24 12:35, 317F

04/24 12:35, 27分鐘前 , 318F
claude也越來越懶+爛了
04/24 12:35, 318F

04/24 12:36, 26分鐘前 , 319F
直接問有什麼攻略網站比較好吧,我還是傾向給我工具
04/24 12:36, 319F

04/24 12:36, 26分鐘前 , 320F
,我自己研讀
04/24 12:36, 320F

04/24 12:39, 23分鐘前 , 321F
Chatgpt現在用thinking模式正確率滿高的 instant模式我覺
04/24 12:39, 321F

04/24 12:39, 23分鐘前 , 322F
得是大便 最好不要用 貪那幾秒速度沒有意義 性能差很多
04/24 12:39, 322F

04/24 12:39, 23分鐘前 , 323F
gemini 還能倒退嚕
04/24 12:39, 323F

04/24 12:41, 21分鐘前 , 324F
所以虎鯨沒有畢業,和博衣一直有連動直播QQ
04/24 12:41, 324F

04/24 12:42, 20分鐘前 , 325F
請問gpt的think模式是要花錢的嗎
04/24 12:42, 325F

04/24 12:42, 20分鐘前 , 326F
只會拿來查簡單的問題,或幫忙搜印象模糊的資料,之前拿來
04/24 12:42, 326F

04/24 12:42, 20分鐘前 , 327F
查法律問題錯誤率高到不如自己看法條
04/24 12:42, 327F

04/24 12:43, 19分鐘前 , 328F
大哥 生成式AI是在玩文字接龍 自始自終都是瞎掰好嗎
04/24 12:43, 328F

04/24 12:45, 17分鐘前 , 329F
我問他全戰戰鎚三的矮人怎麼配部隊,他回我全部屠夫衝
04/24 12:45, 329F

04/24 12:45, 17分鐘前 , 330F
上去砍。
04/24 12:45, 330F

04/24 12:46, 16分鐘前 , 331F
gemimi拿來改圖就好 查資料還是靠gpt
04/24 12:46, 331F
文章代碼(AID): #1fwk4_f3 (C_Chat)
文章代碼(AID): #1fwk4_f3 (C_Chat)