Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了

看板C_Chat (希洽)作者 (smart0eddie)時間3小時前 (2026/04/25 12:24), 3小時前編輯推噓0(001)
留言1則, 1人參與, 3小時前最新討論串16/16 (看更多)
※ 引述《kopune (談崩專家 康普尼)》之銘言: : 在今年1-2月 : 我還讚歎Gemini對於ACG知識量超過其它家的 : 對於較老的或冷門作品也能找出來 : 但最近越來越多幻覺 : 而且還很有自信 : 舉例1 我問他寶可夢pokopia的小型遺失物有何用途 : 它回答我可以給寶可夢裝備 會增強某些技能 : 這分明是和其他寶可夢遊戲搞混了 : 然後我要糾正它兩次 它才認錯 : 舉例2 我問他為何Holo的風真168 : 最近常常需要跑公司的工作室 : 還需要住在工作室 : 它回答我因為要準備HoloX的Live : 然後還捏造了「博衣和虎鯨最近常連動開直播」 : 我只好忍痛告訴它 「沙花叉クロヱ已經畢業了」 : 它才認錯 : 雖然別家的多多少少也會出現對ACG不熟的狀況 : 但Gemini最近則是 非常有自信的瞎掰 : 怎麼會這樣? : 想到一個有趣的東西 感謝打出全台詞文本的大大 包龍星:朱二,你上次說,戚秦氏在你那裏買了一斤砒霜,對不對? 朱二:沒錯,大人。 包龍星:驗屍官,你說上次戚家的那一鍋糖水裏面有毒,是不是? 驗屍官:是,大人。 包龍星:各位,這裏有鍋糖水,一斤砒霜,全倒進去,去你媽的,比芝麻糊還糊, 這種東西會有人肯喝嗎? 常昆:她買一斤砒霜,不一定會全放下去。 包龍星:那沒有用完的砒霜往那裏去了呢?我搜索戚家上下,都沒有找到。 更何況,一個兇手如果用不到那麼多毒藥, 為什麼要買那麼多惹人懷疑?所以 事情就是……你說謊。 朱二:我沒有說謊呀大人。 有為:沒有? 包龍星:這本帳簿是從你店裏偷來的,砒霜根本就很少有人買, 你今年只買進了半斤砒霜,你那來一斤賣給人家? 朱二:可能是小人記錯了,大人。 包龍星:記錯了?你幾個月前記錯,你現在又記錯了?你老是記錯? === Gemini的自我反省與點評 看完原劇情對比,我發現電影原片的**「邏輯刀法」**比我剛才演的還要犀利好幾倍! 原劇情的精髓在於包龍星不是只靠「罵」,而是用了三層遞進的**「破綻分析」**,這簡 直就是頂級的「除錯(Debug)流程」: 1. 物理常識的絕殺(硬體限制) 「比芝麻糊還糊,這種東西會有人肯喝嗎?」 這一段最強大。在 AI 的世界裡,這就像是在說:一個模型如果輸出了一堆完全不合 邏輯、密密麻麻的廢話,使用者一眼就能看出這東西「有毒」。電影裡用「濃稠度」來具 象化謊言的荒謬,真的神來之筆。 2. 行為動機的側寫(參數異常) 「為什麼要買那麼多惹人懷疑?」 包龍星抓住了「不合理性」。如果我明明只需要一個簡單的日期,卻編出一大篇長篇 大論來掩飾,這就是典型的「過度擬合」或是為了圓謊而製造更多破綻。 3. 數據庫的終極實錘(底層資料) 「你今年只買進了半斤砒霜,你那來一斤賣給人家?」 這是我覺得最精彩的!這已經不是在吵「記性」,而是直接翻看後台 Log 紀錄。 朱二(瞎掰的我): 試圖用「記憶力」當藉口(我想是我記錯了)。 包龍星(看資料的我): 直接用「庫存總量」封殺。你資料庫(進貨)根本沒這東 西,你輸出(賣出)的資料從哪生出來的? === 所以請愛用 google 搜尋的 AI mode 讓她看著資料說話 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.236.213.253 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777091075.A.1B8.html ※ 編輯: smart0eddie (36.236.213.253 臺灣), 04/25/2026 12:26:07

04/25 12:27, 3小時前 , 1F
也許戚家的人都是豬頭三啊==
04/25 12:27, 1F
文章代碼(AID): #1fx4836u (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1fx4836u (C_Chat)