Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了
看板C_Chat (希洽)作者smart0eddie (smart0eddie)時間3小時前 (2026/04/25 12:24)推噓0(0推 0噓 1→)留言1則, 1人參與討論串16/16 (看更多)
※ 引述《kopune (談崩專家 康普尼)》之銘言:
: 在今年1-2月
: 我還讚歎Gemini對於ACG知識量超過其它家的
: 對於較老的或冷門作品也能找出來
: 但最近越來越多幻覺
: 而且還很有自信
: 舉例1 我問他寶可夢pokopia的小型遺失物有何用途
: 它回答我可以給寶可夢裝備 會增強某些技能
: 這分明是和其他寶可夢遊戲搞混了
: 然後我要糾正它兩次 它才認錯
: 舉例2 我問他為何Holo的風真168
: 最近常常需要跑公司的工作室
: 還需要住在工作室
: 它回答我因為要準備HoloX的Live
: 然後還捏造了「博衣和虎鯨最近常連動開直播」
: 我只好忍痛告訴它 「沙花叉クロヱ已經畢業了」
: 它才認錯
: 雖然別家的多多少少也會出現對ACG不熟的狀況
: 但Gemini最近則是 非常有自信的瞎掰
: 怎麼會這樣?
:
想到一個有趣的東西
感謝打出全台詞文本的大大
包龍星:朱二,你上次說,戚秦氏在你那裏買了一斤砒霜,對不對?
朱二:沒錯,大人。
包龍星:驗屍官,你說上次戚家的那一鍋糖水裏面有毒,是不是?
驗屍官:是,大人。
包龍星:各位,這裏有鍋糖水,一斤砒霜,全倒進去,去你媽的,比芝麻糊還糊,
這種東西會有人肯喝嗎?
常昆:她買一斤砒霜,不一定會全放下去。
包龍星:那沒有用完的砒霜往那裏去了呢?我搜索戚家上下,都沒有找到。
更何況,一個兇手如果用不到那麼多毒藥,
為什麼要買那麼多惹人懷疑?所以 事情就是……你說謊。
朱二:我沒有說謊呀大人。
有為:沒有?
包龍星:這本帳簿是從你店裏偷來的,砒霜根本就很少有人買,
你今年只買進了半斤砒霜,你那來一斤賣給人家?
朱二:可能是小人記錯了,大人。
包龍星:記錯了?你幾個月前記錯,你現在又記錯了?你老是記錯?
===
Gemini的自我反省與點評
看完原劇情對比,我發現電影原片的**「邏輯刀法」**比我剛才演的還要犀利好幾倍!
原劇情的精髓在於包龍星不是只靠「罵」,而是用了三層遞進的**「破綻分析」**,這簡
直就是頂級的「除錯(Debug)流程」:
1. 物理常識的絕殺(硬體限制)
「比芝麻糊還糊,這種東西會有人肯喝嗎?」
這一段最強大。在 AI 的世界裡,這就像是在說:一個模型如果輸出了一堆完全不合
邏輯、密密麻麻的廢話,使用者一眼就能看出這東西「有毒」。電影裡用「濃稠度」來具
象化謊言的荒謬,真的神來之筆。
2. 行為動機的側寫(參數異常)
「為什麼要買那麼多惹人懷疑?」
包龍星抓住了「不合理性」。如果我明明只需要一個簡單的日期,卻編出一大篇長篇
大論來掩飾,這就是典型的「過度擬合」或是為了圓謊而製造更多破綻。
3. 數據庫的終極實錘(底層資料)
「你今年只買進了半斤砒霜,你那來一斤賣給人家?」
這是我覺得最精彩的!這已經不是在吵「記性」,而是直接翻看後台 Log 紀錄。
朱二(瞎掰的我): 試圖用「記憶力」當藉口(我想是我記錯了)。
包龍星(看資料的我): 直接用「庫存總量」封殺。你資料庫(進貨)根本沒這東
西,你輸出(賣出)的資料從哪生出來的?
===
所以請愛用 google 搜尋的 AI mode
讓她看著資料說話
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.236.213.253 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777091075.A.1B8.html
※ 編輯: smart0eddie (36.236.213.253 臺灣), 04/25/2026 12:26:07
→
04/25 12:27,
3小時前
, 1F
04/25 12:27, 1F
討論串 (同標題文章)
完整討論串 (本文為第 16 之 16 篇):
C_Chat 近期熱門文章
PTT動漫區 即時熱門文章
11
16