[情報] Grok答不出柏德之門3問題 馬斯克怒凍結模

看板C_Chat (希洽)作者 (Windows X Linux)時間4月前 (2026/02/27 21:40), 4月前編輯推噓18(19131)
留言51則, 28人參與, 4月前最新討論串1/1
Grok 答不出〈柏德之門 3〉問題,馬斯克怒凍模型更新、抽調工程師緊急救火T https://reurl.cc/vKyevN 伊隆‧馬斯克(Elon Musk)旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答 〈柏德之門〉(Baldur’s Gate)遊戲細節問題,延遲數天推出模型更新。xAI 更緊急抽 調多名高級工程師放下手頭項目,專門協助改善 Grok 遊戲知識庫。 工程師臨時被抽調 遊戲問題觸發內部混亂 Business Insider 深度調查報導披露,Elon Musk 對 Grok 回答〈柏德之門 3〉( Baldur’s Gate 3)細節問題表現強烈不滿,下令延遲推出相關模型更新。他要求高級工 程師放下手頭項目,轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶 如無休止消防演習 。xAI 位於帕羅奧圖(Palo Alto)總部設有多個作戰室,隨時應對各 種緊急情況 。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok 在〈英雄聯盟〉(League of Legends)遊戲能力,目標更是達到最高挑戰者( Challenger)段位。 Larian Studios 開發〈柏德之門 3〉,以龍與地下城(Dungeons & Dragons)為背景。 遊戲劇情複雜且機制豐富,廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考, 業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。 Grok 成績大翻身 準確率現達 92% 事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報 導,Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名, 向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結 果顯示 Grok 整體勝任,準確率據報達 92%。 四大 AI 風格各異 測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料,並 大量使用 save-scumming 及 DPS 等玩家術語,不熟悉遊戲用戶較難理解。ChatGPT 傾向 以重點列表簡潔作答 。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎,建 議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識,回答風格差異比內 容差異更為明顯。 這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求,最 終讓 Grok 遊戲知識領域能力得到大幅提升。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.145.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1772199629.A.710.html ※ 編輯: Winux (61.224.145.120 臺灣), 02/27/2026 21:40:50

02/27 21:43, 4月前 , 1F
之後就是說要讓grok去打電競了
02/27 21:43, 1F

02/27 21:43, 4月前 , 2F
內部管理混亂(X 上頭腦門一拍想啥做啥(O
02/27 21:43, 2F

02/27 21:44, 4月前 , 3F
回答遊戲內問題很重要嗎== 今天馬投顧關心柏德之門
02/27 21:44, 3F

02/27 21:44, 4月前 , 4F
明天他玩了其他遊戲發現有錯又要工程師改嗎
02/27 21:44, 4F

02/27 21:45, 4月前 , 5F
這就像馬投顧他的推特觸及率下降去電工程師一樣
02/27 21:45, 5F

02/27 21:46, 4月前 , 6F
沒人用grok幹正事 那專注娛樂用途也好
02/27 21:46, 6F

02/27 21:46, 4月前 , 7F
從那之後我的為你推薦時不時就會出現他的推文
02/27 21:46, 7F

02/27 21:47, 4月前 , 8F
靠北我平常根本就不看英文推文! 我推特就是看圖而已
02/27 21:47, 8F

02/27 21:47, 4月前 , 9F
如果他能在所有電玩知識領域大幅超越其他AI那會挺有趣的
02/27 21:47, 9F

02/27 21:48, 4月前 , 10F
有任何電玩問題就問grok,這樣也不錯
02/27 21:48, 10F

02/27 21:48, 4月前 , 11F
這麼嚴格
02/27 21:48, 11F

02/27 21:48, 4月前 , 12F
重點是馬投顧要求改善的可否一法通萬法通
02/27 21:48, 12F

02/27 21:49, 4月前 , 13F
電玩攻略問AI要答對不難啊 抓特定網站資料就行
02/27 21:49, 13F

02/27 21:50, 4月前 , 14F
真正有用的應該是實際打電玩能力 能夠練綜合智商
02/27 21:50, 14F

02/27 21:50, 4月前 , 15F
笑死 那我可以問他SB最佳兼職策略嗎
02/27 21:50, 15F

02/27 21:51, 4月前 , 16F
希望也能加強偶像大師的正確率 別在偶大和LL和Hololive
02/27 21:51, 16F

02/27 21:51, 4月前 , 17F
都搞混了
02/27 21:51, 17F

02/27 21:51, 4月前 , 18F
笑鼠
02/27 21:51, 18F

02/27 21:53, 4月前 , 19F
能不能報個明牌讓我知道台股哪隻成本最低又漲的最高
02/27 21:53, 19F

02/27 21:54, 4月前 , 20F
柏德3說實話很考驗AI統整能力,設定超細一堆支線,攻
02/27 21:54, 20F

02/27 21:54, 4月前 , 21F
略區一把抓很容易出錯
02/27 21:54, 21F

02/27 21:56, 4月前 , 22F
被老闆抓到bug了,不改不行啊XD
02/27 21:56, 22F

02/27 21:56, 4月前 , 23F
能不能先搞瑟瑟
02/27 21:56, 23F

02/27 21:56, 4月前 , 24F
重點XAi要轉軍用 這點程度不能不會吧
02/27 21:56, 24F

02/27 21:57, 4月前 , 25F
因為這個在網路上能找到精準答案 這都回答不好表示很爛
02/27 21:57, 25F

02/27 21:57, 4月前 , 26F
只要抓BG3 Wiki的資料基本上就解答了 會出錯就是抓到討
02/27 21:57, 26F

02/27 21:57, 4月前 , 27F
論區的白痴AI
02/27 21:57, 27F

02/27 21:59, 4月前 , 28F
AI明顯在有很多登場人物的作品都會搞錯 他不是搞錯身高幾
02/27 21:59, 28F

02/27 22:00, 4月前 , 29F
公分幾歲這種細節問題 而是在大部份資料都正確的情況下冷
02/27 22:00, 29F

02/27 22:00, 4月前 , 30F
grok生成色圖被閹割,連翻譯av字幕都比gemini差,價格
02/27 22:00, 30F

02/27 22:00, 4月前 , 31F
還比較貴,完全沒訂閱的理由了
02/27 22:00, 31F

02/27 22:02, 4月前 , 32F
不及防給你來一個對作品內容都不太深入的人都不會犯的錯
02/27 22:02, 32F

02/27 22:03, 4月前 , 33F
而且中文名和翻譯名居然是分開的 有可能會發生原文譯名正
02/27 22:03, 33F

02/27 22:04, 4月前 , 34F
翻譯圖片內容目前gemini應該是最強的
02/27 22:04, 34F

02/27 22:04, 4月前 , 35F
確但中文譯名錯誤的情形 若非親眼看到窩直覺也是怎麼可能
02/27 22:04, 35F

02/27 22:05, 4月前 , 36F
在B站上不少那種假錯視圖測試 幾乎都只有gemini能過
02/27 22:05, 36F

02/27 22:05, 4月前 , 37F
能不能先搞瑟瑟
02/27 22:05, 37F

02/27 22:07, 4月前 , 38F
至少敢承認不能回答BG3問題的AI就是垃圾。
02/27 22:07, 38F

02/27 22:17, 4月前 , 39F
笑死
02/27 22:17, 39F

02/27 22:19, 4月前 , 40F
上次我記得板上有人用ai問中國法律,也是錯很大,但
02/27 22:19, 40F

02/27 22:19, 4月前 , 41F
想不起來是那一家的ai==
02/27 22:19, 41F

02/27 22:39, 4月前 , 42F
能正確答才有問題吧... 資料去那邊幹來的
02/27 22:39, 42F

02/27 23:46, 4月前 , 43F
討論區有些人都亂講 版本也有差
02/27 23:46, 43F

02/28 05:41, 4月前 , 44F
這種爛AI公司還是快點倒閉好了
02/28 05:41, 44F

02/28 05:42, 4月前 , 45F
不能色誰用你grok?
02/28 05:42, 45F

02/28 06:12, 4月前 , 46F
讓AI可以打上LOL我覺得是有點困難==
02/28 06:12, 46F

02/28 09:17, 4月前 , 47F
ai仍然會去找錯誤的舊資料
02/28 09:17, 47F

02/28 09:31, 4月前 , 48F
某樓 用AI問股票很多人在用了吧
02/28 09:31, 48F

02/28 12:12, 4月前 , 49F
遊戲還要請代玩的就不要整天想買你的gamer形象了
02/28 12:12, 49F

02/28 12:14, 4月前 , 50F
你要裝什麼太空博士鋼鐵人都隨你
02/28 12:14, 50F

02/28 21:44, 4月前 , 51F
AI也沒有辨識資料正確性的能力啊
02/28 21:44, 51F
文章代碼(AID): #1fePxDSG (C_Chat)
文章代碼(AID): #1fePxDSG (C_Chat)