Re: [閒聊] 所以付費版GPT查遊戲攻略ok嗎
※ 引述《area223672 (JOJO的奇妙比喻)》之銘言:
: 之前都用gemini問東西也是幻覺嚴重
: 那麼最新的5.5模型
: 叫他查攻略
: 例如蔚藍檔案國際服競技大賽前五十名芒打隊伍推薦
: 他會查給我正確資訊嗎
這個問題會出現,
我不禁懷疑是不是因為各大家AI公司急著變現所以刻意避談LLM的性質
LLM所給出來的結果不是確定性的 (deterministic),
也就是你現在問跟等一下問或者稍微用不同的方式問同樣問題,
都有可能出現不一樣的結果。
我目前也沒看過哪家公司的LLM保證你問同一個問題100遍結果保證都一樣。
什麼樣的結果是確定性的?
你用python的numpy函式庫去算 sin(0.368) ,
除非是機器被強力宇宙射線打到,
不然不管執行幾億次,結果都會是 0.35975005528622994
那些標準函式庫以及寫在數學課本上的定理,
才是所謂的「可靠的、不建議一般人去質疑」的結果。
而基於這個認知,就應該能理解「他會查給我正確資訊嗎」不是一個合理的疑問;
該問的是「我該用什麼樣的方式驗證LLM給的資訊」
--
「魔法少女不能對哭泣的孩子坐視不管」
~魔法少女 春菜
https://i.imgur.com/514nBjt.jpg


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.45.195.96 (美國)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777875210.A.BD7.html
推
05/04 14:17,
1月前
, 1F
05/04 14:17, 1F
→
05/04 14:17,
1月前
, 2F
05/04 14:17, 2F
推
05/04 14:17,
1月前
, 3F
05/04 14:17, 3F
→
05/04 14:19,
1月前
, 4F
05/04 14:19, 4F
→
05/04 14:19,
1月前
, 5F
05/04 14:19, 5F
→
05/04 14:19,
1月前
, 6F
05/04 14:19, 6F
→
05/04 14:19,
1月前
, 7F
05/04 14:19, 7F
→
05/04 14:20,
1月前
, 8F
05/04 14:20, 8F
→
05/04 14:20,
1月前
, 9F
05/04 14:20, 9F
噓
05/04 14:20,
1月前
, 10F
05/04 14:20, 10F
→
05/04 14:20,
1月前
, 11F
05/04 14:20, 11F
→
05/04 14:20,
1月前
, 12F
05/04 14:20, 12F
→
05/04 14:21,
1月前
, 13F
05/04 14:21, 13F
推
05/04 14:21,
1月前
, 14F
05/04 14:21, 14F
→
05/04 14:21,
1月前
, 15F
05/04 14:21, 15F
→
05/04 14:21,
1月前
, 16F
05/04 14:21, 16F
推
05/04 14:21,
1月前
, 17F
05/04 14:21, 17F
其他我不確定 Gemini 和 ChatGPT 都會給產生回應的訊息來源
光是有這些,驗證起來已經算是輕鬆了
推
05/04 14:22,
1月前
, 18F
05/04 14:22, 18F
→
05/04 14:22,
1月前
, 19F
05/04 14:22, 19F
倒也不是這樣的
相較於像Google 或 Bing 這種傳統的搜尋引擎,
LLM 進行模糊比對的效率比較高。
LLM不一定要給很正確的答案,但只要他能給有用的引源,
對問問題的使用者來說就是有用的─你最少會知道怎麼樣問更有效率
→
05/04 14:22,
1月前
, 20F
05/04 14:22, 20F
→
05/04 14:23,
1月前
, 21F
05/04 14:23, 21F
推
05/04 14:24,
1月前
, 22F
05/04 14:24, 22F
→
05/04 14:24,
1月前
, 23F
05/04 14:24, 23F
推
05/04 14:24,
1月前
, 24F
05/04 14:24, 24F
這也無妨,重要的是他能給出什麼樣的訊息來源
→
05/04 14:24,
1月前
, 25F
05/04 14:24, 25F
→
05/04 14:25,
1月前
, 26F
05/04 14:25, 26F
→
05/04 14:25,
1月前
, 27F
05/04 14:25, 27F
推
05/04 14:26,
1月前
, 28F
05/04 14:26, 28F
→
05/04 14:26,
1月前
, 29F
05/04 14:26, 29F
推
05/04 14:27,
1月前
, 30F
05/04 14:27, 30F
→
05/04 14:27,
1月前
, 31F
05/04 14:27, 31F
我不需要LLM保證他的結果一定正確啊
但LLM搜尋的過程會給出訊息來源,
我看了訊息來源之後,不就能驗證他的推論了?
→
05/04 14:27,
1月前
, 32F
05/04 14:27, 32F
→
05/04 14:27,
1月前
, 33F
05/04 14:27, 33F
→
05/04 14:28,
1月前
, 34F
05/04 14:28, 34F
→
05/04 14:28,
1月前
, 35F
05/04 14:28, 35F
→
05/04 14:28,
1月前
, 36F
05/04 14:28, 36F
→
05/04 14:28,
1月前
, 37F
05/04 14:28, 37F
推
05/04 14:29,
1月前
, 38F
05/04 14:29, 38F
→
05/04 14:29,
1月前
, 39F
05/04 14:29, 39F
推
05/04 14:29,
1月前
, 40F
05/04 14:29, 40F
→
05/04 14:29,
1月前
, 41F
05/04 14:29, 41F
推
05/04 14:30,
1月前
, 42F
05/04 14:30, 42F
→
05/04 14:30,
1月前
, 43F
05/04 14:30, 43F
推
05/04 14:30,
1月前
, 44F
05/04 14:30, 44F
→
05/04 14:31,
1月前
, 45F
05/04 14:31, 45F
→
05/04 14:31,
1月前
, 46F
05/04 14:31, 46F
推
05/04 14:33,
1月前
, 47F
05/04 14:33, 47F
我覺得LLM什麼問題都可以問啊 有什麼不適合問的嗎?
→
05/04 14:33,
1月前
, 48F
05/04 14:33, 48F
→
05/04 14:34,
1月前
, 49F
05/04 14:34, 49F
→
05/04 14:34,
1月前
, 50F
05/04 14:34, 50F
推
05/04 14:35,
1月前
, 51F
05/04 14:35, 51F
→
05/04 14:35,
1月前
, 52F
05/04 14:35, 52F
→
05/04 14:35,
1月前
, 53F
05/04 14:35, 53F
→
05/04 14:35,
1月前
, 54F
05/04 14:35, 54F
推
05/04 14:59,
1月前
, 55F
05/04 14:59, 55F
→
05/04 15:00,
1月前
, 56F
05/04 15:00, 56F
→
05/04 15:00,
1月前
, 57F
05/04 15:00, 57F
→
05/04 15:01,
1月前
, 58F
05/04 15:01, 58F
推
05/04 15:07,
1月前
, 59F
05/04 15:07, 59F
→
05/04 15:32,
1月前
, 60F
05/04 15:32, 60F
→
05/04 15:32,
1月前
, 61F
05/04 15:32, 61F
推
05/04 15:36,
1月前
, 62F
05/04 15:36, 62F
推
05/04 16:25,
1月前
, 63F
05/04 16:25, 63F
推
05/04 16:38,
1月前
, 64F
05/04 16:38, 64F
→
05/04 16:38,
1月前
, 65F
05/04 16:38, 65F
→
05/04 16:57,
1月前
, 66F
05/04 16:57, 66F
→
05/04 16:57,
1月前
, 67F
05/04 16:57, 67F
→
05/04 17:01,
1月前
, 68F
05/04 17:01, 68F
→
05/04 17:01,
1月前
, 69F
05/04 17:01, 69F
→
05/04 17:01,
1月前
, 70F
05/04 17:01, 70F
那個 該問的問題我已經在文章寫了,
就是「如何驗證一個回應的正確性」,
只要錯誤的機率不是0%,你就不可能去迴避這個問題
所以另外一個有意義的問題是:回應的正確性是否是100%
不過這個是給 理論 和 函式庫 的問題。
→
05/04 17:03,
1月前
, 71F
05/04 17:03, 71F
→
05/04 17:03,
1月前
, 72F
05/04 17:03, 72F
→
05/04 17:03,
1月前
, 73F
05/04 17:03, 73F
※ 編輯: arrenwu (98.45.195.96 美國), 05/04/2026 17:04:44
→
05/04 17:06,
1月前
, 74F
05/04 17:06, 74F
→
05/04 17:06,
1月前
, 75F
05/04 17:06, 75F
→
05/04 17:06,
1月前
, 76F
05/04 17:06, 76F
→
05/04 17:11,
1月前
, 77F
05/04 17:11, 77F
→
05/04 17:11,
1月前
, 78F
05/04 17:11, 78F
→
05/04 17:11,
1月前
, 79F
05/04 17:11, 79F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 3 篇):
26
93
C_Chat 近期熱門文章
PTT動漫區 即時熱門文章
47
114
5
10