PTT動漫區 / C_Chat (希洽)

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

看板C_Chat (希洽)作者arrenwu (最是清楚哇她咩)時間1月前 (2025/11/23 10:25)推噓9(9推 0噓 35→)

留言44則, 11人參與討論串7/8 (看更多)

※ 引述《Rimowa (德國品質)》之銘言： : 我想現在AI遇到最大的問題有兩個 : 一個是很多人提的 AI講錯也不用扛責所以講錯也不會怎樣 : 另一個是因為AI怎麼樣都會掰出一套說法給你 : 如果相信了就可能有這次的吃毒菇案件 : 但如果還是懷疑堅持不信要自己求證那又何必問AI? : 可是很多場景是沒有專業人士的或是說若有專業人士又何必問AI? 這中間有個盲點就是：人並不是只有專業人士或超級外行還有一種是入門水平或中間偏低比如我們來看一個 2024 指定科目考試數學甲的問題：一遊戲廠商將舉辦抽獎活動，廠商公告每次抽獎需使用掉一個代幣，且每次抽獎的中獎機率皆為0.1。某甲決定先存若干個代幣，並在活動開始後進行抽獎，直到用完所有代幣才停止。下列五個選項： (1) 某甲中獎一次所需要抽獎次數的期望值為10 (2) 某甲抽獎兩次就中獎一次以上的機率為0.2 (3) 某甲抽獎10次都沒中獎的機率小於抽獎1次就中獎的機率 (4) 某甲至少要存22個代幣，才能保證中獎的機率大於0.9 (5) 某甲只要存足夠多的代幣，就可以保證中獎的機率為1 請問哪幾個選項是正確的？這問題稱不上很難，但是要具備一定程度訓練和熟練度的人，才能解這問題。但如果你用 Gemini 3 Pro去問這問題，可以得到下面的結果： ============== Gemini 開始 ================ 這是一個經典的機率與期望值問題。我們逐一分析這五個選項，找出正確的答案。基本設定單次中獎機率：p = 0.1 單次沒中獎機率：1 - p = 0.9 抽獎次數（代幣數）：n 選項分析 (1) 某甲中獎一次所需要抽獎次數的期望值為 10 判定：正確分析：這是「幾何分佈」（Geometric Distribution）的概念，即計算直到第一次成功所需的試驗次數。計算：期望值 E = 1/p 代入 p=0.1，則 E = 1/0.1 = 10 這意味著平均來說，確實需要抽 10 次才會中獎一次。 (2) 某甲抽獎兩次就中獎一次以上的機率為 0.2 判定：錯誤分析：「中獎一次以上」的機率 = 1 - 「兩次都沒中」。計算：兩次都沒中的機率：0.9 * 0.9 = 0.81 至少中一次的機率：1 - 0.81 = 0.19 註：此選項的陷阱在於直接將兩次機率相加 ($0.1 + 0.1$)，這是錯誤的算法。 (3) 某甲抽獎 10 次都沒中獎的機率小於抽獎 1 次就中獎的機率判定：錯誤分析：我們需要比較 10次全槓龜與 1次就中的機率計算：抽 10 次都沒中的機率：0.9^10 ~= 0.3487 抽 1 次就中獎的機率：0.1 顯然 0.3487 > 0.1 (4) 某甲至少要存 22 個代幣，才能保證中獎的機率大於 0.9 判定：正確分析：我們要找出最小的整數 n，使得「至少中一次」的機率 > 0.9。 1 - (0.9)^n > 0.9 計算： (0.9)^n < 0.1 兩邊取對數（log）： n > (-1)/(-0.04576) ~= 21.85 因為 n 必須是整數，故 n 至少要為 22。 (5) 某甲只要存足夠多的代幣，就可以保證中獎的機率為 1 判定：錯誤分析：雖然隨著次數增加，中獎機率會無限趨近於 1，但在有限的次數內，它永遠不會「等於」1。數學上，1 - (0.9)^n 永遠小於 1，只要 n 是有限數值，就存在「全部沒中」的微小可能性。正確的選項是 (1) 某甲中獎一次所需要抽獎次數的期望值為10 (4) 某甲至少要存22個代幣，才能保證中獎的機率大於0.9 ============== Gemini 結束 ================ 我幫大家確認過了，這結果沒問題。顯然，有了Gemini提供的過程後，即便是程度較差的人，也可以解決這個問題。因為現在只要能看得懂過程即可。但這並不表示Gemini說正確的選項是(1),(4)，使用者就直接買單，因為Gemini也可能是錯的。所以這結果，對數學麻瓜是沒用的。我本人對於「有了Copilot後不用學程式」或「AI解題力達到奧數金牌，以後不用學數學」是相當不以為然的。反而是有了這些工具之後，人類比起從前更應該學這些東西。只要學一點點，就可以獲得巨大成果，何樂而不為呢 :D @tree_isu https://x.com/tree_isu/status/1990543628004176001/photo/1 https://pbs.twimg.com/media/G5_U4RNacAARxLG.jpg

-- 「凡有正法之地，必有我在；而我在之處，勝利必將隨之到來」～ Krishna https://i.imgur.com/DwaSdca.jpg

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.45.195.96 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1763864726.A.283.html

推

11/23 10:28, 1月前 , 1^F

11/23 10:28, 1^F

→

11/23 10:33, 1月前 , 2^F

11/23 10:33, 2^F

→

11/23 10:34, 1月前 , 3^F

11/23 10:34, 3^F

→

11/23 10:34, 1月前 , 4^F

11/23 10:34, 4^F

所以這問題在我看起來比較像是風氣問題。如果LLM成為標準的工具，那我認為教學機關必須要堅定表明「AI講的=我不知道」的概念

→

11/23 10:35, 1月前 , 5^F

11/23 10:35, 5^F

→

11/23 10:36, 1月前 , 6^F

11/23 10:36, 6^F

我最近超熱中這方面應用這次很認真地打算學習RAG/Agent之類的知識XD 現在程式輔助工具解決很多以往我感到非常困擾的問題

推

11/23 10:43, 1月前 , 7^F

11/23 10:43, 7^F

→

11/23 10:43, 1月前 , 8^F

11/23 10:43, 8^F

推

11/23 10:46, 1月前 , 9^F

11/23 10:46, 9^F

推

11/23 11:06, 1月前 , 10^F

11/23 11:06, 10^F

→

11/23 11:06, 1月前 , 11^F

11/23 11:06, 11^F

→

11/23 11:25, 1月前 , 12^F

11/23 11:25, 12^F

→

11/23 11:25, 1月前 , 13^F

11/23 11:25, 13^F

→

11/23 11:25, 1月前 , 14^F

11/23 11:25, 14^F

→

11/23 11:25, 1月前 , 15^F

11/23 11:25, 15^F

→

11/23 11:26, 1月前 , 16^F

11/23 11:26, 16^F

所以問題是我上一篇講的啊，問題在於「因為一些因素人有意識地選擇盲信」

→

11/23 11:26, 1月前 , 17^F

11/23 11:26, 17^F

→

11/23 11:27, 1月前 , 18^F

11/23 11:27, 18^F

→

11/23 11:28, 1月前 , 19^F

11/23 11:28, 19^F

這跟無知沒什麼關係啊，比如Gemini很大方地在服務下面寫著 "Gemini can make mistakes, so double-check it" 你沒有double-check直接使用結論，這就是盲信啊這邊沒有任何未知的訊息

推

11/23 11:29, 1月前 , 20^F

11/23 11:29, 20^F

→

11/23 11:29, 1月前 , 21^F

11/23 11:29, 21^F

推

11/23 11:30, 1月前 , 22^F

11/23 11:30, 22^F

→

11/23 11:31, 1月前 , 23^F

11/23 11:31, 23^F

→

11/23 11:31, 1月前 , 24^F

11/23 11:31, 24^F

→

11/23 11:31, 1月前 , 25^F

11/23 11:31, 25^F

這個不是服務條款啊，就直接寫在prompt旁邊而已。而且LLM會出錯這知道的人老早很多了不是嗎？

→

11/23 11:32, 1月前 , 26^F

11/23 11:32, 26^F

→

11/23 11:33, 1月前 , 27^F

11/23 11:33, 27^F

→

11/23 11:33, 1月前 , 28^F

11/23 11:33, 28^F

推

11/23 11:34, 1月前 , 29^F

11/23 11:34, 29^F

這個就是 mouscat 提到的類似內容農場的問題。其實學校機關在很早期的階段就給出解法。問題出在實作學術標準的生活方式很多人不喜歡

→

11/23 11:34, 1月前 , 30^F

11/23 11:34, 30^F

→

11/23 11:34, 1月前 , 31^F

11/23 11:34, 31^F

→

11/23 11:35, 1月前 , 32^F

11/23 11:35, 32^F

「忽略警語」這個是另外一種性質的問題這邊的問題，你可以嘗試去長輩群組裡面，對著他們的農場文，提出「這個訊息沒有可靠的引源，不應該相信」的論點，看看他們的反應長啥樣我非常確信這是因為社會因素導致的盲信選擇 ※ 編輯: arrenwu (98.45.195.96 美國), 11/23/2025 11:38:13

推

11/23 12:08, 1月前 , 33^F

11/23 12:08, 33^F

→

11/23 12:08, 1月前 , 34^F

11/23 12:08, 34^F

→

11/23 12:08, 1月前 , 35^F

11/23 12:08, 35^F

推

11/23 12:09, 1月前 , 36^F

11/23 12:09, 36^F

→

11/23 12:09, 1月前 , 37^F

11/23 12:09, 37^F

→

11/23 12:41, 1月前 , 38^F

11/23 12:41, 38^F

→

11/23 12:41, 1月前 , 39^F

11/23 12:41, 39^F

→

11/23 12:41, 1月前 , 40^F

11/23 12:41, 40^F

→

11/23 13:44, 1月前 , 41^F

11/23 13:44, 41^F

→

11/23 13:44, 1月前 , 42^F

11/23 13:44, 42^F

→

11/23 17:28, 1月前 , 43^F

11/23 17:28, 43^F

→

11/23 19:49, 1月前 , 44^F

11/23 19:49, 44^F

‣ 返回看板[ C_Chat ] 閒談

‣ 更多 arrenwu 的文章

文章代碼(AID): #1f8d2MA3 (C_Chat)

討論串 (同標題文章)

完整討論串 (本文為第 7 之 8 篇)：

排序：最新先 | 最舊先 | 留言數

4

47

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒已刪文

1月前, 11/23

9

44

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/23

-3

8

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/23

13

36

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/22

2

4

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/22

2

11

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/22

7

25

Re: [閒聊] 讓AI判斷野菇能不能吃，結果中毒已刪文

1月前, 11/22

140

350

[閒聊] 讓AI判斷野菇能不能吃，結果中毒

1月前, 11/22

在新視窗開啟完整討論串 (共8篇)

C_Chat 近期熱門文章

1

8

[公告] 廣告水桶 20251226

2小時前, 12/26

1

1

[佐賀] 劇場版x onkyodirect 無線耳機

2小時前, 12/26

4

4

[鐵道] 流螢躺在沙發上

2小時前, 12/26

3

4

[牡蠣] 戀人不行Megami雜誌新圖甘織姊妹

2小時前, 12/26

2

2

[GKMS] 學園偶像大師新CM

2小時前, 12/26

12

14

[閒聊] 本月Megami 版權圖

2小時前, 12/26

2

2

Re: [妮姬] NIKKE展揭露各個角色的身高(圖多

2小時前, 12/26

6

6

[FGO] 雷空想樹必須留下為我而留

2小時前, 12/26

更多近期熱門文章 >>

PTT動漫區即時熱門文章

8

14

[情報] 12/27(六) 18:00～19:45 短時間維修

5小時前, 12/26

10

66

[生放] IM@S SC 年終總結感謝特別篇生放送

8小時前, 12/26

5

6

[Live] Roselia ASIA TOUR @台北

9小時前, 12/26

12

21

Fw: [百合] 對我垂涎欲滴的非人少女

15小時前, 12/26

9

17

[新聞] One Piece航海王海賊旗為何成Z世代反抗象

1天前, 12/25

29

68

[檢舉] QueenSideron 4-5

1天前, 12/25

1

7

1天前, 12/25

6

7

Re: [請神] 問一部全彩群交本

1天前, 12/25

更多即時熱門文章 >>

‣ 返回看板[ C_Chat ] 閒談

‣ 更多 arrenwu 的文章

文章代碼(AID): #1f8d2MA3 (C_Chat)