Re: [閒聊] DeepSeek是不是真的很強?
※ 引述《attacksoil (第三方程式)》之銘言:
: → lanjack: 所以我說我看起來像是openai嗎?人家查出是怎麼偷的也沒 02/01 19:14
: → lanjack: 講,我會通靈是吧? 02/01 19:14
: → zwxyzxxx: 還有保密文件跟紙糊的一樣,對岸民間的隨便公司都能偷到 02/01 19:14
: 好像真的很多人不知道偷資料是怎麼偷
:
: 稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs
: 來做測試資料集
:
: 看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係
: 推 Peurintesa: 確實 畢竟openai都沒版權意識了== 02/01 19:15
: 推 ZMTL: 其實OpenAI研發副總也在推特上稱讚DS的模型蒸餾,所以OpenAI 02/01 19:15
: → ZMTL: 「指責」DS偷我蠻好奇出自哪裡的 02/01 19:15
: → ZMTL: 然後如果模型蒸餾侵權能被搞成,OpenAI比較需要擔心他們被美 02/01 19:16
: → ZMTL: 國一堆出版社告偷資料訓練模型會不會成 02/01 19:16
: 他稱讚的模型蒸餾是指拿R3來蒸餾llama3還有qwen吧
: 至於拿openai 的輸出來重新訓練(蒸餾)是否可以告成功 我也不清楚 但據我所知官方
: 是禁止的 但還是有漏洞可鑽 (shareGPT之類的)
一般人心目中的正常訓練大概是這樣
https://i.imgur.com/Ph3DlNC.png

1. 透過網路爬蟲拿到很多資料組
2. 把資料組送到AI架構進行訓練後得到一個LLM
我看到的「偷資料的指控」則是這樣
https://i.imgur.com/OgkvURx.png

1. DS有使用ChatGPT來生成一些回答
2. DS把ChatGPT生成的回答做成新的訓練資料,用在訓練DS上面
所以這裡所謂的「被偷出來的東西」,是那些ChatGPT的回答
...這個是著作權該保護的東西嗎?
那ChatGPT在當網路爬蟲的時候怎麼就很ok?
我記得當初對於網路爬蟲訓練AI最有利的辯護之一是:
如果訓練的資料庫的訓練素材全部都要付錢,
那以後訓練模型就只有超有錢的集團能做,其他人都吃屎。
這類精神也能用在DS上吧?
--
角卷綿芽給予炭治郎的建議
https://i.imgur.com/0mPdESk.jpg


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.45.195.96 (美國)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738411015.A.D1F.html
推
02/01 19:58,
1月前
, 1F
02/01 19:58, 1F
推
02/01 19:59,
1月前
, 2F
02/01 19:59, 2F
推
02/01 20:00,
1月前
, 3F
02/01 20:00, 3F
→
02/01 20:00,
1月前
, 4F
02/01 20:00, 4F
→
02/01 20:01,
1月前
, 5F
02/01 20:01, 5F
推
02/01 20:02,
1月前
, 6F
02/01 20:02, 6F
→
02/01 20:02,
1月前
, 7F
02/01 20:02, 7F
→
02/01 20:02,
1月前
, 8F
02/01 20:02, 8F

推
02/01 20:05,
1月前
, 9F
02/01 20:05, 9F
→
02/01 20:05,
1月前
, 10F
02/01 20:05, 10F
→
02/01 20:05,
1月前
, 11F
02/01 20:05, 11F
→
02/01 20:05,
1月前
, 12F
02/01 20:05, 12F
→
02/01 20:07,
1月前
, 13F
02/01 20:07, 13F
→
02/01 20:09,
1月前
, 14F
02/01 20:09, 14F
→
02/01 20:13,
1月前
, 15F
02/01 20:13, 15F
推
02/01 20:18,
1月前
, 16F
02/01 20:18, 16F
→
02/01 20:18,
1月前
, 17F
02/01 20:18, 17F
我覺得這不是偷,也不是啥破解。就很一般地使用
※ 編輯: arrenwu (98.45.195.96 美國), 02/01/2025 20:19:26
→
02/01 20:20,
1月前
, 18F
02/01 20:20, 18F
推
02/01 20:22,
1月前
, 19F
02/01 20:22, 19F
→
02/01 20:22,
1月前
, 20F
02/01 20:22, 20F
→
02/01 20:22,
1月前
, 21F
02/01 20:22, 21F
推
02/01 20:23,
1月前
, 22F
02/01 20:23, 22F
推
02/01 20:42,
1月前
, 23F
02/01 20:42, 23F
→
02/01 20:42,
1月前
, 24F
02/01 20:42, 24F
推
02/01 21:04,
1月前
, 25F
02/01 21:04, 25F
→
02/01 21:05,
1月前
, 26F
02/01 21:05, 26F
→
02/01 21:06,
1月前
, 27F
02/01 21:06, 27F
推
02/01 21:33,
1月前
, 28F
02/01 21:33, 28F
→
02/01 21:33,
1月前
, 29F
02/01 21:33, 29F
討論串 (同標題文章)
C_Chat 近期熱門文章
PTT動漫區 即時熱門文章