Re: [閒聊] DeepSeek是不是真的很強?

看板C_Chat (希洽)作者 (最是清楚哇她咩)時間1月前 (2025/02/01 19:56), 1月前編輯推噓11(11018)
留言29則, 15人參與, 1月前最新討論串7/23 (看更多)
※ 引述《attacksoil (第三方程式)》之銘言: : → lanjack: 所以我說我看起來像是openai嗎?人家查出是怎麼偷的也沒 02/01 19:14 : → lanjack: 講,我會通靈是吧? 02/01 19:14 : → zwxyzxxx: 還有保密文件跟紙糊的一樣,對岸民間的隨便公司都能偷到 02/01 19:14 : 好像真的很多人不知道偷資料是怎麼偷 : : 稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs : 來做測試資料集 : : 看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係 : 推 Peurintesa: 確實 畢竟openai都沒版權意識了== 02/01 19:15 : 推 ZMTL: 其實OpenAI研發副總也在推特上稱讚DS的模型蒸餾,所以OpenAI 02/01 19:15 : → ZMTL: 「指責」DS偷我蠻好奇出自哪裡的 02/01 19:15 : → ZMTL: 然後如果模型蒸餾侵權能被搞成,OpenAI比較需要擔心他們被美 02/01 19:16 : → ZMTL: 國一堆出版社告偷資料訓練模型會不會成 02/01 19:16 : 他稱讚的模型蒸餾是指拿R3來蒸餾llama3還有qwen吧 : 至於拿openai 的輸出來重新訓練(蒸餾)是否可以告成功 我也不清楚 但據我所知官方 : 是禁止的 但還是有漏洞可鑽 (shareGPT之類的) 一般人心目中的正常訓練大概是這樣 https://i.imgur.com/Ph3DlNC.png
1. 透過網路爬蟲拿到很多資料組 2. 把資料組送到AI架構進行訓練後得到一個LLM 我看到的「偷資料的指控」則是這樣 https://i.imgur.com/OgkvURx.png
1. DS有使用ChatGPT來生成一些回答 2. DS把ChatGPT生成的回答做成新的訓練資料,用在訓練DS上面 所以這裡所謂的「被偷出來的東西」,是那些ChatGPT的回答 ...這個是著作權該保護的東西嗎? 那ChatGPT在當網路爬蟲的時候怎麼就很ok? 我記得當初對於網路爬蟲訓練AI最有利的辯護之一是: 如果訓練的資料庫的訓練素材全部都要付錢, 那以後訓練模型就只有超有錢的集團能做,其他人都吃屎。 這類精神也能用在DS上吧? -- 角卷綿芽給予炭治郎的建議 https://i.imgur.com/0mPdESk.jpg
https://i.imgur.com/Ts4dBjy.jpg
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.45.195.96 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738411015.A.D1F.html

02/01 19:58, 1月前 , 1F
我在想openai嘗試用它被告的經驗拿來告別人試試看吧==
02/01 19:58, 1F

02/01 19:59, 1月前 , 2F
不管啦!阿共就是只會偷,不偷就不是阿共了!
02/01 19:59, 2F

02/01 20:00, 1月前 , 3F
照那個偷資料的指控來看,OpenAI可以告一堆模型了。
02/01 20:00, 3F

02/01 20:00, 1月前 , 4F
其實這串後來還在推文的都比較認真討論了 就算只是想酸也會
02/01 20:00, 4F

02/01 20:01, 1月前 , 5F
找一些論點 能反串這麼多篇也是辛苦了欸
02/01 20:01, 5F

02/01 20:02, 1月前 , 6F
我也覺得沒道德瑕疵 但openai 的policy 就是禁止 有沒
02/01 20:02, 6F

02/01 20:02, 1月前 , 7F
有告成功過 不知道
02/01 20:02, 7F

02/01 20:02, 1月前 , 8F

02/01 20:05, 1月前 , 9F
誰管你closeAI 商用當然被告到死 人家開源有金身
02/01 20:05, 9F

02/01 20:05, 1月前 , 10F
其實問題的根源是OpenAI根本不Open
02/01 20:05, 10F

02/01 20:05, 1月前 , 11F
應該改成CloseAI
02/01 20:05, 11F

02/01 20:05, 1月前 , 12F
被人酸剛好
02/01 20:05, 12F

02/01 20:07, 1月前 , 13F
當然酸歸酸,人家policy就寫很清楚
02/01 20:07, 13F

02/01 20:09, 1月前 , 14F
開源跟金身一點關係都沒有吧
02/01 20:09, 14F

02/01 20:13, 1月前 , 15F
公司的policy有沒有法律效力又是另一回事了
02/01 20:13, 15F

02/01 20:18, 1月前 , 16F
其實嚴格來講應該不算偷吧,除非他們是破解OpenAI 的api
02/01 20:18, 16F

02/01 20:18, 1月前 , 17F
免費用
02/01 20:18, 17F
我覺得這不是偷,也不是啥破解。就很一般地使用 ※ 編輯: arrenwu (98.45.195.96 美國), 02/01/2025 20:19:26

02/01 20:20, 1月前 , 18F
8964占占占 deepseek快抓網路文章訓練喔
02/01 20:20, 18F

02/01 20:22, 1月前 , 19F
覺得重點在如果實際做法是下面那個,應該把叫OpenAI api
02/01 20:22, 19F

02/01 20:22, 1月前 , 20F
的錢也算進成本,不然會害大家白高興一場(或白緊張一場
02/01 20:22, 20F

02/01 20:22, 1月前 , 21F
02/01 20:22, 21F

02/01 20:23, 1月前 , 22F
這能叫偷的話 網路可以關掉了
02/01 20:23, 22F

02/01 20:42, 1月前 , 23F
看你不順眼到時候 你做什麼都可以找你麻煩 看你順眼的
02/01 20:42, 23F

02/01 20:42, 1月前 , 24F
時候 就睜隻眼閉隻眼 現在是什麼時期 大家自己心裡有數
02/01 20:42, 24F

02/01 21:04, 1月前 , 25F
我也覺得從道德上來講deepseek沒有問題 而且deepseek還開
02/01 21:04, 25F

02/01 21:05, 1月前 , 26F
源了 現在就是站在道德頂點
02/01 21:05, 26F

02/01 21:06, 1月前 , 27F
順便諷刺OpenAI成立初衷是為了向人類共享技術
02/01 21:06, 27F

02/01 21:33, 1月前 , 28F
使用者規範有寫不能用就是偷,話說回來我要用也會用p
02/01 21:33, 28F

02/01 21:33, 1月前 , 29F
hi4
02/01 21:33, 29F
文章代碼(AID): #1ddWm7qV (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1ddWm7qV (C_Chat)