Re: [閒聊] DeepSeek是不是真的很強?

看板C_Chat (希洽)作者 (第三方程式)時間4小時前 (2025/02/01 18:41), 3小時前編輯推噓37(39242)
留言83則, 40人參與, 2小時前最新討論串5/14 (看更多)
這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低 論文中說的訓練成本低 是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的 實際有實作經驗的人就知道你要嘗試一個新訓練方式 甚至要提高訓練效率 都嘛還要做一 堆實驗 實際上花的成本遠高於此 DeepSeek真正佛心的地方是把他最後訓練所用的方法都寫在論文上了 後人可以少走彎路 但從現在AI進展的速度 這個訓練配方肯定也不是會被一直使用的東西 技術就是這樣一直 進步 結果被一堆媒體用政治的語言解釋 作者本人肯定也莫名奇妙 然後再說上述的“佛心” 也就是發表了論文 這幾年AI進步上一堆突破都嘛有發明論文 美國 歐洲都有 中國的論文也沒少過 怎麼今天突然被highlight 笑死 有問題的是那個天殺的OpenAI 就他都不發論文也不開源 而且前述模型訓練指的是DeepSeek V3 這次能力真的讓AI界驚艷的是Deepseek R2 也就是 基於前述V3模型做後訓練 真正有創造性的是這個 因為OpenAI幾個月前丟出來的o2模型沒 有論文 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.50.51 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738406466.A.5F8.html

02/01 18:43, 4小時前 , 1F
但即使是商用,也很少重新訓練
02/01 18:43, 1F

02/01 18:43, 4小時前 , 2F
拿來翻譯色遊夠用就算強
02/01 18:43, 2F

02/01 18:43, 4小時前 , 3F
openAI就是來圈錢的
02/01 18:43, 3F
也就這幾年越來越誇張 openai 本身對ai貢獻還是很大 例如現在語音轉文字的標準還是o penai開源的Whisper模型 ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:45:26

02/01 18:45, 4小時前 , 4F
從它開源的那刻起 任何嘴它的理由都顯得有點好笑
02/01 18:45, 4F
沒錯 人家都開源了 真的沒啥好酸 但也不用太過神話 這個Deepseek的衝擊還是沒有當初的llama3和去年的mistral 來的大 ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:47:23

02/01 18:46, 4小時前 , 5F
原本歐噴AI 的用處還真的是用來圈錢,結果來不及圈就破功
02/01 18:46, 5F

02/01 18:46, 4小時前 , 6F
美國的科研是很燒錢的,上市的時候圈錢才能繼續走下去
02/01 18:46, 6F

02/01 18:46, 4小時前 , 7F
openai都多久了,又不是只有一個產品
02/01 18:46, 7F

02/01 18:47, 4小時前 , 8F
看b站跟這邊一堆人把訓練跟使用混在一起
02/01 18:47, 8F

02/01 18:47, 4小時前 , 9F
問是不是以後不用老黃顯卡了 是不是可以每台電腦都裝
02/01 18:47, 9F

02/01 18:47, 4小時前 , 10F
單機遊戲是不是每個npc都可以用AI
02/01 18:47, 10F

02/01 18:47, 4小時前 , 11F
那完全就是兩碼子事==
02/01 18:47, 11F
如果是想討論顯卡相關 那就是另一篇了 這篇是講訓練 實際跟顯卡相關的是推理

02/01 18:47, 4小時前 , 12F
問題是還沒有真的上市阿,之前好像都是找投資
02/01 18:47, 12F

02/01 18:47, 4小時前 , 13F
openAI我覺得還是有優勢啦 但DS出來就是多一個方法幫大家
02/01 18:47, 13F

02/01 18:47, 4小時前 , 14F
省成本
02/01 18:47, 14F

02/01 18:48, 4小時前 , 15F
阿共仔怎麼可能這麼好心!這一定是孔明的陷阱!
02/01 18:48, 15F
阿里巴巴開源一堆模型也不是一天兩天的事 只能說有些東西是無國界的 ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:48:54

02/01 18:48, 4小時前 , 16F
我實在很好奇有些人看到"開源" 他想到的開源到底是啥
02/01 18:48, 16F
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:50:05

02/01 18:49, 4小時前 , 17F
老實講開源是真的挺佛心的
02/01 18:49, 17F

02/01 18:49, 4小時前 , 18F
生命自然會找到出路 越打壓越是如此
02/01 18:49, 18F

02/01 18:50, 4小時前 , 19F
通通不準用!阿共仔會偷你資料!
02/01 18:50, 19F

02/01 18:50, 4小時前 , 20F
這塊大部分的人都會開源吧,除了openai ==
02/01 18:50, 20F

02/01 18:51, 4小時前 , 21F
哪有大部分==
02/01 18:51, 21F

02/01 18:51, 4小時前 , 22F
沒有一定 你有自信自己搞也進步飛快 沒有一定要開源
02/01 18:51, 22F

02/01 18:51, 4小時前 , 23F
沒開源的還是遠多於開源的
02/01 18:51, 23F

02/01 18:52, 4小時前 , 24F
畢竟多數人可能連基礎什麼都不清楚
02/01 18:52, 24F

02/01 18:52, 4小時前 , 25F
他都敢開源了
02/01 18:52, 25F

02/01 18:52, 4小時前 , 26F
開源又怎樣 還不是有機會藏木馬!
02/01 18:52, 26F

02/01 18:53, 4小時前 , 27F
當然先撇開開發國是哪國不講 如果他願意把自己成果開源
02/01 18:53, 27F

02/01 18:53, 4小時前 , 28F
確實很佛 但如果他的被確認是盜用別人東西是另一回事
02/01 18:53, 28F

02/01 18:55, 4小時前 , 29F
上篇有人看到阿共開源會想到在裡面偷塞木馬 對啊
02/01 18:55, 29F

02/01 18:55, 4小時前 , 30F
蛤?你是說開源的盜閉源的嗎?
02/01 18:55, 30F
偷資料是另外一回事 這裡指的偷資料是用openai api生成的回答來訓練 雖然以開源精神來說 我不覺得偷這種資料有多大的道德瑕疵 但如果有偷 然後還被抓到 那就只能乖乖走訴訟程序

02/01 18:55, 4小時前 , 31F
*爆的那篇
02/01 18:55, 31F
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:59:54

02/01 18:56, 4小時前 , 32F
openai自己在網上無視版權亂抓資料訓練模型結果ds出來開
02/01 18:56, 32F

02/01 18:56, 4小時前 , 33F
源後還在那嘴人家抄他們真的很好笑
02/01 18:56, 33F

02/01 18:57, 4小時前 , 34F
這杯水乳滑的梗圖 都可以改成這杯水有木馬竊取你資料
02/01 18:57, 34F

02/01 18:58, 4小時前 , 35F
我是覺得原碼公開這麼久沒被抓到奇怪的東西應該不至於
02/01 18:58, 35F

02/01 18:59, 3小時前 , 36F
r1有開源嗎?我以為只有v3
02/01 18:59, 36F
模型有 huggingface可以下載完整MOE 但訓練腳本有沒有開源我沒注意

02/01 18:59, 3小時前 , 37F
openai要正名closeai才對,看不到哪裡open
02/01 18:59, 37F

02/01 18:59, 3小時前 , 38F
很多開源軟體和套件都有過因為人為/非人為bug搞出過資
02/01 18:59, 38F

02/01 18:59, 3小時前 , 39F
漏洞啦 不是開源就一定萬無一失
02/01 18:59, 39F
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:00:53

02/01 19:00, 3小時前 , 40F
有能力下開源來驗證的幾乎都能抓出有沒有藏木馬好
02/01 19:00, 40F

02/01 19:00, 3小時前 , 41F
嗎 說話之前先思考一下很難?
02/01 19:00, 41F

02/01 19:03, 3小時前 , 42F
阿人家程式碼擺在那邊,有漏洞你抓出來啊,肚子都剖
02/01 19:03, 42F

02/01 19:03, 3小時前 , 43F
開了有幾碗粉不會自己看嗎?
02/01 19:03, 43F

02/01 19:04, 3小時前 , 44F
不把所有事扯在一起講要怎麼抹屎
02/01 19:04, 44F
木馬真的不用擔心 要擔心的是alignment 的問題 但據我所知 現在技術對alignment的控制力暫時還沒那麼強 應該還可以不太需要擔心... 吧 ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:07:39

02/01 19:07, 3小時前 , 45F
偷openai資料 要不要想一下這些資料哪來的 openai現在還不o
02/01 19:07, 45F

02/01 19:07, 3小時前 , 46F
pen了笑死
02/01 19:07, 46F

02/01 19:11, 3小時前 , 47F
這邊好多沒有版權意識的人
02/01 19:11, 47F

02/01 19:11, 3小時前 , 48F
現在就是偷了被抓到了啊,至於訴訟我看起來像是openai嗎
02/01 19:11, 48F

02/01 19:12, 3小時前 , 49F
人家歐噴AI 就不開放資料你是要去哪裡偷
02/01 19:12, 49F

02/01 19:13, 3小時前 , 50F
如果真的能偷到,那是不是反向證明了科技大國的美國資安
02/01 19:13, 50F

02/01 19:14, 3小時前 , 51F
所以我說我看起來像是openai嗎?人家查出是怎麼偷的也沒
02/01 19:14, 51F

02/01 19:14, 3小時前 , 52F
講,我會通靈是吧?
02/01 19:14, 52F

02/01 19:14, 3小時前 , 53F
還有保密文件跟紙糊的一樣,對岸民間的隨便公司都能偷到
02/01 19:14, 53F
好像真的很多人不知道偷資料是怎麼偷 稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs 來做測試資料集 看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係 ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:17:14

02/01 19:15, 3小時前 , 54F
確實 畢竟openai都沒版權意識了==
02/01 19:15, 54F

02/01 19:15, 3小時前 , 55F
其實OpenAI研發副總也在推特上稱讚DS的模型蒸餾,所以OpenAI
02/01 19:15, 55F

02/01 19:15, 3小時前 , 56F
「指責」DS偷我蠻好奇出自哪裡的
02/01 19:15, 56F

02/01 19:16, 3小時前 , 57F
然後如果模型蒸餾侵權能被搞成,OpenAI比較需要擔心他們被美
02/01 19:16, 57F

02/01 19:16, 3小時前 , 58F
國一堆出版社告偷資料訓練模型會不會成
02/01 19:16, 58F
他稱讚的模型蒸餾是指拿R3來蒸餾llama3還有qwen吧 至於拿openai 的輸出來重新訓練(蒸餾)是否可以告成功 我也不清楚 但據我所知官方 是禁止的 但還是有漏洞可鑽 (shareGPT之類的) ※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:20:40

02/01 19:25, 3小時前 , 59F
沒拿出證據然後說抓到了 還硬要上車是....
02/01 19:25, 59F

02/01 19:26, 3小時前 , 60F
之前說侵權的那篇文就說了目前沒證據啊,後續吵都多餘的
02/01 19:26, 60F

02/01 19:28, 3小時前 , 61F
這版有論文的根本沒幾個 跟他們講也是浪費時間 擬人真好
02/01 19:28, 61F

02/01 19:30, 3小時前 , 62F
我純看戲 不站隊 因為我完全不懂 不過看起來挺有意思的
02/01 19:30, 62F

02/01 19:33, 3小時前 , 63F
我的看法是這樣啦
02/01 19:33, 63F

02/01 19:35, 3小時前 , 64F
02/01 19:35, 64F

02/01 19:36, 3小時前 , 65F
一般人就看AI未來發展怎樣又不用站隊
02/01 19:36, 65F

02/01 19:36, 3小時前 , 66F
急著站隊就那種整天在意識形態的
02/01 19:36, 66F

02/01 19:41, 3小時前 , 67F
很多人連蒸餾都搞不清楚 deepseek被太多外行關注了
02/01 19:41, 67F

02/01 19:43, 3小時前 , 68F
要看論文直接搜尋就有啦
02/01 19:43, 68F

02/01 19:44, 3小時前 , 69F
02/01 19:44, 69F

02/01 19:44, 3小時前 , 70F
02/01 19:44, 70F

02/01 19:44, 3小時前 , 71F
02/01 19:44, 71F

02/01 19:48, 3小時前 , 72F
內行
02/01 19:48, 72F

02/01 19:52, 3小時前 , 73F
上課教材或影片文本偷別人的你覺得ok?
02/01 19:52, 73F

02/01 19:54, 3小時前 , 74F
closeAI
02/01 19:54, 74F

02/01 19:55, 3小時前 , 75F
還在講偷來的我都不知道是在酸誰耶
02/01 19:55, 75F

02/01 20:04, 2小時前 , 76F
比當初講解大谷合約還痛苦= = 無限跳針+根本看不懂英文
02/01 20:04, 76F

02/01 20:04, 2小時前 , 77F
的一堆
02/01 20:04, 77F

02/01 20:06, 2小時前 , 78F
gpt訓練時的東西全部都有經過同意嗎 還是未經別人同
02/01 20:06, 78F

02/01 20:06, 2小時前 , 79F
意拿來用
02/01 20:06, 79F

02/01 20:06, 2小時前 , 80F
誰最怕DS被說偷竊,就是在酸它
02/01 20:06, 80F

02/01 20:06, 2小時前 , 81F
連中文起訴書都不想看的人怎麼會看英文論文XD
02/01 20:06, 81F

02/01 20:15, 2小時前 , 82F
吵偷真的好笑,強者會找優點弱者只會找缺點
02/01 20:15, 82F

02/01 20:20, 2小時前 , 83F
8964占占占 deepseek快抓網路文章訓練喔
02/01 20:20, 83F
文章代碼(AID): #1ddVf2Nu (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1ddVf2Nu (C_Chat)