討論串(共24篇) - [閒聊] DeepSeek是不是真的很強? - 看板C_Chat

看板 [ C_Chat ]

討論串[閒聊] DeepSeek是不是真的很強?

共 24 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [閒聊] DeepSeek是不是真的很強?

推噓69(70推 )留言199則，0人參與作者astrayzip時間1年前 (2025/02/01 20:08)資訊

內容預覽:

說回來. 感覺很多人很氣訓練用別人資源. 但是感覺又對openAI沒反應. 我覺得這就很奇怪. 因為OpenAI最知名的一個點. 就是因為盜用別人資料訓練所以官司纏身. 這幾年可非常多新聞. 但很妙的似乎有人看到DeepSeek才開始氣到中風. 這種現象真的很神奇. 真的要氣打從前幾年就要一直罵O

(還有525個字)

Re: [閒聊] DeepSeek是不是真的很強?

推噓1(1推 )留言3則，0人參與作者yahoo2720 (yahoo2720)時間1年前 (2025/02/01 19:59)資訊

內容預覽:

我的理解是. 原本一份專業的工作只有研究生以上的人能處理. 後來產業升級後變成高職就能身任. 雖然還是可以繼續雇研究生. 但是慣老闆愛省錢的結果肯定誰便宜用誰. 所以研究生跟他的親朋好友就慌了. 現實就是成本與硬體需求本來就會越來越低. 但這速度太快了超出很多人想像. 這AI熱錢都還沒賺到手呢. -

Re: [閒聊] DeepSeek是不是真的很強?

推噓11(11推 )留言29則，0人參與作者arrenwu (最是清楚哇她咩)時間1年前 (2025/02/01 19:56)資訊

內容預覽:

一般人心目中的正常訓練大概是這樣. https://i.imgur.com/Ph3DlNC.png. 1. 透過網路爬蟲拿到很多資料組. 2. 把資料組送到AI架構進行訓練後得到一個LLM. 我看到的「偷資料的指控」則是這樣. https://i.imgur.com/OgkvURx.png. 1.

(還有358個字)

Re: [閒聊] DeepSeek是不是真的很強?

推噓11(16推 )留言41則，0人參與作者RBLeipzig (RB萊比錫)時間1年前 (2025/02/01 18:47)資訊

內容預覽:

假如以網路遊戲來類比，輝達就是遊戲的開發商與營運，其他開發AI的科技巨頭就是遊戲玩家. DeepSeek 則是一個發現了快速練等技巧的玩家。原本幾百小時才能練滿一個帳號，現在DeepSeek 找出了幾十個小時就能練滿的方法。. 因為是快速練等，所以裝備可能還是跟不上那些扎實練功的科技巨頭玩家。但是可

(還有156個字)

Re: [閒聊] DeepSeek是不是真的很強?

推噓40(42推 )留言89則，0人參與作者attacksoil (第三方程式)時間1年前 (2025/02/01 18:41)資訊

內容預覽:

這串一堆外行. 首先 DeepSeek模型特點是. 1. 訓練成本低. 2. 推理成本低. 先說訓練成本低. 論文中說的訓練成本低是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的. 實際有實作經驗的人就知道你要嘗試一個新訓練方式甚至要提高訓練效率都嘛還要做一堆實驗實際上花的成本遠高於

(還有1436個字)

首頁

尾頁