看板 [ C_Chat ]
討論串[閒聊] DeepSeek是不是真的很強?
共 24 篇文章

推噓69(70推 1噓 128→)留言199則,0人參與, 9月前最新作者astrayzip時間9月前 (2025/02/01 20:08), 9月前編輯資訊
0
0
0
內容預覽:
說回來. 感覺很多人很氣訓練用別人資源. 但是感覺又對openAI沒反應. 我覺得這就很奇怪. 因為OpenAI最知名的一個點. 就是因為盜用別人資料訓練所以官司纏身. 這幾年可非常多新聞. 但很妙的似乎有人看到DeepSeek才開始氣到中風. 這種現象真的很神奇. 真的要氣 打從前幾年就要一直罵O
(還有525個字)

推噓1(1推 0噓 2→)留言3則,0人參與, 9月前最新作者yahoo2720 (yahoo2720)時間9月前 (2025/02/01 19:59), 編輯資訊
0
0
0
內容預覽:
我的理解是. 原本一份專業的工作只有研究生以上的人能處理. 後來產業升級後變成高職就能身任. 雖然還是可以繼續雇研究生. 但是慣老闆愛省錢的結果肯定誰便宜用誰. 所以研究生跟他的親朋好友就慌了. 現實就是成本與硬體需求本來就會越來越低. 但這速度太快了超出很多人想像. 這AI熱錢都還沒賺到手呢. -

推噓11(11推 0噓 18→)留言29則,0人參與, 9月前最新作者arrenwu (最是清楚哇她咩)時間9月前 (2025/02/01 19:56), 9月前編輯資訊
0
4
0
內容預覽:
一般人心目中的正常訓練大概是這樣. https://i.imgur.com/Ph3DlNC.png. 1. 透過網路爬蟲拿到很多資料組. 2. 把資料組送到AI架構進行訓練後得到一個LLM. 我看到的「偷資料的指控」則是這樣. https://i.imgur.com/OgkvURx.png. 1.
(還有358個字)

推噓11(16推 5噓 20→)留言41則,0人參與, 9月前最新作者RBLeipzig (RB萊比錫)時間9月前 (2025/02/01 18:47), 編輯資訊
0
0
0
內容預覽:
假如以網路遊戲來類比,輝達就是遊戲的開發商與營運,其他開發AI的科技巨頭就是遊戲玩家. DeepSeek 則是一個發現了快速練等技巧的玩家。原本幾百小時才能練滿一個帳號,現在DeepSeek 找出了幾十個小時就能練滿的方法。. 因為是快速練等,所以裝備可能還是跟不上那些扎實練功的科技巨頭玩家。但是可
(還有156個字)

推噓40(42推 2噓 45→)留言89則,0人參與, 9月前最新作者attacksoil (第三方程式)時間9月前 (2025/02/01 18:41), 9月前編輯資訊
0
0
0
內容預覽:
這串一堆外行. 首先 DeepSeek模型特點是. 1. 訓練成本低. 2. 推理成本低. 先說訓練成本低. 論文中說的訓練成本低 是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的. 實際有實作經驗的人就知道你要嘗試一個新訓練方式 甚至要提高訓練效率 都嘛還要做一堆實驗 實際上花的成本遠高於
(還有1436個字)