看板 [ C_Chat ]
討論串[閒聊] DeepSeek是不是真的很強?
共 14 篇文章
首頁
上一頁
1
2
3
下一頁
尾頁

推噓140(170推 30噓 242→)留言442則,0人參與, 41分鐘前最新作者PiracyBamboo (PB)時間6小時前 (2025/02/01 16:10), 編輯資訊
2
0
1
內容預覽:
結果今天就被踢爆是中國大外宣了. https://www.cna.com.tw/news/ait/202502010071.aspx. 研究機構:DeepSeek硬體GPU支出逾160億台幣. SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」
(還有171個字)

推噓10(10推 0噓 14→)留言24則,0人參與, 2小時前最新作者gino0717 (gino0717)時間5小時前 (2025/02/01 16:50), 5小時前編輯資訊
0
0
0
內容預覽:
話說. 我讓deepseek寫些色色的東西啊(讓他幫我寫些色色遊戲設定). 他現在大約寫完後會延遲十秒才收回去(如果他願意寫的話). 這是故意留給我時間讓我趕快複製貼上嗎. 怎麼這麼貼心. 還是太多人在玩了審查機制被塞爆. 過然是民主的大勝利. = =. 南無阿彌陀佛. --. 發信站: 批踢踢
(還有7個字)

推噓6(6推 0噓 2→)留言8則,0人參與, 2小時前最新作者jason90814 (菜B08)時間4小時前 (2025/02/01 17:49), 編輯資訊
0
0
1
內容預覽:
老哥. 雖然中國真的很常唬爛. 但也不能沒搞清楚就亂吐槽. 反而自曝無知= =. AI模型只要訓練一次(花幾天~幾個月)就能一直用. DS說的成本是用訓練消耗時間*雲端租借的費用算的. 因為硬體可以重複使用,所以用租金算成本比較準. 就像GG買光刻機也是幾億在買. 但一台可以一直做一直做. 平均下來

推噓3(15推 12噓 30→)留言57則,0人參與, 32分鐘前最新作者wei115 (社畜)時間4小時前 (2025/02/01 18:14), 3小時前編輯資訊
0
0
0
內容預覽:
是這樣的. 美國人做事比較喜歡用正攻法. 他們就很要求任何技術都要「科學」. 你這麼做,你要拿出證據、拿出理論依據. 不只要證明他真的會更好,還要說明他為什麼會更好. 如果一個技術 經驗主義為主 有效,但沒有那麼多理論的說明. 美國人就會傾向不使用這個技術. 改而使用有依據,但效果沒那麼好的技術.
(還有697個字)

推噓37(39推 2噓 42→)留言83則,0人參與, 2小時前最新作者attacksoil (第三方程式)時間4小時前 (2025/02/01 18:41), 3小時前編輯資訊
1
0
0
內容預覽:
這串一堆外行. 首先 DeepSeek模型特點是. 1. 訓練成本低. 2. 推理成本低. 先說訓練成本低. 論文中說的訓練成本低 是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的. 實際有實作經驗的人就知道你要嘗試一個新訓練方式 甚至要提高訓練效率 都嘛還要做一堆實驗 實際上花的成本遠高於
(還有1436個字)
首頁
上一頁
1
2
3
下一頁
尾頁