看板
[ C_Chat ]
討論串[閒聊] DeepSeek是不是真的很強?
共 14 篇文章
內容預覽:
結果今天就被踢爆是中國大外宣了. https://www.cna.com.tw/news/ait/202502010071.aspx. 研究機構:DeepSeek硬體GPU支出逾160億台幣. SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」
(還有171個字)
內容預覽:
話說. 我讓deepseek寫些色色的東西啊(讓他幫我寫些色色遊戲設定). 他現在大約寫完後會延遲十秒才收回去(如果他願意寫的話). 這是故意留給我時間讓我趕快複製貼上嗎. 怎麼這麼貼心. 還是太多人在玩了審查機制被塞爆. 過然是民主的大勝利. = =. 南無阿彌陀佛. --. ※ 發信站: 批踢踢
(還有7個字)
內容預覽:
是這樣的. 美國人做事比較喜歡用正攻法. 他們就很要求任何技術都要「科學」. 你這麼做,你要拿出證據、拿出理論依據. 不只要證明他真的會更好,還要說明他為什麼會更好. 如果一個技術 經驗主義為主 有效,但沒有那麼多理論的說明. 美國人就會傾向不使用這個技術. 改而使用有依據,但效果沒那麼好的技術.
(還有697個字)
內容預覽:
這串一堆外行. 首先 DeepSeek模型特點是. 1. 訓練成本低. 2. 推理成本低. 先說訓練成本低. 論文中說的訓練成本低 是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的. 實際有實作經驗的人就知道你要嘗試一個新訓練方式 甚至要提高訓練效率 都嘛還要做一堆實驗 實際上花的成本遠高於
(還有1436個字)