Re: [閒聊] Deepseek的角色扮演已刪文

看板C_Chat (希洽)作者 (charlesgg)時間3天前 (2025/01/28 06:49), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
※ 引述 《e04su3no》 之銘言: : → pobby2266: 昨天無聊也是讓他模擬魯迅和尼采對話 01/28 03:19 : 推 pHyrz: 可以串連兩邊讓他們吵架ㄇ 01/28 03:22 : 推 gm79227922: 可以瑟瑟嗎 01/28 05:40 Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1 數學模型,主打純用RL左右互搏不需要像OpenAI的PPO一樣需要先經過大量監督微調(就是 人類構造數據)的步驟就可以讓模型自主學會數學分解思考。 然後比較搞笑的是本來自稱自己開源的OpenAI現在早就把自己的模型全部close,然後首個 開源深度思考模型竟然發生在最封閉的左岸。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.8.79 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738018193.A.6B1.html
文章代碼(AID): #1dc0sHQn (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1dc0sHQn (C_Chat)