PTT動漫區 / C_Chat (希洽)

Re: [閒聊] Deepseek的角色扮演已刪文

看板C_Chat (希洽)作者sxy67230 (charlesgg)時間3天前 (2025/01/28 06:49)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串2/2 (看更多)

※ 引述《e04su3no》之銘言： : → pobby2266: 昨天無聊也是讓他模擬魯迅和尼采對話 01/28 03:19 : 推 pHyrz: 可以串連兩邊讓他們吵架ㄇ 01/28 03:22 : 推 gm79227922: 可以瑟瑟嗎 01/28 05:40 Deepseek目前是有同時釋出開源模型（權重、Code、訓練模型的方法報告都開源）的，走跟 llama一樣的路線，所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型，重點是MoE的架構可以很省GPU（如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1 數學模型，主打純用RL左右互搏不需要像OpenAI的PPO一樣需要先經過大量監督微調（就是人類構造數據）的步驟就可以讓模型自主學會數學分解思考。然後比較搞笑的是本來自稱自己開源的OpenAI現在早就把自己的模型全部close，然後首個開源深度思考模型竟然發生在最封閉的左岸。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.8.79 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738018193.A.6B1.html

‣ 返回看板[ C_Chat ] 閒談

‣ 更多 sxy67230 的文章

文章代碼(AID): #1dc0sHQn (C_Chat)

討論串 (同標題文章)

本文引述了以下文章的的內容：

33

46

[閒聊] Deepseek的角色扮演

3天前, 01/28

完整討論串 (本文為第 2 之 2 篇)：

排序：最舊先 | 最新先 | 留言數

33

46

[閒聊] Deepseek的角色扮演

3天前, 01/28

Re: [閒聊] Deepseek的角色扮演已刪文

3天前, 01/28

在新視窗開啟完整討論串 (共2篇)

C_Chat 近期熱門文章

1

1

[母雞] 祥燈海希初雙貓愛爽睦才是最佳配置吧

9分鐘前, 01/31

1

1

[閒聊] 金城武今年有要買Switch2嗎？

21分鐘前, 01/31

1

1

[母雞卡] 祥爺幫祥子安排相親誰會跳出來阻止？

33分鐘前, 01/31

1

1

[母雞] 大家對睦頭人是不是太無情了

50分鐘前, 01/31

7

21

[閒聊] 三國無雙閃退如何處理

55分鐘前, 01/31

2

2

憾！Tomorin開始脫毛了

1小時前, 01/31

6

10

[閒聊] 每部作品都會有代表奇蹟的東西嗎？

1小時前, 01/31

1

1

[閒聊] 祥爺替祥子代付賠償金後的挽救條件是？

2小時前, 01/31

更多近期熱門文章 >>

PTT動漫區即時熱門文章

19

59

[閒聊] 剩下的前三十百合漫畫莉孤水狗雞

15小時前, 01/31

4

8

[請神] 後宮在”人群面前”被強上

16小時前, 01/31

8

9

[閒聊] 百合姫 2月おどりば緋衣草

16小時前, 01/31

8

13

[閒聊] 要我和你交往(ry 最新話我沒了

16小時前, 01/31

6

6

[推薦] [玉ぼん]愛液狂潮！

17小時前, 01/30

4

5

[檢舉] windowsill 4-4

17小時前, 01/30

3

7

[檢舉] oneeyewolf 4-11

17小時前, 01/30

5

11

Fw: [心得] ふゆから、くるる。宇宙級的腦洞(文長

17小時前, 01/30

更多即時熱門文章 >>

‣ 返回看板[ C_Chat ] 閒談

‣ 更多 sxy67230 的文章

文章代碼(AID): #1dc0sHQn (C_Chat)