Re: [洽特] 試著用Grok產片

看板AC_In (裏洽 18+動漫)作者chirex (不含銅鋰鋅)時間4月前 (2025/11/11 16:20)推噓11(11推 0噓 7→)

留言18則, 8人參與討論串3/3 (看更多)

※ 引述《DarkerDuck (達克鴨)》之銘言： : 我在年初Wan 2.1的時代就有大概玩了一下AI色色動畫生成。 : 不過玩沒多久就沒繼續玩了。痛苦太多，收穫太少。 : 首先Wan訓練資料集並沒有NSFW影片，都被挑掉了。 : 當然在civitai上面有NSFW LoRA可以用，但是想要實現我的想法。 : 不是只要一個NSFW LoRA就夠用了。 : (現在Wan 2.2 好像已經All-in-one的LoRA，不過還沒去試) : 那時候的NSFW只是讓產出的影片可以露點而已。 : 還需要跳舞LoRA、胸部晃動LoRA，活塞運動LoRA，甚至特殊表情也要LoRA。 : 就算把這些LoRA都用上去，試了老半天效果還是不好，大概會打架吧。 : 還要燒點數或是燒顯卡，生一小段影片還要好幾分鐘。就不玩了。 : 等了半年多~~~ : 這次的Grok的grok imagine幾乎不用額外LoRA，提示詞明確幾乎兩三次抽卡就可完成。 : 生成一段影片只要不到一分鐘，還附上音樂和聲音。努力太少，喜悅太多啊。 : 以下是健康的舞蹈影片，請勿做不健康的聯想。 : https://files.catbox.moe/0doo7m.mp4 : 因為經過多次轉檔與AI喵喵追蹤pussy處理，所以不太順暢。 : 下面是高音質順暢版： : ttps://files.catbox.moe/pq22xg.mp : ttps://files.catbox.moe/pavn6l.mp : 能夠一次性把這麼多需求整合在一段影片裡，只靠LoRA是很難達到的。 : Grok很顯然就是幾乎不挑訓練集，AV和H anime也都大量塞進來訓練了。 : 所以才能不需要挑LoRA各種天馬行空的影片都可以生成。 : 譬如在海底要死了都要愛愛: : (看不到我) ttps://files.catbox.moe/a51t5h.mp : 反正xAI算力超級多，免費仔一天都可以生成50部小短片。 : 要生成像這樣的上車影片要確保你的帳號年齡是滿18歲的，然後用手機版解開限制。 : 只要你的輸入參考圖片不是真人，直接上傳上車圖連提示詞都不用就動起來了。 : 提示詞不會下也可以直接問Grok，他也沒什麼在擋。不過簡短就好。 : 太多提示詞限制反而不好讓AI發揮。 : 只要你圖上傳得上去，題材方面也幾乎沒有任何限制，隨便找都一堆hardcore的例子， : 特寫也都生的出。 : 當然蘿莉或是R-18G我就沒測試了，免得FBI找上門，不過別人測試也大都沒問題。 : 但帳號要真的解除限制，我有一個主帳使用上幾乎沒有任何限制。 : 另外一個副帳我也做了所有解決限制的步驟，但就是整天content moderated : 不曉得是什麼問題。 : 若要說缺點，除了無法像Wan 2.2那樣生出真人版本的外。 : 就是影片太短了，這很顯然是為了省算力只給六秒，就算課金了還是只給六秒。 : 然後沒有首尾幀，很難去控制畫面的變動幅度，也很難做出首尾可串接的連續重複動畫。 : 這些都是稍微專業一點的AI生成影片平台應該都會有的東西。 : 當然更進階的像是sora或是veo的story board這種導演工具當然也沒有 : 另外就是只要畫面是變化比較大的，那很容易就會變成歐美畫風。 : 像是以下的影片，整個畫面超級晃啊，就算我提示詞已經註明要日式Anime畫風 : (這不是檔名) avmdod.mp4 : 結果臉一出來，還是給我歐美臉，你哪位?? 不過肢體動作是真的強。 : 玩熟了之後可以自己用一些更動感的鏡位角度，感覺就像是自己當AV導演啊 : 要多少女優就有多少女優 : (你看不見我) ap2jwx.mp4 : 所以我決定不課金，省金子還可避免精盡人亡，太恐怖了。 : 不過這還不是最恐怖的，現在可能其他AI公司也要進來競爭。 : 五年內可能各種導演工具就會齊全，解決角色風格一致性問題生成AI AV長片。 : 十年內甚至可能拿一張圖就可生成世界模型，配合VR進入無盡的幻想世界。 : https://youtu.be/PDKhUknuQDg

: 不光是被動地看圖片影片，而是直接進入這個世界和它互動。 : 第一次多啦A夢的道具是拍出來的時候就已經過時了。 : https://youtu.be/Q4gue5PyEV8

: 譬如給張圖下個prompt要當皇帝有後宮三萬佳麗，馬上就生出這樣的世界出來。 : 要曉得diffusion model的影片生成到現在也不過三年的歷史，十年已經很長。 : 人類種族滅絕於自己的matrix世界也是挺魔幻的。現在的wan 2.2 Wan2.2-Lightning高低噪模型+8step或4step lora，已經可以生成129幀的影片了，4060 8gb也能玩。搭配Qwen 3 VL的反推提示詞，跟主動式生成提示詞，已經能作到跟grok imagine 95%左右的能力了。 480x480p 16fps 8秒的影片，用8gb的N卡大概可要400-500秒，再加上upscale模型，600秒左右就能作完全沒有審查的影片，還有各種不可描述的lora可以相輔相成。在自己的電腦上愛怎麼玩就怎麼玩。我只能說，現在的AI真的進步得太快了。各位紳士，我們的時代真的來臨了。 =..= 就是因為XAI把grok imagine封印了，我才去研究Stable Diffusion，除了本身硬體算力不足，跑不快外，其它基本上都不會比grok imagine差。諸君，這是紳士的勝利~!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.46.121.213 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1762849211.A.628.html ※ 編輯: chirex (114.46.121.213 臺灣), 11/11/2025 16:22:17

推

laeva75

11/11 16:39, 4月前 , 1^F

11/11 16:39, 1^F

→

laeva75

11/11 16:39, 4月前 , 2^F

11/11 16:39, 2^F

→

laeva75

11/11 16:39, 4月前 , 3^F

11/11 16:39, 3^F

→

laeva75

11/11 16:39, 4月前 , 4^F

11/11 16:39, 4^F

YT上的教學去runnighub.ai就可以直接註冊跟下載json了。 (不要選到.cn，台灣無法註冊) 不用開工作流。我都是抓json還來丟到comfyui裡研究。新版的comfyui會提示你缺那些模型跟節點，用manager去下載就好了。模型github還是huggingface都有。其實Kijai的工作流最詳盡，去他的hugging face抓來研究原始的，他註解寫得最清楚。對岸的工作流都是Kj的再整合再細化而已。然後提詞器也不用一定要設api，裝Qwen或是LLM本地端，還是直接扔給Grok圖片叫他寫提示器，也是一種方式。