Re: [洽特] 試著用Grok產片

看板AC_In (裏洽 18+動漫)作者 (不含銅鋰鋅)時間3小時前 (2025/11/11 16:20), 3小時前編輯推噓5(503)
留言8則, 5人參與, 16分鐘前最新討論串3/3 (看更多)
※ 引述《DarkerDuck (達克鴨)》之銘言: : 我在年初Wan 2.1的時代就有大概玩了一下AI色色動畫生成。 : 不過玩沒多久就沒繼續玩了。痛苦太多,收穫太少。 : 首先Wan訓練資料集並沒有NSFW影片,都被挑掉了。 : 當然在civitai上面有NSFW LoRA可以用,但是想要實現我的想法。 : 不是只要一個NSFW LoRA就夠用了。 : (現在Wan 2.2 好像已經All-in-one的LoRA,不過還沒去試) : 那時候的NSFW只是讓產出的影片可以露點而已。 : 還需要跳舞LoRA、胸部晃動LoRA,活塞運動LoRA,甚至特殊表情也要LoRA。 : 就算把這些LoRA都用上去,試了老半天效果還是不好,大概會打架吧。 : 還要燒點數或是燒顯卡,生一小段影片還要好幾分鐘。就不玩了。 : 等了半年多~~~ : 這次的Grok的grok imagine幾乎不用額外LoRA,提示詞明確幾乎兩三次抽卡就可完成。 : 生成一段影片只要不到一分鐘,還附上音樂和聲音。努力太少,喜悅太多啊。 : 以下是健康的舞蹈影片,請勿做不健康的聯想。 : https://files.catbox.moe/0doo7m.mp4 : 因為經過多次轉檔與AI喵喵追蹤pussy處理,所以不太順暢。 : 下面是高音質順暢版: : ttps://files.catbox.moe/pq22xg.mp : ttps://files.catbox.moe/pavn6l.mp : 能夠一次性把這麼多需求整合在一段影片裡,只靠LoRA是很難達到的。 : Grok很顯然就是幾乎不挑訓練集,AV和H anime也都大量塞進來訓練了。 : 所以才能不需要挑LoRA各種天馬行空的影片都可以生成。 : 譬如在海底要死了都要愛愛: : (看不到我) ttps://files.catbox.moe/a51t5h.mp : 反正xAI算力超級多,免費仔一天都可以生成50部小短片。 : 要生成像這樣的上車影片要確保你的帳號年齡是滿18歲的,然後用手機版解開限制。 : 只要你的輸入參考圖片不是真人,直接上傳上車圖連提示詞都不用就動起來了。 : 提示詞不會下也可以直接問Grok,他也沒什麼在擋。不過簡短就好。 : 太多提示詞限制反而不好讓AI發揮。 : 只要你圖上傳得上去,題材方面也幾乎沒有任何限制,隨便找都一堆hardcore的例子, : 特寫也都生的出。 : 當然蘿莉或是R-18G我就沒測試了,免得FBI找上門,不過別人測試也大都沒問題。 : 但帳號要真的解除限制,我有一個主帳使用上幾乎沒有任何限制。 : 另外一個副帳我也做了所有解決限制的步驟,但就是整天content moderated : 不曉得是什麼問題。 : 若要說缺點,除了無法像Wan 2.2那樣生出真人版本的外。 : 就是影片太短了,這很顯然是為了省算力只給六秒,就算課金了還是只給六秒。 : 然後沒有首尾幀,很難去控制畫面的變動幅度,也很難做出首尾可串接的連續重複動畫。 : 這些都是稍微專業一點的AI生成影片平台應該都會有的東西。 : 當然更進階的像是sora或是veo的story board這種導演工具當然也沒有 : 另外就是只要畫面是變化比較大的,那很容易就會變成歐美畫風。 : 像是以下的影片,整個畫面超級晃啊,就算我提示詞已經註明要日式Anime畫風 : (這不是檔名) avmdod.mp4 : 結果臉一出來,還是給我歐美臉,你哪位?? 不過肢體動作是真的強。 : 玩熟了之後可以自己用一些更動感的鏡位角度,感覺就像是自己當AV導演啊 : 要多少女優就有多少女優 : (你看不見我) ap2jwx.mp4 : 所以我決定不課金,省金子還可避免精盡人亡,太恐怖了。 : 不過這還不是最恐怖的,現在可能其他AI公司也要進來競爭。 : 五年內可能各種導演工具就會齊全,解決角色風格一致性問題生成AI AV長片。 : 十年內甚至可能拿一張圖就可生成世界模型,配合VR進入無盡的幻想世界。 : https://youtu.be/PDKhUknuQDg
: 不光是被動地看圖片影片,而是直接進入這個世界和它互動。 : 第一次多啦A夢的道具是拍出來的時候就已經過時了。 : https://youtu.be/Q4gue5PyEV8
: 譬如給張圖下個prompt要當皇帝有後宮三萬佳麗,馬上就生出這樣的世界出來。 : 要曉得diffusion model的影片生成到現在也不過三年的歷史,十年已經很長。 : 人類種族滅絕於自己的matrix世界也是挺魔幻的。 現在的wan 2.2 Wan2.2-Lightning高低噪模型+8step或4step lora, 已經可以生成129幀的影片了,4060 8gb也能玩。 搭配Qwen 3 VL的反推提示詞,跟主動式生成提示詞, 已經能作到跟grok imagine 95%左右的能力了。 480x480p 16fps 8秒的影片,用8gb的N卡大概可要400-500秒, 再加上upscale模型,600秒左右就能作完全沒有審查的影片, 還有各種不可描述的lora可以相輔相成。 在自己的電腦上愛怎麼玩就怎麼玩。 我只能說,現在的AI真的進步得太快了。 各位紳士,我們的時代真的來臨了。 =..= 就是因為XAI把grok imagine封印了,我才去研究Stable Diffusion, 除了本身硬體算力不足,跑不快外,其它基本上都不會比grok imagine差。 諸君,這是紳士的勝利~!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.46.121.213 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1762849211.A.628.html ※ 編輯: chirex (114.46.121.213 臺灣), 11/11/2025 16:22:17

11/11 16:39, 3小時前 , 1F
我是gork閹割後就搞了張4080試著玩看看。建置環境實在蠻
11/11 16:39, 1F

11/11 16:39, 3小時前 , 2F
麻煩,先前用對岸的人做的工作流,卡在跑一次就報錯要重
11/11 16:39, 2F

11/11 16:39, 3小時前 , 3F
新開機。而對岸那邊做的整合包又都放夸克盤沒法下載,就
11/11 16:39, 3F

11/11 16:39, 3小時前 , 4F
先不搞了先研究生圖的部分了。
11/11 16:39, 4F
YT上的教學去runnighub.ai就可以直接註冊跟下載json了。 (不要選到.cn,台灣無法註冊) 不用開工作流。我都是抓json還來丟到comfyui裡研究。 新版的comfyui會提示你缺那些模型跟節點, 用manager去下載就好了。 模型github還是huggingface都有。 其實Kijai的工作流最詳盡,去他的hugging face抓來研究原始的, 他註解寫得最清楚。 對岸的工作流都是Kj的再整合再細化而已。 然後提詞器也不用一定要設api, 裝Qwen或是LLM本地端,還是直接扔給Grok圖片叫他寫提示器, 也是一種方式。

11/11 16:41, 3小時前 , 5F
現在2.2 8GB能跑了喔? 不過看起來還是很花時間
11/11 16:41, 5F
※ 編輯: chirex (114.46.121.213 臺灣), 11/11/2025 16:52:12

11/11 17:50, 2小時前 , 6F
這些比grok還早出吧
11/11 17:50, 6F

11/11 18:10, 1小時前 , 7F
不會被規制依然是很吸引人的理由 煩惱要不要買顯卡...
11/11 18:10, 7F

11/11 19:39, 16分鐘前 , 8F
8g跑的是gguf量化模型吧 多少會犧牲些精度
11/11 19:39, 8F
文章代碼(AID): #1f4l6xOe (AC_In)
文章代碼(AID): #1f4l6xOe (AC_In)