Re: [問題] 描圖比較可惡還是Ai比較可惡?

看板C_Chat (希洽)作者 (沙陀曼)時間4小時前 (2024/10/18 15:27), 編輯推噓91(965328)
留言429則, 72人參與, 58分鐘前最新討論串2/4 (看更多)

10/17 19:04,
2024怎麼還有人雲ai是拼圖
10/17 19:04

10/17 19:16,
原理就不是拼圖啊 還是你指的切是random crop
10/17 19:16

10/17 19:18,
原理不是拼圖 如果只是拼圖這種東西 各大廠就不會搞軍
10/17 19:18

10/17 19:18,
備競賽了
10/17 19:18
我一直很好奇說AI不是拼圖的根據在那裡 == 因為實際上目前的模型就是真的用圖片去拼出來的 == 我舉個比較完整簡單的栗子 == 我在看我的幸福婚約的時候,一直覺得後母這角色很○○。 查了一下沒人搞她的pony模型,所以自己做了一個來玩。 我先回去把自己知道她有出場的部分的圖片截下來,官網的人物介紹圖也抓下來, 然後開始處理,該去背的去背、該修圖的修圖。 下一步分類。 第一個資料夾我會先抓出輪廓清楚的全身圖或七分身圖。 https://i.imgur.com/cW0HmCz.jpeg
這類圖片的功用是讓AI抓住角色的頭身比, 對經常把日式ACG角色身體蘿莉化的pony底模非常重要。 第二個資料夾裝這個角色裝角色的大頭照。 https://i.imgur.com/oZ2OcUP.jpeg
目的當然是就是讓AI知道這個人物的臉長怎樣用的。 第三個資料夾,角色的背影和側身的圖片。 https://i.imgur.com/0kqE7YA.jpeg
AI對於背面一直都比較不敏感, 沒有特別針對這背面訓練的話,有可能造成頭轉過來但是身體沒轉的貓頭鷹現象。 也可能會學不到角色背後的特色。 這個角色背後有個髮髻,加上這件和服背後的飾帶有特別的設計, 所以這些圖片必須額外分開來。 第四個資料夾,角色上半身和輪廓不是很清楚的圖片。 https://i.imgur.com/jDJeLrZ.jpeg
這類的圖片數量一定最多,和其他圖片混在一起容易造成AI只訓練到上半身, 沒有訓練到下半身的情況,所以也得分類出來。 這個資料夾我沒注意到夾了一張穿另一件和服的圖片, 但是因為我打tag的時候本來就有區分出這件衣服,所以沒影響到訓練結果。 最後一個資料夾,一張穿上另一件和服的圖片。 https://i.imgur.com/G6YNz1V.jpeg
這不是我的訓練目標,但是這張圖片我認為對訓練這個角色有正面助益。 所以我額外拿出來,準備將它當正則化用的圖片來處理。(本來另一張也是丟這邊) 之後打標,將我想訓練的目標標出來讓AI去拼。 https://i.imgur.com/lHUAlsJ.jpeg
臉部的部分確認都有被加上"close-up"特寫的標籤,讓AI知道這只是特寫, 不要真的給我生出一堆大臉圖。 然後設定訓練權重。 https://i.imgur.com/zw6L5tH.jpeg
其他的圖片只是給AI參考的,所以一輪只跑1次。 臉和上半身圖片最多,平均下來一輪各4次。 (其實可以丟同一個資料夾,但是分開來比較好分類) 背面圖片約是上半身的一半,所以就一輪*2跑8次。 全身圖圖片最少,簡單估一下大概一輪15次應該夠了, 也不能再多不然AI只會給你一堆全身圖。 然後去睡覺,睡醒驗收成果,叫AI生一張側身的圖片讓我瞧瞧。 https://i.imgur.com/NpeYEHE.png
很好,該學的都有學到,不該學的也沒混進去,一發入魂不用調整直接收工。 再舉兩個將圖片拼成模型的栗子。 這是我的86蕾娜模型的圖片。 https://i.imgur.com/wq69nnB.png
這個模型能生出類似動畫23話感覺的圖片, 運氣好的話還還可以看到後面的鐵幕。 但是按照上面的流程是訓練不出能生出這張圖片的模型的。 因為實際上這個場景的圖片不多, 過於提高蕾娜站在花海圖片的訓練步數則是會造成過擬合,連帶影響其他生成結果。 那怎麼辦?我就讓AI去拼,方法說真的也不難。 https://i.imgur.com/cF8v95c.jpeg
就把23話的純背景圖片截出來,放進訓練集裡面當令一個訓練目標給AI學。 在生成時輸入兩個概念同時叫AI生成,就能生出上面那種風格的圖片。 只是目前解析度好像沒辦法讓AI能認出彼岸花,所以看起來完全是另一種花就是了。 當然,如果我不輸入背景相關的提詞,這個蕾娜也不會動不動就被一堆紅色花朵包起來。 如果我把提詞改一下,換成水仙花,衣服也換為藍色沒挑染的版本。 也能生成這種氛圍類似,但是結果不同的圖片。 https://i.imgur.com/jfH4xZV.png
又或者像這個桔梗。 https://i.imgur.com/ABzEnXs.png
我在做模型的時候想把能死魂蟲和桔梗本人一起練出來。 但是兩個概念沒區隔的話,要嘛死魂蟲打死生不出來,要嘛每張圖旁邊都有白色條狀物。 那怎麼處理呢,一樣。 打標將死魂蟲用特別標註, 打上"sinidama"這個概念區分用的題詞, 以及影響生圖結果用,AI知道其含意的題詞"white dragon"。 https://i.imgur.com/rkBt8nh.jpeg
最後同上,額外挑出特寫死魂蟲的圖片, 並且確認都有標上"no humans"這個提詞標籤,作為和桔梗本身的區分。 https://i.imgur.com/Pi7uNI9.jpeg
這樣AI就能理解,當我打出"sinidama, white dragon"加上桔梗本人的提詞, 但是又沒有"no humans"時,它就應該生成一個有死魂蟲,又有桔梗本人的圖片。 結果就是這樣,勉強還行: https://i.imgur.com/TceOsvz.png
再舉一個拼圖的反例,這是別人的桔梗模型, https://i.imgur.com/0IVyDNA.jpeg
我就是因為覺得這模型用起來怪怪的所以自己又去搓了一個出來。 這模型產出的圖片乍看之下很正常,該有的都有,也很還原動畫的畫風, 不像我這樣犯賤,故意偷塞料把畫風破壞掉。 但因為我是以前每天下課準時收看犬夜叉的怪叔叔, 所以生了幾張圖就發現有點怪怪的。 這是這個模型的桔梗。 https://i.imgur.com/7ysGB7K.jpeg
這是本來動畫的桔梗,來找找看哪裡不一樣。 https://i.imgur.com/uyncmY4.jpeg
對,瀏海。 瀏海中間怎麼常常空出一塊? 如果你和我一樣,以前下課就是等著看犬夜叉的話,可能已經猜出答案了。 解答是: https://i.imgur.com/yaMHKnM.jpeg
對啊,珊瑚的瀏海就是長那個樣子不是嗎? 會造成這種結果的原因是這位作者在製作模型時採用流水自動化作業, 他的圖片是用AI辨認角色自動截圖下來的,並且在自動打標後就丟給AI進行訓練。 由於珊瑚和桔梗本來就長得有點像,AI肯定會將兩個人搞混, 珊瑚的登場機會遠高於桔梗,所以他的訓練集裡肯定包含了大量珊瑚的圖片。 再加上珊瑚和桔梗兩者的瀏海給AI辨認自動打標時, 一定都會被標上"blunt bangs"齊瀏海和"hime cut"公主頭這兩個標籤, 所以也無法被提詞區隔。 最終這個同時包含桔梗和珊瑚的訓練集,結果就造成了AI將這兩個角色拼成了同一個: 一個有著珊瑚瀏海的桔梗。 再一個栗子。 https://i.imgur.com/HuuT5RA.png
戰隊黑禍源死死美,如果有看過愛在世界征服後, 那應該知道這張圖片的概念不存在於動畫之中。 動畫只有兩幕主角的妄想,而且是戴著頭盔的。 而這張圖的生成原理是: https://i.imgur.com/wlR0pmu.jpeg
我把其他兩個女性戰隊成員的頭砍掉氇,然後把衣服染成黑色。 最後打標加上"faceless",讓AI能將衣服與塗黑的砍頭標示分開。 這樣AI就能幫我拼出一個穿著戰隊服的死死美。 其他的栗子像是: https://i.imgur.com/tquAgKY.png
氣噗噗的鞘姬。 https://i.imgur.com/u0DSFkS.png
穿著第一季衣服,但是髮型是劇場版版本的菲特。 這些都是我用類似手法,用訓練權重與提詞區分概念,之後生圖時讓AI去拼的結果。 還有另一種就是更為確實的拼圖,像是用controlnet換臉。 當然,換臉這個行為這東西比起AI本身又是更惡劣的勾當,進警察局也是活該的那種。 我就用比較沒爭議的歷史人物做個示範: 像是阿希和阿史 https://i.imgur.com/7TBSGjc.jpeg
或阿史+阿希 https://i.imgur.com/SGiDHHd.jpeg
直接實現法西斯主義和馬克斯主義的殊途同歸。 同樣的原理,叫AI拼圖換衣服、換動作、換背景、換表情都做得到。 之前巴哈換頭活俠傳就是用這個方法搞出來的。 當然,我知道我講那麼多,可能還是有人會想用論文砸我臉說「AI不是在拼圖」。 真的要這樣我也尊重。 但是我也必須講,實務上目前的AI產圖模型就是用圖片拼出來的, 既然模型是用圖片拼的,那用那個模型生出來的圖片算不算拼圖呢? 我覺得算,起碼我玩AI也玩兩年了。 這期間我一直覺得自己在搞模型的時候是讓AI認知概念, 而生圖時則是想辦法讓AI把它認知的概念拼起來。 大概就醬。 -- (と・てノ) 翼龍欸 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.160.164 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1729236428.A.269.html

10/18 15:28, 4小時前 , 1F
如果你把現代AI算法叫做拼圖 那大部分人類也是在拼圖
10/18 15:28, 1F

10/18 15:29, 4小時前 , 2F
也是可以 看你拼圖的定義是什麼而已
10/18 15:29, 2F

10/18 15:30, 4小時前 , 3F
比起拼圖,我會覺得之前聽到的比喻「灑鹽」再貼切一點
10/18 15:30, 3F

10/18 15:30, 4小時前 , 4F
因為AI雖然說是「拼」,但是它其實沒有「圖」的概念
10/18 15:30, 4F

10/18 15:30, 4小時前 , 5F
不是 你先去看sd的生成原理
10/18 15:30, 5F

10/18 15:30, 4小時前 , 6F
這種就定義的問題 就看你怎麼看AI這黑盒子裡面的運作
10/18 15:30, 6F

10/18 15:30, 4小時前 , 7F
看完原理了,然後呢
10/18 15:30, 7F

10/18 15:30, 4小時前 , 8F
實際上模型就是用圖片拼出來的
10/18 15:30, 8F

10/18 15:31, 4小時前 , 9F
你要認定用圖片拼出來的模型生出來的圖不是拼的嗎
10/18 15:31, 9F

10/18 15:32, 4小時前 , 10F
你沒發現在拼圖的是你而不是ai嗎
10/18 15:32, 10F

10/18 15:32, 4小時前 , 11F
AI從圖裡得到的比較像是一堆向量資料
10/18 15:32, 11F

10/18 15:32, 4小時前 , 12F
如果說把每個位元看作是個點的話,那AI在學的就像是怎
10/18 15:32, 12F

10/18 15:32, 4小時前 , 13F
麼樣撒一把鹽然後讓鹽盡量落在想落的點上
10/18 15:32, 13F

10/18 15:33, 4小時前 , 14F
所以你說我叫AI拼圖,就不等於AI自己拼圖嗎 ==
10/18 15:33, 14F

10/18 15:34, 4小時前 , 15F
那也還是拼圖不是嗎 ==
10/18 15:34, 15F

10/18 15:34, 4小時前 , 16F
AI拼的不是圖是概念 把概念用拼湊的形式拼成一張圖
10/18 15:34, 16F

10/18 15:34, 4小時前 , 17F
和拼圖只有87%像所以不是拼圖
10/18 15:34, 17F

10/18 15:35, 4小時前 , 18F
為什麼都是栗子,害我餓了
10/18 15:35, 18F

10/18 15:35, 4小時前 , 19F
說那些向量降噪之類的我都知道,只是我覺得還是拼啊
10/18 15:35, 19F

10/18 15:35, 4小時前 , 20F
真的要講也是我叫AI拼圖這樣,那還不是拼圖嗎
10/18 15:35, 20F

10/18 15:39, 4小時前 , 21F
你要說拼概念也不是,因為ai從來沒有真正的概念這東西
10/18 15:39, 21F

10/18 15:39, 4小時前 , 22F
,像一個食物對人的概念可能是:能吃、有能量、能被加
10/18 15:39, 22F

10/18 15:39, 4小時前 , 23F
工等等等,這種概念是從人的日常生活中統整出來的,但
10/18 15:39, 23F

10/18 15:39, 4小時前 , 24F
ai並沒有人生,他們所有的模型原理是A+B比A+C能得到更
10/18 15:39, 24F

10/18 15:39, 4小時前 , 25F
多肯定所以以後都是A+C
10/18 15:39, 25F

10/18 15:40, 4小時前 , 26F
那不講拼圖 講成拼線條 拼色塊呢
10/18 15:40, 26F

10/18 15:40, 4小時前 , 27F
這樣講那所有人都是在拼圖啦XD
10/18 15:40, 27F

10/18 15:42, 4小時前 , 28F
當然不是 ==
10/18 15:42, 28F

10/18 15:42, 4小時前 , 29F
你畫畫前置需要40張圖片然後打上標籤和權重嗎 ==
10/18 15:42, 29F

10/18 15:42, 4小時前 , 30F
你舉的這些例子,都沒辦法有效說明你為什麼認為 AI 都在拼
10/18 15:42, 30F

10/18 15:43, 4小時前 , 31F
圖啊!倒不如你先用文字說說看,你覺得什麼叫做拼圖...
10/18 15:43, 31F

10/18 15:43, 4小時前 , 32F
一般講拼圖 是大致原封不動 小地方修改掉
10/18 15:43, 32F

10/18 15:43, 4小時前 , 33F
靠北,餵阿希阿史的圖不會出事喔
10/18 15:43, 33F

10/18 15:43, 4小時前 , 34F
那你舉個AI不用這樣搞也能生圖的栗子給我看看吧,如何?
10/18 15:43, 34F
還有 355 則推文
10/18 17:45, 2小時前 , 390F
我覺得現在需要的是MMA擂台
10/18 17:45, 390F

10/18 17:45, 2小時前 , 391F
今天大家對拼圖的理解好像不太相同 那想必肯定有一方對
10/18 17:45, 391F

10/18 17:45, 2小時前 , 392F
拼圖的概念沒有完全理解 所以還蠻明顯的 現在在推文的
10/18 17:45, 392F

10/18 17:46, 2小時前 , 393F
一定有一邊是AI在推文 我這樣理解沒錯吧
10/18 17:46, 393F

10/18 17:47, 2小時前 , 394F
結論這種拼圖肯定不算抄襲,可以散了
10/18 17:47, 394F

10/18 17:52, 2小時前 , 395F
以你的定義 那麼繪師畫同人圖也是拼圖 把角色、衣服、場
10/18 17:52, 395F

10/18 17:52, 2小時前 , 396F
地、動作拼圖拼起來 如果你想要反駁 那我也很好奇說 以你
10/18 17:52, 396F

10/18 17:52, 2小時前 , 397F
的定義來看 畫同人圖不是拼圖的根據在那裡 = =
10/18 17:52, 397F

10/18 18:04, 2小時前 , 398F
同人繪師也有自己ㄉ畫風ㄚ=又不是完全照官圖畫
10/18 18:04, 398F

10/18 18:06, 2小時前 , 399F
定義的亂七八糟… ai可以從零到有產出桔梗阿 只是你
10/18 18:06, 399F

10/18 18:06, 2小時前 , 400F
要從無數的亂數圖片中 告訴他哪個是對的
10/18 18:06, 400F

10/18 18:07, 2小時前 , 401F
學習本來就是從模仿開始 你覺得叫一個小孩畫一億張
10/18 18:07, 401F

10/18 18:07, 2小時前 , 402F
圖告訴他哪個像桔梗快 還是拿一張圖跟他說桔梗長這
10/18 18:07, 402F

10/18 18:07, 2小時前 , 403F
10/18 18:07, 403F

10/18 18:08, 2小時前 , 404F
你的定義說話也是拼圖阿 你把中文拼起來 對吧
10/18 18:08, 404F

10/18 18:09, 2小時前 , 405F
喔對ㄚ 畫風忘記講 還要再拼上繪師"自己"的畫風 還是拼圖
10/18 18:09, 405F

10/18 18:10, 2小時前 , 406F
描圖吧 ai是人類科技進步的結晶
10/18 18:10, 406F

10/18 18:12, 2小時前 , 407F
AI如果做的是剪下貼上再來跟我說拼圖
10/18 18:12, 407F

10/18 18:14, 2小時前 , 408F
是拼圖啊 我自己會畫畫也會用ai 不如說人類學習模式有一
10/18 18:14, 408F

10/18 18:14, 2小時前 , 409F
部分是拼出來的 不懂一堆人在氣急敗壞什麼
10/18 18:14, 409F

10/18 18:16, 2小時前 , 410F
AI很會拼出六根手指 照這種邏輯 手從哪些圖源拼進來的???
10/18 18:16, 410F

10/18 18:19, 2小時前 , 411F
沒有跟原圖100%相同不算拼圖喔
10/18 18:19, 411F

10/18 18:20, 1小時前 , 412F
為什麼AI畫的手 錯的居多?但是正常圖源 手幾乎都是正常的啊
10/18 18:20, 412F

10/18 18:21, 1小時前 , 413F
如果只是拼圖這麼簡單 AI只是代替人工作業 為什麼會錯?論破!
10/18 18:21, 413F

10/18 18:31, 1小時前 , 414F
感覺白學兩年了
10/18 18:31, 414F

10/18 18:37, 1小時前 , 415F
事實 有人很氣欸
10/18 18:37, 415F

10/18 18:44, 1小時前 , 416F
有人因為自己學半天拼圖爆氣 超好笑
10/18 18:44, 416F

10/18 18:50, 1小時前 , 417F
現在的ai如果你是覺得ok的那群人,那抄襲跟描圖對你
10/18 18:50, 417F

10/18 18:50, 1小時前 , 418F
們來說應該也ok的吧,畢竟是抄一次跟抄幾億次的差別
10/18 18:50, 418F

10/18 18:50, 1小時前 , 419F
而已
10/18 18:50, 419F

10/18 18:51, 1小時前 , 420F
AI就是模糊拼圖所以很不擅長處理直線、重複圖像跟文
10/18 18:51, 420F

10/18 18:51, 1小時前 , 421F
10/18 18:51, 421F

10/18 18:55, 1小時前 , 422F
阿西跟阿林那邊是三爻
10/18 18:55, 422F

10/18 19:03, 1小時前 , 423F
手畫錯算是拼圖拼錯位置?
10/18 19:03, 423F

10/18 19:04, 1小時前 , 424F
我跟老婆生小孩也是拼拼圖
10/18 19:04, 424F

10/18 19:07, 1小時前 , 425F
ai可以做拼圖,但拼圖不代表ai
10/18 19:07, 425F

10/18 19:08, 1小時前 , 426F
太神了
10/18 19:08, 426F

10/18 19:15, 1小時前 , 427F
10/18 19:15, 427F

10/18 19:21, 58分鐘前 , 428F
你畫畫會不會找參考圖,會的話就是拼圖。AI原理這專
10/18 19:21, 428F

10/18 19:21, 58分鐘前 , 429F
業領域的東西不懂就安靜
10/18 19:21, 429F
文章代碼(AID): #1d4WtC9f (C_Chat)
文章代碼(AID): #1d4WtC9f (C_Chat)