ついにここまで来た! DW Poseの紹介記事だ!
もうすでにさんざん遊ばせてもらった後で、今さらかよって言われそうですけどね
逆に考えろ! さんざん遊んだ後、今さらだからこそ言えることもある!
無駄にポジティブ!
要約
PixAI.artの新機能「DW Pose」で楽しく遊ばせていただいております。これまでの棒人形機能である「OpenPose」、「OpenPose Full」と比較し、AIイラストと3Dキャラを用いて認識の違いをテスト。「DW Pose」の再現性の高さを確認します。
はじめに
先月半ば、PixAI.artのControlNetに「DW Pose」が追加されました。「Openpose Full」が導入された時のようなわかりやすい変化はありませんけど、たしかに「DW Pose」は再現性が高いのですよ。
当サイトではラノベ挿絵をAIイラストで作成するべく、元画像のポーズを認識してLoRA生成しています。その際に「Openpose Full」だと再現できなかったポーズが「DW Pose」だと再現できる、ということが実際に何度も起こっています。
具体的にどう違うの? っていうのを、「OpenPose」、「Openpose Full」と比較して確認しました!
↓その他PixAI.artの神機能アレコレはこちら。
↓「Openpose Full」については以下をご参照ください。
最強! DW Pose伝説
再現の難しいAIイラストもバッチリ!
まずは普通にAIイラストで確認します。AIイラストで遊んでいると、ポーズ的にカッコイイんだけど再現が難しそうなのがよく出力されるんですよ。
元画像は見るからに魔法を唱えているシーンっぽくて、ぜひ再現したいポーズです。これを読み込んでもらうと「OpenPose」は体の軸だけ、「OpenPose Full」はプラス顔、「DW Pose」はさらにプラスで手が認識されています。
本当は「OpenPose」も手を認識するのですが、このイラストではポーズ的に難しいみたいです。最新の「DW Pose」でも、指の配置がなんだか怪しいです。
これらの認識結果をもとにLoRA生成してみました。モデル「Moonbeam」で、LoRA比重「1.0」、プロンプトはトリガーワードのみでリクエストです。
「OpenPose」はなぜか色っぽいです。ズボンはいてないし。「OpenPose Ful」も左脚を上げて、なんかちょっと違います。ということで「DW Pose」導入前は、この元画像の再現を諦めていました。
それに比べ「DW Pose」は元画像と同じく、どっしり構えている感があります。手が認識されたことで、前に突き出している体勢も再現。総合的に見て、かなり元画像に近いポーズが再現できています。
……手が怪しい? 手はAIコラージュでどうにでもなるのですよ。参考までに実際に使った挿絵を示します。「DW Pose」でLoRA生成した後、元画像と合成して加工、さらに再描画してもらったものです。
以上より、「DW Pose」の優位性がバッチリ確認できたと思っています。
まさかの3DキャラもOK!
再現が難しい、といえば3Dキャラもそうです。「DW Pose」の再現性をもってすれば、3Dキャラのポーズも再現可能? ということで確認です。
元画像はVRoid Studioで作成した3Dキャラです。両手を広げてお迎えのポーズ。「OpenPose」ですと中途半端なバンザイみたい、「OpenPose Full」で顔と右手の一部が認識、「DW Pose」では顔も手もしっかり認識されています。
これを同じようにLoRA生成です。モデル「Moonbeam」で、LoRA比重「1.0」、プロンプトはトリガーワードのみ。LoRAは同じキャラクターですけど衣装違いです。
「OpenPose」はあきらかに別ポーズになっています。まあ、これはこれでアリですけど、目的は未達。「OpenPose Full」は中途半端に認識された右手を再現するためか、後ろに手を引いたポーズになっています。顔もちょっと微妙。
「DW Pose」はほぼ完ぺき。両手を広げて、少しだけ右半身が前になっている点まで再現。LoRA的には白いはずの服が黒くなっていますけど、ポーズは文句なしです。……指の数がおかしい? もちろんAIコラで解決できる問題です。
3Dキャラのポーズを再現できるってのは、地味に大きいポイントです。今のところOpenPose Editor的なものはPixAI.artに導入されていませんけど、機能的に代替できる可能性があります。
どうしても再現したいイメージがあって、でもAIイラストで生成してもらえない、そんな時にVRoid Studioを介してポーズを指定できそうです。もちろん万全ではないでしょうけど、再現性は確実に上がっています。
まとめ
PixAI.artの新機能「DW Pose」で楽しく遊ばせていただいております。従来の棒人形機能である「OpenPose」、「OpenPose Full」と比較し、AIイラストと3Dキャラを用いて認識の違いをテスト。「DW Pose」の再現性の高さを確認しました。
↓「ご参考までに」機能も便利ですよね。
↓「OpenPose」についてはこちらをどうぞ。
↓ControlNetの楽しい仲間たちです。
↓ControlNetダブル掛けはクレジット消費が怖い? よろしい! ならば会員登録だ!