これは! 深い段ボールでは!?
気持ちはわかりますけど、落ち着いてください。Deep Danbooruですよね?
よぅし! さっそく深い段ボールで遊ぶぞ! ノッポさん風に工作するか、乗って土手を滑るか、はたまた中に入って狭い空間の居心地良さを楽しむか?
せめてわくわくさんって言わないと年齢がバレますよ?
要約
PixAI.artの新機能「画像からキーワードを抽出」を紹介します。この機能により、思いもよらないキーワードを手に入れ、新しいAIイラスト生成に応用できる……、気がします。似た画像生成なら「ご参考までに」機能に分がありますが、こちらは勉強になる、的な。
はじめに
PixAI.artで楽しく遊んでいると、違和感をおぼえることがあります。っていうかしょっちゅうです。「……あれ? これなんか違くね?」と思ったら、それは機能の更新か、年齢的カン違いのサインです。
今回も違和感からの新機能発見です。その名も「画像を説明する」、……もとい「画像のキーワードを抽出」です。
これってDeep Danbooruですよね? オリジナルキャラクターの再現に四苦八苦していたら、「Deep Danbooruを使えば、画像からプロンプトを逆生成できる」って教えてくれた方がいました。ありがとうございます!
あれから半年くらい。今では当サイトもLoRA学習を使えるようになりました。けどやっぱり、画像からキーワードを抽出するのは興味ありますし、勉強にもなりそう。ということで今日も楽しく遊んでみました。
↓最近は主に自作LoRAを使って再現性アップに励んでいます。
↓相変わらずPixAI.artの勤勉さには驚きます。更新頻度ハンパないです。
画像を説明プリーズ!
説明プリーズの方法
見慣れたPixAI.art画像生成画面に見慣れないものが……。
つい先日までなかったボタンがあります(左画像)。「画像を説明する」とありますが、6月15日現在は「画像のキーワードを抽出」に変更になってます。場所は同じですので、このまま説明を進めます。
クリックすると画像をアップロードする的なウィンドウが出てきます(右画像)。「画像から生成されたプロンプトを取得する。」……、これが噂のDeep Danbooru機能? 希望を胸に早速画像を選びます。
画像をアップロードするとキーワードのリストが出てきます(左画像)。よくわからないけど、ミノ子は何かのキャラクターに似てるの? それっぽいキーワードが出てきました。まあ、単なる黒髪ショートの女の子なんですけどね。
キーワードリストの中から気になったひとつを選択すると、画面右下の確認ボタンが押せるようになります(真ん中画像)。これを押すと画像生成画面に戻り、プロンプトには先ほど選択したキーワードが貼り付けられています(右画像)。
クリックするだけの簡単操作でミノ子キーワードの抽出⇒プロンプトへの記入まで完了です。なんたる親切設計! ではでは、さっそくお楽しみの時間ですよ。
ミノ子画像説明プリーズからの生成
まず最初に選んだ説明は「koei tecmo announces samurai sword club ajin 2, 1girl, solo, outdoors, black hair, smile, blue eyes, school uniform, shirt, short hair, bow, looking at viewer」です! これをキーワード①とします。
最初のキーワードはゲームか何か? 調べたんですけどわかりませんでした。これ以外はそれっぽい単語が並んでいます。「bow」って弓? 持ってないよ? って思いましたが「蝶結びのリボン」ですかね?
安定性確認のためもうひとつ。「an anime that has been put together with lots of school buildings around, 1girl, solo, outdoors, black hair, smile, blue eyes, school uniform, shirt, short hair, bow, looking at viewer」をキーワード②とします。
それぞれのキーワードをそのままプロンプトとしてAIイラストをしてもらいます。モデルは週出画像と同じ「Moonbeam」で、「一括(×4)」生成します。安定性を見るためにそれっぽい2枚を選んで下記します。
ほうほう、これは中々。全員同じ女の子、って言っても全く問題ないですな。ちょっと刀がアレですけど、「samurai sword」ですからしょうがない。雰囲気もミノ子っぽい気がする……、まあキーワードを押さえてますから当然ってことですかね。
当サイトのミノ子画像はさんざん遊んでいるので、だいたいどんなキーワードが必要かはわかってます。この「画像からキーワードを抽出する」機能は、珍しい魅力的画像を解析するのに使えそうな予感。
誰かがアップしているものならプロンプトが紹介されてたりしますけど、自分で生成して、たまたま良さげなのが出たけど再現できない、ってときなんかに役に立ってくれそうです。
魔法少女説明プリーズからの生成
……たまたま良さげなのが出たけど再現できない? だとすれば、当サイトではアレがありますよ。
この画像の、魔法を使っている感じを再現したいんですけど、全然できない。ではこの画像にはどんなキーワードが含まれているのか?
ズバリ「a cartoon lady with a light background and a sword holding it up, 1girl, solo, thighhighs, open mouth, looking at viewer, breasts, smile, white thighhighs, fang, bare shoulders, medium breasts」だぞうです!
この中で2回出てくる単語がふたつあります。ひとつは「breasts」。うん、大切な要素ですよね。もうひとつは「thighhighs」。これこそがクオリティーアップの魔法呪文? 勉強になるなぁ、と思ったらニーソでした。
剣は持ってないけど、斬撃のきらめき? みたいな雰囲気もなくはないです。不思議なのは「light background」。むしろ暗くない? などと思わずにともかくやってみます。
「Anything V5」で生成してもらった画像だから、同じほうが良いのかもだけど、この検証をずっと「Anything V5」でやるのもクレジット的にツライ。なので安価な「Anything V4.5」も試して違いが少なければ以後そっちを使うことにしたいです。
うーん、「Anything V4.5」も嫌いじゃない。嫌いじゃないけど「Anything V5」のほうが明暗がはっきりしていて好みです。これはもうおとなしく、クレジットコストの痛みに耐えるしかなさそう。
しかし、これではっきりしました。「sword」はやっぱりいらない。あと「thighhighs」も。ということで「a cartoon lady with a light background, 1girl, solo, open mouth, looking at viewer, breasts, smile, fang, medium breasts」を準備(キーワード③)。
さらにミノ子要素を追加して、キーワード④「a cartoon lady with a light background, 1girl, solo, black short hair, white robe, red ribbon on her neck, black trousers, open mouth, looking at viewer, breasts, smile, fang, medium breasts」とします。
……どうしてこうなった? キーワード④はミノ子に寄せるため「black short hair, white robe, red ribbon on her neck, black trousers」という4つのキーワードを追加しただけ。なのにPixAIちゃんのテンションだだ下がり。あきらかに③のほうがノリノリで描いてます。
キーワード④だって嫌いじゃないんですよ? でもなんか寂しい。この方法で雰囲気を維持したまま、ミノ子に寄せていくのはムズイのかもしれません。
LoRAと併用してプリーズ
気を取り直してラスト、LoRAとの併用にチャレンジします。雰囲気は違うものになるかもですけど、再現性は絶対的なはず! 使うのは懲りずにキーワード④です。LoRAの「比重」を下げていって変化を確認します。
「比重=1.0」はパーフェクトミノ子です。「0.8」、「0.6」はかろうじて小さな校章ワッペンがあるけど、「0.4」で完全に消失。もちろん当初の雰囲気はまるでありません。まあたしかに「light background」かもしれませんけど。ということで惨敗です。
やっぱり変化点はキーワード③から④に移ったあたりですよね。色が少ない感じで白と黒と赤だけです。ひょっとして色指定するとそれに引っ張られるんですかね? ……まあそのあたりの検証はおいおい進めます。
今回「画像からキーワードを抽出」機能を使った感想としては、キーワードはキーワードであってプロンプトではない、ということです。キーワードだけでの画像再現は難しくて、同じような画像を再現するなら、おそらく「ご参考までに」機能のほうが使いやすい。
やっぱりこの機能の面白さは、たまたま出てきた良さげ画像のキーワードを知ることではないでしょうか。今回の例では「light background」がそうかも。おそらく明るさを強調するために、全体的に暗くするのがポイントだったのでは? などと勝手に自己満足しています。
あと「bow」ですよね。「ribbon」だと細長い紐のチョウチョ結びが出てくるっぽいです。こんな感じでプロンプトの勉強になるのもポイントかと思ってます。
まとめ
PixAI.artの新機能「画像からキーワードを抽出」を紹介しました。この機能により、思いもよらないキーワードを手に入れ、新しいAIイラスト生成に応用できる……、気がします。似た画像生成なら「ご参考までに」機能に分がありますが、こちらは勉強になる、的な。
↓これが噂の「ご参考までに」機能です。
↓ちょっとくらいの破綻なら「inpainting」機能で書き換えられますよ
↓こうしてますます以下の記事が古くなっていきます。……新しいの書かないと。