PixAIにLoRA投稿リベンジでオリキャラAIイラスト生成！

サスケ

LoRA学習もかなりいいところまで来てる感があるな

ミノ子

そうですね。ここまでくれば、あともうひと踏ん張り。頑張りましょう！

サスケ

……いや、ここまでくればもうあとはどう転んでもいいかなー、みたいな

ミノ子

ここまでやって、最後投げやり！

要約
はじめに
いざ！　最終決戦！
まとめ

要約

繰り返し数10、エポック数24のLoRA学習ファイルについて、検証をおこないます。正直、前回のエポック数40と大差ないんですけど、今回のほうが若干好みだったので、当サイトのミノ子LoRA学習ファイルは繰り返し数10のエポック数24を採用します。

おまけとしてやってみた修正方法がなかなかイイ感じです。ベース画像を用いて、本当に大事なプロンプトとLoRAだけにする。ポイントはここだと思っています。

はじめに

LoRA学習の検証はそろそろ終わりにしたいです。もういいや、飽きた、ってわけでは決してなくて、検証を続けても差が不明確なあたりまでやり切った感があるからです。自己満足ってやつですな。

ってことで今回が最後。前回繰り返し数（repeat）10、エポック数（epoch）40のファイルをPixAI.artにアップしてAIイラストを検証しましたが、なんかぎこちなさが気になった。エポック数を落としたらどうなるのかを確認するのが今回の主旨です。

あとおまけとして、一度出力した画像の修正方法も試してみました。これがなかなか良いんですよ。棚から牡丹餅的な？

↓repeat=10、epoch=40の検証記事。これでも十分だと思ってます。

↓Paperspaceが気になる？　ぜひ気になってください！

いざ！　最終決戦！

ぎこちなくないLoRA学習ファイル

これを考えようと思ったら前回も示した以下の表が役に立ちます。

PixAI.artにアップしたのはrepeat=10でstep=12000(画像枚数が30枚だからepoch=40）でした。経験的にrepeatを変えるってよりはepochを変えたほうが良さげな雰囲気。ということで次点のrepeat=10でstep=7200（epoch=24）にしました。

前回同様、どんなキャラクターかってのを示すと、以下みたいな感じです。

322ai_image_stablediffusion_lora_17base1

322ai_image_stablediffusion_lora_18base2

VRoid Studioで作成した3Dキャラクターですよ。黒髪ショートカットで、白いローブ的な学生服を着ています。胸のリボンと変な校章ワッペンが再現ムズいです。このあたりの話はLoRA学習の記事を読んでいただけると嬉しいです。

まずは比重を変化

今回もモデルは「Moonbeam」を使用、プロンプトはLoRA＋「girl 1, smile」です。これまでの検証風に言うなら、動作なしのプロンプト①ですな。一括（x4）で4枚の画像を生成して良さげな3枚を示しますよ。

333ai_image_pixai_lora1024_01m06base1 — 比重 : 0.6、画像１

333ai_image_pixai_lora1024_02m06base2 — 比重 : 0.6、画像１

やっぱり比重が低いと自然で再現性低い、比重が高いとぎこちなくて再現性高い、って感じがします。トレードオフはしょうがない。それにしたって比重「1.0」は画像2と3がパーフェクトミノ子です。……画像1が面白いことになってますけど。

今回も比重は「0.9」で行ってみましょう！

比重「0.9」でプロンプト①②③

プロンプト②は「girl 1, smile, right hand punch practice. in the mysterious forest」、③は「girl 1, smile, having a drink, in the streets of medieval Europe」です。モデルは「Moonbeam」のまま、比重を「0.9」にしてAIイラスト生成！