LoRA学習の繰り返し5,10,20動作ありを比重1で確認！

サスケ

プロンプト追加でのAIイラスト生成は比重0.9でやっていたが、1.0だとどうなるのか？　気になったのでやってみた

ミノ子

サスケさんってたまに真面目になって細かい検証しますよね

サスケ

っていうのは建前で、Paperspaceがなかなか空いてないからなだけでしたー

ミノ子

……騙された。感心して損した

要約
はじめに
動作プロンプト追加で比重「1.0」
まとめ

要約

これまでおこなったrepeat=5, 10, 20のLoRAに関して、比重「1.0」で確認をおこないます。たしかに再現性は高いのですが赤紫問題もあるので、やっぱり比重「0.9」が無難かもしれません。

それ以外として、repeat=10の優位性を同時評価において確認できたのが今回の大きな収穫です。これまではそれぞれのrepeatでバラバラでしたけど、同時に生成してもらったAIイラストでもやっぱりrepeat=10が最も良さげす。

はじめに

繰り返し数変化の追加検証的な感じです。以下おさらい。

LoRA学習において大事なパラメーターは学習画像枚数（image）、繰り返し数（repeat）×エポック数（epoch）みたいです。imageは準備した画像の枚数、repeatは同じ画像を学習する回数、epochは学習全体の回数っぽいです。

ステップ数（step）との関係は image × repeat × epoch = step だとか。もちろんstepが大きいほど時間がかかります。なんとなくstepは大きければ大きいほど良さそうな気がしますが、ちょうどいい値を超えると勉強し過ぎの過学習になるそうです。

stepは4000～6000にしろという話や、5000～10000が良いという意見やらいろいろあります。まだよくわかってない、というのもあるでしょうが、たぶん学習内容によっても変わってくるのでしょう。

ちょうど良い条件を探すために、これまでrepeat=5, 10, 20を確認しました。たぶんrepeat=10が当サイトの学習では良さげ、っていう結論です。これらの検証は比重「0.9」で確認しました。最初の検証の過程で、それくらいがちょうど良いと考えたためです。

しかしその後、動作を表すプロンプトを追加するにあたり、「1.0」だったらもっと再現性が良いのだろうか？　ということが気になってきました。ちょっと細かすぎではありますが、今回はそれを確認します。

さすがに比重「1.0」は整合性が難しいらしく、今回は赤紫の多い記事になりますよ。

↓Paperspaceのまとめ記事作りました。ほとんど自作LoRA学習まとめですけど。

↓repeat=10の結果です。アイキャッチ画像左側のミノ子が今のところ最強。

動作プロンプト追加で比重「1.0」

前提条件

普通にAIイラストを生成してもらうだけなら、比重「1.0」でもやってきました。なので今回は動作を表すプロンプトを追加したもののみの検証となります。以下、お馴染みの条件です。

噂に高いkohya版LoRAを使用。repeat=5はepoch=16, 32, 48, 64, 80、repeat=10はepoch=8, 16, 24, 32, 40、repeat=20はepoch=4, 8, 12, 16, 20の結果を示します。image=30だから、それぞれstep=2400, 4800, 7200, 9600, 12000ですよ。

モデルは「SukiyakiMix-v1.0-fp16.safetensors」で、VAEは「orangemix.vae.pt」。その他は以下の方法でPaperspaceにStable Diffusionを導入したデフォルトの状態です。

動作なしのプロンプト①は今回使いません。プロンプト②は「girl 1, smile, right hand punch practice. in the mysterious forest」、③は「girl 1, smile, having a drink, in the streets of medieval Europe」とします。

ネガティブプロンプトは「worst quality, low quality, bad anatomy, nsfw, text, signature, watermark, username, missing limb, bad hands, missing fingers, extra digit, fewer digits」です。