LoRA学習repeat5epoch80編

AI画像生成
広告
サスケ
サスケ

前回repeat10と20の再検証で満足したから、次は5だな

ミノ子
ミノ子

……いつまでやるんですか? なんかあんまり差も見えないしですし

サスケ
サスケ

まだふたつしかやってないじゃん! パラメーターがあったら三つくらいは振りたいじゃん! ふたつだと傾向が見えないでしょ!?

ミノ子
ミノ子

……頭の固い理系思考ですよね

Kindle本に挑戦中です(以下商品リンク)
その肉体の性能だということを忘れるな
他にも何冊かあります
無料体験でも読めます。ご興味あれば是非!
「Kindle Unlimited」メンバー紹介プログラム

要約

学習画像枚数30、繰り返し数5でエポック数を振った場合(最大80)のAIイラスト例を紹介します。これまで繰り返し数20、10、5と試しましたけど、10が最高、次点が20で今回試した5が一番残念な気がします。

はじめに

繰り返し数変化の続編的な感じです。ということで以下おさらい。

LoRA学習において大事なパラメーターは学習画像枚数(image)、繰り返し数(repeat)×エポック数(epoch)みたいです。imageは準備した画像の枚数、repeatは同じ画像を学習する回数、epochは学習全体の回数っぽいです。

ステップ数(step)との関係は image × repeat × epoch = step だとか。もちろんstepが大きいほど時間がかかります。なんとなくstepは大きければ大きいほど良さそうな気がしますが、ちょうどいい値を超えると勉強し過ぎの過学習になるそうです。

stepは4000~6000にしろという話や、5000~10000が良いという意見やらいろいろあります。まだよくわかってない、というのもあるでしょうが、たぶん学習内容によっても変わってくるのでしょう。

今回は学習画像枚数30枚、repeatを5にして、epochの違い(最大80)で生成されるAIイラストがどのように変わるか、確認します。

……っていうか、我ながらいつまで続けるのかよくわからなくなってきました。けど頭が固いからしょうがない。前回の検証的にはrepeat20より10のほうがちょっと良さげ? 的な感じですので、今回はやり過ぎであってほしい。そうしないと終われないですし。

↓Paperspaceのまとめ記事作りました。ほとんど自作LoRA学習まとめですけど。

↓黒服率を下げるために余計なプロンプトを取り除いた記事です。

エポック数振りますよ

まずは比重も変化させて

噂に高いkohya版LoRAを使用。repeat=5で、epoch=16, 32, 48, 64, 80の結果を示します。image=30だから、それぞれstep=2400, 4800, 7200, 9600, 12000ですよ。諸説あるけどepoch=16は学習不足、80は過学習の予定です。

モデルは「SukiyakiMix-v1.0-fp16.safetensors」で、VAEは「orangemix.vae.pt」。その他は以下の方法でPaperspaceにStable Diffusionを導入したデフォルトの状態です。

使うプロンプトは「girl 1, smile」+LoRAのみ、ネガティブプロンプトは「worst quality, low quality, bad anatomy, nsfw, text, signature, watermark, username, missing limb, bad hands, missing fingers, extra digit, fewer digits」です。

これはなかなかイイ感じにダメなんじゃないでしょうか。希望通りダメな方向ってことで、好ましい結果です。

具体的に何がダメって、今回ジャスト画像がほぼない。repeat=10や20の時みたいに、ひとめ見てミノ子っぽいAIイラストは生成されませんでした。あと赤紫のモヤモヤが出たり、破綻画像が出たりも多くて怪しい感じでした。

ということでrepeat=5は、この学習においてちょっと少ないんじゃね? 的な雰囲気です。

つづいて比重=0.9固定でプロンプト追加

前回と同じように、比重=0.9に固定して、プロンプト追加で試してみました。……比重=1.0も気になるけど、それはまた今度ってことで

プロンプト①は「girl 1, smile」、②は「girl 1, smile, right hand punch practice. in the mysterious forest」、③は「girl 1, smile, having a drink, in the streets of medieval Europe」です。

「epoch : 64、プロンプト②」が奇跡的にハイレベルです。なんならプロンプト追加前よりずっと再現性高いし。「epoch : 48、プロンプト②」や「epoch : 80、プロンプト①」も良いのですが、赤紫や青の部分が破綻な気がします。おしい。

やっぱりrepeat=5だと少なすぎ説が濃厚です。……別にアレですよ? 検証が面倒くさくなって強引に結論づけようとしてるんじゃないですよ?

*Paperspaceは誰かの紹介で始めたほうがお得です。詳しくは「PaperspaceでWebUIなStable Diffusion」をご参照ください。以下のリンクから登録すると当サイト経由ということで割引コードが適用されます。

Paperspace
Build and scale ML applications with a cloud platform focused on speed and simplicity.

クレジットカード登録が気乗りしないならVプリカの使用をおすすめします。貧乏性でVプリカの手数料が気になる or ポイ活的に補いたいって人は、ポイントインカムからVプリカに交換して資金を調達する方法もあります。

まとめ

学習画像枚数30、繰り返し数5でエポック数を振った場合(最大80)のAIイラスト例を紹介しました。これまで繰り返し数20、10、5と試しましたけど、10が最高、次点が20で今回試した5が一番残念だった気がします。

もちろんこの結果は学習する画像や、その他いろいろなパラメーターの影響を受けて変わるものと考えます。でもまあ、とりあえず今回の検証ではこのような傾向が見られました。

……え? だったら繰り返し数10と20のあいだ、15が気になる? そうですよねぇ、やっぱりそう思いますよねぇ。あんまり細かく振るのもどうかと思いますけど、15くらいは……、なんて思ってしまいます。

↓repeat=10の結果です。アイキャッチ画像左側のミノ子が今のところ最強。

↓悪くないけど若干repeat=10に劣る感じがします。主観になるのがツラいところ。

↓PixAI.artは再現性が高い傾向にある? 「moonbeam」と相性良いの?

↓ということでとっととPixAI.artで遊びたいんですけど。

↓上手くいったらこのサイトの概要を書き直さなければなりません。

↓比重「1.0」でも確認しましたよ!

↓点数付けするともうちょっとわかりやすくなる?