LoRA学習repeat5,10,20動作なしを点数付け評価！

サスケ

やっとここまで来た！　長かった！

ミノ子

ずいぶん苦労しましたね。正直、私たち何してんの？　無駄じゃね？　とか疑問に思ったこと数知れず……

サスケ

無駄などではない！　この検証結果が誰かの役に立ってくれれば本望！　っていうか、そんなこと考える暇があったら、とっととPixAIで遊びたい！

ミノ子

……最後ホンネが駄々もれですよ

要約
はじめに
動作なしプロンプトまとめ
まとめ

要約

LoRA学習のrepeat=5, 10, 20の動作ありプロンプトについて、これまで検証した結果をまとめました。さらに今回は画像を点数付けして、ちょっとだけ曖昧さを回避しました。その結果やっぱりrepeat=10が優位であることを確認できました。

はじめに

長ったLoRA学習の検証もようやく終わります。……え？　繰り返し数15？　やろうと思ったんですけど、Paperspaceで「予期せぬエラー」とか出たんで後回しです。これまでの経験から言ってしばらくすれば直る、……はずです。

ということで、いつものおさらいを以下に示します。

LoRA学習において大事なパラメーターは学習画像枚数（image）、繰り返し数（repeat）×エポック数（epoch）みたいです。imageは準備した画像の枚数、repeatは同じ画像を学習する回数、epochは学習全体の回数っぽいです。

ステップ数（step）との関係は image × repeat × epoch = step だとか。もちろんstepが大きいほど時間がかかります。なんとなくstepは大きければ大きいほど良さそうな気がしますが、ちょうどいい値を超えると勉強し過ぎの過学習になるそうです。

stepは4000～6000にしろという話や、5000～10000が良いという意見やらいろいろあります。まだよくわかってない、というのもあるでしょうが、たぶん学習内容によっても変わってくるのでしょう。

今回はこれまでおこなったrepeat=5, 10, 20の動作なしプロンプトに対するまとめです。

↓Paperspaceのまとめ記事作りました。ほとんど自作LoRA学習まとめですけど。

↓当サイトが準備したミノ子学習画像ともっとも相性の良いrepeat=10の記事です。

動作なしプロンプトまとめ

前提条件

条件はいつもと同じです。

噂に高いkohya版LoRAを使用。repeat=5はepoch=16, 32, 48, 64, 80、repeat=10はepoch=8, 16, 24, 32, 40、repeat=20はepoch=4, 8, 12, 16, 20の結果を示します。image=30だから、それぞれstep=2400, 4800, 7200, 9600, 12000ですよ。

モデルは「SukiyakiMix-v1.0-fp16.safetensors」で、VAEは「orangemix.vae.pt」。その他は以下の方法でPaperspaceにStable Diffusionを導入したデフォルトの状態です。

プロンプトは「girl 1, smile」のみです。これまで検証してきたプロンプト①、ってやつですよ。今回の検証でプロンプトはこれしか使いませんが、これまでとの関係からプロンプト①と表記します。

ネガティブプロンプトは「worst quality, low quality, bad anatomy, nsfw, text, signature, watermark, username, missing limb, bad hands, missing fingers, extra digit, fewer digits」です。

さらに今回は画像の点数評価も行います。独断と偏見で服、髪、リボン、校章、破綻について評価。