![サスケ](https://lanovesashie.com/wp-content/uploads/2022/12/sasuke_angry.png)
興味のない人には前回と何が違うのかさっぱりわからないと思う。やってる本人もさっぱりわかりません!
![ミノ子](https://lanovesashie.com/wp-content/uploads/2023/01/minoko_subtle.png)
まあそうですよね。数値で評価が出るならともかく、画像で良し悪しを判定ですからね
![サスケ](https://lanovesashie.com/wp-content/uploads/2022/12/sasuke_normal.png)
誰か教えて!
![ミノ子](https://lanovesashie.com/wp-content/uploads/2022/12/minoko_surprise.png)
考えることを放棄した!
要約
学習画像枚数30、繰り返し数10でエポック数を振った場合(最大40)のAIイラスト例を紹介します。
今回も特に意味があるっぽい事はわかっていません。なんですけど、ひょっとしてエポック数が大きければ、あまりプロンプトはいらない? むしろ邪魔? 的な疑惑が出てきたので、手がかりかもしれないことを得られたのは前進かもです。
はじめに
前回の続編的な感じです。ということで以下おさらい。
LoRA学習において大事なパラメーターは学習画像枚数(image)、繰り返し数(repeat)×エポック数(epoch)みたいです。imageは準備した画像の枚数、repeatは同じ画像を学習する回数、epochは学習全体の回数っぽいです。
ステップ数(step)との関係は image × repeat × epoch = step だとか。もちろんstepが大きいほど時間がかかります。なんとなくstepは大きければ大きいほど良さそうな気がしますが、ちょうどいい値を超えると勉強し過ぎの過学習になるそうです。
stepは4000~6000にしろという話や、5000~10000が良いという意見やらいろいろあります。まだよくわかってない、というのもあるでしょうが、たぶん学習内容によっても変わってくるのでしょう。
今回は学習画像枚数30枚、repeatを10にして、epochの違い(最大40)で生成されるAIイラストがどのように変わるか、確認します。
相変わらず違いがあるんだかないんだか、よくわからないんですけどね。例によって例のごとく、LoRA学習の参考にしていただければ幸いです。
↓Paperspaceのまとめ記事作りました。ほとんど自作LoRA学習まとめですけど。
↓前回のrepeat20検証結果ですよ。
懲りずにepoch振りますよ
もちろん比重も変化
噂に高いkohya版LoRAを使用。repeat=10で、epoch=8, 16, 24, 32, 40の結果を示します。image=30だから、それぞれstep=2400, 4800, 7200, 9600, 12000ですよ。諸説あるけどepoch=8は学習不足、40は過学習の予定です。
モデルは「SukiyakiMix-v1.0-fp16.safetensors」で、VAEは「orangemix.vae.pt」。その他は以下の方法でPaperspaceにStable Diffusionを導入したデフォルトの状態です。
使うプロンプトは「girl 1, smile」+LoRAのみ、ネガティブプロンプトは「worst quality, low quality, bad anatomy, nsfw, text, signature, watermark, username, missing limb, bad hands, missing fingers, extra digit, fewer digits」です。
![326ai_image_stablediffusion_repeat10_01e08s06](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_01e08s06.jpg)
![326ai_image_stablediffusion_repeat10_02e08s08](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_02e08s08.jpg)
![326ai_image_stablediffusion_repeat10_03e08s10](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_03e08s10.jpg)
![326ai_image_stablediffusion_repeat10_04e16s06](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_04e16s06.jpg)
![326ai_image_stablediffusion_repeat10_05e16s08](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_05e16s08.jpg)
![326ai_image_stablediffusion_repeat10_06e16s10](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_06e16s10.jpg)
![326ai_image_stablediffusion_repeat10_07e24s06](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_07e24s06.jpg)
![326ai_image_stablediffusion_repeat10_08e24s08](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_08e24s08.jpg)
![326ai_image_stablediffusion_repeat10_09e24s10](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_09e24s10.jpg)
![326ai_image_stablediffusion_repeat10_10e32s06](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_10e32s06.jpg)
![326ai_image_stablediffusion_repeat10_11e32s08](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_11e32s08.jpg)
![326ai_image_stablediffusion_repeat10_12e32s10](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_12e32s10.jpg)
![326ai_image_stablediffusion_repeat10_13e40s06](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_13e40s06.jpg)
![326ai_image_stablediffusio](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_14e40s08.jpg)
![326ai_image_stablediffusion_repeat10_15e40s10](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_15e40s10.jpg)
これはいきなり期待が持てる結果です。特に「epoch : 24、比重 : 1.0」がヤバい。リボンの色、校章ワッペンの色が完璧。同じ理由で「epoch : 40、比重 : 1.0」も中々。髪型がちょっとイマイチだけど。「epoch : 32、比重 : 1.0」はワッペンないけどほぼ完ぺきなミノ子。
黒髪ショートカットを指定せずとも、このクオリティーです。ってことは指定したらもっとイイ感じ? さらにプロンプト追加にも耐えられる? ……そう考えていた時もありました。
比重=0.9固定でプロンプト追加
前回と同じように、良さげな雰囲気ただよう比重=0.9に固定して、プロンプト追加で試してみました。
プロンプト①は「girl 1, smile, black short hair」、②は「girl 1, smile, black short hair, right hand punch practice. in the mysterious forest」、③は「girl 1, smile, black short hair, having a drink, in the streets of medieval Europe」です。
![326ai_image_stablediffusion_repeat10_16e08base](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_16e08base.jpg)
![326ai_image_stablediffusion_repeat10_17e08punch](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_17e08punch.jpg)
![326ai_image_stablediffusion_repeat10_18e08drink](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_18e08drink.jpg)
![326ai_image_stablediffusion_repeat10_19e16base](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_19e16base.jpg)
![326ai_image_stablediffusion_repeat10_20e16punch](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_20e16punch.jpg)
![326ai_image_stablediffusion_repeat10_21e16drink](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_21e16drink.jpg)
![326ai_image_stablediffusion_repeat10_22e24base](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_22e24base.jpg)
![326ai_image_stablediffusion_repeat10_23e24punch](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_23e24punch.jpg)
![326ai_image_stablediffusion_repeat10_24e24drink](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_24e24drink.jpg)
![326ai_image_stablediffusion_repeat10_25e32base](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_25e32base.jpg)
![326ai_image_stablediffusion_repeat10_26e32punch](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_26e32punch.jpg)
![326ai_image_stablediffusion_repeat10_27e32drink](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_27e32drink.jpg)
![326ai_image_stablediffusion_repeat10_28e40base](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_28e40base.jpg)
![326ai_image_stablediffusion_repeat10_29e40punch](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_29e40punch.jpg)
![326ai_image_stablediffusion_repeat10_30e40drink](https://lanovesashie.com/wp-content/uploads/2023/05/326ai_image_stablediffusion_repeat10_30e40drink.jpg)
……むしろ遠くなりました。ここまで黒い服が多いと流石に嫌な予感が……。これってひょっとして「black」に引っ張られてる?
そもそも「black short hair」のプロンプトはrepeat=20のepock=3, 5, 7で必要と思ったから追加しました。epockが十分大きければ不要になり、むしろ邪魔する? その結果黒い服が多くなった? なんかそんな気がしてきました。
実はこの後、さらにrepeatを少なくして検証しようかと思っていたんですけど、その前に「black」問題を解決する必要があるっぽいです。
……こういう変なことばかりしてるから、どんどんラノベ挿絵応用が遅れるのではないでしょうか。ちょっと自分でも心配になってきました。
*Paperspaceは誰かの紹介で始めたほうがお得です。詳しくは「PaperspaceでWebUIなStable Diffusion」をご参照ください。以下のリンクから登録すると当サイト経由ということで割引コードが適用されます。
![](https://lanovesashie.com/wp-content/uploads/cocoon-resources/blog-card-cache/292e556e3b8eac5fb915270802a4ec77.jpg)
クレジットカード登録が気乗りしないならVプリカの使用をおすすめします。貧乏性でVプリカの手数料が気になる or ポイ活的に補いたいって人は、ポイントインカムからVプリカに交換して資金を調達する方法もあります。
まとめ
学習画像枚数30、繰り返し数10でエポック数を振った場合(最大40)のAIイラスト例を紹介しました。
今回も特に意味があるっぽい事はわかっていません。なんですけど、ひょっとしてエポック数が大きければ、あまりプロンプトはいらない? むしろ邪魔? 的な疑惑が出てきたので、手がかりかもしれないことを得たのは前進かもです。
三歩進んで二歩下がる精神で頑張ります!
↓とっととPixAI.artに投稿して遊びたいんですけど……。
↓「black short hair」を抜いて黒服率ダウン!
↓一番最初の検証。repeat=20のepock=3, 5, 7です。
↓repeat=5の検証記事。残念だけど嬉しい結果です。
↓PixAI.artに持ってくLoRAは厳選したいのですよ。
↓学習のもとになっているのはVRoid Studioの3Dキャラクターです。