[AI]V_predictionモデルのLORA作成メモ

あんまり取り扱ってる記事がなかったけど書くほどではなかったのでほとんどメモです。

NoobAI-XLなど一部モデルで採用されているv-prediction

このv-preタイプのモデルでLORAを作成しようとするとノイズ画像になります。

設定を変更すれば作成できたのでそちらについて書いてます。

目次

作業前に

環境構築とか事前準備の解説はしません、LORAを作成したことがある前提です。

またv-predictionモデルでもメジャーな方のepsilonで作成したLORAが使用できたのであまり意味があるかは分かりません。

作業は自己責任で行ってください、当方は一切の責任を持ちません

使用ソフト

kohya_ss(Kohya’s GUI)

今回はGUI版を使用しています

仕様バージョン

v25.0.3 b9028e8

参考記事

特に特殊な設定はしないので自前の設定ができていればこの部分は不要です

v25にアップデートしたら以前作成したコンフィグが使用できなかったので、こちらの解説記事のjsonファイルをベースに作業しました。

今回はAdaptiveの方ファイルをベースに使用して、Optimizerの設定をProdigyにしてありますがこの辺りは好きなのを使ってください。

v23位から使用してたコンフィグだとエラー出るようになるやつがあったのでなるべく最近のを参考にする。

設定関係

基本的に変更する箇所は殆どないです。

v_paramにチェックを入れる

v_paramにチェックをいれてSDXLと両方チェックが入った状態にします。

Fluxも調べた感じは行けそうですが未確認。

バージョンによっては両方にチェックが出来ないようになっている物があるので、そちらについてはこの後書き換えます。

作成時の最新バージョンではチェックが入りませんでした。

手動で設定する

JSONファイルをエディタやメモ帳で開きます。

後半にあるv_parameterizationを探してfalseからtrueに変更して保存します。

"v_parameterization": true,

これだけで作動するようになりますが、もう数点変更箇所があります。

Noise offset typeをoriginal

Noise offsetを0に(初期値0.03)

オプションにはないのでzrSNRをオプションに追加

ただこちらのオプションを有効化すると背景などが散らかりにくくなったり対象以外の余計なものが減るような記載がありますが、有効化しないことを推奨するモデルなども一部あるので効果のほどはいまいち分かりません。

画像の品質を上げた場合は良い感じになりますが、古い画像などではいまいちな感じがしたのでその辺りは、使用しないなどの判断をしてください。

モデルデータなどにも左右されるようでこちらのオプションは調整が必要そうです。

作業時の環境では初動で追加しています。

--zero_terminal_snr

その他設定の注意点

基本的にv_parameterizationの設定を有効化できるので、細かい設定は調整しながら行います。

SNR関係のノイズ関係の項目は基本的に0にするのを推奨されていますが、元の設定でも実行出来たりLORAの目的に合わせて調整してください。

STEPは300~500でも割と画風がより安い感じと、1000~2000でキャラなどもいけそうな感じがしました。

V-preモデルはプロンプトの反応が良いモデルが多いので少な目のステップでも良さそうですが、癖が強めなので目的に合わせて調整してください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次