[AI]V_predictionモデルのLORA作成メモ

2025年4月4日2025年4月5日

あんまり取り扱ってる記事がなかったけど書くほどではなかったのでほとんどメモです。

NoobAI-XLなど一部モデルで採用されているv-prediction

このv-preタイプのモデルでLORAを作成しようとするとノイズ画像になります。

設定を変更すれば作成できたのでそちらについて書いてます。

作業前に

環境構築とか事前準備の解説はしません、LORAを作成したことがある前提です。

またv-predictionモデルでもメジャーな方のepsilonで作成したLORAが使用できたのであまり意味があるかは分かりません。

作業は自己責任で行ってください、当方は一切の責任を持ちません

今回はGUI版を使用しています

GitHub

GitHub – bmaltais/kohya_ss Contribute to bmaltais/kohya_ss development by creating an account on GitHub.

仕様バージョン

v25.0.3 b9028e8

特に特殊な設定はしないので自前の設定ができていればこの部分は不要です

基本的に変更する箇所は殆どないです。

v_paramにチェックをいれてSDXLと両方チェックが入った状態にします。

Fluxも調べた感じは行けそうですが未確認。

バージョンによっては両方にチェックが出来ないようになっている物があるので、そちらについてはこの後書き換えます。

作成時の最新バージョンではチェックが入りませんでした。

JSONファイルをエディタやメモ帳で開きます。

後半にあるv_parameterizationを探してfalseからtrueに変更して保存します。

"v_parameterization": true,

これだけで作動するようになりますが、もう数点変更箇所があります。

Noise offset typeをoriginal

Noise offsetを0に（初期値0.03）

オプションにはないのでzrSNRを追加

ただこちらを有効化すると背景などが散らかりにくくなったり対象以外の余計なものが減るような記載がありますが、有効化しないことを推奨するモデルなども一部あるので効果のほどはいまいち分かりません。

画像の品質を上げた場合は良い感じになりますが、古い画像などではいまいちな感じがしたのでその辺りは、使用しないなどの判断をしてください。

モデルデータなどにも左右されるようでこちらのオプションは調整が必要そうです。

--zero_terminal_snr

基本的にv_parameterizationの設定を有効化するだけでも動作するので細かい設定は調整しながら行います。

SNR関係のノイズ関係の項目は基本的に0にするのを推奨されていますが、元の設定でも実行出来たりLORAの目的に合わせて調整してください。

STEP300～500位でも多少効きがでるのでその辺りで調整しながら、1000～2000位で作成すると良い感じになりそう。

V-preモデルはプロンプトの反応が良いモデルが多いので少ないステップでも良さそうですが、癖が強めなので目的に合わせて調整してください。

よかったらシェアしてね！