LoRA その1

AI画像作成コース

LoRAってなに?

「AIに特化スキンを装着する軽量ツール」
AIモデルに「特定のスタイル・キャラクター・画風」を追加するための小さな追加データです。
例えるなら、スマホアプリの「フィルター」やゲームの「追加キャラクターDLC」のような役割をします。

チェックポイントにスキンを被せるイメージです。

LoRAの特徴

  1. 軽量:基本モデルの1/1000程度のサイズ(通常10~200MB)。
  2. 高速適用:学習済みモデルに即座に追加可能。
  3. 組み合わせ自由:複数のLoRAを同時に使って「猫耳+和風衣装+水彩画風」のように合成できる。

仕組みのイメージ

  • 基本モデル:何でも描ける汎用AI画家
  • LoRA:特定のスキル(例:「浮世絵風に変換」「特定キャラの顔を再現」)
    → 画家の手元に「専用のトレースシート」を置いて、特定のパターンを上書きします。

チェックポイントに「鳥山明LoRA」、「小畑健LoRA」、「秋元治LoRA」を適用したイメージ図です。

具体的な使い道

  • アニメキャラの顔を正確に再現
  • 特定の画家(ゴッホ風など)の画風を模倣
  • 現実では存在しない衣装デザインを追加
  • 背景スタイル(サイバーパンク、幻想世界)を切り替え

なぜLoRAが便利なのか?

  • 省リソース:フルモデル再学習に比べ、100倍速く学習可能
  • カスタマイズ性:ユーザーが自作可能(自分の絵でLoRAを作れる)
  • 互換性:同じ基本モデル(例:Stable Diffusion)ならLoRAを共有できる

LoRAの限界

  • 基本モデルの性能が土台(弱いモデルにLoRAを載せても劇的には変わらない)
  • 複数LoRAの組み合わせで矛盾が生じる場合がある
  • 「全く新しい概念」の追加には向かない(既存パターンの調整がメイン)

実際の使用例

  1. 「◯◯アニメ風LoRA」をダウンロード
  2. 生成時にLoRAを選択
  3. プロンプトに <lora:◯◯アニメ風:0.8> と追加
  4. AIが基本の画力+LoRAの特徴を合成して生成

重要な設定パラメータ

  • Weight(重み):LoRAの影響度(0.0~1.0)。高すぎると不自然に。
  • Trigger Words(発動ワード):特定の単語でLoRAを起動(例:「makoto_style」)

Embeddingとの違い

観念を学習したEmbeddingとの違いは、

  • Embeddingはテキスト解釈に影響を与える。
  • LoRAは出来上がった画像に影響を与える。

ことで、影響を与える場所がちがいます。

まとめ

作成される画像をLoRAを使うことで好みの画風に寄せることができます。また、LoRAは自分で作成することもできます。

次回は、実際にLoRAを追加した場合に画像がどのように変化するかを確認します。

コメント

タイトルとURLをコピーしました