1.

Stable Diffusion とは?OSS 画像生成 AI の使い方・モデル世代

編集

本稿は Stable Diffusion (ステーブルディフュージョン) に関する記事です。

Stable Diffusion とは?

Stable Diffusion は、Stability AI を中心に開発・公開されたオープンソースの画像生成 AIです。「潜在拡散モデル (Latent Diffusion Model)」と呼ばれる方式を採用し、テキスト(プロンプト)から画像を生成します。

最大の特徴はモデルの重みが公開されていることです。Midjourney や DALL·E が SaaS でしか使えないのに対し、Stable Diffusion はローカル GPU 上で実行でき、商用 SaaS に依存しない画像生成パイプラインを構築できます。

主な特徴

  • オープンソース / オープンウェイト — 重みが公開され、ローカルや自社サーバで動かせる
  • 多様な派生モデル — SD 1.5、SDXL、SD 3、SDXL Turbo、SD3.5 など世代と派生が豊富
  • LoRA / ControlNet による細かい制御 — 画風・構図・人物姿勢を制御
  • img2img / inpaint — 既存画像をベースに変換、部分修正
  • 巨大なコミュニティCivitai 等で派生モデル・LoRA・プロンプトが大量に共有される
  • 商用利用可 — ライセンス条件下で商用利用が可能(モデル毎に要確認)

主な世代

世代位置づけ
SD 1.4 / 1.5初期版。軽量で派生モデルが最も豊富
SD 2.x解像度向上、ただし普及はやや限定的
SDXL大幅に画質向上。1024×1024 を標準解像度
SDXL Turbo / SDXL Lightning1〜4 ステップで高速生成
SD 3 / SD 3.5最新世代。テキスト埋め込み・構造理解の向上

動かし方の選択肢

方法特徴
AUTOMATIC1111 WebUI最も普及するローカル UI。プラグイン豊富
ComfyUIノードベースの UI。ワークフロー再現性が高い
Forge / Fooocus軽量・高速。Fooocus は初心者向け
Hugging Face Diffusers (Python)ライブラリとしてアプリ組込・自動化
Stability AI 公式 API / WebSaaS で利用(DreamStudio など)
クラウド GPUReplicate、RunPod、Lambda Labs 等で従量利用

必要なハードウェア(ローカル実行)

項目目安
GPUNVIDIA RTX 3060 (12GB) 以上推奨。SDXL は VRAM 8GB+ 必須クラス
VRAMSD1.5: 6GB / SDXL: 8〜12GB / SD3: 12GB+
RAM16GB 以上
OSWindows / Linux / macOS(Apple Silicon でも動作可、速度は劣る)
ストレージモデル 1 個 2〜7GB。複数モデル想定で 100GB+ 確保

派生機能・関連技術

技術用途
LoRA軽量ファインチューニング。特定キャラ・画風を後付け
ControlNet線画・ポーズ・深度マップで構図制御
IP-Adapter参照画像の「画風」を反映
img2img既存画像から変換
inpaint / outpaint部分修正・拡張
VAE潜在空間と画像の変換器。差し替えで色味が変わる
Textual Inversion / Embedding新しい概念を埋め込みに追加
Diffusers ライブラリHugging Face の Python API

類似サービス・モデルとの比較

サービス提供形態強み
Stable DiffusionOSSローカル実行・カスタマイズ・コミュニティ
MidjourneySaaSアート寄り・高品質・操作シンプル
DALL·E (ChatGPT)SaaSOpenAI 統合・指示の忠実度
Adobe FireflySaaS商用利用に配慮した学習データ
FLUX (Black Forest Labs)OSS / APISD 系開発者の新興モデル
Imagen / Veo (Google)SaaSGoogle サービス統合

注意点・ライセンスと倫理

  • モデルごとのライセンス: SD 1.5 / SDXL / SD3 は CreativeML Open RAIL や Stability AI Community License 等。商用条件・収益規模に応じた制約を要確認
  • 派生モデル (Civitai 等) は別のライセンスのことが多い。配布元の規約を必ず確認
  • 著作権・肖像権: 既存キャラクター・実在人物を再現するモデル/LoRA は権利侵害になりうる
  • NSFW・違法生成: 児童画像等の違法コンテンツ生成は厳禁。配布元・国の法令に従う
  • 透かし / 出所表示: 生成画像の出所表示が義務化される動き(EU AI Act 等)
  • セキュリティ: 外部から拾った .ckpt 形式は任意コード実行可能性あり。safetensors 形式を選ぶ
  • 業務利用ではAdobe Firefly 等の商用安全モデルとのすみ分けを検討

関連

編集
Post Share
子ページ

子ページはありません

同階層のページ
  1. Stable Diffusion
  2. Midjourney

最近更新/作成されたページ