イントロダクション Introduction
「もっと意図通りに、高精度な画像を生成したい」
"I want to generate high-precision images exactly as
intended"
SD Visual Prompt Editor は、Stable
Diffusionのプロンプト(呪文)を単に管理するだけでなく、構造を可視化して「推敲(ブラッシュアップ)」し、生成精度を高めるためのビジュアルエディタです。
SD Visual Prompt Editor is a visual editor designed not just to
manage Stable Diffusion prompts, but to
visualize their structure for "refining (brushing up)"
and improving generation accuracy.
長いプロンプトを作成していると、「どのタグが効いているのか分からない」「重複や矛盾が発生している」「トークン数制限を超えて後ろのタグが無視されている」といった問題に直面します。
本ツールは、テキストを「色のついたタグブロック」として可視化することで、これらの問題を一目で発見し、直感的な操作で修正することを可能にします。
When creating long prompts, you often face problems such as not
knowing which tags are effective, occurrences of duplication or
contradiction, or tags being ignored because they exceed the token
limit.
This tool allows you to discover these issues at a glance and fix them
intuitively by visualizing text as "colored tag blocks."
✨ 3つのコア・コンセプト ✨ Three Core Concepts
Stable DiffusionのAIはCLIP(テキストエンコーダー)を通じて自然言語も理解できるため、「色がついていない=AIが理解できない」わけではありません。
※将来的には、CLIP辞書にトークンが存在するかどうかを判定・可視化する仕組みも実装予定です。
Since Stable Diffusion AI can also understand natural language through CLIP (Text Encoder), "no color does not mean the AI cannot understand it."
*In the future, we plan to implement a mechanism to determine and visualize whether tokens exist in the CLIP dictionary.
Stable Diffusion(CLIP)は、プロンプトを75トークンごとの塊(バッチ)として処理する性質があります。
この区切りをまたぐと、単語同士の結びつきが弱くなったり、後半の要素が反映されにくくなったりすることがあります。
このラインを意識して「絶対に外せない要素」を前半に配置することで、生成結果が安定しやすくなります。
Stable Diffusion (CLIP) processes prompts in chunks (batches) of 75 tokens.
Crossing this separator can weaken the connection between words or make elements in the latter half harder to reflect.
By being aware of this line and placing "essential elements" in the first half, the generation results tend to be more stable.
🚀 クイックスタート (利用サイクル) 🚀 Quick Start (Usage Cycle)
本ツールは、WebUI (Automatic1111等) とセットで使用することを想定しています。 This tool is intended to be used in conjunction with a WebUI (such as Automatic1111).
-
入力 (Import):
WebUIにある既存のプロンプトをコピーし、本ツールの「プロンプトエディタ」に貼り付けます。Input (Import):
Copy an existing prompt from the WebUI and paste it into the "Prompt Editor" of this tool. -
可視化 (Convert):
画面中央の ⬇️ ビジュアルエディタに反映 ボタンを押します。テキストが解析され、タグとして展開されます。Visualization (Convert):
Click the ⬇️ Reflect in Visual Editor button in the center of the screen. The text is analyzed and expanded as tags. -
推敲 (Refine):
ドラッグ&ドロップでタグの順番を入れ替えたり、検索パレットから不足しているタグを追加したりして、構成を練り直します。Refinement (Refine):
Refine the composition by rearranging tags with drag-and-drop or adding missing tags from the search palette. -
利用 (Export):
プロンプトとしてコピー ボタンを押し、修正されたプロンプトをWebUIに戻して画像を生成します。Use (Export):
Click the Copy as Prompt button and return the modified prompt to the WebUI to generate an image.
次のページからは、各機能の詳細な使い方を解説します。
The following pages explain how to use each function in detail.
1. 基本表示・モード切替 へ進む ➡️
Go to 1. Basic Display / Modes ➡️