SDXL 提示词指南:控制技术手册

Stable Diffusion XL (SDXL) 不是玩具;它是工作室。与其他猜测你想要什么的模型不同,SDXL 需要精确的工程设计。学习如何控制它的双文本编码器,掌握特定分辨率“桶”的语法,并使用提示词权重来强制 AI 专注于重要内容。

上传图片 → 获取 SDXL 提示词

幕后:CLIP G+L 架构

展示 SDXL 双文本编码器架构(CLIP G 和 L)的技术图解

SDXL 的独特之处在于它同时使用两个文本编码器(CLIP ViT-L 和 OpenCLIP ViT-bigG)。可以把它想象成有两个大脑并行工作:一个专注于对主体的简单、自然语言描述,另一个专注于抽象概念、关键词和艺术风格。

这意味着你的提示词需要同时满足这两者。一个简短有力的句子安抚 'G' 编码器,而一系列特定标签安抚 'L' 编码器。与想要故事的 Flux 不同,SDXL 想要结构化的规格说明。它还严格遵守语法:使用 (parentheses:1.2) 来增加关注度不是建议——它是给模型的数学指令。

控制板设置

设置推荐值重要性
分辨率 (Buckets)1024x1024, 1152x896, 896x1152SDXL 是在特定的“桶”上训练的。偏离这些比例会导致图像烧毁/裁剪。坚持使用标准比例。
步数 (Steps)30-50例如:30 用于速度,50 用于最大细节。超过 50 很少能增加价值,只会增加时间。
CFG 比例 (CFG Scale)7.0 - 8.0它听你话的程度。太高 (>9) 会烧毁图像。太低 (<5) 会让它忽略你的提示词。
采样器 (Sampler)DPM++ 2M KarrasSDXL 的黄金标准。快速且详细。Euler a 更柔和/更快,但细节较少。

工作流:工程师管道

  1. 基础提示词(主体):用自然语言清晰定义核心主体。例如 'A robot barista pouring coffee'。
  2. 修饰符堆栈(风格):添加逗号分隔的标签给第二个编码器。例如 'cyberpunk, neon lights, 8k, octane render'。
  3. 权重控制:识别最重要的元素并提升它。如果咖啡缺失,将其改为 '(pouring coffee:1.3)'。
  4. 负向提示词盾牌:SDXL 需要被告知不要做什么。添加你的标准负向嵌入或列表:'text, watermark, blurry, deformed hands'。

工程化提示词模板

权重黑客(聚焦增强器)

Positive

Formula: (Main Subject:1.2), [Action], [Context], [Style Tags] 原理:有时 SDXL 会忽略你提示词的一部分。将其放在 (parentheses) 中会将其注意力分数乘以 1.1。添加数字 :1.2 或 :1.5 会强制模型将该 token 优先于所有其他 token。 Example: '(Red sports car:1.3) drifting on a racetrack, smoke, motion blur, 8k uhd, dslr'

Negative

blue car, slow, parked, cartoon

“打断”技术(概念混合)

Positive

Formula: [Concept A] BREAK [Concept B] 原理:如果你想混合两个独特的颜色或概念而不让它们相互渗透(比如蓝衬衫和红裤子),请使用关键词 BREAK。它会重置上下文窗口,强制模型独立处理下一个块,然后再合并。 Example: 'A woman with blue hair BREAK wearing a red dress'

Negative

purple dress, green hair

“负向盾牌”(质量增强器)

Positive

Formula: [Prompt] ... Negative: text, watermark, bad anatomy, blurry, low quality, cropped 原理:SDXL 没有像 DALL-E 3 那样的内置“质量过滤器”。你必须提供负向提示词来过滤掉其庞大训练集中包含的“垃圾”数据(水印、模糊照片)。 Example: 'An astronaut on mars. Negative: helmet reflection, text, nasa logo, malformed limbs'

Negative

text, watermark, bad anatomy, blurry, low quality, cropped

案例研究:SDXL 精度

案例研究 1:超现实主义构图

SDXL 能完美处理抽象概念。注意“蒸汽朋克城市”和“鲸鱼”是如何自然融合的,没有旧模型中常见的伪影。

SDXL 生成的漂浮在蒸汽朋克城市上空的鲸鱼超现实画作

a giant whale floating in the sky above a steampunk city, golden clouds, dreamlike atmosphere, surrealism, intricate details, oil painting style --w 1024 --h 1024

案例研究 2:构图控制(“打断”技术)

通过使用 BREAK 关键词,我们可以将主体描述与风格/氛围设置分离,确保艺术风格不会干扰主体细节(例如,眼镜和帽子保持清晰)。

戴眼镜和蓝帽子的白色毛茸茸狗狗的艺术风格画作,展示概念隔离

a white fluffy dog wearing round glasses and a blue cap BREAK artistic painting style, warm color palette, simple background, soft lighting, shallow depth of field

SDXL 疑难解答

为什么我的图像被裁剪或重复了?

你可能使用了错误的分辨率。SDXL 讨厌随机尺寸(如 512x512)。始终使用“桶”:1024x1024, 1152x896, 1216x832, 1344x768, 1536x640。坚持使用这些比例以获得连贯的图像。

什么是“精炼器 (Refiner)”?

精炼器是设计用于在基础模型之后运行以清理噪点的第二个模型。然而,许多现代工作流(以及 ImgtoPrompt)对基础模型提示词的优化非常好,以至于精炼器通常是不必要的。我们专注于把基础提示词做对。

我可以使用“Danbooru”标签吗?

可以!与 Midjourney 不同,SDXL 识别流行的图像板标签(如 1girl, upper_body, looking_at_viewer)。将这些与自然语言混合通常是最强大的提示方式。

继续探索

工程化你的 SDXL 提示词

不要浪费积分去猜测权重和语法。上传你的参考图片,让我们为你构建完美的、权重平衡的 SDXL 提示词。

自动生成 SDXL 提示词
SDXL 提示词指南:控制技术手册 | ImgtoPrompt