Генератор промптов SDXL из картинки

Загрузите картинку и получите промпт SDXL плюс компактный negative prompt примерно за 5 секунд — естественный язык для энкодера G, теги для энкодера L и автоматически подобранный bucket разрешения. Вставляется прямо в AUTOMATIC1111, ComfyUI, Forge или Fooocus. Две бесплатные генерации в день, без регистрации.

Drop an image here to generate a SDXL prompt

Max 5MB · PNG, JPG, WEBP · takes about 5 seconds

Open workspace

Почему промпты SDXL отличаются от SD 1.5

SDXL использует параллельно два текст-энкодера: CLIP ViT-L (под теги) и OpenCLIP ViT-bigG (под естественный язык). Оба видят ваш промпт одновременно. Лучшие промпты для SDXL удовлетворяют оба — описательное предложение в начале, затем список тегов. Именно это и выдаёт инструмент ниже.

  1. 1. Естественно-языковое вступление

    a close-up macro photograph of a dewdrop on a green leaf at sunrise

    Настраивает энкодер OpenCLIP bigG. Рассказывает модели сюжет сцены человеческими словами.

  2. 2. Структурные теги

    masterpiece, best quality, 8k uhd, sharp focus, shallow depth of field, soft morning light

    Питает энкодер CLIP L. Теги добавляют технический словарь, который трудно эффективно упаковать в одно предложение.

  3. 3. Компактный negative prompt

    text, watermark, bad anatomy, blurry, low quality, cropped

    SDXL МЕНЕЕ чувствителен к negative prompt, чем SD 1.5. Правило 2026 года: начинайте с 5–7 терминов и добавляйте только при конкретных сбоях.

  4. 4. Bucket разрешения

    1024×1024 (или 1216×832 для горизонтального)

    SDXL обучен на конкретных размерах-бакетах. Случайные размеры вроде 512×512 вызывают сдвиг композиции и сбои анатомии.

  5. 5. CFG Scale

    6–8 (оптимум — 7)

    Насколько строго следовать промпту. Выше 10 — пересвет и искажения; ниже 5 — промпт игнорируется.

  6. 6. Сэмплер + шаги

    DPM++ 2M Karras, 25–30 шагов

    Стандартный рабочий процесс SDXL. Выше 30 шагов визуальный прирост мал, а генерация замедляется втрое.

Real image, real prompt

The prompt below is the raw output of this tool on the image shown — not hand-written samples.

Фото животного → промпт SDXL
Фото животного → промпт SDXL
best quality, Australian Shepherd dog with brown and white fur, looking forward with mouth open, one ear up, set against outdoors, tan sand, blurred blue water, blurred light blue sky, shown in a close-up portrait, eye-level angle, with soft natural light, diffused light, minimal shadows

Negative: text, watermark, blurry, low quality, oversaturated, plastic, cartoon, cgi, 3d render

Things most beginners miss

  1. 1. Не копируйте negative prompt от SD 1.5

    Негативка из 50 слов, которая работала для SD 1.5, часто ухудшает качество SDXL. Практика 2026: начинайте с минимума (5–7 терминов) и добавляйте конкретные только при явных сбоях.

  2. 2. Используйте бакеты разрешения SDXL

    1024×1024 (квадрат), 1152×896 (4:3), 1216×832 (3:2), 1344×768 (16:9), 1536×640 (21:9). Другие размеры ломают анатомию. Инструмент авто-подбирает ближайший bucket под аспект вашего изображения.

  3. 3. Синтаксис весов в SDXL слабее

    (keyword:1.4) влияет меньше, чем в SD 1.5. Часто простой текст работает лучше. Держите вес не выше 1.4 — выше могут быть сбои цвета.

  4. 4. Refiner для большинства задач не нужен

    Если промпт для базовой модели написан хорошо, SDXL Refiner чаще не нужен. Он добавляет ~40% к времени генерации ради малозаметной выгоды в современных A1111/ComfyUI.

  5. 5. Анатомия портретов — точечная негативка

    Если руки стабильно кривые, добавьте в negative `(bad hands:1.4), (missing fingers:1.3)`. Не бейте ковровой бомбардировкой — целитесь по конкретному сбою.

SDXL vs другие модели

CapabilitySDXLFlux DevMidjourney
Локальный запуск (8GB+ VRAM)✅ Открытые веса✅ Нужно 12GB+❌ Только облако
Поддержка negative prompt✅ Полная❌ Не поддерживается⚠️ --no работает
Цена за 1000 картинок~$0 (после GPU)~$40 ($0.04/шт)~$40 ($10/мес ≈ 250 шт)
Текст на картинке⚠️ Слабовато✅ Отлично✅ Хорошо

Frequently asked questions

Совместимо с AUTOMATIC1111, ComfyUI, Forge?

Да. Вывод — простой текст, который вставляется в любой UI для SDXL. Для рабочих процессов ComfyUI JSON скопируйте positive и negative в соответствующие узлы CLIPTextEncode. Синтаксис одинаков во всех UI.

Работает ли с SDXL Turbo?

Да, но снизьте шаги до 1–4 и CFG до 1.0–2.0. Структура промпта та же — SDXL Turbo это дистиллированная версия SDXL 1.0 с более быстрым инференсом. Наш вывод работает без правок, просто меняете настройки сэмплера.

Какие CFG и шаги использовать?

Для SDXL 1.0: CFG 6–8 (7 — безопасный дефолт), шаги 25–30 с DPM++ 2M Karras. Для SDXL Turbo: CFG 1.0–2.0, шаги 1–4. Для SDXL Lightning: CFG 1.0–2.0, шаги 2–8.

Почему нет синтаксиса весов вида (keyword:1.3)?

Потому что SDXL (и его производные — Pony, Juggernaut XL) архитектурно менее чувствительны к весам, чем SD 1.5. Простой естественный язык часто даёт тот же результат без артефактов. Добавляйте веса вручную, только чтобы закрыть конкретные сбои.

Подходит ли для Pony Diffusion или Juggernaut XL?

Да — это чекпойнты на базе SDXL. Однако Pony Diffusion сильно реагирует на score-теги вроде `score_9, score_8_up, score_7_up` в начале позитивного промпта. Добавляйте их вручную; инструмент выдаёт SDXL-синтаксис, независимый от конкретного чекпойнта.

В каком разрешении реально генерировать?

Всегда используйте bucket SDXL (1024×1024, 1216×832, 1152×896, 1344×768, 1536×640). Никогда не 512×512 — это территория SD 1.5, в SDXL композиция сломается. Если нужно меньше — сгенерируйте в bucket-размере и уменьшите.

Other model guides

  • Картинка → промпт FluxЕсли у вашего GPU 12GB+ VRAM, Flux Dev даёт более резкую детализацию и лучшую отрисовку текста, чем SDXL.
  • Картинка → промпт MidjourneyНе хотите возиться с локальным GPU? Midjourney V7 даёт сопоставимое качество как облачный сервис.

Ready to generate your SDXL prompt? Open the workspace and drop an image — first two runs each day are free.

Генератор промптов SDXL из картинки | imgtoprompt