Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1324284 >полный развал контекста На рекламно-агитационном материале нет ни одного поворота лица. Так что фотореалистичного character consistency можно не ждать. Инпейнт шляпы - вообще шляпа. А стилизации прикольные, видно что местами поумнее контекста.
>>1324373 Это мистер кококомпозиция, он на своей волне. У него композиция означает что-то свое, только ему известное. Он еще с сд2.1 называл хорошей композицей мыльный клосап бабы с шарп фокусом на трех разных расстояниях. Одному богу известно, что он тут под композицией имеет в виду.
>>1324415 > грейн - фу бяка, не реалистично > расплывшийся шакал, артефакт артефактом прогоняет - вооо, риализм По какому принципу ты определяешь реализм? Что у тебя вышло, то и реализм?
>>1324516 > На СДХЛ прогресс остановился напомнило шизика, который год носился с кривой базовой сдхл и рассказывал, как прогресс 1.5 остановился, а когда только начали появляться более-менее вменяемые тюны сдхл и все начали на них переходить, он внезапно решил, что сдхл - деград. что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных?
>>1324640 Это значит, что любое частное лицо и компания может спокойно делать деньги без отчехления или какого-либо упоминания авторов модели. Тебе дали опенсурсный инструмент, делай с ним что хочешь - те, кто тебе его дал ничего не будут спрашивать в замен.
Фактическим этим мувом они убили Black Forest Labs с их Флюхой. Им теперь остается либо сделать новую коммерчески залоченную модель лучше чем qwen, либо уйти в закат.
>>1324529 >в отсутствие правильной светотени или это у тебя руки кривые? Ван не умеет в тени, это не новость
>>1324568 >что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных? Лол, я на 1.5 генерил реалистичные фото, особенно с контролнетами, а теперь мне нужно год ждать тюнов, что бы запилить что-то отдаленно похожее на реальное фото
>>1324855 юзай на 1 шаг какой-нибудь маня-мешной моделью, потом в добивку на остальные 9 свою реалистик, всерху и сниху сразу появится место и нормальная поза, не будет ни обрезанной головы, ни обрезанных ног.
>>1324818 >вижу только пластиковое квеноговно уровня прошлогоднего флукса Ты уверен? Зацени текстуры которые есть в модели Wan2.2. Зацензурил так как всё равно в центре только провал, хотя очень реалистичный. The image is a photograph depicting a close-up of a woman's genital area, focusing on her vulva. She has light skin with a visible tan line and some body hair on her pubic region. Her labia minora and majora are clearly visible. A yellow and blue syringe, which appears to be partially filled, is being held by someone with their hand slightly out of frame, and the needle is inserted into her vagina. The angle of the photo is slightly from above, capturing her pelvis and upper thighs in detail. The lighting highlights the texture of her skin and the contours of her body. There is no other visible content or context outside of this intimate and explicit scene. The overall tone of the photograph is clinical yet personal due to the close-up nature and the insertion of medical equipment.
>>1324867 > столько мыла сверху Побочный эффект от самопальной CA. Каналы расходятся. То, что было одним пикселем на краях растягивается на ~3 по разным каналам, по другому и быть не может.
Ньюфажный вопрос. Есть уникальный персонаж и некоторое количество изображений с ним (~15, можно получить еще но будут похожи на те что уже есть) как сделать лору с ним? От количества настроек onetrainer я охуел. Попробовал shakkerai, получилось не очень, видимо недообучилось (10 repeat, 9 epoch) И почему в гайдах пишут что надо 50 картинок в охуительном качестве иначе будет говно, но всяким ботам в телеге и прочим сайтам которые лепят твое ебло на супермена хватает полторы фотки в шакальном качестве?
И как генерить глаза хотя бы как на 4 пике в оп посте? В большинстве случаев получается как будто наложили кучу всратых фильтров, примерно как тут >>1324733>>1324700
>>1324596 не оч понятно, хорошо это или нет. Если подавал карту глубины, то всё пошло по пизде, а если просто картинку как пример и хотел вариации, то тож немного по пизде из-за перспективы
Qwen-Image-Edit — новый инструмент для умного редактирования картинок от Qwen
Теперь можно не только генерировать изображения, но и редактировать их по команде: менять объекты, стиль, фон или даже текст прямо на картинке.
Что умеет: - ✨ Редактировать смысл и детали — можно, например, повернуть объект, сменить цвет или стиль, не трогая остальное. - 🔤 Менять текст на картинках — добавлять, убирать или редактировать надписи на китайском и английском, при этом сохраняются шрифт и стиль. - 🏆 Лучшие результаты на тестах — модель показывает топ-уровень среди открытых решений.
Как работает: Система сочетает понимание картинки (VL-модель) и точное управление структурой (VAE-кодировщик). Поэтому картинка сохраняет и смысл, и детали после правок.
Как попробовать: Достаточно открыть Qwen Chat и выбрать режим Image Editing.
>>1325313 >Qwen-Image-Edit охуенно. попробовал уже бесплатно на huggingface spaces, промпту следует сразу, не ломается через раз как контекст. всратую фотку с нулевых годов сильно улучшил. правда немного замыливает, настроек мало на HF. осталось дождаться ггуфов и воркфлоу, для полного контроля.
>>1325559 Ебало вот этого представили? Нет, раз такие требования предъявляют в треде, где месяц назад всё было засрано пластиковой анимереалистик 1вуман или просто шизой, то мы растём чересчур быстро. Это хрома. >>1324415 Как так охуенно сгенерить? Сохрани воркфлоу в webp.
>>1325568 > месяц назад всё было засрано пластиковой анимереалистик А теперь будешь засирать реализмом уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика?
>>1325583 > у тебя бомжа на калькулятора запускается и коупить не нужно Но ведь для 1.5 генерации и апскейла суперскейлом (или че там тогда модно было?) достаточно иметь деревянные счеты. Ты в логику совсем не умеешь или ты решил обсуждение качества перевести в бомжесрач, потому что по существу сказать нечего?
>>1325600 > Как раз не 1.5, а хрома так там качество >>1325578 > уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика тебе так сильно сраку разрывает от дмд, что ты готов любое говно ложкой жрать, лишь бы для его запуска нужна была карта дороже 15к рублей?
>>1325608 Ну вот об этом и говорю. Настолько копиума бахнул, что уже и хрома у него кал, и ван, и квен. Не легче ли признать, что просто ведро не тянет и оправдываешься? Ору блять, секта ебаная.
>>1325611 > копиума бахнул Не проецируй, лучше присмотрись к анатомии на объекте твоего восторга >>1325487 и осознай, что у тебя нулевые навыки понимания того, что пишет между строк твой собеседник (в большинстве случаев между строк ничего нет, даже если тебе очень сильно кажется, что есть).
>>1325624 Так сгенерируй лучше. Ну или газуй нахуй с треда реальные фотки смотреть, лол. Пока я вижу лишь свинью, которая специально выискивает недостатки. При этом сама свинка ничего не постит и продолжает безпруфно хрюкать, мол, прогресс никуда не двигается и мой 1.5 кал сделает также если не лучше.
>>1325634 кроме того, что чел стоит на своих 15см ногах, у бабы одна ягодицах в 2 раза больше другой, губы - свежезамороженное филе курицы, глаза - масляные пятна, кожа - засохший пва, ухо - прифотошопленный пельмень, волосы - кожаные ремни, ну и не стоит забывать про гигантскую бородавку на пальце под кольцом тоже мимо, не бомж
>>1325639 > Так сгенерируй лучше не могу( я вообще на пальцах считаю, т.к. бомж. а почему бы тебе не сгенерировать что-то лучше того кала на своей буратиновой карточке, вместо бескартиночных нахрюков?
>>1325646 Из объективных косяков - текстуры, да. И то корень этой проблемы в агрессивном апскейле NMKD-Siax. Остальное что ты перечисли - хуита из пальца высосанная. Мужик сидит, жопа в порядке.
>>1325313 Потестил в Комфи, ну такое себе. По инструкциям конечно годно, на голову выше контекста. Но мылище. С лайтнингоим от простого квена плохо работает, очень мылит. Без него надо 50 шагов ебашить. Смысл вообще такого.
>>1325487 Кто бы мог подумать, что такой толстенный вброс вызовет больше бурлений, особенно со стороны защитников, чем we-are-doomed, который хотя бы удачно зашакален был. Куда же мы скатились?
>>1325687 Нихуя не понял в какую сторону ты написал. Я, например, сгенерил, что-то похожее получил. Одна из лучших генераций за многие треды тут. Ну, так и очевидно почему, чел кинул же ссылку на чужую генерацию. Причем тут слово вброс?
>>1325611 никакой объём vram не сможет компенсировать твоё рукожопие, если ты даже натвис+дмд не смог осилить. твой удел - вбивать запросы в гугл и листать готовые результаты
>>1325845 Второе это без лор нароллилось? Как оно вообще работает на видеокартах, что по скоростям? Я со своими нищими 16гб даже пытаться не хочу, нунчаку до сих пор пилят под комфи.
ai-toolkit обновился с поддержкой ван 2.2, каких-то преимуществ в точности обучения, в сравнении с musubi-tuner не заметил. обидное. лоры обученные на ван 2.1 кажутся точнее в передаче черт
>>1325611 > что уже и хрома у него кал, и ван, и квен вообще-то нет. использую и хрому и квен, ван не пробовал, но ничего против не имею. кал - это тот кривой высер, от которого ты обмалафьился и кинулся защищать, попутно хрюкая что-то про секты и паля во все стороны
Еще одна неделя, еще одна модель
Аноним# OP19/08/25 Втр 20:29:44№1326141135
Ебет Flux Kontext во все щели, черный лес лабораторатории могут уже закрываться, после уходя с SD они макс смогли нам дать только одну модель, да и хуй с ними
>>1326141 Я полтора часа пердолился и не смог сделать как у китайцев на пиках. Оно мылит дико, реализма ноль. Ну собственно как у Контекста было. Про кручение предметов тоже не понял, тянку с другого угла чтоб получить надо выебнуться знатно, а не просто как они типа 3 слова пишут.
>>1326232 да не, просто у меня тут разрешение меньше, делался даунскейл nearest exact, хотя оригинал по всей видимости тоже был сделан на базовом qwen image.
Почему-то на Qwen Image могу генерить 1328x1328, но на Qwen Edit не тянет с 1.76 мегапикселя. Придется ждать нунчаку
В принципе у Qwen почти нет лимитов по разрешению, вплоть до 4k, поэтому это не совсем то, что можно считать ограничением модели.
>>1326238 Поздравляю! Тред ещё далек от завершения, но вы уже уверенный претендент на первое место в конкурсе на самую омерзительную генерацию! Так держать!
>>1326141 > QuantStack Опаньки, а у них и дистиллированный гуф есть там. >>1326232 > не осилили так же как чёрнолабые А это вообще возможно перевести в латент и обратно без потерь? Масштабирование тут не причем. Единственный вариант вырезать редактированный кусок и вставлять в оригинал, ящитаю.
>>1326269 > неактуал после релиза лоры Я её попробовал, а с ней NAG у меня не работает. А сейчас проверил, он вообще перестал работать с qwen, может после больших апдейтов в комфи, а может из-за изменений параметров запуска. И вообще, че-то она мне не очень зашла. 1 - дистил, 10 шагов. 2 - обычный с 8step лорой, 8 шагов (хуй знает, кто на пике). 3 - обычный с 4step-bf16 лорой (ну нахуй).
>>1326299 >Новое конфи меню говно полное, какой-то имбецил его дизайнил, нихуя не удобно, ищу способы вернуть Да ладно меню, что за хуйня теперь с линейкой открытых форкфлоу? Или ниже (в две строки) или выше (в две строки) или спрятано в меню, но не там, где ожидаемо(раньше). А где ожидаемо и было раньше, там теперь всегда постое место. Почему UI-дезигнеры такие дегенераты?
>>1326502 Там это простое место сверху очень любят использовать под себя разные плагины которые мониторингом занимаются. Например графики загрузки-температуры GPU выводить. Видимо под них прогнулись. Раньше открытые workflow с ними за него боролись до полной неюзабельности.
>>1326269 Не читал ваш дискас, но видео - тупейшая хуйня. Я гонял контекст для смены стиля, такие смещения это дело сида. Норма - сгенерить много и выбрать лучшее.
Привет, двач, вопрос по ComfyUI. При установке кастом нод через менеджер (и через гит клон в папку кастом нод) выходит такая ошибка (на скринах ComfyUI-VideoHelperSuite и ComfyUI-GGUF). Что пытался: 1. установка зависимостей в .venv через смд 2. Переустановка комфи Ничего из этого не помогло, куда копать? Или подскажи тематический тред, не нашел.
Ггуфо-квантодебилы, скажите, все ебанутые? Ну, писало loaded partially, не помещалось полностью, видимо. Скачал ггуф, начало писать loaded completely. А хули толку? Точность ниже, генерит на СОРОК БЛЯДЬ ПРОЦЕНТОВ дольше. Нахуй всрались эти ггуфы?
>>1326818 >генерит на СОРОК БЛЯДЬ ПРОЦЕНТОВ дольше. Нахуй всрались эти ггуфы? Братан, у меня тоже самое. Может не настолько медленно, но на 10-15% гуфы медленнее. Я уже давно об этом писал, как только флюкс появился. Кучу скринов и тестов предоставил в тред по запросам, но мне никто не поверил в итоге. Ну и хуй с ним как бы.
>>1325845 Тоже этим впечатлился. Офигительно следует промпту, просто написанному на русском, причем практически как попало, без особой оптимизации. FLUX нервно курит в сторонке по этому моменту.
Тыкал пока чисто на пробу, скачал чего поменьше чисто на посмотреть - и даже убитый квант q3km выдает что-то интересное. Качество конечно - убогое мыло, но и то... Если использовать этот квант для создания сцены, а потом по ней проехаться чем-то вроде sdxl, как рефайнером - можно, IMHO, решить основную проблему старых моделей - композиция и основа сцены. Т.к. так детально как qwen, даже через control net под чистым sdxl сцену не сделать. Зато старые модели огромную кучу стилей налорили - выбирай-нехочу. :)
>>1326835 Да верю, например я, верю. У меня то же самое. Просто gguf нужен тем, у кого с vram СОВСЕМ плохо - для самых низких квантов. Ну, или у кого multigpu сетап. Там вроде как через один плагин можно offload делать в vram другой карты а не в обычную ram - но только для gguf.
>>1326835 > но мне никто не поверил в итоге А кто должен был поверить, что у тебя на 10-15% гуфы медленнее? И почему тебе так важно, чтобы люди верили, что у тебя на 10-15% гуфы медленнее? Что произойдет, если кто-нибудь перестанет верить, что у тебя гуфы на 10-15% медленнее?
>>1324255 (OP) Аноны, подскажите лору для Пони, которая делает вот это вот "типичное" китайское овальное лицо. Я пытался искать, но как-то не очень получилось, в лучшем случае в компклекте ещё всякая китайская атрибутика подтягивается, а мне нужно только лицо.
>>1326936 Тебе бы самому погуглить что это такое. Зловещая долина это отсутствие асимметрии в лице, это понятие и мем которые описывают искусственно созданное лицо, причем это всегда относится к таким объектам, которые созданы с помощью формы, штамповки, каких-то точных инструментов. Например штампованное лицо куклы. Античные статуи и написанные портреты этим эффектом не страдают, потому что созданы не точным инструментом, а рукой человека. Нейрослоп тебе при всём желании точную симметрию в лице не сделает, а неестественность, которую ты ошибочно называешь долиной, это либо артефакты т.е. модель создает что-то страшное и несуразное в деталях, либо такая была база обучения и модели, например там было много 3д говна, а модель делает именно то, что от неё хотят.
>>1326141 для тех, кто будет ставить ггуф Qwen Edit, не забудьте поставить вот эту хуйню в папку с текст энкодерами, иначе у вас будет неполноценный Qwen Edit
Еще если вам не нужен негативный промпт на Qwen Edit, то можно не пропускать картинку через второй энкодер на квен эдит и поставить вместо него пустой обычный.
Потестил этот ваш квен, до гопоты ему далеко, промты простые ещё делает, с более сложными уже не справляется. Стили не понимает, известных персонажей знает плохо, детализация бедная, мылит картинку постоянно.