【询问】AI作图提示词
想问一下,AI作图时,正向提示词过多,结果出现元素错位和元素丢失,应该怎么解决?
以及如何描述多人场景,使每个人匹配到对应元素,如动作、饰品等?
(如果可以的话能再麻烦说一下多人场景中肢体混乱的解决办法吗,扩大画布都没用)
用的是stable diffusion,模型indigoFurryMix_v25AnimeNiji.safetensors(其实也有indigoComic_v10.ckpt等其他模型,但那一款用的多一些)
最近在试着AI作图时,发现正向提示词比较多,或者比较长的时候,系统对于这个元素就会有一定的曲解。
比如,当我想描述“手里卧着一把剑,剑的另一端插在地上”这种比较长的词汇的时候,做出来的结果是两把剑,手里一把地上一把;描述“一个幼年北极熊”,画的是是一个成年北极熊和一个小北极熊,甚至有时候是一条小狗……
这是提示词比较长的情况。还有错位和丢失的现象,比如,刚才的同一副图,我想描述“暗红色的长条旗挂在城堡外壁”,结果那只旗子反而挂在剑柄上了……(这AI一开始画的甚至是英国和美国国旗……);另一幅图都写好black blindfold还加了1.2的比重,结果画出来还是红的,狼倒画成黑的了;还有那个蜜汁微笑,我打了scared, shocked, angry, pain, wound, deep wound, injury, many wounds,还加了1.2的比重和反咒才勉强抹掉那个蜜汁微笑(虽说时不时还是偶尔冒出来,它到底对微笑有多执着),但当我再加提示词的时候,比如dark background, blood stain, cement floor等,似乎人物身上就没有伤口,wound, injury等提示词就被抹去了。
(插一嘴,有些词汇之间会有很强的相互关联,比如写snowing, polar bear等与雪有关的词以后,背景总会出现木屋、干枯的树和松树;写花店,背景总会是一扇大玻璃窗,写反咒加到1.2都抹不了,就很气。
但写人物跪在地上,再写blood stain之后,为什么一定要集中画在裆前,看起来就像是社出血了好吗(作为一种XP也不是不行,怪欸))
强关联内容先暂停一下,接着继续元素错位和丢失的问题。
比如这张!猜猜描绘的什么!
我描述的是在花店里有一只灰色狼人,穿着棕色围裙带着棕色手套,手捧一个花盆,花盆里有一株向日葵,旁边是木制花架,上面有红的蓝的紫的之类其他的花。
所以,人呢?
都气笑了。甚至有那么一瞬间想检查一下自己是不是写到反咒里去了。你抽什么风
(并不是没有百度之类的搜索过,但很多教程都是单人以及一些简单的动作,比如一个女孩,水手装,街道,就结束了。如此简单的场景不足以支撑我强大的XP当我想描述一些比较复杂的动作,比较繁复的饰品与场景,就会出现错误……而且有些教程被删了,更是让孩子本就白痴的脑子雪上加霜。所以有没有好心人帮忙指导一下,怎么写提示词,还是用的模型架构之类不太行……会给很多很好的评价,或者来一些教程也可以啊)
想要特定姿势,lora模型很好,去c站找一个对应的站姿lora模型。
其次,checkpoint模型也要好好选择,有一些专门画特定类型的模型,自然发挥会比什么都有的模型更加精准。
我推荐的方法是,想画一个画的时候,把主要内容当做关键词去c站等各种网站搜索一下,比如想画狼人,就搜索werewolf,然后出现的很多图片里挑选一张满意的,直接照搬它的模型与关键词,然后添加自己想要的背景关键词,寻找自己想要的姿势lora模型,之后重新随机。另外,如果看到一个部分符合要求的图片,比如牛头人在花园里,不妨试试把他的seed贴上去,用自己想要的关键词和模型跑一遍,seed一致你的新作会和原图有一定相似,然后抽卡就好。
如果有帮助请给我钱 不会ai绘画之类的诶,愿楼主能解决问题 好像可以删掉一些正向的,然后自己添加负向的吧,我看论坛里有个大佬每次发出自己的tag,里面负面tag比正面tag多好几倍 过于细致的有些难,不过有点可能是关键词没找对,楼上猫猫给出的方法很实用,就是记得要挂梯子{:4_114:} 确实欸(´×ω×`)可以看看最近的ai绘画帖,就那么一些些内容,能有满屏的英文单词的(瑟瑟发抖)好像用英文单词当提示词效果更好的
发动大召唤术@silencedonkey
小驴的图都很棒的~问问他好了~ 去掉一些正向提示词试试看? 楼上给出方法很实用呢,不太懂的话。论坛记得还有AI绘画的教程帖子来着。 本帖最后由 silencedonkey 于 2023-7-25 11:53 编辑
首先要确定你描述的情况(固定关键词)是偶尔出现还是所有的图都大量出现,如果你跑一批大部分都有这些问题,应该就是关键词描述不到位了。每个模型对于各类关键词权重的敏感度非常不一样,一般都得试很多次确定稳定的效果。还有就是大力出奇迹,AI本来随机性就很强,出图偏差也是常有的事,多跑几张总能产出自己满意的(我有时候跑一批拉满100张都挑不出一张满意的,这种情况就要根据结果回头检查一下关键词)。最后,有些特定的场景AI就是很难画出来,可能是对应模型当初训练的时候就有所缺陷,这个没有很好的解决办法。
你说的问题我其实都有遇到过。AI就是会时常丢元素,如果人物丢了检查一下是不是描述风景关键词太多。错位也是常有的事,复杂的构图有时候就是不准,只能多跑几次选正确的了。有的关键词确实会有极强的联想,会自己补出场景的物品,跟模型有关。如果场景元素不是很多,尽量一开始不要跑很大的图(后续可以重绘成大图),否则容易出现你说的多个人物的现象,是AI填不满画布就自己发挥复制能力了。
至于多人场景的精准匹配,我自己也没有很好的解决方法,等个用过相关插件的大佬解答吧。
【十周年庆】小驴的AI毛茸茸入门教程
https://www.gamemale.com/forum.php?mod=viewthread&tid=112794&fromuid=731005
(出处: GameMale)
最爱的小驴的教程~ 有可能是标签太多了导致的,可以去掉一部分非关键的标签 QAQ 确实 感觉需要炼丹大师 可以看看楼上的教程呢 不太懂炼丹,可以去论坛找找教程? 是很细致的问题呢 蹲很会炼丹的大佬来解答一下 本帖最后由 flint0769 于 2023-7-25 12:05 编辑
AI绘画,现在就是随机性太强。你想要具体仔细的描述很难做到。
1.多人场景是stable diffusion的弱项。网上那么多图,没有见过SD画好过多人,画好概率很低,出图多人往往缺乏互动性。很怪。画多人需要用mijourney,网上看到好的多人基本都是mijourney画的
2.关键词丢失。我感觉这个暂无解决办法。我觉得关键词有权重之分。有的容易识别。有的A跟B一起出现之后。B会不显示。哪个词权重高?无从得知,都是试过之后才知道。不同模型,关键词权重也会改变,不同模型,对关键词识别也不一样。 有的关键词就是无用词,有的关键词是极容易出效果的。 之前看大佬们的咒语也没有特别长 本帖最后由 書圖 于 2023-7-26 11:37 编辑
好心回答沒有任何回應 自刪 ai这类的没用过,看看哪个会玩ai的坛佬说明 围观大佬们交流,还没操作过AI绘图的我说不定也可以从中学习到知识! 出现了好多炼丹大佬啊,围观人士表示学到很多
页:
[1]
2