|
本帖最后由 1849160110 于 2024-1-7 01:02 编辑
声明:本帖仅作为一个AI绘图爱好者的入门级建议,所有资源皆来自于网络。请尊重原作者特别是为AI绘画提供原数据的画师们的辛勤劳动,毕竟没他们的作品,那就连赛博丹药都没得炼。
所有读者的个人行为以及行为后果皆与本文及本文作者无关~
例行镇楼引狼~
如上期预告的,本期主要讲下采样方法的区别和Tags的书写和排布,这俩放一起是因为二者对AI绘画的基础构图都有根源上的影响,不少潭友表示自己绘图会出克系鬼畜图或者需要“抽卡”(出图质量不稳定,需要大量随机出图,从中间挑能看的),说白了就是Tags、采样方法、底模这三者适配的不好。所以本期就简单说说这个。依旧是个人的经验参考,大佬请无视(不对不足之处请潭友们勿喷,杠就是你赢23333)
—————————————正文开始————————————— 上期说过,所谓采样方法可以理解成“一张图要怎么画”,本质原因是AI绘画的机制,并不是像大家想的如同真人绘画那样从空白往上添加元素,这种绘画方式要求的计算量绝不是普通家用PC能负担的了得。所以SD采用了一种更适配家用PC计算能力数量级的方式,具体方式感兴趣的潭友可以参考对应的原理文章,用一句话描述就是:从一堆噪点里,按照你的Tags等,定向降噪,不断重复,最终形成一张图。举例子形容就是:一片雪地,把某些位置的雪弄掉,不断重复,最后从高空看就是个图像(类似下图,雪地上的画实际是人的足迹把雪踩掉之后,从高空看到的)。 所以在讲Tags之前,先来说说这个采样方法:如果Tags对AI绘图的影响是1,采样方法的影响就是0.3-0.7——合适的采样方法一定能让你的绘图过程事半功倍,反之亦然。先来看看以下不同采样方法成图对比的一张图: 这三张图除了采样方法的所有参数和Tags等均完全相同,但是因为采样方法的不同,三张图的内容有明显区别,并且在绘图细节和完成度(人体比例、解剖合理程度、图片清晰度等)方面也有一定区别。这就是刚才提到的,采样方法对AI绘画的重要性。有些时候如果怎么出图都不理想,可能是你的Tags、底模、采样方法三者契合度不佳,因为修改Tags比较麻烦而且改了就不一定是我们想要的东西了,更换底模和采样方法反而要更有用。 对于采样方法,上期也提到过,SD自带了很多采样方法,这些采样方法其实是可以分“家族”的,也就是某几个采样方法其实是同一个路子,成图效果经常大同小异,这种情况下固定使用其中一两个采样方法即可,用不到那么多;另外,某些采样方法由于其内在绘图机制的问题,要么成图时间很慢,要么依从性差,要么直接容易鬼畜,也可以直接淘汰掉。我个人经过长期玩SD,筛选出来了几个最适合我Tags习惯和底模的采样方法,简单介绍下(因为估计潭友们也是用的类似底模,写的也是类似瑟瑟Tags哈哈哈): 1.DPM++ 2M SDE Karras和DPM++ 3M SDE Karras:非常优秀的采样方法,综合性能是最佳的,在对Tags的依从性、成图速度、成图完成度等几方面都相当不错。并且这个系列的采样方法有个挺好玩的地方:由于有个内在的噪声表,其它参数相同情况下,采样迭代步数每变化约5,图像细节及构图就会有一些小的变化,这个的优点在于当我们出了一张95%满意的图,仅个别地方不太满意想比较自然地让图进行变化以期得到最佳图像时,就可以变化采样迭代步数来达到目的,这是其他采样方法比较难做到的(其他的不稳定,而局部重绘有时候该部位看着会比较突兀)。3M可以理解为2M的进阶版本,之所以都保留是因为有的个别的图2M画出来反而比3M更满足我的胃口,因人而异自行选择就行; 2.DDIM:可以说是爷爷级的采样方法,虽然有几个“后辈”,但经过实测,稳定性和成图完成度都不如DDIM。这个采样方法最鲜明的特点就是一个字——快。它是真的快啊,同样采样迭代步数情况下,DDIM用时只有别人的60%,此外这家伙成图需要的采样迭代步数还比别人少。举个例子:同一张图需要60步,DPM++ 3M SDE Karras可能需要40s,DDIM只需要25s左右;同样的Tags,DPM++ 3M SDE Karras成图可能需要60步,DDIM大概35步左右就行。对于电脑显卡不太好的潭友或者急着想出图而不追求质量的潭友,DDIM是个性价比极高的选择。当然它的缺点也比较明显:DDIM对Tags依从性不如其他采样方法“更不听话”,成图完成度相比DPM++ 3M SDE Karras这个系列也差一点。我自从换了30系N卡之后,DDIM就很少用了; 3.Euler a:也是个爷爷级的采样方法了,在SD中应用许久,但由于其性能优秀,一直没有被淘汰,还在发光发热。这个采样方法的优点在于其稳定性中的随机性:也就是参数发生变化时,相比上一个系列,该采样方法成图变化更大,这就给喜欢高质量“抽卡”(保证“抽卡”的成图基本都合格)带来了乐趣,只要Tags、采样方法、底模三者适配,都不用怎么修改参数,点点点就行,成图之间的区别会比较大,经常有意外惊喜; 4.DPM adaptive:DMP家族真的是人才辈出,DPM adaptive也是个很优秀的采样方法。但这玩意优点缺点一样鲜明——优点是DPM adaptive出图相当细腻,对Tags的还原程度较好(虽然依从性不一定好23333),特别适合真人R型模型出一些质量要求高的图;缺点是这哥们太慢了。。。慢到你根本不知道多少步合适,所以它叫“adaptive”(自适应),如果你的采样迭代步数大于它出图需要,它会自动缩减超出的那部分步数的时间(画完了,你后面多的那几步我不画了),但如果你的采样迭代步数大于它出图需要,那就会出半成品的图。。。以至于我用这哥们,采样迭代步数都拉到80以上,增加了出图时间。此外,跑同样步数,DDIM的速度是它两倍,电脑显卡不行的就更长了。所以建议是,电脑不好的慎用、急着出图的慎用、质量要求不高的慎用,但想出细节满满的大图+你也有耐心+30系N卡,这个相当合适。 这里放一张以上四种采样方法出图的对比图(从左往右顺序分别是刚才介绍的采样方法的1→4,其他所有参数完全相同): 可以看到,DDIM细节最少(但它出图最快),DMP adaptive细节很多也很细腻(但它出图最慢),Euler a是四张图里姿势变化最大的,DPM++ 3M SDE Karras则是几个的平衡。 至于SD的其他采样方法,我个人用过都觉得很一般,总有非此即彼的很多问题,也就基本淘汰了。当然因为潭友们Tags的书写方法、底模使用与我不同,所以并不是我惯用的就是对你来说最好的,有时间了可以自己一点点试~ 终于讲到Tags啦,这个可能是最困扰潭友们的东西啦,因为——这玩意儿纯英文英语苦手碰见这个简直就要阵亡了( 连标点符号都要用英文制式的,很重要)。不过还在我们还有——呛呛呛——翻译软件哈哈哈哈哈哈,是的你没看错,百度或者有道这类翻译软件真的能帮上忙 当然秋叶大佬的整合包里自带Tags补全插件,基本上只要你知道某个Tag的开头字母,打进去就会自动列出候选,相当方便。当然,最简单的是抄别人的Tags,只要Tags、底模、参数三者基本一致,那你也能出类似的图(但不是完全一样,因为显卡型号、SD内核版本甚至插件等都会影响出图)。我的个人建议是:抄其中的部分,特别是一些品控词(一会儿会讲),其他的就根据自己想要的内容书写或者扔给翻译软件~ 不过,在正式讲Tags之前还是先要说一句:Tags固然重要,但参数调整、底模选择、采样方法等,加起来对成图的影响不亚于Tags的作用,所以用了别人的Tags但没出同样内容和品质的图再正常不过了(楼主开始玩SD就是这种小白,大佬的Tags到我手里简直就是Bags),学会怎么写Tags、怎么排布Tags才是最重要的。 所谓的Tags,其实可以理解成“我想要的画面内容转化成AI能理解的关键点”,这个玩意儿对于AI绘图的降噪是指向性的也是决定性的,你没写的Tag,AI给你画出来有很小的可能,但你要写了,那基本上就是一定会出现(基本上,担有几个干扰因素)。比如楼主个人控袜,所以Socks这个Tag就是我常写的一个,如果没有这个Tag,AI极大概率会画出鞋子而不是没有鞋子的袜子(如下图,不写socks,直接连足部都不给画了,AI就是这么任性)。 Step1:书写Tags之前,需要先确定这张图上我都想要什么元素,并且最好给这些元素按重要性排序,以便稍后对Tags进行排布使用。举例:我想要一个穿着白袜的黑衬衫小哥哥,坐在扶手椅上对着我笑,那需要出现的Tags就有:black shirt, a muscular old male is light smile to you, socks, sitting on armchair等这四个(SD中,Tags可以是单词、词组、短句,甚至emoji表情,但必须是纯英文),按照我个人期望的重要性排列就是:a muscular old male is light smile to you, black shirt, sitting on armchair, socks。这就完成了书写的第一步。 Step2:接下来第二步,补充品控词。所谓品控词,就是对出图的整体质量进行把控,或者对场景布局进行宏观调整的Tags。比如刚才的那几个Tags,如果直接拿来出图,第一图会很糊,第二会出现“大头照”,第三甚至可能出鬼畜,非常影响体验,那品控词就至关重要了,特别是画面上你想要的元素越多,那品控词也需要对应增加分量。比如楼主个人常用的一套品控词:masterpiece, best quality, realistic, very detailed, incredibly absurdres, highres, muscular, looking at viewer, cowboy shot,前六个是对出图质量的控制,后三个是对构图和细节的控制(Tags具体意思请自行翻译,懒得解释了23333)。有了这几个品控词,出图的质量会提升一大截。 Step3:负面Tags。这个玩意儿是啥呢,如果你打开了SD绘图的具体界面,就会看到,Tags的输入区域实际有两个,上面那个是正面Tags,是我想要什么;而下面的就是负面Tags,我不想要什么。某种程度上来说,负面Tags也算一种另类形式的品控词,但相比品控词对画面的整体调控,负面Tags更倾向于局部细节的调节(让某样东西不要出现)。比如portrait, close up, greyscale, bad anatomy, extra limbs, bad hands, long hair这几个我个人常用的负面Tags,前三个是不想要“大头照”和“黑白照”,后四个是不想看见畸形、烂手和长发。负面Tags的书写没有什么局限性,基本上是跑图过程中发现什么自己受不了的雷区频繁触发,那就书写对应的负面Tags就行。 Steps4:Tags排布。有些潭友写Tags喜欢想到哪写到哪,经常一串写的是乱七八糟。。。这种我只能说你高兴就好。但实际上由于你面对的是AI,你写Tags的顺序,这玩意也会当个影响因素用于绘图(不信的可以把头尾的Tags换个位置,Tags越长越多影响越明显),简单说就是:以75个tokens为单位,越靠前的AI越重视,越靠后的越不容易得到好的呈现。 这里就出现了一个“75个tokens”的概念,这玩意简单说就是:AI不能无限度理解超长的句子,所以要以一定长度进行限制,打包成块,每次整一块里头的东西。在Tags书写界面的右上角,有个“XX/75”就是这个东西,随着你书写Tags的数量增减,这个数值也会有变化。这里楼主要说的就是:①保证每75个Tags里,最重要的Tag放最前面②不同种类的Tags尽量分类放,比如品控词放一起、身体描述词放一起、场景描述词放一起③尽可能不要让非单个单词的Tags“越线”,比如写完cowboy shot这个Tag,可以是74/75,也可以是77/150,甚至可以是75/75,但不要是76/150(Cowboy占了75的位置,shot占了76的位置)。虽然SD最新版本已经考虑了这个问题进行了优化,但经过实测仍旧会对构图有影响(可以看到spread legs这个tag和之前的socks换了位置之后,变成了“越线”,直接导致画面结构特别是腿部发生了明显变化)。 所以楼主个人书写Tags的习惯是:品控词→人物描述词(身体→衣服→姿势)→场景描述词。这样的好处是,方便修改同时一旦出现“越线”的问题,可以通过Step5的补充来修正,大大增加出图的稳定性,减少“抽卡”等失控情况的发生。 Step5:Tags补充与修正。如果潭友们以上4个Steps全都完成了,但在跑图过程中发现有的元素想补充,比如socks特定成white socks、black socks、silk socks等,或者发现有的长Tags“越线”了要修改,那就可以在遵守上述4个步骤的原则下调整。只要上述4个Steps的原则没变,那不管你怎么改,都只是画面元素的变化,不会造成图品质、人体解剖合理性、“全身照”变“大头照”等情况的出现,大大加强AI绘图的愉快性和尝试不同绘图内容的需要时间。
————————————分割线———————————
咳咳咳,又是打字打的手疼 接下来再讲一点点Tags进阶的操作
————————————分割线———————————
Step6:Tags书写除了上述内容之外,还有一个进阶玩法:权重。在SD里,权重用于对某个要素进行强调或削弱,使得这个要素出现的可能性发生变化。例如:绘图中由于底模问题,socks这个词怎么画都是白袜子,但我就想要黑袜子,哪怕写了black socks也还是白袜怎么办?那这时候就需要把black或者black socks进行加权,写成(black socks:1.1)或者(black:1.1) socks这种形式(注意,加权的Tags的标点符号我用的全是英文制式,不是中文制式的哦),这样AI就会更加侧重画“黑袜”而不是“白袜”(加权之后白袜就化成了黑袜)。 对于一些细节部分或者明明写了还放很前面但AI就是不画的要素会很管用 比如刚才提到的品控词,我一般的书写是(masterpiece, best quality, realistic, very detailed, incredibly absurdres, highres:1.1), muscular, looking at viewer, cowboy shot。这里这个1.1自己可以改其他数值,一般建议0.5-1.6之间,太低了不起作用,太高了会很鬼畜 (如果只打括号不写数字默认是1.1的数值强度)。
好了本期的采样方法和Tags的教学就先到这,关于这部分再多的内容潭友们自行百度学习(一般绘图讲的这些完全够了) 。
下期预告:
①老公木有吉尔怎么办——LoRA的价值和作用;
②想要老公XXXXX但木有对应的LoRA怎么办——自力更生炼小丹:LoRA。
最后,例行放几张自己跑的图,权当福利吧,就不收金币啦(收了也没人买哈哈哈哈笑哭就当做好人好事了)~潭友们可以照着这两期的自己试试啦~~各位潭友愿意的话也请多给些堕落追随啥的都行~ 愿大家都能玩的开心~也感谢秋叶、C站各位上传者们,最重要的,感谢各位画师,没有他们,就没有AI绘图
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
评分
-
查看全部评分
已有2人关注本帖
|