设为首页收藏本站 🌓 游客问题

快捷导航

登陆 / 注册搜索

USERCENTER

SEARCHSITE

搜索

GameMale»首页 › 技术交流 › C G A I › 用GPT-4o口述改图的方法与测试

12 / 2 页下一页

返回列表 发新帖

查看: 1371|回复: 37

收起左侧

[其他相关] 用GPT-4o口述改图的方法与测试

[复制链接] |关注本帖

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

楼主| 并没有太多用 发表于 2025-4-1 10:29:34 | 显示全部楼层 |阅读模式 <

本帖最后由并没有太多用于 2025-4-1 11:25 编辑

3月26日，沉寂已久的OpenAI~~CloseAI~~发布了新的ChatGPT-4o模型，其中最引人瞩目的就是其原生图像生成功能。用人话说，就是告诉它需求，它帮你P图。

这次OpenAI良心地让免费用户也有试用资格，所以特来一试。事先声明，以下内容会尽量全面地呈现实际使用中的结果，不吹不黑。

一、使用方法

非常简单，只需登陆GPT官网（https://chatgpt.com/）：通过其中的“+”上传需要修改的图片，再在右侧“…”中勾选“创建图片”：

然后填写修改要求，再点击“↑”即可提交上传。

对免费用户而言，单个账号一天能提交的数量应该是比较有限制的（大概5张左右），但可以通过用多个邮箱注册不同账号来白嫖，其中qq和163都是可用的，但不能用带有教育（edu）的邮箱。

二、使用测试

1.修改角色细节

这回使用的示例图片是这一张，虽然乍一眼还算帅帅的看得过去，但有不少细节可以打磨。

首先试一个简单的改法，设定需求为：请把图中人物的项链改得更有埃及风也更美观，其余部分不变。结果如下：

评价这幅图改得好坏，我会从以下维度分析（可不看）：

总体而言，考虑整体的美观度，能给个8.5-9分。

因为AI没遵循“其余部分不变”的要求，外加这名角色的设定还是更偏“谦和”的，上一幅图则显得有些成熟和英武了。考虑到这一版的GPT似乎对中文接受度不是很好，使用新的英文prompt再试一次：

结果：

“其余部分不变”的要求还是没达到，优点和缺点也大同小异，给个8.5分吧。但毕竟是更加柔和的形象，选这一张作为加下来生图的素材。

2.推理角色整体形象与所在场景

使用如下prompt，让该角色手持长弓站在沙漠中：

结果：

我了个反重力长弓呀，真不走心。不过嘛，竟然没画裤子耶（喜）~

除却一眼能看见的问题，还有些细节是可以留意一下的：

不过看在没穿裤子的份上，所有缺点都不重要了~

另外，我也把原图扔进去，加上了更多prompt的描述：

结果：

~~赤身果体却一脸清纯的哥哥……要犯罪了……不行不行绝不能有非分之想……~~

等等，怎么会有弟弟看见哥哥的果体就被魅惑得移不开眼呢(*´д`)

3.表情差分生成

使用如下prompt，生成开心、愤怒、悲伤和严肃的表情差分：

Draw the difference between the character's happy, angry, sad, andserious expressions.

结果：

开心和愤怒都还算acceptable，但这悲伤和严肃是什么鬼！？莫名想到了某个jojo里乔鲁诺的表情包……

正经的说，也许是AI没有太多福瑞角色表情的素材,所以把人类的模板套了上去。

但还有一种可能：GPT-4o模型生成图片的顺序是从左上到右下的，因此越往右下偏离的可能性越大。因此，我把四个表情的顺序颠倒后再输入，得到结果：

好像确实变好了一些，至少严肃和悲伤看起来没那么抽象了。但总觉得表情差分里的角色和原图的不是同一个，这个功能还有提升空间。

4.绘制四格小漫画

绘制有连续内容的画面算是GPT-4o比较有卖点的功能，用如下prompt测试：

结果：

画风变得好萌耶~~~哥哥好可爱，想……~~阿努你冷静点(#`Д´)ﾉ

正经的说，除却变萌的画风（毕竟要求里也没提画风的事），角色在不同画面间的一致性，和对要求的遵从性可以说做得很好。例如，本来在图二才出现的汗水在图一已经有所体现。

要说缺点，也有一些，不过不算特别突出：

关于漫画风格的调整，已有坛友珠玉在前（https://www.gamemale.com/thread-158299-1-1.html），不再赘述。

综合来说，GPT-4o在改图方面，哪怕还有提升空间，也肯定是有质的突破的，这一点集中提现在角色的一致性和对内容的理解能力上，可谓离用AI创作漫画算是又近了一步，毕竟各种prompt技巧算是AI还不够聪明时的权宜之计,真正聪明的AI应该能满足哪怕表述不清的人的需求。但会员用户至少要20美刀一个月，这个价格对普通玩家不是很友好。

关于其技术路线，也已经有人讲了，属于和SD或MJ的扩散模型不同的自回归模型：https://x.com/dotey/status/1905901279244677189，相信以中美AI界一众卷王的实力,很快就能卷出廉价甚至免费,亦或是破甲版本。所以现阶段，只要不是深度AI用户，拿免费版来改改清水图应该已经足够了。

其他一些非内容性的要点

1. 在用局部图生成全身图时，避免使用“扩图（expendimage）”，尽量使用改图，不然会喜提封印若干时间：

2. 免费用户不要在一次请求里上传多余一张的图，不然直接封印24小时（也是因为这个原因，我没做双图融合实验）。

3. 多次提交失败或卡在出图环节动不了都是正常的，免费用户是这样的了（摊手）。

我还看到了一个生成gif的案例，也许对搞勋章的小伙伴们有帮助，也贴一下：https://x.com/jesselaunz/status/1905809027482939694

本帖子中包含更多资源

您需要登录才可以下载或查看，没有账号？立即注册

x

评分

参与人数 6	血液 +9	追随 +6	堕落 +3	收起理由
nkmrsato		+ 1
书の妖怪		+ 1		很给力!
yota	+ 3	+ 1	+ 1
cinder	+ 1	+ 1	+ 1
咸鱼鱼	+ 5	+ 1		很给力!
迷糊月牙魇		+ 1	+ 1

查看全部评分

我也说一句

发表

楼主新帖

楼主热帖

回复

使用道具举报

“久战久胜，越爱越勇。”

凯诺斯 发表于 2025-4-1 10:58:05 | 显示全部楼层 <

GPT-4o感觉好厉害，还能够帮忙进行改图

我也说一句

发表

回复

“久战久胜，越爱越勇。”

Burry 发表于 2025-4-1 10:59:05 | 显示全部楼层 <

感觉把原图丢进去，直接改成了可爱画风了。腿也好像有点短了？

我也说一句

发表

回复

“热心村民的头衔称号现已开放公测~！”

毛茸茸兽兽 发表于 2025-4-1 11:22:41 | 显示全部楼层 <

表情蛮生动的哇～也方便生成漫画咯～

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

shirley1213 发表于 2025-4-1 11:27:31 | 显示全部楼层 <

现在的GPT越来越高级了，不知道后面能不能直接根据一张图片和描述生成动画呢

并没有太多用 :生成动画的功能OpenAI自己的Sora和字节的即梦倒是都有，但针对二次元的优化比较弱，生成的内容抽象得基本不可用，以后应该会有更优质的AI

2025-04-01 11:34 回复

我也说一句

发表

回复

堀川光虎 发表于 2025-4-1 11:34:07 | 显示全部楼层 <

感谢教程，这下终于知道要怎么调出想要的漫画啦

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

咸鱼鱼 发表于 2025-4-1 11:57:32 | 显示全部楼层 <

感觉用来生成一些表情包是很不错的选择

我也说一句

发表

回复

“这把剑守护每个孩子，无论他有没有被神选中。”

娱乐法师火布偶 发表于 2025-4-1 12:22:41 | 显示全部楼层 <

表情差分感觉还是有一点僵硬，不过局部修改的效果已经还不错了

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

克莱因蓝 发表于 2025-4-1 13:27:25 | 显示全部楼层 <

这样子倒是简化了修改图的过程呢不过感觉还是吃对ai调教的熟练程度呢

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

cinder 发表于 2025-4-1 13:29:40 | 显示全部楼层 <

非常實用的帖子,這就去嘗試讓老公動起來./w\

我也说一句

发表

回复

mozhu 发表于 2025-4-1 13:42:57 | 显示全部楼层 <

现在好像是因为使用人数过多，要收20刀的费用了来着

并没有太多用 :时常去蹭一蹭还是能蹭到使用机会的，帖子里的图都是多个免费账户蹭出来的

2025-04-01 13:47 回复

mozhu :回复并没有太多用 :好家伙，不过生图的话，其实有这样的东西了，把deepseek接入comfyui，实现ai写提示词

2025-04-01 13:52 回复

我也说一句

发表

回复

“别人浪迹天涯，我以星河为家。”

万俟 发表于 2025-4-1 13:46:41 | 显示全部楼层 <

这个感觉效果还不错哎，现在的AI真的是太厉害了，让我想到了一些其他的用途

我也说一句

发表

回复

ssjnanajaj 发表于 2025-4-1 14:08:45 | 显示全部楼层 <

现在ai已经比百度，浏览器搜索问问题更快捷了

我也说一句

发表

回复

“久战久胜，越爱越勇。”

米立 发表于 2025-4-1 14:39:16 | 显示全部楼层 <

看上去还可以诶，主要是很方便

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

silencedonkey 发表于 2025-4-1 16:50:38 | 显示全部楼层 <

我比较看重一致性的部分，如果能方便解决的话对AI绘图很有帮助
局部修改维持不了不变的部分，看来还用不上

我也说一句

发表

回复

2667847524 发表于 2025-4-1 17:05:40 | 显示全部楼层 <

进一步降低门槛了，随便描述一下就帮忙修好，感觉还可以让它换风格，很实用快捷

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

Inari 发表于 2025-4-1 17:06:11 | 显示全部楼层 <

还可以啊，图生图能做到很接近了

我也说一句

发表

回复

“活着很好，鼠了也好。” (活动期间限时获取)(永久)

ruguangyinzi 发表于 2025-4-1 17:06:40 | 显示全部楼层 <

感觉ai越来越智能了啊，感觉可以去干很多事了）

我也说一句

发表

回复

威海 发表于 2025-4-1 17:57:02 | 显示全部楼层 <

AI越来越厉害了，一开始的图能一眼看到明显的不对劲，现在越来越少了

我也说一句

发表

回复

kimidave 发表于 2025-4-1 18:36:05 | 显示全部楼层 <

现在ai图我也是来者不拒的喜欢那种，毕竟能产出自己的xp角色真的很棒，感谢分享心得

我也说一句

发表

回复

12 / 2 页下一页

返回列表 发新帖

文字版|手机版|小黑屋|GameMale

GMT+8, 2025-4-12 15:46 , Processed in 0.144845 second(s), 146 queries , Redis On.

Copyright © 2013-2025 GameMale

All Rights Reserved.

快速回复 返回列表