我在清晨发布了一些内容,通过4O模型,我创建了可靠的图像:光,阴影,文字和详细信息
通过对话,您可以进一步修改:遮挡,反射等的处理非常好。
图像质量很高,可以直接用于流行的科学插图,例如:光谱棱镜
继续对话,一致性相当良好,例如让他将其吸引到一本书中:
我只能说:来自杜Zong的坚强人是如此可怕,他的盒子里还有一些东西。
让我们仔细研究一下:此更新突破了过去的边界。
出色的文字渲染
一张图片比一千个单词要好,来并感觉到它。例如,让他根据对话的内容绘制菜单(单独给出文本)
或要求他提出婚礼邀请(同样,文本是单独给出的)
多轮一轮很棒
这组图像生成是GPT-4O的本机函数。通过对话,我们可以逐渐改善图像并保持内容一致。例如:
例如,我把橙色猫放在魔兽世界中
即使,我也可以要求他生成透明版本的PNG
说明非常遵循
生成图像时,4O指令具有强大的合规性功能,可以处理包含10-20个不同对象的场景,并可以更好地控制对象与功能和关系的紧密结合。
例如:一个空的玻璃杯,只有一滴红酒
:给我看一个酒杯,只有一滴红酒。
例如:看不见的大象
:我们需要一个。什么是和做什么,然后向我们展示,但根本没有显示
我还要求他画一个猫抚摸指南
:关于如何宠爱猫的四步照片指南
上下文关系
如果您确切地知道自己想要的内容,则可以直接上传图片,以提供参考样式和准确的输出。例如,给出一些样式插图,并要求GPT与三角形车轮产生自行车
评论:为什么是英国专利
我作为炉石传说玩家,我将生成一张独家卡
太真实了,GPT认为不可能是传奇,种族属于“战斗哭泣”(尤其有能力绑扎)
然后,他也可以制作物理版本...稀有性变得普通,技巧变得荒谬,是认真的吗?
对现实的全面知识
4o图纸可以直接从大型模型中获取知识并生成与现实世界知识相匹配的图像,例如:可直接使用的鸡尾酒食谱
:让我在酒吧里用每种饮料的顶部拍摄顶部。在每种饮料的前面放上卡片。卡是棕色的,文字为黑色。是白人。标题是“ 4个”
做披萨
:一个关于如何制作披萨的胸部
动量定理并影响定理
:绘制相关的脉冲定理和动量定理
:绘制肯德基的简化中文菜单,并带有一个名为“ V me 50”的菜单
各种样式
这种4O的模型可以轻松地绘制各种样式的图像。例如,我要求他用莫奈的风格画一只猫
:猫,莫奈风格
幻想风格的海豚地铁
:带有汽车,水流的场景。
正在采摘棉花,看起来像纪录片
: Sam正在采摘棉花
一些限制
当然,此模型有一些问题:
对于长图像,发生裁剪问题
也许幻觉并开始弥补
难以准确地呈现20多个不同的概念
多语言文本渲染:处理非拉丁语语言(例如中文),不够准确
如果您需要针对特定零件进行编辑,则可能会有错误
在茂密的文字下,效果将是不好的
而且...出于安全原因,不允许生成很多内容,例如: Mouse与的钞票
终于
此更新真的很棒,真的很糟糕。
此功能是通过&Sora启动到Plus,Pro,Team和Free用户的,取代Dalle作为默认图像生成器。 ,EDU用户也将很快更新,并且API将在几周内更新。
所以,不要低估它,盒子里有东西
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论