炸翻AI绘画界！?DALL·E 3和ChatGPT强强联合了？！

chatgpt2023-09-25 19:52:50263

点击上方蓝字CG世界关注我们

“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”

中国很有影响力影视特效CG动画领域自媒体

近两年，众多AI艺术生成器相继出现在大家的视野里，随之掀起了一股生成式AI热潮。但许多早期的生成器都比较粗糙，无法精炼和修改图像；对比之下，如OpenAI和Midjourney、StableDiffusion之流就受到了更广泛的关注。

就在最近，因ChatGPT爆火的OpenAI再次推出了一款王炸产品，直接强强联合把AI绘画和ChatGPT合一起了！！！

由OpenAI推出的DALL-E，是GPT-3的120亿参数版本，经过训练可以根据文本描述创建图像。它不仅能够创建动物和物体的拟人化版本、以合理的方式组合不相关的概念、还可以渲染文本以及对现有图像进行应用转换。

就在9月21日，OpenAI推出了DALL-E的最新版本→DALL-E3，新版本将使用广受欢迎的人工智能聊天机器人ChatGPT，通过自动扩展提示来帮助创建更复杂细致的艺术作品。

研究人员表示，比起之前的系统，DALL-E3能够理解更多的细微差别和细节之处，让使用者可以轻松地将心中所想转换成十分贴合且准确的图像。

相比其他的文字生成图像系统会经常忽略掉某些提示词，DALL-E3完全遵循用户提供的文本内容，从背景到人物，甚至是有些模糊的形容词，都能够活灵活现地完美呈现。

说再多都不如有图有真相：

“First

满月照耀下的繁华城市街道。

人行道上熙熙攘攘享受夜生活的行人。

在街角的摊位上，一位年轻女子顶着火红头发、身穿标志性天鹅绒斗篷；正在与脾气暴躁的老年商贩讨价还价。

这位暴躁商贩，是一个身材高大、很老练的男人，穿着一套笔挺的西装，留着引人注意的小胡子，正在用蒸汽朋克电话热情的交谈着。

咱不敢说是绝对精准一比一复刻吧，但看看文字描述中的重点词，再瞅瞅图，也算是呈现得惟妙惟肖了。

不过，真正的强者不仅要和别人比，还要勇于超越自己。

即使是在使用相同的提示文本的情况下，新版本生成的图像比起上一代DALL-E2，不论是细节、清晰度还是明亮度方面，这进步都是肉眼可见的大啊。

左图：DALL-E2 右图：DALL-E3

内置于ChatGPT

除了前面说的，DALL-E3最大的特点和优势：要数它与ChatGPT集成，原生构建在ChatGPT之上。理解能力大幅飞跃的同时，还可以让ChatGPT来帮忙写文本提示词。

当用户有了一个创意，只需要输入自己的想法，ChatGPT将会自动生成为DALL-E3量身定制的详细文本，并迅速生成图片。如果生成的图片没有完全满足自己的要求，用户还可以让ChatGPT用几句话来进行调整。

至于集成ChatGPT后的效果，已经有网友试过了；快来看看这位家长是怎么把自己小朋友脑中幻想一步步变成现实的吧。

提问：我家5岁宝贝一直说的“超级向日葵刺猬”它应该长什么样？

只见ChatGPT直接给出了4段不同风格的提示文本，并且依次生成了图像。

当选择了其中一张后，故事的主角就被定了下来；为了后续和ChatGPT沟通更简便，再给这只小刺猬起个名字【Larry】。

有了主角Larry，再为它打造一个专属的家。我们可以看到不仅图中的刺猬形象和之前生成的一样，就连门口的信箱上也印上了刚刚起好的名字。

之后还可以通过ChatGPT来添加更多元素，让故事情节更加的完善和丰满。这边刚编写好故事情节，下一秒就出可以出配套插图。

保持Larry的形象，生成贴纸风格，

是不是觉得有点棒棒哒？不过，接下来才是重头戏！别眨眼，展现真正技术的时刻到了

：

用户可以直接让ChatGPT归纳总结之前的所有对话内容，生成一个完整的睡前故事~

01

安全性

与之前版本相同，DALL-E3限制生成暴力、成人以及仇恨内容；同时还改进了在公众人物生成和有害视觉偏见等高风险领域的安全性能。

研究团队表示，他们正在试验一款新的内部工具→来源分类器，可以帮助识别图像是否由DALL·E 3生成，并希望利用这款新工具更好的了解生成图像的使用途径和方式。

02

创作控制

DALL·E 3被设计成会拒绝要求它用在世的艺术家的风格生成图片的请求。创作者现在也可以选择将自己创作的图像，从未来图片生成模型的训练数据中剔除。

目前，DALL·E 3还处于封闭测试阶段。OpenAI计划于10月初首先面向ChatGPT Plus和企业客户开放使用，之后是实验室和API用户。

与DALL·E 2相同,创作者使用DALL·E 3生成的图片属于自己,可以自由地使用,无需获得O的许可就可以重新打印、出售或者作为商品来销售。

至于新版本是否会像发布原始DALL-E模型和DALL-E 2那样，发布免费的网页工具，OpenAI还没有给出明确的说明。

感兴趣的小伙伴可以时刻关注https://openai.com/的更新。

End

点击图片进入详情页

当用迪士尼风打开《鹊刀门传奇》······

起猛了！吉卜力被收购；DNEG“花式”降薪裁员，员工要贷款上班？！

Unity：我错了，我改！

本文链接：https://yunguke.com/chatgpt/320.html

相关文章

国产GPT5.0即将登场，它能否打破技术天花板？
国产GPT5.0即将发布，引发业界对其技术突破的广泛期待，作为国产大模型的最新迭代版本，GPT5.0在语言理解、逻辑推理和多模态交互等方面或将实现显著提升，有望进一步缩小与国际顶尖AI模型的差距，此次...
chatgpt资讯2025-06-2012技术天花板国产gpt5.0
GPT-5.0原理揭秘，下一代AI如何突破思维边界？
GPT-5.0作为下一代AI代表，通过多模态架构融合与动态思维链技术实现认知跃迁，其核心突破在于：1）跨模态统一建模，将文本、图像、音频等数据转化为共享语义空间，实现复杂场景理解；2）引入神经符号系统...
chatgpt资讯2025-06-2013GPT5.0 思维边界 gpt5.0原理
GPT-5.0会收费吗？深度解析未来AI的定价趋势与用户选择
目前OpenAI尚未公布GPT-5.0的定价细节，但基于GPT-4及此前版本的商业化路径，未来AI收费趋势可能呈现以下特点：，1. **分层订阅模式延续**：大概率保留免费基础版+付费高级版的双轨...
chatgpt资讯2025-06-1913GPT5.0 定价趋势 gpt5.0收费吗
GPT-5.0不开源，技术垄断还是商业必然？深度解析背后的逻辑与影响
GPT-5.0未选择开源引发热议，这一决策究竟是技术垄断还是商业发展的必然选择？从商业视角看，闭源模式能保障OpenAI的研发投入回报，维持技术领先优势，同时规避开源可能带来的滥用风险，而技术垄断的质...
chatgpt资讯2025-06-1912技术垄断商业必然 gpt5.0不开源
GPT-5.0到底有多强？揭秘下一代AI的颠覆性突破
GPT-5.0作为下一代AI标杆，展现出颠覆性突破：其万亿级参数规模和多模态融合能力，实现了接近人类水平的复杂任务处理，包括逻辑推理、创意生成和跨领域知识整合，新架构采用"思维链"强化技术，错误率较前...
chatgpt资讯2025-06-1811GPT5.0 颠覆性突破 gpt5.0多么厉害

网友评论