近两年,众多AI艺术生成器相继出现在大家的视野里,随之掀起了一股生成式AI热潮。但许多早期的生成器都比较粗糙,无法精炼和修改图像;对比之下,如OpenAI和Midjourney、StableDiffusion之流就受到了更广泛的关注。
就在最近,因ChatGPT爆火的OpenAI再次推出了一款王炸产品,直接强强联合把AI绘画和ChatGPT合一起了!!!
由OpenAI推出的DALL-E,是GPT-3的120亿参数版本,经过训练可以根据文本描述创建图像。它不仅能够创建动物和物体的拟人化版本、以合理的方式组合不相关的概念、还可以渲染文本以及对现有图像进行应用转换。
就在9月21日,OpenAI推出了DALL-E的最新版本→DALL-E3,新版本将使用广受欢迎的人工智能聊天机器人ChatGPT,通过自动扩展提示来帮助创建更复杂细致的艺术作品。
研究人员表示,比起之前的系统,DALL-E3能够理解更多的细微差别和细节之处,让使用者可以轻松地将心中所想转换成十分贴合且准确的图像。
相比其他的文字生成图像系统会经常忽略掉某些提示词,DALL-E3完全遵循用户提供的文本内容,从背景到人物,甚至是有些模糊的形容词,都能够活灵活现地完美呈现。
说再多都不如有图有真相:
“First
满月照耀下的繁华城市街道。
人行道上熙熙攘攘享受夜生活的行人。
在街角的摊位上,一位年轻女子顶着火红头发、身穿标志性天鹅绒斗篷;正在与脾气暴躁的老年商贩讨价还价。
这位暴躁商贩,是一个身材高大、很老练的男人,穿着一套笔挺的西装,留着引人注意的小胡子,正在用蒸汽朋克电话热情的交谈着。
咱不敢说是绝对精准一比一复刻吧,但看看文字描述中的重点词,再瞅瞅图,也算是呈现得惟妙惟肖了。
不过,真正的强者不仅要和别人比,还要勇于超越自己。
即使是在使用相同的提示文本的情况下,新版本生成的图像比起上一代DALL-E2,不论是细节、清晰度还是明亮度方面,这进步都是肉眼可见的大啊。
左图:DALL-E2 右图:DALL-E3
内置于ChatGPT
除了前面说的,DALL-E3最大的特点和优势:要数它与ChatGPT集成,原生构建在ChatGPT之上。理解能力大幅飞跃的同时,还可以让ChatGPT来帮忙写文本提示词。
当用户有了一个创意,只需要输入自己的想法,ChatGPT将会自动生成为DALL-E3量身定制的详细文本,并迅速生成图片。如果生成的图片没有完全满足自己的要求,用户还可以让ChatGPT用几句话来进行调整。
至于集成ChatGPT后的效果,已经有网友试过了;快来看看这位家长是怎么把自己小朋友脑中幻想一步步变成现实的吧。
只见ChatGPT直接给出了4段不同风格的提示文本,并且依次生成了图像。
有了主角Larry,再为它打造一个专属的家。我们可以看到不仅图中的刺猬形象和之前生成的一样,就连门口的信箱上也印上了刚刚起好的名字。
之后还可以通过ChatGPT来添加更多元素,让故事情节更加的完善和丰满。这边刚编写好故事情节,下一秒就出可以出配套插图。
保持Larry的形象,生成贴纸风格,
用户可以直接让ChatGPT归纳总结之前的所有对话内容,生成一个完整的睡前故事~
01
安全性
与之前版本相同,DALL-E3限制生成暴力、成人以及仇恨内容;同时还改进了在公众人物生成和有害视觉偏见等高风险领域的安全性能。
研究团队表示,他们正在试验一款新的内部工具→来源分类器,可以帮助识别图像是否由DALL·E 3生成,并希望利用这款新工具更好的了解生成图像的使用途径和方式。
02
创作控制
DALL·E 3被设计成会拒绝要求它用在世的艺术家的风格生成图片的请求。创作者现在也可以选择将自己创作的图像,从未来图片生成模型的训练数据中剔除。
目前,DALL·E 3还处于封闭测试阶段。OpenAI计划于10月初首先面向ChatGPT Plus和企业客户开放使用,之后是实验室和API用户。
与DALL·E 2相同,创作者使用DALL·E 3生成的图片属于自己,可以自由地使用,无需获得O的许可就可以重新打印、出售或者作为商品来销售。
至于新版本是否会像发布原始DALL-E模型和DALL-E 2那样,发布免费的网页工具,OpenAI还没有给出明确的说明。
感兴趣的小伙伴可以时刻关注https://openai.com/的更新。
End
当用迪士尼风打开《鹊刀门传奇》······
起猛了!吉卜力被收购;DNEG“花式”降薪裁员,员工要贷款上班?!
网友评论