澎湃Logo
下载客户端

登录

  • +1

AI绘图到底是天才画手,还是潘多拉魔盒?

2022-08-16 07:15
来源:澎湃新闻·澎湃号·湃客
字号

原创 分享生活的灵感 Voicer

汽车在纽约上空飞行、中世纪居民头戴VR眼镜、宇航员在火星表面跳街舞、大卫雕塑爱打碟、古埃及的动物壁画玩电脑……欢迎来到AI绘图的世界!

输入文字就能得到你想要的任何画面,无论多么荒诞无理的要求,无论定制Edward Hopper画风还是宝丽来胶片,AI都能“使命必达”。

听上去如此梦幻的跨时代工具,似乎是下一波新技术浪潮的抬头,2022也被称为“AI绘图元年”。但是它就像任何一项新技术一样,难免伴随争议:究竟是开启了一个全新绘画时代,还是打开了潘多拉魔盒?无论你做何感想,AI绘图时代已经不可逆转地到来。

⚠️

!ATTENTION!

以下图片纯属AI虚构

如有雷同,纯属巧合

● “一个人坐在办公室隔间里,用键盘打字,压力重重的样子 - 文艺复兴绘画风格”

● “金毛寻回犬小狗坐在小餐馆里喝咖啡,看起来很忧郁 - Edward Hopper风格”

● “战斗中戴着士兵头盔的猫猫特写 - 二战历史摄影风格,黑白”

● “一张非常细节、复古、颗粒感的纽约市汽车飞行照片(1936 年)”

● “宇航员b-boy组合在火星上表演 - 宝丽来风格”

● “用柯达专业Portra 400胶卷拍摄的外星人肖像 - 由Annie Leibovitz掌镜”

● “米开朗基罗的大卫雕塑正戴着耳机打碟”

● “在太空边缘奔跑,奔向星球,平静,抵达深渊 - 数字艺术风格”

以上这些画面都来自今年最热门的AI绘图平台DALL·E 2(ig:@openaidalle),AI制作它们的时间,可能不到一分钟。

不管是照片还是绘画,你想到什么,AI就能呈现什么。真有那么神奇吗?今天我们就先从DALL·E 2聊起。

创造奇迹的DALL·E 2

到底是何方神圣?

● DALL·E logo

作为AI绘图的大势平台,DALL-E 2的火爆常常让人忘记这个程序今年4月才刚刚推出。

初代DALL-E诞生于去年,在此基础上进行了升级的DALL-E 2图像分辨率更高,对指令的理解也更准确。

● 输入“日出时狐狸坐在田野上的画作,莫奈风格”,左右分别为第一代和第二代AI交出的作业

“DALL-E”的名字来自《机器人总动员》中的机器人瓦力(WALL-E)和超现实主义画家达利(Dalí)。它也确实在功能上兼顾了两者:一个能制作超现实主义图像的机器人。

● 左:半人半机器版达利,右:瓦力版蒙娜丽莎,都由DALL·E 2绘制

在DALL-E 2宇宙里,脑洞有多大,世界就有多大。

你只需要给它一些描述语,包括画面内容、参考画风/画家、形式(摄影/绘画/雕塑)、工具(xx胶卷/镜头),剩下的就全部交给它。

● “古埃及壁画上的动物神明正在使用计算机”

● “数千个星系的超深场天文学照片”✨灵感来自韦伯望远镜拍下的图像

比如说,可以画成什么样?DALL·E 2官网给出了两组词条:

A组词条描述行为:

“像狂热科学家一样混合化学物质”

“购买杂货”

“从事AI研究️”

B组词条描述风格/状态:

“儿童蜡笔艺术️”

“1980年代在月球上”

“和90年代科技产品一起待在水下”

“浮世绘风格”

……

把A组和B组连词成句,就能得到以下这些奇妙结果。

不过,DALL·E 2不仅会创造图像这么简单,还可以在现成图片上施展魔法。它能在照片里加入任何元素,并对阴影、反射和纹理进行细致处理,让新照片毫无违和感。

比如,我们要求DALL·E 2在美术馆照片上加一只柯基,并要求它分别出现在二次元画作上和三次元展馆里,AI就会自动计算柯基应该出现的样子。

● 在照片的1⃣️2⃣️3⃣️位置分别加入柯基会是什么效果?

当然你也可以丢给DALL·E 2一张画作,让它以此为灵感去创作,《戴珍珠耳环的少女》从此便有了多个模样。

● DALL·E 2版《戴珍珠的少女》

● 给蒙娜丽莎换个莫西干头发型,或是狗狗换小猫,都不在话下

DALL·E 2究竟是如何工作的?

OpenAI曾对此做过视频解释。和大多数AI一样,DALL·E 2的根本原理是算法。通过深度学习大数据,从而掌握内在逻辑。运用在绘图领域的话,就是对海量的主题图片作归类总结。

比如成千上万的“考拉”图片构成一个网络,而“摩托车”图片则是毫不相干的另一个。当用户输入“考拉骑摩托车”时,AI就把这两个网络交叉组合,并从中选出符合要求的图片。

● 如果对DALL·E 2生成的结果不满意,用户可以进行修改,这些修改也在不断帮助DALL·E 2变得更准确

AI绘画正在占领赛博世界

● “机器人梦见电子羊”(cr:Sam Altman)

看到这里,如果你已经迫不及待要上手感受下DALL·E 2,那么很遗憾:DALL·E 2目前并未对大众开放。虽然可以申请加入waitlist,但大多情况下你只能拿着爱的号码牌,陷入无尽的等候。

远水解不了近渴。一款与DALL·E 2极为相似、且对公众开放的免费工具DALL-E mini引起了大家的兴趣。

它与DALL·E 2并无直接关系(现已改名Crayon),功能却基本一致。只要提交描述,它就能在极短时间内生成图片——虽然质感与DALL·E 2存在肉眼可见的差距,但是对于图个新鲜的网友们来说已经足够。

● “泳池派对的黑客”(cr:weirddalle)

● “当黑武士遇见pingu”(cr:weirddalle)

● “腹语人偶版扎克伯格”(cr:weirddalle)

对于更“资深”一点的玩家来说,AI绘画工具早已是任君挑选。除了DALL·E 2,如今受到关注的AI工具还包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

这些工具使用起来难易程度不一,比如CogView是国内团队开发的AI工具,仅支持中文搜索。而Disco Diffusion充满代码的界面略为赶客,需要跟着教程一步步操作。

我们也玩了一把!

在AI绘图app“dream by wombo”(可免费下载)上,我们试着以“voicer”为关键词,分别生成了“吉卜力”“蒸汽朋克”“浮世绘”“达利”风格的图片。

● 你最中意哪个?

当然最终效果也大多与AI工具的操作难易程度成正比。CogView生成的图片多少带点AI痕迹,而Disco Diffusion的玩家社区,早已成为浪漫想象力与美术功底的竞技场。

这些原本就是高超画手的用户们,与Disco Diffusion不断磨合调教,创作出无数难以辨别AI绘画痕迹的优秀作品。

● “Father Time”(cr:@noah__proctor)

● 比起DALL·E 2,Disco Diffusion似乎更擅长描绘恢弘的场景(cr:@discodiffusion)

● Disco Diffusion社区用户总结了在同一描述下,各个画家的关键词会生成的不同风格,截图为其中一部分

虽然2022被成为“AI绘画元年”,但“AI绘画”绝非一个全新概念。

只是在这项技术发展早期,人们对此态度并不乐观。而当时算法也还没有那么强大,AI的作品停留在学龄前儿童水平。

● 即便是现在,DALL·E 2还是会生成两个手掌长在一起这样视觉错乱的图片

不过人们对于AI作画的探索并未就此停止,反而奋勇向前。在互联网流行AI作画之前,实体AI作画就已经受到不小的关注。

根据2018年的报道,当年国际机器人艺术大赛的获奖名单里有不少对AI作画的实验。

加拿大艺术家Joanne Hastie制作了由编程控制绘画的机械臂;美国艺术家Pindar Van Arman创造的AI机器人,可以模仿所给图片绘画;泰国机器人实验室CMIT Robotics则可以捕捉人类在绘画时的每一个动作轨迹,机器人通过精准复制动作,从而完整复刻人类的画作。

● Joanne Hastie创造的抽象作品

● 只要人类先画一遍,CMIT Robotics就能近乎完美地复刻

● Van Arman的AI机器人可以根据动态热力图来调整作画

而在四年后的今天,AI机器人作画显然又向前迈进一大步。在今年威尼斯双年展上亮相的AI艺术家“Ai-Da”,是一个拥有机械臂、外形酷似人类的机器人。

和街头画家一样,Ai-Da用机械臂绘制人物肖像,并且配置了和人类对话的智能程序及发声器,可以边作画边与绘画对象攀谈。

● Ai-Da和她的自画像

● Ai-Da的肖像作品

● 世界上第一幅由AI机器人绘制的英国女王肖像

天才画手还是恐怖黑箱?

● “人们戴着VR眼镜的中世纪画作”,由DALL·E 2生成

当AI绘画的实力越来越强劲,问题也随之而来:它会替代传统绘画吗?画手们是否会面临集体失业?

有人对此保持乐观。毕竟虽然AI很强大,但本质上还是依赖人类的原创。它没有独立创造某种风格的能力,而Edward Hopper有。

● 无论美漫风格、数字艺术风格还是宝丽来,DALL·E 2都是参照人类创造出的现有风格

也有人对此非常悲观。虽然高端画师暂时还不会被取代,但是普通画手的创作却可能变得越来越不值钱。

此外,AI绘图还面临着更多问题。

一个月前,DALL·E 2发布了一张AI图片,描述语为“一个男人举起双臂和双手,用手势表示‘这么多’”。

● DALL·E 2生成结果

这张生成图片里的男子,有点像每年苹果发布会上的乔布斯,立刻引发了网友不满:为什么“一个男人”=“年轻的白人男性”?难道AI世界也奉行白人中心主义吗?

但是考虑到DALL·E 2的运行逻辑,它也许只是这个充满偏见的世界的缩影。

它的学习素材都来自人类的图片——如果人类的图片世界本身就充满偏见和刻板印象,又怎么期待AI能根据“A man”的描述语生成黄种人或黑人?或者根据“护士”的描述语,生成男女比例对等的图片?

● DALL·E 2生成的“建筑工人”图片

● DALL·E 2生成的“空乘人员”图片

更严重的问题可能来自法律纠纷。

AI绘图是否会重蹈AI换脸技术的覆辙,被用来做一些侵犯他人权利的事情?如果AI能够随意生成他人的照片,那么狗仔们是否从此有了造谣利器,而政客们也有了陷害对手的把柄?

(亚利桑那州立大学计算机技术教授)

图片版权是一个更难厘清的问题。关于AI生成图片能否商用,各平台众口纷纭。通过学习他人画作生成的作品,是否会侵犯到原作者权益?这给知识产权领域提出了新的思考。

如果AI绘图有一天完全成为大众工具,那么现实与虚拟的边界无疑将被进一步模糊。

● 网友Aditya Ramesh使用DALL·E 2将维多利亚式房屋改造成现代房屋,把特斯拉变成老爷车,把iPhone变成老式电话

200年前摄影技术诞生时,给绘画带来的最大冲击即是“真实感”——我们可以不相信绘画,却不能不相信一张真实的照片。然而200年后蓄势待发的AI绘图技术反其道而行之,进一步消解了图像的真实性。

等到AI绘图真的占领互联网的那一天,我们还能相信眼睛看到的任何一张图片吗?

原标题:《AI绘图到底是天才画手,还是潘多拉魔盒?》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈