- +1
AI绘图到底是天才画手,还是潘多拉魔盒?
原创 分享生活的灵感 Voicer
汽车在纽约上空飞行、中世纪居民头戴VR眼镜、宇航员在火星表面跳街舞、大卫雕塑爱打碟、古埃及的动物壁画玩电脑……欢迎来到AI绘图的世界!
输入文字就能得到你想要的任何画面,无论多么荒诞无理的要求,无论定制Edward Hopper画风还是宝丽来胶片,AI都能“使命必达”。
听上去如此梦幻的跨时代工具,似乎是下一波新技术浪潮的抬头,2022也被称为“AI绘图元年”。但是它就像任何一项新技术一样,难免伴随争议:究竟是开启了一个全新绘画时代,还是打开了潘多拉魔盒?无论你做何感想,AI绘图时代已经不可逆转地到来。
⚠️
!ATTENTION!
以下图片纯属AI虚构
如有雷同,纯属巧合
● “一个人坐在办公室隔间里,用键盘打字,压力重重的样子 - 文艺复兴绘画风格”
● “金毛寻回犬小狗坐在小餐馆里喝咖啡,看起来很忧郁 - Edward Hopper风格”
● “战斗中戴着士兵头盔的猫猫特写 - 二战历史摄影风格,黑白”
● “一张非常细节、复古、颗粒感的纽约市汽车飞行照片(1936 年)”
● “宇航员b-boy组合在火星上表演 - 宝丽来风格”
● “用柯达专业Portra 400胶卷拍摄的外星人肖像 - 由Annie Leibovitz掌镜”
● “米开朗基罗的大卫雕塑正戴着耳机打碟”
● “在太空边缘奔跑,奔向星球,平静,抵达深渊 - 数字艺术风格”
以上这些画面都来自今年最热门的AI绘图平台DALL·E 2(ig:@openaidalle),AI制作它们的时间,可能不到一分钟。
不管是照片还是绘画,你想到什么,AI就能呈现什么。真有那么神奇吗?今天我们就先从DALL·E 2聊起。
创造奇迹的DALL·E 2
到底是何方神圣?
● DALL·E logo
作为AI绘图的大势平台,DALL-E 2的火爆常常让人忘记这个程序今年4月才刚刚推出。
初代DALL-E诞生于去年,在此基础上进行了升级的DALL-E 2图像分辨率更高,对指令的理解也更准确。
● 输入“日出时狐狸坐在田野上的画作,莫奈风格”,左右分别为第一代和第二代AI交出的作业
“DALL-E”的名字来自《机器人总动员》中的机器人瓦力(WALL-E)和超现实主义画家达利(Dalí)。它也确实在功能上兼顾了两者:一个能制作超现实主义图像的机器人。
● 左:半人半机器版达利,右:瓦力版蒙娜丽莎,都由DALL·E 2绘制
在DALL-E 2宇宙里,脑洞有多大,世界就有多大。
你只需要给它一些描述语,包括画面内容、参考画风/画家、形式(摄影/绘画/雕塑)、工具(xx胶卷/镜头),剩下的就全部交给它。
● “古埃及壁画上的动物神明正在使用计算机”
● “数千个星系的超深场天文学照片”✨灵感来自韦伯望远镜拍下的图像
比如说,可以画成什么样?DALL·E 2官网给出了两组词条:
A组词条描述行为:
“像狂热科学家一样混合化学物质”
“购买杂货”
“从事AI研究️”
B组词条描述风格/状态:
“儿童蜡笔艺术️”
“1980年代在月球上”
“和90年代科技产品一起待在水下”
“浮世绘风格”
……
把A组和B组连词成句,就能得到以下这些奇妙结果。
●
不过,DALL·E 2不仅会创造图像这么简单,还可以在现成图片上施展魔法。它能在照片里加入任何元素,并对阴影、反射和纹理进行细致处理,让新照片毫无违和感。
比如,我们要求DALL·E 2在美术馆照片上加一只柯基,并要求它分别出现在二次元画作上和三次元展馆里,AI就会自动计算柯基应该出现的样子。
● 在照片的1⃣️2⃣️3⃣️位置分别加入柯基会是什么效果?
当然你也可以丢给DALL·E 2一张画作,让它以此为灵感去创作,《戴珍珠耳环的少女》从此便有了多个模样。
● DALL·E 2版《戴珍珠的少女》
● 给蒙娜丽莎换个莫西干头发型,或是狗狗换小猫,都不在话下
DALL·E 2究竟是如何工作的?
OpenAI曾对此做过视频解释。和大多数AI一样,DALL·E 2的根本原理是算法。通过深度学习大数据,从而掌握内在逻辑。运用在绘图领域的话,就是对海量的主题图片作归类总结。
比如成千上万的“考拉”图片构成一个网络,而“摩托车”图片则是毫不相干的另一个。当用户输入“考拉骑摩托车”时,AI就把这两个网络交叉组合,并从中选出符合要求的图片。
● 如果对DALL·E 2生成的结果不满意,用户可以进行修改,这些修改也在不断帮助DALL·E 2变得更准确
AI绘画正在占领赛博世界
● “机器人梦见电子羊”(cr:Sam Altman)
看到这里,如果你已经迫不及待要上手感受下DALL·E 2,那么很遗憾:DALL·E 2目前并未对大众开放。虽然可以申请加入waitlist,但大多情况下你只能拿着爱的号码牌,陷入无尽的等候。
远水解不了近渴。一款与DALL·E 2极为相似、且对公众开放的免费工具DALL-E mini引起了大家的兴趣。
它与DALL·E 2并无直接关系(现已改名Crayon),功能却基本一致。只要提交描述,它就能在极短时间内生成图片——虽然质感与DALL·E 2存在肉眼可见的差距,但是对于图个新鲜的网友们来说已经足够。
● “泳池派对的黑客”(cr:weirddalle)
● “当黑武士遇见pingu”(cr:weirddalle)
● “腹语人偶版扎克伯格”(cr:weirddalle)
对于更“资深”一点的玩家来说,AI绘画工具早已是任君挑选。除了DALL·E 2,如今受到关注的AI工具还包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。
这些工具使用起来难易程度不一,比如CogView是国内团队开发的AI工具,仅支持中文搜索。而Disco Diffusion充满代码的界面略为赶客,需要跟着教程一步步操作。
我们也玩了一把!
在AI绘图app“dream by wombo”(可免费下载)上,我们试着以“voicer”为关键词,分别生成了“吉卜力”“蒸汽朋克”“浮世绘”“达利”风格的图片。
● 你最中意哪个?
当然最终效果也大多与AI工具的操作难易程度成正比。CogView生成的图片多少带点AI痕迹,而Disco Diffusion的玩家社区,早已成为浪漫想象力与美术功底的竞技场。
这些原本就是高超画手的用户们,与Disco Diffusion不断磨合调教,创作出无数难以辨别AI绘画痕迹的优秀作品。
● “Father Time”(cr:@noah__proctor)
● 比起DALL·E 2,Disco Diffusion似乎更擅长描绘恢弘的场景(cr:@discodiffusion)
● Disco Diffusion社区用户总结了在同一描述下,各个画家的关键词会生成的不同风格,截图为其中一部分
虽然2022被成为“AI绘画元年”,但“AI绘画”绝非一个全新概念。
只是在这项技术发展早期,人们对此态度并不乐观。而当时算法也还没有那么强大,AI的作品停留在学龄前儿童水平。
● 即便是现在,DALL·E 2还是会生成两个手掌长在一起这样视觉错乱的图片
不过人们对于AI作画的探索并未就此停止,反而奋勇向前。在互联网流行AI作画之前,实体AI作画就已经受到不小的关注。
根据2018年的报道,当年国际机器人艺术大赛的获奖名单里有不少对AI作画的实验。
加拿大艺术家Joanne Hastie制作了由编程控制绘画的机械臂;美国艺术家Pindar Van Arman创造的AI机器人,可以模仿所给图片绘画;泰国机器人实验室CMIT Robotics则可以捕捉人类在绘画时的每一个动作轨迹,机器人通过精准复制动作,从而完整复刻人类的画作。
● Joanne Hastie创造的抽象作品
● 只要人类先画一遍,CMIT Robotics就能近乎完美地复刻
● Van Arman的AI机器人可以根据动态热力图来调整作画
而在四年后的今天,AI机器人作画显然又向前迈进一大步。在今年威尼斯双年展上亮相的AI艺术家“Ai-Da”,是一个拥有机械臂、外形酷似人类的机器人。
和街头画家一样,Ai-Da用机械臂绘制人物肖像,并且配置了和人类对话的智能程序及发声器,可以边作画边与绘画对象攀谈。
● Ai-Da和她的自画像
● Ai-Da的肖像作品
● 世界上第一幅由AI机器人绘制的英国女王肖像
天才画手还是恐怖黑箱?
● “人们戴着VR眼镜的中世纪画作”,由DALL·E 2生成
当AI绘画的实力越来越强劲,问题也随之而来:它会替代传统绘画吗?画手们是否会面临集体失业?
有人对此保持乐观。毕竟虽然AI很强大,但本质上还是依赖人类的原创。它没有独立创造某种风格的能力,而Edward Hopper有。
● 无论美漫风格、数字艺术风格还是宝丽来,DALL·E 2都是参照人类创造出的现有风格
也有人对此非常悲观。虽然高端画师暂时还不会被取代,但是普通画手的创作却可能变得越来越不值钱。
此外,AI绘图还面临着更多问题。
一个月前,DALL·E 2发布了一张AI图片,描述语为“一个男人举起双臂和双手,用手势表示‘这么多’”。
● DALL·E 2生成结果
这张生成图片里的男子,有点像每年苹果发布会上的乔布斯,立刻引发了网友不满:为什么“一个男人”=“年轻的白人男性”?难道AI世界也奉行白人中心主义吗?
但是考虑到DALL·E 2的运行逻辑,它也许只是这个充满偏见的世界的缩影。
它的学习素材都来自人类的图片——如果人类的图片世界本身就充满偏见和刻板印象,又怎么期待AI能根据“A man”的描述语生成黄种人或黑人?或者根据“护士”的描述语,生成男女比例对等的图片?
● DALL·E 2生成的“建筑工人”图片
● DALL·E 2生成的“空乘人员”图片
更严重的问题可能来自法律纠纷。
AI绘图是否会重蹈AI换脸技术的覆辙,被用来做一些侵犯他人权利的事情?如果AI能够随意生成他人的照片,那么狗仔们是否从此有了造谣利器,而政客们也有了陷害对手的把柄?
(亚利桑那州立大学计算机技术教授)
图片版权是一个更难厘清的问题。关于AI生成图片能否商用,各平台众口纷纭。通过学习他人画作生成的作品,是否会侵犯到原作者权益?这给知识产权领域提出了新的思考。
如果AI绘图有一天完全成为大众工具,那么现实与虚拟的边界无疑将被进一步模糊。
● 网友Aditya Ramesh使用DALL·E 2将维多利亚式房屋改造成现代房屋,把特斯拉变成老爷车,把iPhone变成老式电话
200年前摄影技术诞生时,给绘画带来的最大冲击即是“真实感”——我们可以不相信绘画,却不能不相信一张真实的照片。然而200年后蓄势待发的AI绘图技术反其道而行之,进一步消解了图像的真实性。
等到AI绘图真的占领互联网的那一天,我们还能相信眼睛看到的任何一张图片吗?
原标题:《AI绘图到底是天才画手,还是潘多拉魔盒?》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司