- +1
人工智能学者张峥:AI落地关键取决于业务数字化的可能性
近日,由中国建银投资有限责任公司倾力打造的2020年度“JIC讲堂·科技投资系列”第六场活动在建投书局举行。
本期活动上,上海纽约大学计算机系终身教授、亚马逊云服务上海人工智能研究院院长张峥与《经济学人·商论》执行总编辑吴晨二人,以“人工智能产业的未来与挑战”为主题进行了一场信息量巨大的对谈。
谈到目前人工智能已经可以辅助人类进行写作,张峥表示这是数据量大幅增加后“大力出奇迹”的结果。他表示,人工智能的应用需要解决数据的获取、数据的清洗与数据的洞察三方面的问题。自动驾驶是一个人工智能应用非常好的场景,但它需要分场景、分阶段落地。谈到数据安全和隐私的理念,张峥则认为,“原始粗暴的数据积累早日结束早日好”,并介绍了新的数据和隐私安全理念下“联邦学习”的加密分布式学习技术。
人工智能写作是“大力出奇迹”的结果
吴晨介绍,《经济学人》有一个熊彼特专栏,有15年历史约1000篇稿件,三年前编辑部做过一个实验,把这1000篇稿件输入机器,让机器人去写,但写出来的结果是每句话都像英文,连在一起不知道在说什么。但三年以后的现在,机器人已经能够写出像样的稿件了。
对此,张峥表示,这是数据量大幅增加后“大力出奇迹”的结果。
“我们给机器喂了46个T的数据,相当于几百个100G手机的容量,有1750亿个参数要去慢慢调整。”张峥表示,“这几年人工智能在质量方面确实有一定的飞跃,所以变得越来越像‘人话’”。
当前计算机在写作上已经能够给予人类一定的辅助,但机器其实并不能理解人类用词时的情感和意义。
以当前各类应用都会有的词汇联想功能为例,张峥举例称,一个《纽约客》的作者做了一个实验,他在给儿子写一封邮件,写I'm very p..,其实他的原意是I'm very pleased,但机器给他的提示是I'm very proud。
“这比他本意要好多了——作为爸爸应该为儿子感到自豪,而不能总是居高临下。”张峥评论道,“但机器其实不知道是怎么回事,是人自己脑补做爸爸的做得不够好。”
人工智能落地关键是业务数字化的可能
张峥表示,人工智能落地的关键是这个业务有没有数字化的可能。
他具体介绍,人工智能的应用需要解决数据的获取、数据的清洗与数据的洞察三方面的问题。人工智能是否能在产业中落地,首先要看产业数字化转型程度,一个产业如果已经数字化并且大量地依靠数据,人工智能才能更好地进入。其次,产业数字化后,还需要注意对数据的清洗,因为获得的数据往往非常粗糙,“噪声”很大。最后是解决对数据的洞察,如何从无结构的数据中获取结构,也是人工智能未来亟待解决的问题。因此,较有发展前景的应用领域应该是实现了良好的数字化转型,并能通过结构化将数据转化成生产力的领域。
谈到自动驾驶行业时,张峥表示,自动驾驶是一个人工智能应用非常好的场景,但它需要分场景、分阶段落地。
吴晨也表示,街上跑的车都变成自动驾驶在3-5年内是不现实的,但是在园区、高速公路、货运卡车这些领域可能会更快地看到变化。他介绍,“硬件领域一定有很多的投资机会,所以会不断有需求,但是真正组合起来到底会是什么样新的商业场景,这中间存在很大的风险。”
谈隐私:原始粗暴的数据积累应尽早结束
数据对于人工智能发展的重要性毋庸置疑,吴晨引用李开复的观点称,中国人工智能和大数据之所以在过去几年这么快地发展,就是因为中国的数据无论从总量还是搜集渠道都比美国要多得多。
对此张峥表达了自己的看法,称“原始粗暴的数据积累早日结束早日好,这是不能乱来的。我觉得保护隐私是大家的责任”。
吴晨提出,用户在使用很多免费服务的时候,实质是拿自己的行为信息在换取某种便利的服务,但这个数据到底应该归于谁,手机上的行为信息到底属于这个App还是属于用户自己,这是中国、欧美都在探讨的问题。
欧洲《通用数据保护条例(GDPR)》专门提出了两个重要的领域,一是数据的“可迁移性”(portability),如当用户不想使用某个社交网络服务时,可以把上面过去形成的所有数据都带走。另一个是数据的“遗忘权”,就是过去在网上分享的内容,不想再保留的话用户可以将其删除。
在这种数据安全的理念指导之下,张峥介绍了新兴的“联邦学习”(Federated Learning)技术。
联邦学习是一种加密的分布式学习技术,各个参与方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型,适合训练数据涉及隐私敏感,和训练数据太大无法集中收集的情况。
张峥表示,联邦学习的这种“模型与数据互相不信任,但是还可以达到某一种服务。这中间有一定的折衷,质量可能要低一点,但是换取了其他意义上的信任”。
“JIC讲堂”是中国建投集团调动优质智力资源,以建投书局文化空间为前沿阵地,集合多方智慧和力量打造的高品质讲堂品牌。“JIC讲堂”自2016年以来共举办70余场深度对话和思想交流,向社会分享前瞻视野与专业洞察,提供理性分析与价值参考,拥有逾百位专家学者的思想智库,覆盖国内顶级高校和科研机构,受到学界、业界、公众等多方人士的关注。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司