- +1
以色列总统,为ChatGPT“带盐”
近期,生成式AI又点燃了人工智能的火炬,科技圈也刮起了一股名叫“ChatGPT”的风。
据报道,以色列总统艾萨克 · 赫尔佐格 ( Isaac Herzog )在2月1日为网络安全会议 "2023 特拉维夫全球网络技术 " 录制了 " 特别开幕致辞 "。在此开幕致辞上赫尔佐格发表了部分由ChatGPT撰写的演讲,成为世界首位得益于ChatGPT帮助撰写演讲稿的领导人。
那么ChatGPT到底有多火?连以色列总统都用上了。
以色列总统亲自“带盐”
据悉,以色列总统艾萨克 · 赫尔佐格在开幕致辞的开场白:" 能够成为一个拥有如此充满活力和创新的高科技产业的国家的总统,我很自豪。"这句话就是由ChatGPT撰写的。并且赫尔佐格还使用ChatGPT撰写的一段“励志名言”结束了他的演讲。“让我们不要忘记,是我们的人性让我们真正与众不同,”
以色列总统办公室向外媒证实,演讲的结尾是ChatGPT通过提示撰写的,他们给出的提示是:“写一段关于人类在超人类科技世界中所扮演角色的励志名言。”
尽管赫尔佐格使用了AI撰写了部分演讲稿,但他依旧在演讲中强调,AI不会取代人类。赫尔佐格表示:“硬件和软件无法取代人的意志。”并且在演讲最后说道,“决定我们命运的不是机器,而是我们为全人类创造更美好明天的心灵、思想和决心。”
图片:以色列总统艾萨克 · 赫尔佐格 ( Isaac Herzog )
巨头纷纷布局赛道
ChatGPT是由OpenAI公司开发的一个人工智能聊天机器人程序,于2022年11月推出。ChatGPT使用基于GPT-3.5架构的大型语言模型,能够通过学习和理解人类的语言来进行对话互动交流,甚至能完成撰写邮件、文案、翻译、代码等任务。
人工智能每五六年都会有一波浪潮出现,上一波是AlphaGO,这一波就是ChatGPT。但是当阿尔法围棋(AlphaGo)的人工智能,在没有任何让子的情况下以 5:0 完胜欧洲冠军、职业围棋二段樊麾一消息出现时,不少人可能只是当成一个新闻去看,而对于ChatGPT而言,许多人的心态发生转变,开始变成从消费者的立场和角度来看待它,数据显示,截至2023年一月末,ChatGPT的月活用户已突破1亿,这距离它推出才不过2个月的时间。ChatGPT也成为史上增长最快的消费者应用,这是AI第一次如此大规模的传播。
对于ChatGPT在业界引起的轰动,谷歌工程师Sam表示,谷歌对ChatGPT的出现给予了充分的重视,甚至亮出了“红色代码”最高级别警报。谷歌还提出了所谓的“绿色车道”,以缩短评估和减轻AI潜在危害的过程。谷歌母公司Alphabet在此前宣布裁员之时,Alphabet的首席执行官桑达尔•皮查伊在邮件中写道:“几年前,公司将重心转向人工智能,这为我们的业务和整个行业带来了突破性进展。在我们的产品中,人工智能为我们带来了巨大的机遇,我们准备大胆地应对。”
而另一科技巨头Meta也发出了类似感叹。据《华盛顿邮报》,早在ChatGPT发布的前三个月,Mete就已经发布了聊天机器人“Blenderbot”,但是收获的反响并不好,许多人表示Meta的聊天机器人让人觉得很无聊。Meta首席科学家Yann LeCun曾表示就底层技术而言,ChatGPT并不是多么了不得的创新。
然而就算如此,不少AI从业者也是表示,自从ChatGPT出现后,行业重新变得热闹而有活力。随着ChatGPT热度上升,拥有敏锐观察力的科技巨头们也已开始抢抓商机,在AIGC(利用人工智能技术来生成内容)跑道展开布局。
微软于1月23日在官博宣布与OpenAI扩大合作伙伴关系,OpenAI也表示,新资本的注入将用于继续研究和“开发越来越安全、有用和强大的人工智能”。紧随其后的是,微软在2月2日宣布旗下所有产品将全线整合ChatGPT。全面接入ChatGPT的微软新版Bing也于近日短暂现身。微软创始人比尔·盖茨在2月3日接受采访时也表示,“AI将成为2023年最热门的话题,与PC和互联网一样重要。”
不仅仅是微软,国内外各大科技公司也有所动作。在2月4日凌晨,谷歌斥巨资投资OpenAI竞争对手、AIGC公司Anthropic,投资金额超过3亿美元。据三位知情人士透露,谷歌将通过这笔交易获得约10%的股份,跟微软最初投资OpenAI一样,交易条款要求Anthropic用这笔钱从谷歌云计算部门购买计算资源。这笔交易也标志着科技巨头和AI创企之间的最新联盟。
作为中文搜索引擎的“老大”,百度也表示将在3月份在中国推出类似ChatGPT的AI对话程序,具体可能就是一种“生成式搜索”功能。此前在百度Create AI开发者大会上,百度宣布将基于百度自研的生成式模型,升级“生成式搜索”能力,并指出,生成式AI和搜索引擎是互补关系而不是替代,还说搜索底层技术和AI底层技术是相通的,从2021年起百度就开始尝试把AIGC与搜索两者结合起来。
表:国内外科技公司在AIGC领域的布局
当前,百度、阿里巴巴、快手、字节跳动、网易、商汤、美图、科大讯飞等纷纷入局,都在加大对AIGC领域的投入。
那么,ChatGPT到底有什么魔力,可以带火AIGC这条赛道?
ChatGPT的“前世今生”与技术优势?
据了解,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的聊天机器人模型,它基于Transformer架构。其实,在此之前,OpenAI就曾设计出GPT相关系列。尤其是GPT-3的问世,作为一种大规模语言模型,它已经在来自各种来源的大量文本数据上进行了训练,能够产生类似人类的反应,可用于广泛的与语言相关的任务,成为当时NLP领域最强AI模型。
下面,我们来梳理一下ChatGPT的整个“诞生”过程:
2017年6月,Google发布的论文 Attention is all you need,首次提出了Transformer模型,这是GPT发展的基础。
2018年6月,OpenAI 发布论文《通过生成式预训练提升语言理解能力》(Improving Language Understanding by Generative Pre-Training),首次提出GPT模型(Generative Pre-Training)。
2019年2月,OpenAI 发布论文《语言模型是一个无监督多任务学习者》(Language Models are Unsupervised Multitask Learners),提出GPT-2模型。
2020年5月,OpenAI 发布论文《语言模型应该是一个少量样本学习者》(Language Models are Few-Shot Learners),正式提出GPT-3模型。
2022年2月底,OpenAI 发布论文《使用人类反馈指令流来训练语言模型》(Training language models to follow instructions with human feedback),公布Instruction GPT模型。Instruction GPT是基于GPT-3的一轮增强优化,所以,也被称为GPT-3.5。
2022年11月30日,ChatGPT基于以上技术的实现正式出道。现在,人们常提及的ChatGPT 可以理解为一个多轮迭代训练后的InstructionGPT,并在此基础上增加了Chat对话聊天功能。
ChatGPT之所以受到如此关注,除了微软的大手笔投资和对其技术的认可外,和它本身所体现出的价值是分不开的。
首先,从其功能性上来看,ChatGPT是一个具有高级文本理解和推理能力的聊天机器人,能够快速、准确地生成答案的能力将使用户及时收到问题的答案,这为人工智能模型提供了全新的新界面与体验。同时,它也有助于研究人员了解如何使用数据来训练模型,以生成更精确的文本。
相较于OpenAI之前发布的GPT-3,对于开放性问题的回答,ChatGPT可以有条理、有层次的给开放性问题一个方案。ChatGPT还能够尝试用第一人称进行对话。可以说,ChatGPT不仅具备GPT-3已有的能力,还敢于质疑不正确的前提和假设、主动承认错误以及一些无法回答的问题、主动拒绝不合理的问题、提升了对用户意图的理解以及结果的准确性。
对话式机器人我们其实已经见过不少,例如微软小冰、苹果Siri,还有谷歌2020年推出的Meena等。与上述AI程序相比,ChatGPT具备成强大的自我学习能力,甚至还会“思考”,其不单从海量信息中积累学习成果,还会在思辨过程中成长。
除了简单的对话,ChatGPT可以根据上下文内容像人一样给用户恰当的反馈。让用户真的有聊天的感受,言之有物,还能知错就改,要比现在的AI聊天软件更人性。
降本增效是ChatGPT大规模商用的前提
有人将ChatGPT与搜索引擎作对比,甚至坦言“有了ChatGPT都不会再用搜索引擎了”。那么,它真的能够快速淘汰搜索引擎吗?数据猿认为,ChatGPT要想取代传统搜索引擎,为时尚早,还无法撼动当前的全球搜索引擎市场竞争格局。
单从目前成本来看,ChatGPT这类大模型有两类成本,一个是模型训练成本,一个是推理应用成本,两者成本均居高不下。
就拿OpenAI推出的GPT-3语言模型举例,2018年,其在训练阶段就花费了1200万美元。并且,在线推理端成本也依旧价格高昂。根据模型的现有数据,假设每次生成的回答长度平均为50个词,使用8x英伟达A100用于推理的情况下,我们估算ChatGPT每一次生成答案的成本约为1.3美分,约为谷歌搜索引擎每次搜索成本的3倍。如果每天面对数以亿计用户的搜索请求,如此高昂的成本是公司所不能承受的,中短期内完全取代传统搜索引擎在商业模式上无法做到。
毕竟,ChatGPT想要走向市场,不能忽略的一个问题就是ChatGPT的经济性。一直以来,训练阶段的沉没成本过高,导致人工智能应用早期很难从商业角度量化价值。随着算力的不断提高、场景的增多,相关应用的成本将进一步提高,如何降低ChatGPT的使用成本,是其规模化商用需要解决的一大问题。
起初,OpenAI以非盈利为目标,然而,经过多年在研发费用以及产品本身的投入不断增加,科研人员也不得不妥协让步,放弃非营利的设想。
2月2日,OpenAI宣布推出付费试点订阅计划ChatGPT Plus,定价每月20美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。当然,OpenAI方面仍将提供对ChatGPT的免费访问权限。
OpenAI负责人Natalie在公告中称,即使在需求很高时,ChatGPT Plus也能提供可用性、更快的响应速度以及对新功能的优先访问权。OpenAI表示,从美国开始,该公司将逐步向所有用户推出付费订阅方案。
据瑞银报告显示,截至目前,推出仅两个多月的ChatGPT,月活用户就达到了1亿,创造了新的用户增长速度纪录——相比之下,当年火爆的linstagram用户数达到1亿用了两年半时间。
因此,假设所有用户均付费,以1亿用户、每月20美元计算,ChatGPT年收入将超过200亿美元。同时,全球有超过10亿潜在用户可以从ChatGPT获得帮助,经估算,整个ChatGPT的市场规模就超过2000亿美元。ChatGPT如果收费模式获得成功,对于投资者而言,这将有巨大的商业前景。
内容创作成ChatGPT商用的重要方向
ChatGPT作为自然语言处理(NLP)领域的前沿研究成果之一,现已成为AIGC里程碑式的产品,其应用非常广泛,从帮助人们对话,到自动生成新闻报道,再到提供科技支持等。由于它的高效性和易用性,ChatGPT已经成为了自然语言处理领域中非常重要的工具。
尤其是在内容创作方面,很多人将其视为人类写作的替代品,尤其对内容创作者而言,将带来颠覆性的改变。
事实上,媒体行业已经开始尝试使用人工智能生成的内容。科技新闻网站 CNET 已经使用人工智能工具撰写了数十篇文章,而数字媒体巨头 BuzzFeed 也宣布将使用 ChatGPT 生成更多新内容。
2月6日,招商银行信用卡就小试牛刀,在官微发布了一篇名为《ChatGPT首秀金融界,招行亲情信用卡诠释“人生逆旅,亲情无价》的推文,这也是国内金融行业首篇使用AIGC技术发布的品牌稿件。
总的来说,ChatGPT是一种高效的、可扩展的自然语言处理工具,可以帮助人们完成诸多任务,提高工作效率。尤其是在文字创作方面,可以用来写各种让人头疼的“应付性”文字,也可以用来当做辅助,比如整理提纲、描写场景等。能够实现快速、匹配度较高的内容创造。
但是,就目前来看,ChatGPT所暴漏出的局限性也一览无余,具体包括:
其一,ChatGPT无法理解生成单词的上下文语境或含义。ChatGPT只能根据给定的训练数据,根据某些单词或单词序列一起出现的概率生成文本。也就是说ChatGPT不能够进行推理,并且在回答时或许不能完全连贯。
其二,ChatGPT无法接触到人类所拥有的大量知识,没有人类的意识,也没有思想、感觉或经历,更没有能力做决定或独立判断,只能提供它所接受过训练的信息。ChatGPT需要OpenAI的工作人员不断地通过新数据训练,用微调算法提高性能,因此它可能无法回答训练数据之外的问题。
其三,ChatGPT接受的是大量数据的训练,有时可能会生成包含冒犯性或不恰当语言的回复。
当然,除了内容创作外,办公、教育、人形机器人、医疗、 电商、工业等领域,或许也将是未来ChatGPT 能快速落地实施的方向。
例如,在办公领域,ChatGPT 受益于微软强大生态,将在更多办公场景应用落地 。微软公司进一步扩大与 OpenAI 的合作并计划将 ChatGPT 整合入旗下全系产品,包括Office 全家桶、Bing 搜索引擎等,有望为用户提供交互式智能文本生成服务。对标微软,金山办公等国内办公领军企业亦有望以 AI 赋能自身业务。金山办公至今已开发近 100 项 AI 办公能力,随着 NLP 技术的迭代提升,办公巨头有望持续跟进,为用户提供更智能化的办公服务。
人形机器人,ChatGPT 有望加速算法落地助力人机互动能力升级。2022 年 10 月,Tesla 已经发布了 Optimus 人形机器人的原型机,而它需要配合算法形成软硬件综合协同方能应用。我们认为,ChatGPT 有望提升人形机器人的人机交互能力,加速人形机器人使用体验升级。
需要指出的是,ChatGPT的一些违规应用也带来了巨大的争议,比如学生在论文写作中使用ChatGPT并获奖,这也让业界出现诸多反对声音。1月底,权威学术出版机构Nature,针对ChatGPT做出规定。Nature规定,ChatGPT等大模型不能被列为作者。如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明。
时至2月,反ChatGPT的产品也已出现。美国斯塔福大学研究人员推出了DetectGPT,用于检测AI生成文本。另一个反ChatGPT的产品GPTZero在1月底进行了升级,一天之内便有40万的访问量和220万的服务请求,这款产品能在几秒内摸清文字是人类还是AI写的。
中国的ChatGPT何时出现?
无疑,ChatGPT的横空出世,为人工智能带来了一次小高潮。在人工智能领域,中美是两个最主要的玩家。整体上,美国的实力要比中国强不少,但中国已经坐稳第二把交椅,并且近几年发展迅速。我们不禁要问,中国版的ChatGPT什么时候出现呢?
无论是大规模预训练模式,还是对话式AI,中国都有不少科技企业布局,并且实力并不弱,但为什么没能出现明星产品呢?在数据猿看来,与全球顶尖水平相比,我国在算法、算力和数据方面都存在不小的差距:
算法,原创算法研发能力不足。ChatGPT是建立在一系列原创算法模型基础上的,比如谷歌提出的Transformer模型,OpenAI 提出的GPT模型、GPT-2模型、GPT-3模型、GPT-3.5模型(Instruction GPT)。可以说,没有这些先进的算法模型,就不会有如今技惊四座的ChatGPT。在ChatGPT的发展历程中,OpenAI发布了多篇高质量论文,比如《通过生成式预训练提升语言理解能力》、《语言模型是一个无监督多任务学习者》、《使用人类反馈指令流来训练语言模型》。在人工智能领域,大部分底层理论、原创算法模型都来自美国,中国企业大多是基于别人的底层技术来探索应用场景,研发底层算法模式的能力严重不足。要想下一个人工智能明星产品诞生在中国,首先要补的一课就是原创算法的研发。
算力,人工智能芯片产业实力不够。超大规模预训练模型要取得成功,除了算法以外还需要足够的算力支持,一次模型训练往往需要消耗巨量的计算资源。芯片尤其是GPU等人工智能芯片,是智能算力产业的基础。在芯片领域,中美差距很大,全球芯片产业长期被美国的英伟达、英特尔、高通等公司把持,并成为美国卡中国脖子的关键工具。为了中国智能算力产业的安全,发展国产智能芯片产业就成为当务之急。目前来看,这项任务任重而道远。
数据,中国数据无法与全球数据媲美。有了算法和算力,接下来决定一个人工智能模型的关键就是数据,数据越多、数据质量越高,训练出来的模型就越强大。总体上看,中国的数据规模不到全球的五分之一。中国企业大多只能应用中国数据,美国企业却可以利用全球数据。因而,即使开发出同样的人工智能模型,那美国科技巨头可以用全球数据来训练该模型,中国企业则只能用国内数据训练,差距自然巨大。毕竟,五分之一是很难超越五分之四的。更进一步,用中国数据训练的智能模型,如果走出国门很可能会出现“水土不服”的症状,可以预见当德国人用中文数据训练的对话式AI模型时其体验必然不会太好。
因此,想要中国出现媲美ChatGPT的产品甚至引领下一次人工智能浪潮,需要在算法、算力和数据方面取得突破,补上原创算法的短板,构建国产智能芯片供应链,同时通过互联网出海、云计算出海等方式来实现中国科技公司的全球化运营,应用全球数据来训练中国的人工智能产品。
每一次推动人工智能发展浪潮的标志性事件都发生在美国,希望在下一次浪潮当中,看到更多中国企业的身影。
文:媛媛 余小鱼 月满西楼 / 数据猿
统筹:月满西楼 / 数据猿
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司