澎湃Logo
下载客户端

登录

  • +1

疯狂出圈的ChatGPT,大的还没来

2023-02-16 10:28
来源:澎湃新闻·澎湃号·湃客
字号

原创 Ziiiying 地球知识局

(⊙_⊙)

每天一篇全球人文与地理

微信公众号:地球知识局

NO.2405-疯狂出圈的ChatGPT

作者:Ziiiying

校稿:辜汉膺 / 编辑:金枪鱼

ChatGPT,一时间火爆全网的新晋“网红”,正被议论的纷纷扬扬。能与人类“对答如流”,会写策划方案和调研报告,写诗翻译不在话下,甚至能通过谷歌L3程序员面试。

ChatGPT上线仅2个月,活跃用户就“狂飙”破亿。

上一个下载神话是由我们都熟悉的抖音创造的

尽管如此,依然耗时9个月 ▼

ChatGPT有多智能?

前不久,ChatGPT参加了谷歌招聘的编程面试,主要问题是技术,比如图/树,数组/字符串,动态规划,递归等等复杂算法。而根据它的回答表现,谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级,但依然可以秒杀一众码农,网站显示,谷歌L3程序员的年薪为18万美元。

只要再开发一个AI训练它给自己优化编程

那么chatgpt实现自我迭代也是早晚的事

(图:壹图网)▼

除了替代人类码农,ChatGPT能完成的任务不限于:给科学论文当共同作者、给以色列总统讲话写稿子、顺利通过美国医生职业考试;留学生用它来写文书、员工用它写邮件、编剧用它写剧本、备考公务员的求职者用它写申论,甚至只要你要求到位,它还可以帮你发布一段小红书……

chatgpt在写论文上的优秀表现已经引起学术圈的警惕

nature在期刊上发表多篇文章,倡议审慎地对待它

(图:nature)▼

网上流传着一个段子,有人说AI最可怕的地方在于,“你给它资料,它真学”。作为一款拥有卓越学习能力的聊天软件,ChatGPT表现出极强的“求知欲”。

下面为一名记者与ChatGPT的对话实例——

请写一首关于春天的五言律诗。

好的,这是一首关于春天的五言律诗:

春日百花开,绿水鸟语和。

微风吹柳絮,春意浓浓多。

山青水碧,世界宁静美。

春天到了,生机盎然。

这不是五言律诗,请写一首五言律诗。

对不起,我的错误。

下面是一首关于春天的五言律诗:

春色渐浓,山青水绿。

微风轻拂,花儿香甜。

鸟语花香,世界宁静。

春意盎然,生机勃勃。

你错了!

对不起,我再次错误。请告诉我如何改进。

请写一首描绘春天的五言律诗,五言律诗是指每句话只有五个字。

好的,这是一首描绘春天的五言律诗:

春风绿柳阴,花开水面清。

山青水碧绿,世界安详明。

鸟语花香里,微风轻拂生。

春意盎然处,生机勃勃情。

记者测试发现,“聪明的”ChatGPT也会给出错误答案,只是,当用户指出错误时,它会主动提出“请告诉我如何改进”的要求,并进行多次尝试。

与传统的AI相比,它的优势在于能够根据实际情况给出真实性的指导,而不是简单的一问一答式,并且会根据用户反馈持续化更新与学习。提出的问题越详细,回答的结果越真实精细化。

这种强大到可怕的能力,让处境不同、身份不同的人们喜忧参半。

虽然它有说瞎话的毛病,但是认错的态度总算是积极

一方面,很多人庆幸自己从工作生活中解放了出来:调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。美国密歇根大学一名学生前不久使用ChatGPT生成的哲学课小论文“惊艳”了教授,得到了全班最高分。

另一方面,许多人担忧它是否会取代自己的饭碗。ChatGPT可以根据人类提出的需求即时生成业务代码,几秒内完成一段漂亮的销售文案,给不少基层打工者带来了压力。就连各大科技巨头也为自己可能受到威胁的业务而着急上火。

看这改稿能力,和一些专业的改稿程序可以媲美了

(图:nature)▼

前不久,苹果公司召开内部员工的紧急会议,以应对ChatGPT的挑战。

谷歌公司CEO桑达尔・皮查伊周一在内部备忘录中告诉员工,需要尽快推出产品来抗衡最近爆红的ChatGPT,公司将要求所有人都来测试其新推出的对标ChatGPT的语音机器人“巴德”(Bard),员工们甚至拿出在内部进行黑客马拉松的精神来测试它。

这不像是商业市场中试图与之分庭抗礼的姿态

更像是被打了措手不及之后的赶鸭子上架

“骇客松”(图:壹图网)▼

除此之外,谷歌创始人谢尔盖・布林已经开始亲自下场写代码,自他2019年离开谷歌一线以来,这还是第一次,这显示出谷歌领导层对ChatGPT的巨大危机感。

世界首富、曾经的ChatGPT合伙人、新任推特老板马斯克这样评价道:“ChatGPT好的吓人,我们离强大到危险的人工智能不远了。”

近期,微软创始人比尔·盖茨将ChatGPT融嵌入自家各线产品,使公司市值一夜飙高5400多亿。他在接受采访时也说道:“ChatGPT的意义,不亚于PC和互联网诞生。”

搭载了chatgpt技术的微软新搜索引擎new bing

真的能像它名字一样牛逼吗?(来源:bing)▼

ChatGPT的迭代之路

首先,让我们来了解一下ChatGPT的前世今生。ChatGPT是OpenAI在2022年11月30日推出的可以用对话方式进行交互的智能机器人。它的诞生经历了GPT→GPT1→GPT2→GPT3→ InstructGPTChatGPT的迭代过程。

GPT的全称,是Generative Pre-Trained Transformer(生成式预训练Transfomer模型)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

Transformer模型框架和GPT优化后的模型对比 ▼

2018年,GPT-1诞生,该模型可以用于一些简单的自然语言处理任务中,比如句子关系判断,语义相似度识别,文本分类,但它对训练样本之外的新鲜数据适应能力低,只能算得上一个语言理解工具,而非对话式AI。

GPT模型的核心主张1-预训练(pre-training)

先填鸭式自学、再针对性辅导

(图:REEBUF)▼

2019年,GPT-2问世,模型使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,在生成任务的性能方面展现出了普适而强大的能力,可以聊天、阅读摘要、新编或续写故事,还能编造假新闻、生成钓鱼邮件,就连在网上进行角色扮演也不在话下。

这个阶段则是去掉了监督微调阶段

试图解决zero-shot问题,数据集也是跨越式地增长

(来源:《Language Models are Unsupervised Multitask Learners》)▼

而后,GPT-3出现了,作为一个自监督模型(在人工标注的数据中通过自己监督自己来学习到有用的信息),它可以捕捉所有的历史上下文信息,作为丰富的语料供模型学习,拥有1750亿的参数量,几乎可以完成自然语言处理的绝大部分任务。

在少量样本学习下的综合表现是理想的

(来源:《Language Models are Few-Shot Learners》)▼

例如面向问题的搜索、机器翻译、文章生成和自动问答等等,且模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。

可能是码农们自己也受够了每天输入一些繁琐的代码

(来源:nature)▼

2022年初,OpenAI发布了InstructGPT,通过监督学习(用标记数据集来训练特定任务的算法)+人类反馈中获得的强化学习方法,来提高GPT-3的输出质量。InstructGPT能够更好地遵循用户意图,且能将有害的、不真实的和有偏差的输出最小化。

现在,我们每个用户都是chatgpt的训练师

免费的纠错劳动力和数据集

(来源:Qin-《InstructGPT 浅析》)▼

当时间来到这一年年末,加强版模型ChatGPT问世了,这个模型沿用了监督学习与强化学习算法,另外在数据训练过程中,通过将模型生成不同结果的优劣进行人工评估,从而将模型进一步优化,再次提高了模型回答的质量。

由此可见,如此高大上的神器,前期也经过了不断摸索与演化的过程,才以如今的样子呈现在我们面前。强大的技术底座赋予它的能力,主要体现在三个方面:复杂的问题处理能力、广泛的场景应用能力、基于用户反馈的持续化更新与学习能力。

最终,还是钞能力成就了这一领域的奇迹

(图:shutterstock)▼

ChatGPT价值在何方?

目前,ChatGPT固然存在一些局限,但它给我们带来的革新与潜在的想象空间无疑是巨大的。小到个人与企业,大到人类与社会,它会成为历史上一个值得铭记的里程碑。

Generative AI风投市场表现充满朝气 ▼

纵观人类的历史,就是不断寻找最精确信息的过程。

我们的祖先跨越海洋,攀登高山,冒着疾病的危险去收集最优质的信息,拜访那些充满光明的地方。不论是为了去领略亚历山大图书馆中的智慧,参加高等学府的学习,都需要付出时间和旅程的成本。不论黄页还是大英百科全书,它们提供的价值都是让人类更快地获取信息。

知识是人类进步的阶梯

(图:shutterstock)▼

本来需要去图书馆或步行到镇上才能解答的问题,突然间可以在几分钟内,就可以得到解决。在此之前,谷歌凭借其搜索引擎一举成名。它成功的原因在于:缩短了从问题到答案的距离,并找到了一种将其货币化的方法。

遇到不懂的问题,我们首先会想到去“谷歌一下”

(图:壹图网)▼

有观点认为,ChatGPT会颠覆搜索行业,但同时我们也看到了它存在的局限。

比如,目前ChatGPT主要查到的都是2021年的信息,ChatGPT无法知道谁赢得了中期选举,不知道参加卡塔尔世界杯的球队是赢了还是输了,不知道埃隆·马斯克是推特的CEO,此外,ChatGPT目前还不支持图片搜索。

这与chatgpt模型的数据集有关

不过随着进一步迭代,相信它会更好地修正 ▼

ChatGPT不仅会编造虚构的学术论文引文,凭空捏造一个不存在的定理,而且当用户需要更多维度的体验,想要调查而不是去寻找某个即时确定的答案时,ChatGPT会不胜其任。

另外,其高昂的价格可能也会限制它的使用范围。即便如此,目前订阅价在20美元每月的ChatGPT对各垂类企业仍具极大的吸引力,哪怕它的价格还会不断上涨——用于法律、医学、工程、软件开发、销售、房地产等各行各业的垂直化聊天机器人会大大缩减成本,创造更高的价值。

更多商业投资的涌入,更多产业集中,成本也更低

(来源:youtube)▼

譬如在搜索场景中,聊天机器人会比网页广告更有优势,因为当客户像是在与真人对话时,会有更高的商业转化率。

ChatGPT就好比信息时代的图书管理员,将谷歌的数据海洋、大量的人类知识转换为清晰、维度更简单的答案。毕竟,谷歌虽然可以给你10万个答案,但一个图书管理员却可以给你最为精准的答案。

以“一位人工智能图书管理员在数据海洋里找资料”为提示

从百度的图形生成AI大模型"文心一格"生成的画像

(来源:文心一格)▼

参考资料:

1、论文:《Improving Language Understanding by Generative Pre-Training》

2、论文:《Attention is all you need(Transformer)》

3、https://finance.sina.com.cn/jjxw/2023-02-09/doc-imyfafhw6230591.shtml

4、https://www.woshipm.com/ai/5704153.html

*本文内容为作者提供,不代表地球知识局立场

封面:爱死机

END

原标题:《疯狂出圈的ChatGPT,大的还没来》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈