- +1
谷歌最强大模型PaLM 2超越GPT-4?谷歌背水一战
来源丨元宇宙简史
编写丨元宇宙简史主理人 Fun
【元宇宙导读】在人工智能赛道,谷歌曾一直是领导者和创新者。在今天凌晨举行的谷歌I/O大会上,谷歌再次展示了其在人工智能领域的最新成果和愿景。本文将详细介绍PaLM 2、Bard和Duet的特点和优势,以及它们对人工智能和办公领域的影响。
在今天凌晨举行的谷歌I/O大会上,谷歌公司发布了在多方面超越GPT-4的最新的AI语言模型“PaLM 2”,并将其用于支持自家的25项功能和产品。
同时,谷歌还推出了一款全新的办公全家桶服务Duet AI,将覆盖谷歌的Workspace应用,包括Gmail、Docs、Slides和Sheets等。
01、PaLM 2:号称超越GPT-4的大模型
PaLM 2是谷歌继去年推出的PaLM之后的最新成果,是一种通用的AI模型,可以用于多种任务,如聊天机器人、语言翻译、代码生成、图像分析和响应等。
与其他领先的AI系统相比,PaLM 2在一些任务上表现出更优异的性能。PaLM 2基于谷歌自己研发的开源“变换器”Transformer架构,这是目前最先进的自然语言处理技术之一。
变换器最早由谷歌在2017年提出,并被OpenAI用于开发其GPT系列模型。
变换器可以有效地处理长序列数据,并利用自注意力机制来捕捉序列中不同位置之间的关系。
PaLM 2使用了大量的数据来训练,包括超过100种语言、科学数据集和代码。它有四种不同大小和速度的版本,分别命名为:Gecko、Otter、Bison和Unicorn。
其中Unicorn是最大也是最强的版本,拥有超过1000亿个参数。PaLM 2还有两种特殊版本,分别是Med-PaLM 2和sec-PaLM,针对医疗和安全领域进行了优化。
谷歌表示,PaLM 2是其多年来在人工智能领域积累的成果,也是其重夺人工智能领导地位的努力。
谷歌CEO 桑达尔·皮查伊在大会上说:“我们正在经历一个神经网络革命,它始于大约10年前,并且大部分因谷歌而起。”
他指出,变换器等人工智能突破都来自于谷歌的研究,并表示:“我们非常兴奋地将这些模型广泛地提供给外部用户,因为我们想看看人们能用它们做什么。我们相信它们将打开很多机会,让以前被认为是魔法和遥不可及的事情成为可能。”
谷歌DeepMind部门副总裁Zoubin Ghahramani表示,PaLM 2是最先进的语言模型,它擅长数学、编码、推理、多语言翻译和自然语言生成。它在理解、生成和翻译各种语言的细微文本(包括成语、诗歌和谜语)方面有了显著提高,现在可以理解100多种语言。
PaLM 2现在可以通过高级语言能力考试,并且能达到“精通”的水平。在数学考试中,PaLM 2可以正确地回答95%以上的问题,在编程考试中,PaLM 2可以正确地编写90%以上的代码,在逻辑推理考试中,PaLM 2可以正确地推断85%以上的结论,在创意写作考试中,PaLM 2可以生成高质量且有趣的文章。
谷歌CEO皮查伊还展示了PaLM 2模型在多种场景下的应用效果。在自动写作方面,PaLM 2可以根据用户提供的主题或开头生成一篇完整且连贯的文章;在问答方面,PaLM 2可以根据用户提出的问题从网上搜索相关信息,并给出简洁且准确的回答。在机器翻译方面,PaLM 2可以根据用户选择的目标语言,将任何语言的文本翻译成另一种语言,并保持原文的语义和风格;在对话系统方面,PaLM 2可以根据用户的语境和情感,与用户进行自然且有趣的对话,甚至可以生成诗歌、歌词、笑话等创意内容。
皮查伊还特别提到了PaLM 2模型在编程方面的能力。他说:“PaLM 2模型不仅可以理解和生成自然语言,还可以理解和生成计算机语言。它可以根据用户提供的需求或示例,自动编写出符合规范且高效的代码,支持多种编程语言和框架。”
为了证明这一点,皮查伊邀请了一位谷歌工程师上台进行了一场实时演示。
在演示中,工程师向PaLM 2模型提出了一个需求,即编写一个能够实现图片分类功能的Python程序。PaLM 2模型在几秒钟内就生成了一段完整且正确的代码,并在屏幕上显示出了运行结果。工程师还向PaLM 2模型提出了一些修改和优化的要求,PaLM 2模型也能够快速地对代码进行调整和改进。
02、Bard:基于PaLM 2的聊天机器人
PaLM 2最重要的应用之一就是谷歌自己开发的聊天机器人Bard。
Bard最早在去年发布时只对少数用户开放,并且只支持英语。现在Bard已经向全球公众开放,并且增加了日语和韩语两种语言支持。谷歌计划未来让Bard支持40种语言。
Bard不仅可以与用户进行自然而流畅的对话,还可以根据用户发送的图片进行分析和回应。
这利用了PaLM 2强大的多模态能力,即可以同时处理文本和图像等不同类型的数据。用户可以发送一张厨房货架上食材的图片,并询问可以做什么菜。Bard就会根据图片中识别出来的食材给出一个合适的菜谱,并附上图片和步骤。
这个功能与OpenAI去年发布GPT-4时承诺但尚未实现的类似功能相反,让谷歌在多模态方面领先一步。除了图片外,Bard还可以处理音频、视频等其他类型的数据,并给出相应的回应。
03、Duet:基于PaLM 2的办公全家桶服务
除了Bard外,PaLM 2还将为谷歌旗下多个产品和功能提供支持。其中最引人注目的是一款全新推出的办公全家桶服务Duet AI。
Duet是基于PaLM 2的生成式AI合作者,旨在帮助用户更快地学习、构建和操作。Duet将在今年晚些时候推出,将覆盖谷歌的Workspace应用,包括Gmail、Docs、Slides和Sheets等。
Duet支持的Workspace,是谷歌为了应对微软将GPT-4整合进其办公全家桶Copilot之举,全世界的办公室革命很可能由谷歌和微软而起。
在Duet的帮助下,用户可以利用PaLM 2的强大能力来提高工作效率和创造力。例如,在Google Slides中,用户只需要输入几个单词,就可以生成适合幻灯片的图片。在Google Sheets中,用户可以让PaLM 2自动整理行和列的顺序。在Google Meet中,用户可以生成独特的虚拟背景和滤镜,并让PaLM 2根据会议内容生成摘要和行动计划。
除了这些,Duet还有一个最令人惊艳的功能,就是可以让用户与PaLM 2进行协同创作。无论是写文章、编程、设计图表,还是做数学计算,用户都可以邀请PaLM 2作为自己的搭档,提供建议、修改、补充等。用户还可以与PaLM 2进行交流,询问其创作过程和原理,并从中学习。
谷歌表示,Duet是其对未来办公方式的重新想象,也是其将人工智能与人类智慧结合的尝试。谷歌认为,PaLM 2不仅是一种工具,也是一种伙伴,可以帮助用户实现自己的目标和梦想。
严正声明:本文为元宇宙简史原创,未经授权禁止转载!内容仅供参考交流,不构成任何投资建议。任何读者若据此进行投资决策,风险自担。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司