下载客户端

AI日报｜AI夺走了他们的工作：Gizmodo解雇西班牙员工，改用AI翻译

2023-09-07 16:24

来源：澎湃新闻·澎湃号·湃客

今日值得关注的人工智能新动态：

谷歌更新其 Android 品牌并发布新功能

Zoom推出“人工智能伴侣”

宝马与亚马逊扩大合作，纳入自动驾驶汽车数据

AI夺走了他们的工作：Gizmodo解雇西班牙员工，改用AI翻译

NVIDIA高管：AI市场价值6000亿美元

美国50州总检察长敦促国会，保护儿童免受AI生成性虐待图像侵害

微软扩大G42合作伙伴关系，纳入云和AI工具

DeepMind联合创始人：未来 5 年，人人拥有个人AI“参谋长”

语言代理的认知架构

将AlphaZero算法融入五子棋

AniPortraitGAN：从2D图像集生成动画3D肖像

自驱动接地：自动学习语言技能的LLMs代理

谷歌更新其 Android 品牌

并发布新功能

紧随 Android 品牌重塑之后，谷歌发布了季度 Android 功能更新。首先是主屏幕的“助理概览”小部件，它是现有“概览”小部件的改进。它采用机器学习算法来提供相关信息的片段，如当地天气、航班的旅行更新以及方便的活动提醒。

此外，谷歌还更新了以下功能：

谷歌 Lookout 应用程序上的一项名为“图像问答”的新功能使用人工智能（AI）生成图像的详细描述，使得盲人或视力不佳的人可以获得图像的正确描述，甚至可以询问后续信息。

谷歌钱包正在获得急需的使用条形码或二维码导入和数字化通行证的能力。这意味着用户可以上传健身房通行证或图书馆卡的照片，并将其安全的数字版本存储在谷歌钱包中，在忘记带钱包的时候可以派上用场。

Android Auto 正在获得对 Webex 和 Zoom 音频电话会议的支持。这意味着用户可以在任一平台上加入会议并在车载显示屏上浏览日程安排。

最后一个新功能与 Google Assistant 相关——用户可以将 Fitbit 或 Google Fit 的睡眠跟踪数据添加到 Google Assistant 例程中。设置好后，说一声“嘿 Google，早上好”，即可回顾睡眠统计数据以及晨间新闻。

Zoom推出“人工智能伴侣”

Zoom 现在向付费账户提供人工智能（AI）个人助理工具。该工具名为 “Zoom AI Companion”，最近作为免费试用版向使用该视频会议平台的公司发布。

如果在 Zoom 会议中启用，与会者可以使用 AI Companion 在与 AI 的私人侧屏对话中弥补他们错过的内容。会议结束时，管理员可以生成会议摘要并与与会者或受邀但未能出席会议的人共享。

在 Zoom Team Chat 中，用户可以招募 AI Companion 来总结消息并生成回复和新消息的草稿。

另外，Zoom 表示，AI Companion 默认处于关闭状态，控制该帐户的人将负责启用它们。该公司还表示，不会使用客户的音频、视频或其他材料来训练其 AI。

宝马与亚马逊扩大合作

纳入自动驾驶汽车数据

宝马表示，它将使用亚马逊网络服务（AWS）云软件来管理其自动驾驶汽车的数据。

该公司已与 AWS 达成协议，处理其联网汽车的数据。现在，这家德国汽车制造商正在扩大协议范围，将其下一代高级驾驶辅助系统（ADAS）的数据也包括在内，该系统部分采用了高通公司的 Snapdragon Ride Vision 平台。

宝马表示，为了帮助加速高度自动化的宝马汽车的交付，AWS 将帮助提供与“生成人工智能、物联网、机器学习和存储功能相关的数据的云存储”。

AI夺走了他们的工作：

Gizmodo解雇西班牙员工，

改用AI翻译

据报道，上周，Gizmodo 母公司 G/O Media 解雇了其西班牙语网站的员工，并开始用人工智能（AI）翻译英语文章来取代他们的工作。

到目前为止，Gizmodo 向 AI 翻译的转型进展并不顺利。在社交媒体网站上，有记者和读者指出，该网站的一些新文章中突然从西班牙语切换为英语，这可能是由于 AI 翻译系统出现了故障。

尽管 AI 翻译技术在过去十年中取得了显著进步，但专家表示，它仍然无法完全取代人工翻译。细微的错误、误译和文化知识的缺乏可能会损害自动翻译内容的质量。

NVIDIA高管：

AI市场价值6000亿美元

日前，NVIDIA 高管 Manuvir Das 概述了人工智能（AI）市场中一些令人震惊的数字。

Das 表示，AI 的潜在市场总额将包括 3000 亿美元的芯片和系统，1500 亿美元的生成式 AI 软件以及 1500 亿美元的通用企业软件。他还表示，这些数字代表了“长期”增长，但他没有具体说明目标日期。AI 驱动的市场机会总计 6000 亿美元，与 NVIDIA 所谓的“加速计算”相关。

美国50州总检察长

敦促国会保护儿童

免受AI生成性虐待图像侵害

据美联社报道，美国 50 个州的总检察长联合起来，向国会发出一封公开信，要求针对人工智能（AI）增强的儿童性虐待图像加强保护措施。信中呼吁立法者 “成立一个专家委员会，专门研究 AI 可用于剥削儿童的手段和方法”。

这封寄给参众两院共和党和民主党领导人的信还敦促政治家们扩大现有的对儿童性虐待材料的限制，以专门涵盖 AI 生成的图像和视频。这项技术非常新，因此目前还没有任何法律明确将 AI 生成的图像与其他类型的儿童性虐待材料归为一类。

微软扩大G42合作伙伴关系

纳入云和AI工具

微软正在扩大与 G42 公司的合作，计划在阿联酋开发跨领域的人工智能（AI）技术并提供云基础设施。

两家公司表示，此举将使阿联酋公共部门和其他一些行业能够使用微软 Azure 上的云和 AI 功能，并帮助他们遵守当地的隐私和监管要求。

随着时间的推移，两家公司将寻求为重要项目提供特定行业的 AI 解决方案，其中可能包括将于今年晚些时候在迪拜举行的 COP28 气候峰会。通过此次合作，微软将通过 G42 和阿联酋电信的合资公司 Khazna 数据中心在阿联酋扩展其 Azure 服务。

DeepMind联合创始人：

未来5年，人人拥有个人AI“参谋长”

谷歌人工智能部门 DeepMind 的联合创始人 Mustafa Suleyman 在接受 CNBC 采访时表示，随着人工智能技术的普及，未来五年内每个人都将拥有自己的人工智能（AI）个人助理。

他说：“在我看来，5 年后，每个人都将拥有自己的‘参谋长’。据《哈佛商业评论》报道，参谋长指的是公司中的高级职位，旨在帮助高管做出更好的商业决策。”

Suleyman 表示，与参谋长一样，AI 将 “深入了解你的个人信息，与你的利益完全一致，并帮助你管理和处理你需要的所有信息 ”。

语言代理的认知架构

最近的一些研究已经将大型语言模型（LLMs）与外部资源（如互联网）或内部控制流（如提示链）结合起来，用于需要接地或推理的任务，但缺乏一个构建完整语言代理的系统框架。

为了应对这一挑战，研究人员借鉴了符号人工智能中丰富的代理设计历史，他们首先展示了 LLMs 与生产系统具有许多相同的特性。然后，他们提出了语言代理认知架构（CoALA），这是一个概念框架，用于系统化基于 LLMs 的推理、接地、学习和决策的各种方法，并将其作为框架中语言代理的实例。最后，他们利用 CoALA 框架强调了差距，并提出了可操作的方向，以便在未来开发出能力更强的语言代理。

论文：

Cognitive Architectures for Language Agents

将AlphaZero算法融入五子棋

在过去几年中，AlphaZero 在复杂棋盘游戏方面表现出的卓越能力引起了广泛关注。这种革命性的算法最初是为围棋游戏设计的，它将深度学习技术与蒙特卡洛树搜索（MCTS）相结合，超越了早期的顶级方法。

该研究将 AlphaZero 的使用范围扩大到了五子棋。为了增加价值，研究人员努力实现游戏的平衡性。他们的测试证明了 AlphaZero 在适应围棋以外的其他游戏方面的多功能性。MCTS 已成为复杂场景（尤其是棋类游戏）决策过程的主要算法。AlphaZero 技术将深度学习与 MCTS 的平衡行为相结合，充分利用了这两个领域的优势，为人工智能对弈建立了全新的标准。在围棋、国际象棋和将棋等棋类游戏中，AlphaZero 取得了显著的成功。

论文：

AlphaZero Gomoku

AniPortraitGAN：

从2D图像集生成动画3D肖像

为了实现适用的视频头像，该研究提出了一种可动画化的 3D 感知 GAN，它能生成具有可控面部表情、头部姿势和肩部动作的肖像图像。它是在非结构化 2D 图像集合上训练的生成模型，无需使用 3D 或视频数据。对于新任务，研究人员的方法以生成辐射流形表示为基础，并配备了可学习的面部和头肩变形。为了提高生成人脸的质量，他们提出了一种双摄像头渲染和对抗学习方案。他们还开发了一种姿势变形处理网络，用于为长发等具有挑战性的区域生成可信的变形。实验表明，这个方法在非结构化 2D 图像上经过训练后，可以生成多样化和高质量的 3D 人像，并对不同属性进行理想的控制。

论文：

AniPortraitGAN: Animatable 3D Portrait Generation from 2D Image Collections

自驱动接地：

自动学习语言技能的LLMs代理

大型语言模型（LLMs）展现出强大的自动推理和规划能力，但在现实环境中的应用受到接地问题的限制。现有研究尝试通过微调 LLMs 或使用预定义的API将 LLMs 与环境连接，但这需要大量的人力和物力，并减弱了 LLMs 的通用性。

为了让 LLMs 自主地与环境接地，该研究提出了自驱动接地（SDG）框架，通过自驱动技能学习，自动、渐进地让 LLMs 接地。SDG 首先利用 LLMs 提出实现任务的子目标假设，然后通过与底层环境交互来验证假设的可行性。经过著名的指令跟踪任务集 BabyAI 的验证，SDG 在最具挑战性的任务中取得了与花费数百万演示费的模仿学习方法相当的性能，证明了所学技能的有效性，并展示了框架的可行性和效率。