澎湃Logo
下载客户端

登录

  • +1

Python3.10第二个alpha版本来了,最新特性值得关注

2020-11-27 07:13
来源:澎湃新闻·澎湃号·湃客
字号

选自towardsdatascience

作者:James Briggs

机器之心编译

编辑:陈萍

Python3.10 的第二个 alpha 版本已在 11 月初发布,相比于不久前发布的 3.9 版本,新版本对类型注释扩展、zip、位计数、字典映射又有了新的改进。

Python3.9 刚刚发布不久,Python3.10 的第二个 alpha 版本也已于 11 月初发布。透过这个版本,我们或许可以一窥 Python 的未来改变。

Python3.10 第二个 alpha 版本的新功能包括以下三大部分:

类型注释扩展

为什么类型注释很重要

新方法和行为

类型注释扩展

Python3.9 版本对类型提示与注释进行了彻底的修改和清理。Python3.10 版本似乎延续了这一趋势,Python3.10 alpha 2 版本将类型注释功能进行了扩展。

从 Python 3.0 到 Python 3.10 类型注释的变化。

类型注释的延迟评估

类型注释的评估始终在函数定义时执行,这意味着类型注释以自上而下的方式逐行进行评估。这看似合乎逻辑,但存在两个问题:

引用尚未定义的类型(前向引用)的类型提示无效,必须以字符串形式表示。例如应该是「“int”」而不是「int」(尽管这仅适用于自定义类型,而不是内置 / 预定义类型)。

由于需要执行类型提示,模块导入的速度减慢。

因此,注释将被存储在 __annotations__,然后进行集中评估,即允许前向引用并首先执行模块导入(以减少初始化时间)。

Union 操作符类型

Python 3.10 引入了 | 操作符。在注释数据类型时,可以使用 | 作为 OR。例如,存在一个预计为 int 或 float 的变量,我们可以将其写作 int | float:

def f(x: *int | float*) -> float: return x * 3.142 f(1) # passf(1.5) # passf('str') # linter will show annotation error

在 3.10 之前的版本中,等效运算符使用 type.Union 方法进行编写,例如 Union[int, float]。

TypeAlias 注释

回到前向引用问题,避免前向引用的常见解决方案是将它们作为字符串写入。

但是,将类型作为字符串编写,会在将这些类型分配给变量时出现问题,因为 Python 假设字符串文本类型注释只是一个字符串。

在使用类型注释的地方使用该类型注释变量将返回错误。例如:

MyType = "ClassName" # ClassName is our type annotationdef foo() -> MyType: ...

我们正在尝试使用 MyType 作为类型的别名(alias),但是 MyType 将被读取为字符串值,而不是类型别名。

只要在后面的代码中定义了 ClassName,这就是有效的。目前,这将引发注释错误。

为了解决这个问题,该版本添加了一个显式地将 MyType 识别为类型别名的方法:

from typing_extensions import TypeAliasMyType: TypeAlias = "ClassName"def foo() -> MyType: ...ORMyType: TypeAlias = ClassName # if we have defined ClassName alreadydef foo() -> MyType: ...

为什么类型注释很重要

Python 的强大之处在于它易于使用和掌握,原因之一就是我们不需要在整个代码中显式地定义类型。

这看似违背常理,但允许开发人员定义类型可以极大地增强代码库的可读性和可维护性。例如从 transformers 库的源代码中提取如下内容:

def get_default_model(targeted_task: Dict, framework: Optional[str], task_options: Optional[Any]) -> str: ...

class DefaultArgumentHandler(ArgumentHandler): ... @staticmethod def handle_kwargs(kwargs: Dict) -> List: ...

@staticmethod def handle_args(args: Sequence[Any]) -> List[str]:

即使没有上下文,我们也可以读取这些代码,并了解应该向这些函数、类和方法提供哪些数据,以及应该返回哪些数据类型。

在复杂的代码库(甚至是简单的代码库)中,类型注释可以极大地提高可读性。同时,并不是每个开发者都想(或需要)使用类型注释,因此可选的、无异常的功能可以达到完美的平衡。

新方法和实现

除了类型注释方面的更改之外,3.10 alpha 2 版本对其他核心功能也进行了一些更新。

为 Zip 添加等长标记

第一个是 PEP 618,它为 zip() 函数添加了一个可选的 strict 标记。设置 strict = True,如果 zip 的两个输入长度不等,则会引发错误。

左侧无 strict=True 标记,没有引发错误,并且较长的列表被截断用于创建压缩生成器。如果设置 strict = True,就会引发错误。

整数的位计数

也叫做「总体计数」(population count)。这一新方法允许计算整数二进制表示中 1 的个数,只需写 int.bit_count() 即可:

字典视图映射

三种字典方法 dict.keys()、dict.values() 和 dict.items() 返回字典的不同视图。现在,将 mapping 属性添加到每个视图对象。

这一新属性是 types.MappingProxyType 对象,用来包装原始字典。如果在视图上调用它,则返回原始字典。

原文链接:

https://towardsdatascience.com/new-features-in-python-3-10-66ac05e62fc7

NeurIPS 2020线上分享:面向鲁棒深度学习的对抗分布式训练

论文:《Adversarial Distributional Training for Robust Deep Learning》。

本篇论文中,研究者提出了一种名为对抗分布式训练(adversarial distributional training, ADT)的新型框架。11月26日,清华大学计算机系博士生董胤蓬,为大家详细解读此前沿研究。

识别二维码,入群一起看直播。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com喜欢此内容的人还喜欢

原标题:《Python3.10第二个alpha版本来了!最新特性值得关注》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈