大神进阶之路：Python技巧小贴士

一条Python代码 · 2020-01-09 23:32:46 · 657 次点击 · 预计阅读时间 5 分钟 · 大约8小时之前开始浏览

这是一个创建于 2020-01-09 23:32:46 的文章，其中的信息可能已经有所发展或是发生改变。

介绍 Python 炫酷功能(例如，变量解包，偏函数，枚举可迭代对象等)的文章层出不穷。但是还有很多 Python 的编程小技巧鲜被提及。因此，本文会试着介绍一些其它文章没有提到的小技巧，这些小技巧也是我平时会用到的的。让我们一探究竟吧!

整理字符串输入

整理用户输入的问题在编程过程中极为常见。通常情况下，将字符转换为小写或大写就够了，有时你可以使用正则表达式模块「Regex」完成这项工作。但是如果问题很复杂，可能有更好的方法来解决：

1.  user_input = "This\nstring has\tsome whitespaces...\r\n" 

3.  character_map = { 
4.  ord('\n') : ' ', 
5.  ord('\t') : ' ', 
6.  ord('\r') : None 
7.  } 
8.  user_input.translate(character_map)  # This string has some whitespaces...


推荐Python大牛在线分享技术 扣qun：855408893

领域：web开发，爬虫，数据分析，数据挖掘，人工智能

零基础到项目实战，7天学习上手做项目

在本例中，你可以看到空格符「\ n」和「\ t」都被替换成了单个空格，「\ r」都被删掉了。这只是个很简单的例子，我们可以更进一步，使用「unicodedata」程序包生成大型重映射表，并使用其中的「combining()」进行生成和映射，我们可以

迭代器切片(Slice)

如果对迭代器进行切片操作，会返回一个「TypeError」，提示生成器对象没有下标，但是我们可以用一个简单的方案来解决这个问题：

1.  import itertools 

3.  s = itertools.islice(range(50), 10, 20)  # &lt;itertools.islice object at 0x7f70fab88138&gt; 
4.  for val in s: 
5.  ...

我们可以使用「itertools.islice」创建一个「islice」对象，该对象是一个迭代器，可以产生我们想要的项。但需要注意的是，该操作要使用切片之前的所有生成器项，以及「islice」对象中的所有项。

跳过可迭代对象的开头

有时你要处理一些以不需要的行(如注释)开头的文件。「itertools」再次提供了一种简单的解决方案：

1.  string_from_file = """ 
2.  // Author: ... 
3.  // License: ... 
4.  // 
5.  // Date: ... 
6.  Actual content... 
7.  """ 

9.  import itertools 

11.  for line in itertools.dropwhile(lambda line: line.startswith("//"), string_from_file.split("\n")): 
12.  print(line)

这段代码只打印初始注释部分之后的内容。如果我们只想舍弃可迭代对象的开头部分(本示例中为开头的注释行)，而又不知道要这部分有多长时，这种方法就很有用了。

只包含关键字参数的函数 (kwargs)

当我们使用下面的函数时，创建仅仅需要关键字参数作为输入的函数来提供更清晰的函数定义，会很有帮助：


1.  def test(*, a, b): 
2.  pass 

4.  test("value for a", "value for b")  # TypeError: test() takes 0 positional arguments... 
5.  test(a="value", b="value 2")  # Works...

如你所见，在关键字参数之前加上一个「」就可以解决这个问题。如果我们将某些参数放在「」参数之前，它们显然是位置参数。

创建支持「with」语句的对象

举例而言，我们都知道如何使用「with」语句打开文件或获取锁，但是我们可以实现自己上下文表达式吗?是的，我们可以使用「enter」和「exit」来实现上下文管理协议:


1.  class Connection: 
2.  def __init__(self): 
3.  ... 

5.  def __enter__(self): 
6.  # Initialize connection... 

8.  def __exit__(self, type, value, traceback): 
9.  # Close connection... 

11.  with Connection() as c: 
12.  # __enter__() executes 
13.  ... 
14.  # conn.__exit__() executes

这是在 Python 中最常见的实现上下文管理的方法，但是还有更简单的方法:


1.  from contextlib import contextmanager 

3.  @contextmanager 
4.  def tag(name): 
5.  print(f"<{name}>") 
6.  yield 
7.  print(f"</{name}>") 

9.  with tag("h1"): 
10.  print("This is Title.")

上面这段代码使用 contextmanager 的 manager 装饰器实现了内容管理协议。在进入 with 块时 tag 函数的第一部分(在 yield 之前的部分)就已经执行了，然后 with 块才被执行，最后执行 tag 函数的其余部分。

用「slots」节省内存

如果你曾经编写过一个创建了某种类的大量实例的程序，那么你可能已经注意到，你的程序突然需要大量的内存。那是因为 Python 使用字典来表示类实例的属性，这使其速度很快，但内存使用效率却不是很高。通常情况下，这并不是一个严重的问题。但是，如果你的程序因此受到严重的影响，不妨试一下「slots」：

1.  class Person: 
2.  __slots__ = ["first_name", "last_name", "phone"] 
3.  def __init__(self, first_name, last_name, phone): 
4.  self.first_name = first_name 
5.  self.last_name = last_name 
6.  self.phone = phone

当我们定义了「slots」属性时，Python 没有使用字典来表示属性，而是使用小的固定大小的数组，这大大减少了每个实例所需的内存。使用「slots」也有一些缺点：我们不能声明任何新的属性，我们只能使用「slots」上现有的属性。而且，带有「slots」的类不能使用多重继承。

限制「CPU」和内存使用量

如果不是想优化程序对内存或 CPU 的使用率，而是想直接将其限制为某个确定的数字，Python 也有一个对应的库可以做到：


1.  import signal 
2.  import resource 
3.  import os 

5.  # To Limit CPU time 
6.  def time_exceeded(signo, frame): 
7.  print("CPU exceeded...") 
8.  raise SystemExit(1) 

10.  def set_max_runtime(seconds): 
11.  # Install the signal handler and set a resource limit 
12.  soft, hard = resource.getrlimit(resource.RLIMIT_CPU) 
13.  resource.setrlimit(resource.RLIMIT_CPU, (seconds, hard)) 
14.  signal.signal(signal.SIGXCPU, time_exceeded) 

16.  # To limit memory usage 
17.  def set_max_memory(size): 
18.  soft, hard = resource.getrlimit(resource.RLIMIT_AS) 
19.  resource.setrlimit(resource.RLIMIT_AS, (size, hard))

我们可以看到，在上面的代码片段中，同时包含设置最大 CPU 运行时间和最大内存使用限制的选项。在限制 CPU 的运行时间时，我们首先获得该特定资源(RLIMIT_CPU)的软限制和硬限制，然后使用通过参数指定的秒数和先前检索到的硬限制来进行设置。最后，如果 CPU 的运行时间超过了限制，我们将发出系统退出的信号。在内存使用方面，我们再次检索软限制和硬限制，并使用带「size」参数的「setrlimit」和先前检索到的硬限制来设置它。

控制可以/不可以导入什么

有些语言有非常明显的机制来导出成员(变量、方法、接口)，例如在 Golang 中只有以大写字母开头的成员被导出。然而，在 Python 中，所有成员都会被导出(除非我们使用了「all」)：


1.  def foo(): 
2.  pass 

4.  def bar(): 
5.  pass 

7.  __all__ = ["bar"]

在上面这段代码中，我们知道只有「bar」函数被导出了。同样，我们可以让「all」为空，这样就不会导出任何东西，当从这个模块导入的时候，会造成「AttributeError」。

实现比较运算符的简单方法

为一个类实现所有的比较运算符(如 lt , le , gt , ge)是很繁琐的。有更简单的方法可以做到这一点吗?这种时候，「functools.total_ordering」就是一个很好的帮手：


1.  from functools import total_ordering 

3.  @total_ordering 
4.  class Number: 
5.  def __init__(self, value): 
6.  self.value = value 

8.  def __lt__(self, other): 
9.  return self.value < other.value 

11.  def __eq__(self, other): 
12.  return self.value == other.value 

14.  print(Number(20) > Number(3)) 
15.  print(Number(1) < Number(5)) 
16.  print(Number(15) >= Number(15)) 
17.  print(Number(10) <= Number(2))

这里的工作原理究竟是怎样的呢?我们用「total_ordering」装饰器简化实现对类实例排序的过程。我们只需要定义「lt」和「eq」就可以了，它们是实现其余操作所需要的最小的操作集合(这里也体现了装饰器的作用——为我们填补空白)。

结语

并非本文中所有提到的功能在日常的 Python 编程中都是必需或有用的，但是其中某些功能可能会不时派上用场，而且它们也可能简化一些原本就很冗长且令人烦恼的任务。还需指出的是，所有这些功能都是 Python 标准库的一部分。而在我看来，其中一些功能似乎并不像标准库中包含的标准内容，所以当你使用 Python 实现本文提到的某些功能时，请先参阅 Python 的标准库，如果你不能找到想要的功能，可能只是因为你还没有尽力查找(如果真的没有，那它肯定也存在于一些第三方库)。

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：一条Python代码

查看原文：大神进阶之路：Python技巧小贴士

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

657 次点击

加入收藏微博

收入我的专栏

上一篇：使用 Iris 打造一款个人博客(视图路由篇)

下一篇：【Golang 源码包分析】01 net/http包

python

函数

代码

切片

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

大神进阶之路：Python技巧小贴士

用户登录

今日阅读排行

一周阅读排行

关注我

大神进阶之路：Python技巧小贴士

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏