一、类型和运算
寻求帮助
1 | dir(obj) # 简单的列出对象obj所包含的方法名称,返回一个字符串列表 |
测试类型的三种方法
推荐第三种
1 | if type(L) == type([]): |
Python数据类型:哈希类型、不可哈希类型
哈希类型,即在原地不能改变的变量类型,不可变类型。可利用hash函数查看其hash值,也可以作为字典的key
数字类型:int, float, decimal.Decimal, fractions.Fraction, complex
字符串类型:str, bytes
元组:tuple
冻结集合:frozenset
布尔类型:True, False
None不可哈希类型,原地可变类型:list、dict和set。它们不可以作为字典的key。
数字常量
1 | 1234, -1234, 0, 999999999 # 整数 |
数字的表达式操作符
1 | yield x # 生成器函数发送协议 |
整数可以利用bit_length
函数测试所占的二进制位数
1 | a = 1; a.bit_length() # 1 |
repr和str显示格式的区别
repr格式:默认的交互模式回显,产生的结果看起来它们就像是代码。
str格式:打印语句,转化成一种对用户更加友好的格式。
数字相关的模块
- math模块
- Decimal模块:小数模块
1 | import decimal |
- Fraction模块:分数模块
1 | from fractions import Fraction |
集合set
set是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素。
set支持union(联合), intersection(交), difference(差)和symmetric difference(对称差集)等数学运算。
set支持x in set
, len(set)
, for x in set
。
set不记录元素位置或者插入点, 因此不支持indexing
, slicing
, 或其它类序列的操作
1 | s = set([3,5,9,10]) # 创建一个数值集合,返回{3, 5, 9, 10} |
集合frozenset,不可变对象
set是可变对象,即不存在hash值,不能作为字典的键值。同样的还有list等(tuple是可以作为字典key的)
frozenset是不可变对象,即存在hash值,可作为字典的键值
frozenset对象没有add、remove等方法,但有union/intersection/difference等方法
1 | a = set([1, 2, 3]) |
布尔类型bool
1 | type(True) # 返回<class 'bool'> |
动态类型简介
变量名通过引用,指向对象。
Python中的“类型”属于对象,而不是变量,每个对象都包含有头部信息,比如”类型标示符” “引用计数器”等
共享引用及在原处修改:对于可变对象,要注意尽量不要共享引用!
共享引用和相等测试:
1 | L = [1], M = [1], L is M # 返回False |
增强赋值和共享引用:普通+号会生成新的对象,而增强赋值+=会在原处修改
1 | L = M = [1, 2] |
常见字符串常量和表达式
1 | S = '' # 空字符串 |
内置str处理函数:
1 | str1 = "stringobject" |
三重引号编写多行字符串块,并且在代码折行处嵌入换行字符\n
1 | mantra = """hello world |
索引和分片:
1 | S[0], S[len(S)–1], S[-1] # 索引 |
字符串转换工具:
1 | int('42'), str(42) # 返回(42, '42') |
另类字符串连接
name = "Andy" "Ron" # 单行,name = "AndyRon"
name = "Andy" \
"Ron" # 多行,name = "AndyRon"
Python中的字符串格式化实现1–字符串格式化表达式
基于C语言print
模型,并且在大多数的现有的语言中使用。
通用结构:%[(name)][flag][width].[precision]typecode
1 | "this is %d %s bird" % (1, 'dead') # 一般的格式化表达式 |
Python中的字符串格式化实现2–字符串格式化调用方法
普通调用
1 | "{0}, {1} and {2}".format('spam', 'ham', 'eggs') # 基于位置的调用 |
添加键 属性 偏移量 (import sys
)
1 | "my {1[spam]} runs {0.platform}".format(sys, {'spam':'laptop'}) # 基于位置的键和属性 |
具体格式化
1 | "{0:e}, {1:.3e}, {2:g}".format(3.14159, 3.14159, 3.14159) # 输出'3.141590e+00, 3.142e+00, 3.14159' |
说明:1
2
3
4
5
6
7
8fieldname是指定参数的一个数字或关键字, 后边可跟可选的".name"或"[index]"成分引用
format_spec ::= [[fill]align][sign][#][0][width][,][.precision][type]
fill ::= <any character> #填充字符
align ::= "<" | ">" | "=" | "^" #对齐方式
sign ::= "+" | "-" | " " #符号说明
width ::= integer #字符串宽度
precision ::= integer #浮点数精度
type ::= "b" | "c" | "d" | "e" | "E" | "f" | "F" | "g" | "G" | "n" | "o" | "s" | "x" | "X" | "%"
例子:
1 | '={0:10} = {1:10}'.format('spam', 123.456) # 输出'=spam = 123.456' |
常用列表常量和操作
1 | L = [[1, 2], 'string', {}] # 嵌套列表 |
用切片来删除序列的某一段
1 | a = [1, 2, 3, 4, 5, 6, 7] |
常用字典常量和操作
1 | D = {} |
字典解析
1 | D = {k:8 for k in ['s', 'd']} # {'s': 8, 'd': 8} |
字典的特殊方法missing:当查找找不到key时,会执行该方法
1 | class Dict(dict): |
元组和列表的唯一区别在于元组是不可变对象,列表时可变对象
1 | a = [1, 2, 3] # a[1] = 0, OK |
元组的特殊语法: 逗号和圆括号
D = (12) # 此时D为一个整数 即D = 12
D = (12, ) # 此时D为一个元组 即D = (12, )
文件基本操作
1 | output = open(r'C:\spam', 'w') # 打开输出文件,用于写 |
其他
Python中的真假值含义:1. 数字如果非零,则为真,0为假。 2. 其他对象如果非空,则为真
通常意义下的类型分类:1. 数字、序列、映射。 2. 可变类型和不可变类型
二、语法和语句
赋值语句的形式
1 | spam = 'spam' # 基本形式 |
序列赋值 序列解包
1 | [a, b, c] = (1, 2, 3) # a = 1, b = 2, c = 3 |
带有*
时 会优先匹配*
之外的变量,如1
a, *b, c = [1, 2] # a = 1, c = 2, b = []
print函数原型
1 | print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False) |
and,or
Python中and或or总是返回对象(左边的对象或右边的对象) 且具有短路求值的特性
1 | 1 or 2 or 3 # 返回 1 |
if/else三元表达符(if语句在行内)
1 | A = 1 if X else 2 |
while,for
Python的while语句或者for语句可以带else语句 当然也可以带continue/break/pass语句
1 | while a > 1: |
for循环的元组赋值
1 | for (a, b) in [(1, 2), (3, 4)]: # 最简单的赋值 |
列表解析语法
1 | M = [[1,2,3], [4,5,6], [7,8,9]] |
两个列表同时解析:使用zip函数
1 | for teama, teamb in zip(["Packers", "49ers"], ["Ravens", "Patriots"]): |
输出:1
2Packers vs. Ravens
49ers vs. Patriots
带索引的列表解析:使用enumerate函数
1 | for index, team in enumerate(["Packers", "49ers", "Ravens", "Patriots"]): |
输出:
1 | 0 Packers |
生成器表达式
1 | G = (sum(row) for row in M) # 使用小括号可以创建所需结果的生成器generator object |
文档字符串
出现在Module的开端以及其中函数或类的开端 使用三重引号字符串
1 | """ |
命名惯例
以单一下划线开头的变量名(_X
)不会被from module import*
等语句导入
前后有两个下划线的变量名(__X__
)是系统定义的变量名,对解释器有特殊意义
以两个下划线开头但不以下划线结尾的变量名(__X
)是类的本地(私有)变量
列表解析 in成员关系测试 map sorted zip enumerate内置函数等都使用了迭代协议
1 | 'first line' in open('test.txt') # in测试 返回True或False |
del语句: 手动删除某个变量
1 | del X |
获取列表的子表的方法:
1 | x = [1,2,3,4,5,6] |
手动迭代:iter和next
1 | L = [1, 2] |
Python中的可迭代对象
"""
1.range迭代器
2.map、zip和filter迭代器
3.字典视图迭代器:D.keys()), D.items()等
4.文件类型
"""
三、函数语法规则
函数相关的语句和表达式
1 | myfunc('spam') # 函数调用 |
Python函数变量名解析:LEGB原则
local(functin) --> encloseing function locals --> global(module) --> build-in(python)
说明:以下边的函数maker为例 则相对于action而言 X为Local N为Encloseing
嵌套函数举例:工厂函数
1 | def maker(N): |
嵌套函数举例:lambda实例
1 | def maker(N): |
nonlocal和global语句的区别
1 | # nonlocal应用于一个嵌套的函数的作用域中的一个名称 例如: |
函数参数:不可变参数通过“值”传递,可变参数通过“引用”传递
1 | def f(a, b, c): print(a, b, c) |
Keyword-Only参数:出现在*args
之后 必须用关键字进行匹配
1 | def keyOnly(a, *b, c): print('') # c就为keyword-only匹配 必须使用关键字c = value匹配 |
可变参数匹配: * 和 **
1 | def f(*args): print(args) # 在元组中收集不匹配的位置参数 |
函数调用时的参数解包: * 和 ** 分别解包元组和字典
1 | func(1, *(2, 3)) <==> func(1, 2, 3) |
函数属性:(自己定义的)函数可以添加属性
1 | def func():..... |
函数注解: 编写在def头部行 主要用于说明参数范围、参数类型、返回值类型等
1 | def func(a:'spam', b:(1, 10), c:float) -> int : |
匿名函数:lambda
1 | f = lambda x, y, z : x + y + z # 普通匿名函数,使用方法f(1, 2, 3) |
lambda函数与map filter reduce函数的结合
1 | list(map((lambda x: x + 1), [1, 2, 3])) # [2, 3, 4] |
生成器函数:yield VS return
1 | def gensquare(N): |
生成器表达式:小括号进行列表解析
1 | G = (x ** 2 for x in range(3)) # 使用小括号可以创建所需结果的生成器generator object |
本地变量是静态检测的
1 | X = 22 # 全局变量X的声明和定义 |
函数的默认值是在函数定义的时候实例化的 而不是在调用的时候 例子:
1 | def foo(numbers=[]): # 这里的[]是可变的 |
四、函数例子
数学运算类
1 | abs(x) # 求绝对值,参数可以是整型,也可以是复数,若参数是复数,则返回复数的模 |
集合类操作
1 | basestring() # str和unicode的超类,不能直接调用,可以用作isinstance判断 |
五、模块Moudle
Python模块搜索路径:
(1)程序的主目录
(2)PYTHONPATH目录
(3)标准链接库目录
(4)任何.pth文件的内容
查看全部的模块搜索路径
1 | import sys |
模块的使用代码
1 | import module1, module2 # 导入module1 使用module1.printer() |
重载模块reload
这是一个内置函数 而不是一条语句
1 | from imp import reload |
模块的包导入
使用点号(.)而不是路径(dir1\dir2)进行导入
1 | import dir1.dir2.mod # d导入包(目录)dir1中的包dir2中的mod模块 此时dir1必须在Python可搜索路径中 |
init.py包文件
每个导入的包中都应该包含这么一个init__.py文件
该文件可以为空
首次进行包导入时, 该文件会自动执行
高级功能:在该文件中使用
__all__
列表来定义包(目录)以from*
的形式导入时 需要导入什么
包相对导入:使用点号(.) 只能使用from语句
1 | from . import spam # 导入当前目录下的spam模块(错误: 当前目录下的模块, 直接导入即可) |
包相对导入与普通导入的区别
1 | from string import * # 这里导入的string模块为sys.path路径上的 而不是本目录下的string模块(如果存在也不是) |
模块数据隐藏:最小化from*的破坏
1 | _X # 变量名前加下划线可以防止from*导入时该变量名被复制出去 |
模块属性
可以使用__name__
进行模块的单元测试:当模块为顶层执行文件时值为__main__
,当模块被导入时为模块名。
1 | if __name__ == '__main__': |
模块属性中还有其他属性,例如:1
2
3
4__doc__ # 模块的说明文档
__file__ # 模块文件的文件名,包括全路径
__name__ # 主文件或者被导入文件
__package__ # 模块所在的包
import语句from语句的as扩展
import modulename as name
from modulename import attrname as name
得到模块属性的几种方法
假设为了得到__name__
属性的值
1 | M.__name__ |
六、类与面向对象
最普通的类
1 | class C1(C2, C3): |
Python的类没有基于参数的函数重载
1 | class FirstClass: |
子类扩展超类: 尽量调用超类的方法
1 | class Manager(Person): |
类内省工具
1 | bob = Person('bob') |
返回1中 数据属性spam是属于类 而不是对象
1 | I1 = C1('bob'); I2 = C2('tom') # 此时I1和I2的spam都为42 但是都是返回的C1的spam属性 |
类方法调用的两种方式
1 | instance.method(arg...) |
抽象超类的实现方法
1 | # (1)某个函数中调用未定义的函数 子类中定义该函数 |
OOP和继承: “is-a”的关系
1 | class A(B): |
类的伪私有属性:使用__attr
1 | class C1: |
类方法是对象:无绑定类方法对象 / 绑定实例方法对象
1 | class Spam: |
获取对象信息: 属性和方法
1 | a = MyObject() |
为类动态绑定属性或方法: MethodType方法
1 | # 一般创建了一个class的实例后, 可以给该实例绑定任何属性和方法, 这就是动态语言的灵活性 |
七、类的高级话题
多重继承
“混合类”, 搜索方式”从下到上 从左到右 广度优先”
1 | class A(B, C): |
类的继承和子类的初始化
1 | # 1.子类定义了__init__方法时,若未显示调用基类__init__方法,python不会帮你调用。 |
实例方法 / 静态方法 / 类方法
1 | class Methods: |
函数装饰器:是它后边的函数的运行时的声明,由@符号以及后边紧跟的”元函数”(metafunction)组成
1 |
|
类修饰器:是它后边的类的运行时的声明,由@符号以及后边紧跟的”元函数”(metafunction)组成
1 | def decorator(aClass):..... |
限制class属性: slots属性
1 | class Student: |
类属性高级话题: @property
1 | # 假设定义了一个类:C,该类必须继承自object类,有一私有变量_x |
定制类: 重写类的方法
1 | # (1)__str__方法、__repr__方法: 定制类的输出字符串 |
动态创建类type()
1 | # 一般创建类 需要在代码中提前定义 |
八、异常相关
捕获异常:
1 | try: |
Python3.x中的异常链
raise exception from otherException
1 | except Exception as X: |
assert子句: assert <test>, <data>
1 | assert x < 0, 'x must be negative' |
with/as环境管理器:作为常见的try/finally用法模式的替代方案
1 | with expression [as variable], expression [as variable]: |
用户自定义异常: class Bad(Exception):…..
1 | """ |
用户定制异常数据
1 | class FormatError(Exception): |
关于sys.exc_info:允许一个异常处理器获取对最近引发的异常的访问
1 | try: |
异常层次
1 | BaseException |
九、Unicode和字节字符串
Python的字符串类型
1 | """Python2.x""" |
字符编码方法
1 | """ASCII""" # 一个字节,只包含英文字符,0到127,共128个字符,利用函数可以进行字符和数字的相互转换 |
查看Python中的字符串编码名称,查看系统的编码
1 | import encodings |
源文件字符集编码声明: 添加注释来指定想要的编码形式 从而改变默认值 注释必须出现在脚本的第一行或者第二行
1 | """说明:其实这里只会检查#和coding:utf-8,其余的字符都是为了美观加上的""" |
编码,解码
编码: 字符串 –> 原始字节
解码: 原始字节 –> 字符串
Python3.x中的字符串应用
1 | s = '...' # 构建一个str对象,不可变对象 |
Python2.x的编码问题
1 | u = u'汉' |
bytes对象
1 | B = b'abc' |
文本文件,二进制文件
文本文件: 根据Unicode编码来解释文件内容,要么是平台的默认编码,要么是指定的编码类型
二进制文件:表示字节值的整数的一个序列 open('bin.txt', 'rb')
Unicode文件
1 | s = 'A\xc4B\xe8C' # s = 'A?BèC' len(s) = 5 |
十、其他
Python实现任意深度的赋值
1 | a[0] = 'value1' |
1 | class MyDict(dict): |
Python中的多维数组
1 | lists = [0] * 3 # 扩展list,结果为[0, 0, 0] |
代码规范
PEP 8 – Style Guide for Python Code