文本为《python简易教程》的自学笔记
在Python命令解释提示符输入:
print("Hello World!");
结果
GNU/LINUX 或者 OS X上的shell程序,
ctrl+d' 或者输入
exit()`
WINDOWS:
ctrl+z [enter]
退出
这里使用了pycharm
例子:
print('Hello world') # print is a function
字面常量的例子是诸如23 4 这样的数字或者
这是一个文本
这样的文本
数字主要分两种
- 整数(Integers)
- 浮点数(Floats)
字符串(string) 是字符(characters)的序列(sequence)
- 单引号,可以使用单引号来指定字符串,比如说
'天行所向利剑凌空'
- 双引号,被双引号和单引号括起来的字符串其工作机制是一样的,比如说
"what's your name?
- 三引号,在三引号之间的实际上是多行字符串,另外可以再三引号之间自由地使用单引号和双引号
这意味着一旦你创建了一串字符串,你就不能改变他
有时候,我们想从其他信息中构建字符串。利用formate函数
age = 20
name = 'chenpeng'
print('{0}' was {1} years old when he wrote this book.'.format(name,age))
print('why is {0} playing with that python?'.format(name))
运行结果:
但是,数字是可选的,同样的也可以写成
print('{} was {} years old when he wrote this book'.format(name,age))
print('why is {} playing that with python?'.format(name))
formate 还有更详细的用法:
# 对于浮点数,'0.333' 保留小数点(.)后三位
print('{0:.3f}'.format(1.0/3));
# 使用下划线填充文本,并保持文字处于中间位置
# 使用(^)定义'___hello___'字符串长度为11
print('{0:_^11}'.format('hello'))
#基于关键词输出'Swaroop wrote A Byte of Python
print('{name} wrote {book}'.format(name="xiaopeng",book="enjoy-python"))
注意print()函数,最后会以一个不可见的"新一行"字符(\n)结尾,为了防止打印过程中出现
换行,可以通过end
指定空白结尾:
print('a',end='')
print('b',end='')
输出结果:
ab
或者你可以通过end指定空格结尾:
print('a',end=' ')
print('b',end=' ')
print('c')
输出结果:
a b c
如果希望生成的字符串中包含(')、()以及其他诸如控制字符串格式的(\n)、(\t)等需要用到转义序列
比如要输出what's your name
应该这样写 'what\'s your name'
利用\n
换行,This is the first line \n This is the second line'
还有一个特殊的用法,用在末尾表示字符串在下一行继续:
"This is the first sentence.\
This is the second sentence."
相当于:
"This is the first sentence.This is the second sentence."
如果你需要指定一些未经处理的字符串,比如转义序列,可以在字符串前加上r
或者R
r"Newlines are indicated by \n"
使用字面量无法满足我们开发的需求, 这时候就需要使用变量(veriables).
- 第一个字符必须是字母表中的字母(大小写ASCII或者Unicode或者_)
- 标识符的其他部分可由字符、下划线、数字组成
- 标识符区分大小写
变量可以将各种形式的值保存为不同的数据类型,基本的数据类型包括数字和字符串,在后面我们将会讨论通过类(Classes)来创建我们自己的数据类型.
需要记住python将程序中任何内容统称为对象(Object).这是一般意义的叫法。我们通常以某对象(object)相称,而非某东西(something)
案例:使用变量和字面变量
# 文件名:var.py
i = 5
print(i)
i = i+1
print(i)
s = '''This is muti-line string.
This is the second line.'''
print(s)
输出:
5
6
This is muti-line string.
This is the second line.
变量秩序被赋值某一个值,不需要声明或定义数据类型
物理行(Physical Line)是指在编写程序时你所看到的内容。
逻辑行(Logical Line)是指Python所识别的单个语句。
实际上,python暗含这样一个期望鼓励每一行使用一句独立的语句从而使得代码更加可读
如果你希望在一行物理行中指定多行逻辑行,那么你必须使用;
来表示该行或者语句的结束.
i = 5
print(i)
实际上等价于
i = 5;
print(i);
同样可以看作
i = 5;print(i);
也与这一写法相同
i = 5;print(i)
实际上不应该使用分号,在python程序中大多不存在
;
的使用,如果你有一行非常长的代码,你可以通过反斜杠\
来将其拆分成多个物理行.这被称之为显式连接(Explicit Line Joining):
s = 'This is a string.\
This continues the string.'
print(s)
结果输出:
This is a stirng.This continues the string.
类似地,
i = \
5
等价于
i = 5
在某些情况下,会存在一个隐含的交涉,允许你不用反斜杠这一情况即以括号开始,它可以是方括号或者花括号,但不能是结束括号,这称为隐式连接(Implicit Line Joining)
空白区在python中是非常重要的。空白区在各行的靠头非常重要被称为(Indentation).在逻辑行的开头留下空白区(使用空格或者制表符)用以确定各逻辑行的缩进级别,后者可以确定语句的分组。这表示放置在一起的语句必须要有相同的缩进,我们把每一组这样的语句称为块(block)
错误的缩进会导致错误
i = 5
print('Value is',i)
print('I repeat,the value is',i)
如何缩进?
使用四个空格来缩进,这是python官方的建议
我们所编写的大多数语句(逻辑行)都包含了表达式(Expressions).
一个表达式的简单的例子就是2+3
.表达式,可以拆分为
- 运算符(Operators)
- 操作数(Operands)
在2+3
这样的表达式里,+
就是运算符,2
和3
就是操作数
下面来简要的了解各类运算符以及他们的用法
下面是运算符的速览
-
+
(加)- 两个对象相加
3+5
则输出8
,'a'+'b'
输出'ab'
-
-
(减)- 从一个数中减去另一个数,如果第一个操作数不存在,假定为0
-5.2
将输出一个负数
-
*
(乘)- 给出两个数的乘积,或者返回字符串重复指定次数后的结果
2*3
输出6
.'la'*3
输出'lalala'
.
-
**
(乘方)- 返回x的y次方
3**4
输出81
(即3*3*3*3
)
-
/
(除)- x除以y
13/3
输出4.333333333333
-
//
(整除)- x除以y并对结果向下取整至最接近的整数
13//4
输出4
.-13//4
输出-5
-
%
(取模)- 返回除法之后的余数
13%5
输出1
-
<<
(左移)- 将数字的位想左移动指定的位数
2<<2
输出8
-
>>
(右移)- 将数字的位向右移动指定的位数
11>>1
输出5
-
&
(按位与)- 对数字进行按位与操作
5&3
输出1
-
|
(按位或)- 对数字进行按位或操作
5|3
输出 7
-
~
(按位取反)~5
输出 -6- x的取反的结果为
-(x+1)
-
<
(小于)- 返回x是否小于y,所有比较的结果返回
True
或者False
,注意首字母为大写 5<3
输出False
- 比较可以任意组成链接:
3<5<7
返回True
- 返回x是否小于y,所有比较的结果返回
-
<=
(小于等于)- 返回x是否小于或等于y
x = 3;y = 6;x<=y
返回True
-
>=
(大于等于)- 返回x是否大于或者等于y
x = 4;y = 3;x>=3
返回True
-
==
(等于)- 比较两个对象是否相等
x = 2;y = 2;x == y
返回True
x = 'str';y = 'stR';x == y
返回False
x = 'str';y = 'str';x == y
返回True
-
!=
(不等于)- 比较两个对象是否不相等
x = 2;y = 3;x!=y
返回True
-
not
(布尔"非")- 如果x是
True
,返回False
,同理反之亦如是 x = True;not x
返回False
- 如果x是
-
and
(布尔"与")- 若x为
False
,则x and y
返回False
,否则返回y
的计算值 - 若x为
False
,x = False;y = True; x and y
此时python将不会计算y因为它已经了解and表达式的左侧为False
,意味着整个表达式都是False
,这种情况为短路运算(Short-circuit Evaluation)
- 若x为
-
or
(布尔"或")- 如果x为
True
,返回True
,否则返回y的计算值 x = True;y = False; x or y
返回True
,在这里短路运算同样适用.
- 如果x为
变量 = 变量 运算 表达式
a = 2
a = a*3
变量 运算 = 表达式
a = 2
a *= 3
下表罗列了python的运算的优先级
可以使用括号来使得表达式更加易读
运算符通常由左至右结合
例子
length = 5
breadth = 2
area = length*breadth
print('Area is ',area)
print('Perimeter is ',2*(length+breadth))
输出
python中有三种控制流语句
- if
- for
- while
案例,其中else从句是可选的
number = 23
guess = int(input('Enter an integer:'))
if guess == number:
print('Congratulations,gu guessed it.')
print('(but you do not win any prizes!)')
elif guess<number:
print("No,it is a litter higher than that")
else:
print('No,it is a little lower than that!')
print('Done')
输出
python 中不存在switch语句
案例:
number = 23
running = True
while running:
guess = int(input('enter an integer :'))
if guess == number:
print('success!,you guessed it.')
running = False
elif guess<number:
print('No,it is little higher!')
else:
print('No,it is little lower!')
else:
print('The while loop is over.')
print('done')
结果:
可以在while循环中使用else语句
for i in range(1,5):
print(i)
else:
print('The for loop is over')
输出的结果为
在这个例子中我们使用了内置的
range
函数生成这一数字序列。range(1,5)将会产生[1,2,3,4]。如果我们向range提供第三个参数,这个数字将成为步长,比如range(1,5,2),将会产生[1,3],特别注意不包括第二个数字在内,换做数学语言来讲是左边开区间,右边闭区间,第三个数为步长。
break
语句用以中断循环语句,也就是终止循环的语句。
有一点需要注意的是,如果你中断了比如for和while循环,那么,任何相应循环中的else块都将不会执行
案例:
while True:
s = input('Enter something:')
if s == 'quit':
break
print('Length of the string is ',len(s))
print('Done')
运行结果:
所谓continue就是告诉python跳过当前循环中的剩余的语句继续下一个循环。
案例:
while True:
s = input('Enter something:')
if s == 'quit':
break
if len(s)<3:
print('Too small')
continue
print('Input is out of sufficient length')
运行结果:
注意 continue 同样能够适用于for循环
所谓函数(Functions)就是可重复使用的程序片段。 通过函数名在程序的任何地方来运行代码块,并且可以执行任意次数,这就是所谓的调用(Calling)函数
函数可以通过def
来定义
函数定义形式:
def say_hello():
# do something...
# end function
函数的调用:
say_hello()
函数中的参数通过防止在用以定义函数的一对括号中指定。
特别地:
在定义函数时候给的名称叫做"形参"(Parameters)
在调用函数时所提供给函数的值称为"实参"(Arguments)
案例:
def print_max(a,b):
if a>b:
print(a,'is maximum')
elif a == b:
print(a,'is equal to',b)
else:
print(b,'is maximum')
print_max(3,4)
x = 5
y = 7
print_max(x,y)
运行结果:
第一次调用我们以实参的形式直接向函数提供这一数字,第二次调用时候,我们使用变量来作为实参调用函数,是的将实参x赋值给形参a,两次print_max都以相同的方式工作
当你在一个函数的定义中声明变量,他们不会以任何方式与身处函数之外具有相同名称的变量产生任何的关系,也就是说,这些变量名,只存在函数这一局部(local).这被称之为作用域(Scope).
案例:
x = 50
def func(x):
print('x is ',x)
x = 2
print('Changed local x to ',x)
func(x)
print('x is still ',x)
结果:
实际上x的值并不会收到调用的函数中的局部变量的影响.
如果你想给一个在程序顶层的变量赋值,你必须告诉python这是一个全局(Global)的变量不是局部变量,我们通常需要通过global语句来完成这件事情.因为,你不看为一个定义于函数之外的变量赋值.
案例:
x = 50
def func():
global x
print('x is ',x)
x = 2
print('changed global x to ',x)
func()
print('value of x is ',x)
运行结果:
不难看出和上一个例子不同这里的x已经改变了,如果语句中不知一个全局变量,你可以这样写
global x,y,z
对于有些函数你可能希望是一些参数可选并使用默认值,你可以在函数定义时候,附加一个赋值运算符(=
)来为参数制定默认的参数值.
案例:
def say(message,times=1):
print(message*times)
say('Hello')
say('World',5)
运行结果:
注意! 在函数列表中,拥有默认参数值参数不能位于没有默认参数值的参数之前. 举例来说,def func(a,b = 5)是合法的,但def func(a = 5,b)是无效的
假设你有一些许多参数的函数,但是,你不可能为每一个参数都赋值,这样看起来很傻,我们只希望对其中某些关键的参数来给这些参数赋值,这就是关键字参数(Keywrod Arguments)
案例:
def func(a,b = 5,c =10):
print('a is ',a,' and b is ',b,'and c is ',c)
func(3,7)
func(25,c = 24)
func(c = 50,a = 100)
运行结果:
实际上可以看到func(3,7),参数a获得了3,参数b获得7,而c获得了函数定义时候的默认值 第二次调用,参数a获得25,但是这时候我们不想给b赋值,我们通过关键字参数来直接给c赋值,从而打破了函数调用时参数顺序的限定 同理第三次调用,我们直接将c先赋值,再对a赋值,这也是允许的,所以python的语法还是很灵活的!记住这是关键字参数带给我们的便利
有时你可能想定义的函数里面能够有任意数量的变量,也就是参数数量是可变的,这可以通过使用型号来实现
案例:
def total(a = 5,*numbers,**phonebook):
print('a',a)
for single_item in numbers:
print('single_item',single_item)
for first_part,second_part in phonebook.items():
print(first_part,second_part)
print(total(10,1,2,3,Jack = 1123,John = 2231,Inge=1560))
结果:
当我们声明*param的星号参数时,从此处开始知道结束的所有位置参数(Positional Arguments)都将被收集并汇集成一个称为"param"的元组(Tuple)
当我们声明**param的双星号参数时,从此处来时直至结束的所有的关键字参数都将被收集并汇集成一个名为Param的字典(Dictionary)
return
语句用于从函数中返回,也就是中断函数.
案例:
def maximum(x,y):
if x>y:
return x
elif x == y:
return "The numbers are equal "
else:
return y
print(maximum(2,3))
运行结果:
要注意如果return 没有搭配任何一个值则代表着 None. None 在Pyton中是一个特殊的类型,代表着虚无。 每一个函数都在其末尾隐含了一句
return None
,除非你写了你自己的return
语句.
另外有一个名为max内置函数已经实现了找最大值的功能,尽可能使用这一内置函数
DocStrings是一款甚是优美的功能,能够帮助你更好地记录程序并让其更加易于理解。
案例:
def print_max(x,y):
'''prints the maximum of tow mumbers.
The tow values must be integers.'''
x = int(x)
y = int(y)
if x>y:
print(x,' is maximum')
else:
print(y,' is maximum')
print_max(3,5)
print(print_max.__doc__)
结果:
我们可以通过函数的
__doc__
的属性来获取函数print_max文档的字符串属性,自动化工具可以用这种方式来检索你程序中的文档,所以墙裂建议编写的所有重要的函数配以文档字符串。python发型版本中附带的pydoc命令和help()使用文旦字符串的方式类似
如果你想在你所编写的程序中重用一些函数的话,应该怎么办?答案是模块(Modules).
首先我们来了解如何使用标准款模块
import sys
print('The command line arguments are:')
for i in sys.argv:
print(i)
print('\n\nThe PYTHONPATH is ',sys.path,'\n')
输出:
导入一个模块是一件代价高昂的事情,因此python引入了一些技巧来使其能够更加快速的完成。其中一种方式就是创建按字节码编译的***(byte-compiled)***文件,这些.pyc文件是独立于运行平台的
这些.pyc文件通常会创建在对应的.py文件所处的目录中,如果python没有相应的权限对这一目录进行写入文件的操作,那么.pyc文件将不会被创建.
如果希望直接将argv的变量导入自己的程序,可以使用from sys import argv
这一语句来完成.
警告:一般来说,应该尽量避免使用from...import 语句,而去使用import语句,这是为了避免在自己的程序中出现名称冲突,也为了使程序更加的可读
案例
from math import sqrt
print('square root of 16 is ',sqrt(16))
每一个模块都有一个名称,而模块中的语句可以找到它们所处的模块的名称,这对于确定模块是独立运行的还是被导入进来的运行的这一特定目的来说大为有用.
案例:
if __name__ == '__main__':
print('This program is being run by itself')
else:
print('Iam being imported from another module')
结果
在Python中每一个python程序同时也是一个模块。只需要保证它以.py为拓展名即可
案例(保存为 mymodule.py)
def say_hi():
print('Hi,this is mymodule speaking.')
__version__ = '0.1'
另一个模块(保存为 mymodule_demo.py)
import mymodule
mymodule.say_hi()
print('Version',mymodule.__version__)
输出:
Hi,this is mymodule speaking.
Version 0.1
下面是 from...import
语法的版本(保存为 mymodule_demo2.py
)
from mymodule import say_hi,__version__
say_hi()
print('Version',__version__)
这里需要注意的是,如果导入到mymodule中已经存在了__version__这一名称,那将会产生冲突。所以我们大都推荐最好去使用import 语句,尽管看起来代码稍微长一些。
你还可以使用:
from mymodule import *
这将导入诸如 say_hi
等所有公共名称,但不会导入__version__名称,因为后者以双下划线开头.
警告:应该避免使用import-star 这种形式
内置的 dir()
函数能够返回由对象所定义的名称列表.
如果该对象是一个模块,则该列表会包括函数内所定义的函数、类与变量
另外,该函数还接受参数。如果参数时模块名称,函数将返回这一指定模块的名称列表。如果没有提供参数,函数将返回当前模块的名称列表。
案例:
import sys
dir(sys)
返回的结果:
下面给出当前模块的属性名称
dir()
返回的结果
接着创建一个新的变量
a = 5
返回的结果:
删除或者移除一个名称
del a
返回的结果:
同时还有一个
vars()
函数也可以返回给你这些值的属性,但只是可能,并不对所有的类都能正常工作
代码必须加以有效的管理,学过java、c++的同志们应该知道代码必须有章法,否则就是一盘散沙不能够真正凝聚力量来解决大规模的问题。python中,变量通常位于函数的内部,函数和全局变量通常位于模块内部。如果你希望组织起来,这就是**包(Package)**登场的时刻.
包是指一个包含模块与一个特出的__init__.py文件的文件夹,后者想Python表面这一文件夹是特别的,因为其包含了python模块.
假设你想创建一个"world"的包,其中还包含着"asia"、"afica"等包,并且这些子包都包含了诸如"india"、"madagascar"等模块.
- <some floder present in the sys.path>/
- world/
- __init__.py
- asia/
- __init_.py
- india/
- __init_.py
- foo.py
- africa/
- __init__.py
- madagascar/
- __init__.py
- bar.py
包是一种能够方便地分层组织模块的方式,你将在标准库中看到许多诸如此类的实例
数据结构(Data Structures)是用来存储一些相关数据的集合。
在python中有四种内置的数据结构
- 列表(List)
- 元祖(Tuple)
- 字典(Dictionary)
- 集合(Set)
列表是一种用于保存一些有序项目的集合.python中需要你在它们之间多加上一个逗号,项目的列表应该用方括号括起来,这样python才能理解你正在指定一张列表.一旦你创建了一张列表你可以添加、删除、搜索列表中的项目.我们说列表是一种可变(Mutable)的数据类型,这种数据类型是可以被改变的.
列表是使用对象与类的实例。当我们启用一个变量i并将整数5赋值给它时,你可以认为这是在创建一个int类之下的对象i.
一个类也可以带有方法(Method),也就是说对这个类定义仅对于它启用某个函数.例如python 为 list 类提供了一种 append 方法,它能够允许你向列表末尾添加一个项目.例如mylist.append('an item')
将会向mylist添加一串字符串.
一个类同样也可以具有字段(Field),它是只为该类定义且为该类所用的变量.字段同样可以通过.来访问,比如mylist.field
.
案例(保存为 ds_using_list.py
)
shoplist = ['apple','mango','carrot','banana']
print('I have',len(shoplist),' items to purchase')
print('These items are:',end=' ')
for item in shoplist:
print(item,end=' ')
print('\nI also have to buy rice.')
shoplist.append('rice')
print('My shopping list is now ',shoplist)
print('I will sort my list now')
shoplist.sort()
print('Sorted shopping list is ',shoplist)
print('The first item I will buy is ',shoplist[0])
olditem = shoplist[0]
del shoplist[0]
print('I bought the',olditem)
print('My shopping list is now',shoplist)
输出结果:
你可以想列表中添加任何类型的对象,包括数字,甚至是其他列表 我们还使用 for...in 循环来便利列表中的每一个项目 这里注意在调用print函数时我们使用end参数,这样就能够通过一个空格来完成输出工作而不是通常的换行. 接下来,如我们讨论的那段,我们通过列表对象中的append方法向列表中添加一个对象.
列表是可变的,而字符串是不可变的 当我们需要删除列表中的元素时,我们使用
del
语句来实现这一需求.
元素(Tuple)用于将多个对象保存在一起。类似于列表但是不能提供列表类能够提供给你的广泛的功能。元素的一大特征类似于字符串,他们不可变.你不能编辑或者更改元组.
案例(ds_using_tuple.py):
zoo = ('python','elephant','penguin')
print('Number of animals in the zoo is ',len(zoo))
new_zoo = 'monkey','camel',zoo
print('Number of cages in the new zoo is ',len(new_zoo))
print('All animals in new zoo are ',new_zoo)
print('Animals brought from old zoo is ',new_zoo[2])
print('Last animal brought from old zoo is ',new_zoo[2][2])
print('Number of animals in the new zoo is ',len(new_zoo)-1+len(new_zoo[2]))
输出结果:
如同我们在列表里所做的那般,我们可以通过在方括号中指定项目所处的位置来访问元祖中的各个项目。这种使用方括号的形式被称为**索引(Indexing)**运算符.
一个空的元素由一对圆括号组成,就像
myempty=()
这样.然而,一个只拥有一个项目的元祖并不像这样简单.你必须在第一个项目的后边加上一个逗号来指定它,如此一来python才可以识别出在这个表达式想表达的是一个元组还是一个对象.如果你想指定一个包含项目2的元组你必须指定singleton=(2,)
字典就像一本地址簿,如果你知道某人的姓名你就可以找到对方更多详细的信息,我们将键值(Keys)和值(Values)相互联系在一起.需要注意的是键值必须是唯一的。
需要重点注意的是:你只能使用不可变的对象作为字典的键值,
但是你可以使用可变或者不可变的对象作为字典中的值.
在字典中你可以通过使用符号构成 d = {key:value1,key2:value2}
这样的形式来制定对应的键值对.
另外,在字典中成对的键值对不会以任何方式进行排序.如果你希望为它们安排一个特别的次序,只能在使用他们之前进行排序.
案例(ds_using_dict.py)
ab = {
'Swaroop':'[email protected]',
'Larry':'[email protected]',
'Matsumoto':'[email protected]',
'Spammer':'[email protected]'
}
print("Swaroop's address is ",ab['Swaroop'])
del ab['Spammer']
print('\n There are {} contacts in the address-book\n'.format(len(ab)))
for name,address in ab.items():
print('Contact {} at {}'.format(name,address))
ab['Guido'] = '[email protected]'
if 'Guido' in ab:
print("\nGuido's address is",ab['Guido'])
输出:
我们可以通过索引运算符来制定某一个键值以访问相应的键值配对.
我们可以通过
del
语句来删除某一个键值-值配对.
通过
item
方法来访问字典中的每一对键值-值配对信息.
如果想增加一对新的键值-值配对,我们可以简单的通过使用索引郁金算符访问一个键值并为之分配相应的值.
我们可以通过
in
运算符来检查某对键值-值配对是否存在.
如果你曾经在函数中使用过关键字参数,那么你就已经使用过字典了。当你在你的函数中访问某一变量时,它其实就是访问字典中的某个函数.(在编译器设计术语中,这叫做符号表[Symbol Table])
序列(Sequence) 有两种表现形式:
- 列表(List)
- 元祖(Tuples)
- 字符串(Characters)
序列的主要功能:
- 资格测试(Membership Test) 也就是
in
与not in
表达式 - 索引操作(Indexing Operations) 他们能够允许我们直接获取序列中的特定项目
上面所提到的序列的三种状态,同样有一种切片(Slicing)运算符,它能够允许我们序列中的某段切片--也就是序列中的一部分.
shoplist = ['apple','mango','carrot','banana']
name = 'swaroop'
# indexing or 'subscription' operation
print('Item 0 is',shoplist[0])
print('Item 1 is',shoplist[1])
print('Item 2 is',shoplist[2])
print('Item 3 is',shoplist[3])
print('Item -1 is',shoplist[-1]) # banana
print('Item -2 is',shoplist[-2]) # carrot
print('Character 0 is',name[0])
# slicing on a list
print('Item 1 to 3 is',shoplist[1:3]) # [1,3)
print('Item 2 to end is',shoplist[2:]) # from index 2 to the end
print('Item 1 to -1 is',shoplist[1:-1]) # not included the last one ,because -1 equals 3(last one)
print('Item start to end is',shoplist[:]) #all
# slicing on characters
print('characters 1 to 3 is',name[1:3]) #[1,3)
print('characters 2 to end is',name[2:]) # from index 2 to the end
print('characters 1 to -1 is',name[1:-1]) # from index 1 to the last one(not included)
print('characters start to end is',name[:]) # all
输出结果:
需要特别注意的一点切片操作中,数字是可选的,但是冒号
:
却不是 第一个数字是切片开始的位置,第二个位置是切片结束的位置,重点强调包括开始的位置,但是不包括结束的位置
同样的在切片操作中还提供的第三个参数,叫做步长(Step)默认的步长是1
>>> shoplist = ['apple','mango','carrot','banana']
>>> shoplist[::1]
['apple','mango','carrot','banana']
>>> shoplist[::2]
['apple','carrot']
>>> shoplist[::3]
['apple','banana']
>>> shoplist[::-1]
['banana','carrot','mango','apple']
序列的一大优点在于你可以使用同样的方式去访问元祖、列表、字符串.
集合(Set)是简单对象的无序集合(Collection).
通过使用集合可以测试某些对象的资格或者情况,检查他们是否是其它集合的子集,找到两个集合的交集等等.
当你创建了一个对象并将值给某个变量时,变量会查阅(Refer)某个对象,并且它也不会代表对象本身.也就是说,变量名只是指向你计算机内存中存储了相应对象的那一部分.
这叫做将名称绑定(Binding)给哪一个对象.
案例(ds_refrences.py)
print('Simple Assignment')
shoplist = ['apple','mango','carrot','banana']
mylist = shoplist
del shoplist[0]
print('shoplist is ',shoplist)
print('mylist is ',mylist)
print('copy by making a full slice')
mylist = shoplist[:]
del mylist[0]
print('shoplist is ',shoplist)
print('mylist is ',mylist)
输出结果:
重要提示,如果你希望创作一份如薛烈等复杂对象的副本使用切片来完成 如果你仅仅将一个变量名赋予给另一个变量名,那么他们都会查阅同一个对象,如果你对此不够小心,那么他将造成很大的麻烦.
字符串也是一种对象,他也有自己很丰富的方法,可以做到检查字符串中的一部分,或者是去掉空格等几乎一切的事情.
下面是使用字符串的具体案例:(ds_str_methods.py)
name = 'Swaroop'
if name.startswith('Swa'):
print('Yes,the string starts with "Swa"')
if 'a' in name:
print('Yes,it contains the string "a"')
if name.find('war')!= -1:
print('Yes,it contains the string "war"')
delimiter = '_*_'
mylist = ['China','Brazil','Russia','India']
print(delimiter.join(mylist))
输出结果:
startswidth
用于检查查找的字符是否在字符串的开头
in
运算符可以检查给定的字符串是否是查询字符串的一部分
find
方法用于定位字符串给定的字符串的位置。如果找不到相应的字符串那么就会返回-1
str
类同样的还有一个简洁的方法用联结(Join)序列中的项目,其中字符串将会作为每一项目之间的分隔符.
我们已经学习了python语言的很多的一部分了,现在我们尝试来编写一个小程序来实战一下.
现在我想编写这样一个程序,它能够帮助我备份所有重要的文件
我们仔细想想这样的问题该如何解决?我们需要进一步的分析它
- 我们应该如何指定哪些文件是我们需要备份的?
- 它们应该如何备份?
- 备份后的文件需要存储到哪里?
下面我们来开始设计我们的程序,下面是我们程序应该如何运转的清单:
- 需要备份的文件与主目录应该在一份列表中予以指定
- 备份必须存储在一个主备份目录中
- 备份文件将打包压缩成zip文件
- zip压缩文件的文件名由当前日期和时间构成
- 我们使用在任何GNU/Linux或者Unix发行版本中都会默认提供标准的zip命令进行打包
将下述代码保存为 backup_ver1.py:
import os
import time
# 1.需要备份的文件与目录将被
# 指定在一个列表中
# 例如在windows中
# source = ['"C:\\My Documents"','c:\\Code']
# 如在Mac OS X 与 Linux下:
source = ['E:\\Coding\\es6study']
# 在这里需要在字符串中使用双引号,用以括起其中包含空格的名称
# 2.备份文件必须存储在一个主备份目录中
# 例如在windows 下:
# target_dir = 'E:\\Backup'
# 又例如在 Mac OS X 与 Linux 下:
target_dir = 'E:\\Testing'
# 3.备份文件将打包压缩成zip文件
# 4.zip压缩文件名由当前日期与时间构成
target = target_dir+os.sep+\
time.strftime('%Y%m%d%H%M%S')+'.zip'
# 如果目标目录文件不存在需要进行创建
if not os.path.exists(target_dir):
os.mkdir(target_dir)
# 5.我们用zip命令将文件打包成zip格式
zip_command = 'zip -r {0} {1}'.format(target,' '.join(source))
# 运行备份
print('Zip command is :')
print(zip_command)
print('Running:')
if os.system(zip_command) == 0:
print('Successful backup to',target)
else:
print('Backup Failed!')
由于文件的名字由当前日期与实践构成,这里通过
time.strftime()
函数来创建 在这里要注意os.sep
的使用方式--它将根据你的操作系统给出相应的操作符 在GNU/Linux 与 Unix 中它会是'/',在windows中它会是'\',在Mac OS中它会是':'time.strftime()
函数会遵循某些格式 我们可以使用os.system
函数的命令,这一函数可以使命令就像是在系统中运行的.
在第一个版本中已经能够工作,但是还有一个更好的文件命名机制-使用时间作为文件名,存储在以当前日期为名字的文件夹中,这一文件夹则照常存储在主备份目录下.
import os
import time
# 1.需要备份的文件与目录将被
# 指定在一个列表中
# 例如在windows中
# source = ['"C:\\My Documents"','c:\\Code']
# 如在Mac OS X 与 Linux下:
# source = ['/users/swa/notes']
source = ['E:\\Coding\\es6study']
# 在这里需要在字符串中使用双引号,用以括起其中包含空格的名称
# 2.备份文件必须存储在一个主备份目录中
# 例如在windows 下:
# target_dir = 'E:\\Backup'
# 又例如在 Mac OS X 与 Linux 下:
# target_dir = '/users/swa/backup'
target_dir = 'E:\\Testing'
# 如果目标目录文件不存在需要进行创建
if not os.path.exists(target_dir):
os.mkdir(target_dir)
# 3.备份文件将打包压缩成zip文件
# 4.zip压缩文件名由当前日期与时间构成
today = target_dir+os.sep+time.strftime('%Y%m%d')
# 将当前的时间作为zip文件的文件名
now = time.strftime('%H%M%S')
# ZIP 文件名称格式
target = today+os.sep+now+'.zip'
# 如果子目录尚不存在则创建一个
if not os.path.exists(today):
os.mkdir(today)
print('Successfully created directory',today)
# 5.我们用zip命令将文件打包成zip格式
zip_command = 'zip -r {0} {1}'.format(target,' '.join(source))
# 运行备份
print('Zip command is :')
print(zip_command)
print('Running:')
if os.system(zip_command) == 0:
print('Successful backup to',target)
else:
print('Backup Failed!')
通过
os.path.exists
函数来检查主文件目录中是否已经存在了以当前日期作为名称的子目录.如果尚未存在,我们通过os.mkdir
函数来创建一个.
我们希望用户在压缩文件的时候zip文件可以带上用户的说明.
保存为 backup_ver3.py
import os
import time
# 1.需要备份的文件与目录将被
# 指定在一个列表中
# 例如在windows中
# source = ['"C:\\My Documents"','c:\\Code']
# 如在Mac OS X 与 Linux下:
# source = ['/users/swa/notes']
source = ['E:\\Coding\\es6study']
# 在这里需要在字符串中使用双引号,用以括起其中包含空格的名称
# 2.备份文件必须存储在一个主备份目录中
# 例如在windows 下:
# target_dir = 'E:\\Backup'
# 又例如在 Mac OS X 与 Linux 下:
# target_dir = '/users/swa/backup'
target_dir = 'E:\\Testing'
# 如果目标目录文件不存在需要进行创建
if not os.path.exists(target_dir):
os.mkdir(target_dir)
# 3.备份文件将打包压缩成zip文件
# 4.zip压缩文件名由当前日期与时间构成
today = target_dir+os.sep+time.strftime('%Y%m%d')
# 将当前的时间作为zip文件的文件名
now = time.strftime('%H%M%S')
# 添加一条来自用户注释以创建
# zip 文件的文件名
comment = input('Enter a comment -->')
# 检查是否有评论键入
if len(comment) == 0:
target = today + os.sep+now+'.zip'
else:
target = today + os.sep + now +'_'+\
comment.replace(' ','_')+'.zip'
# 如果子目录尚不存在则创建一个
if not os.path.exists(today):
os.mkdir(today)
print('Successfully created directory',today)
# 5.我们用zip命令将文件打包成zip格式
zip_command = 'zip -r {0} {1}'.format(target,' '.join(source))
# 运行备份
print('Zip command is :')
print(zip_command)
print('Running:')
if os.system(zip_command) == 0:
print('Successful backup to',target)
else:
print('Backup Failed!')
注意本代码中在为用户评论修改zip文件名称时要注意使用'',注意区分物理行和逻辑行的区别
上面的程序已经能够对大多数用户来说都能令人满意地工作的脚本了.但是,我们不能仅仅满足于此,我们还可以通过添加-v
和-q
分别来表示显示详细信息和退出程序.
最重要的改进是不使用os.system的方法来创建归档文件,而是使用zipfile或者tarfile内置的模块来创建它们的归档文件.这是标准库的一部分,随时供你在电脑上没有zip程序外部依赖的情况下跑起来.
- what?
- how?
- do it!
- test
- use
- maintain
在之前我们编写的程序中都是面向过程的(Procedure-oriented)的编程方式,但是接下来我们要学习一种更为先进的**方法面向对象编程.
类与对象是面向对象编程的两个主要的方面。一个类能够创建一种新的类型,其中对象是类的实例.
- 字段(Field): 从属于对象或者类的变量叫做字段
- 方法(Method): 属于类的函数来实现某些功能
字段和方法统称为类的属性(Attribute)
字段有两种类型
- 实例变量(Instance Variables)
- 类变量(Class Variables)
类方法与普通函数只有一种特定的区别--前者必须有一个额外的名字,这个名字必须添加到参数列表的开头,但是你不用再你调用这个功能时为这个参数赋值.python 会为这种特定的变量引用是对象本身,他被赋予self
这一名称.
python 中的self 相当于c++中的指针和java和c#中的this指针
最简单的类(class)可以通过下面的案例来展示(保存为oop_simplestclass.py)
class Person:
pass
p = Person()
print(p)
输出:
案例:
class Person:
def say_hi(self):
print('Hello,how are you?')
p = Person()
p.say_hi()
# 同样可以写作:Person().say_hi()
python类中,有不少方法的名称具有特殊的意义.现在我们要了解的就是__init__方法的意义. __init__方法会在类的对象呗实例化时立即运行.这一方法可以对任何你想进行操作的木白哦对象进行初始化(Initialization)
案例:
class Person:
def __init__(self,name):
self.name = name
def say_hi(self):
print('Hello,my name is ',self.name)
p = Person('chenpeng')
p.say_hi()
# 同样的也可以这样写Person('Swaroop').say_hi()
输出结果:
特别注意的是
self.name
是这个叫name的东西是self对象的一部分,而name则是一个局部变量.
我们已经讨论过了类与对象的功能部分,现在我们学习书籍部分。 字段只不是绑定到类与兑现国的命名空间(Namespace).字段(Field)有两种类型-类变量和对象变量
- 类变量(Class Variable)是共享的,可以被术语该类的所有实例访问.
- 对象变量(Object Variable)由类的每一个独立的对象或实例所拥有.每个对象都拥有属于它自己字段的副本,也就是说他们不会被共享.
案例:
# coding=UTF-8
class Robot:
"""表示有一个带有名字的机器人"""
# 一个类变量,用来技术机器人的数量
population = 0
def __init__(self,name):
"""初始化数据"""
self.name = name
print("(Initializing({}))".format(self.name))
# 当有机器人被创建时,机器人会增加人口的数量
Robot.population += 1
def die(self):
"""我挂了"""
print("{} is being destroyed!".format(self.name))
Robot.population -= 1
if Robot.population == 0:
print("{} was the last one.".format(self.name))
else:
print("There are still {:d} robots working".format(Robot.population))
def say_hi(self):
"""来自机器人真诚的问候"""
print('Gretting,my master call me {}.'.format(self.name))
@classmethod
def how_may(cls):
"""打印当前的人口数量"""
print("we have {:d} robots.".format(cls.population))
droid1 = Robot("r2-D2")
droid1.say_hi()
Robot.how_may()
droid2 = Robot("C-3P0")
droid2.say_hi()
Robot.how_may()
print("\nRobots con do some work here.\n")
print("Robots have finished their work,So let's destory them")
droid1.die()
droid2.die()
Robot.how_may()
输出结果:
population
属于Robot
类,它是一个类变量.name 变量属于一个对象,故他是一个对象变量除了使用
Robot.population
,我们还可以使用self.__class__.population
,因为每个对象都通过self.__class__
属性来引用它的类.
how_many
实际上是一个属于类而非属于对象的方法,这就意味着我们将它定义为一个classmethod
(类方法)或是一个staticmethod(静态方法)
.我们使用装饰器(Decorator)来将
how_many
方法标记为类方法.
@classmethod
装饰器等价于调用:`how_many = classmethod(how_many)只能使用self来引用同一对象的变量与方法,这被称作属性引用(Attribute Reference)
我们还可以通过
Robot.__doc__
访问类的文档字符串,对于方法字符串可以使用Robot.say_hi.__doc__
所有的类成员都是公开的,但是在pyton中有这样一个约定,如果使用数据成员并在名字中使用双下划线作为前缀诸如
__privatevar
这样的形式,python会使用名称调整(Name-mangling)来使其有效地成为一个私有变量.另外,所有的类成员(包括数据成员)都是公开的,并且python中所有的方法都是虚拟的(Virtual)
面向对象编程的一个优点就是代码的重用(Reuse),重用的一种实现方法就是继承机制.
案例:
# coding=UTF-8
class SchoolMember:
'''代表任何学校里的人员'''
def __init__(self,name,age):
self.name = name
self.age = age
print('(Initialized schoolMember:{})'.format(self.name))
def tell(self):
'''告诉我有关我的细节'''
print('Name:{},age:{}'.format(self.name,self.age))
class Teacher(SchoolMember):
'''代表一位老师'''
def __init__(self,name,age,salary):
SchoolMember.__init__(self,name,age)
self.salary = salary
print('(Initialized Teacher:{})'.format(self.name))
def tell(self):
SchoolMember.tell(self)
print('Salray:{:d}'.format(self.salary))
class Student(SchoolMember):
'''代表一位学生'''
def __init__(self,name,age,marks):
SchoolMember.__init__(self,name,age)
self.marks = marks
print('(Initialized Student:{})'.format(self.name))
def tell(self):
SchoolMember.tell(self)
print('Marks:{:d}'.format(self.marks))
t = Teacher('Mrs.Chen',24,6000)
s = Student('chenpeng',23,10000)
print()
members = [t,s]
for member in members:
member.tell()
结果:
python 不会自动调用基类构造函数你必须自己显式的调用它 如果我们没有在一个子类中定义一个__init__方法,python将会自动调用基类的构造函数
如果继承元素中有多个,被称为多重继承(Multiple Inheritance)
如果你希望获取用户输入的内容,并向用户打印出这一些返回结果,我们可以通过input()
函数和print()
函数来实现这一需求.
你可以使用rjust
方法来获取一个右对齐指定宽度的字符串.
另一个常见的输入输出的类型就是处理文件.
案例:(io_input.py)
def reverse(text):
return text[::-1]
def is_palindrome(text):
return text == reverse(text)
something = input("Enter text:")
if is_palindrome(something):
print('yes,it is a palidrome')
else:
print('no,it is not a palindrome')
该程序主要判断字符串是否为回文 利用切片来将字符串取反[::-1]
你可以创建一个属于file类对象并适当使用它的read,readline,write
方法来打开或者使用文件,并对它们进行读取或者写入.
你可以调用close
方法来告诉pyton你已经完成了对该文件的使用.
案例:(io_using_file.py)
poem = '''\
Programming is fun
when the work is done
if you wanna make your work also fun:
use python!
'''
# 打开文件以编辑('w'riting)
f = open('poem.txt','w')
# 向文件中编写文本
f.write(poem)
# 关闭文本
f.close()
# 如果没有特别指定
# 将假定启用默认的阅读('r'ead)模式
f = open('poem.txt')
while True:
line = f.readline()
# 零长度指示 EOF
if len(line) == 0:
break
print(line,end='')
#关闭文件
f.close()
运行结果:
我们使用内置的open
函数并制定文件名以及我们所希望使用的打开模式来打开一个文件.打开模式可以是:
- 阅读模式('r')
- 写入模式('w')
- 追加模式('a')
我们还可以选择是通过文本模式('t')还是二进制模式('b')来读取,x写入或者追加文本.
我们在循环中使用readline
方法来读取文件的每一行,当一个空字符串返回时表示我们已经找到了文件的末尾.
我不得不禁叹python真的太方便,太强大了!
python提供了一个叫做pickle
的标准模块,通过它你可以将任何纯python对象存储到一个文件中,并在稍后将其取回.这叫做持久地(Persistently)存储对象.
案例(io_pickle.py)
import pickle
shoplistfile = 'shoplist.data'
shoplist = ['apple','mango','carrot']
f = open(shoplistfile,'wb')
pickle.dump(shoplist,f)
f.close()
del shoplist
f = open(shoplistfile,'rb')
storedlist = pickle.load(f)
print(storedlist)
输出结果:
我们将一个对象存储到一个文件中,我们首先需要通过open以写入二进制的模式打开,然后调用pickle模块的dump函数,这一个过程叫做封装. 接着我们通过pickle模块的load函数接受返回的对象,这个过程叫做拆封.
截止到目前我们使用的只是简单的英文字符,如果我们使用的是中文我们需要使用unicode 类型.
当我们阅读或写入某一文件或当我们希望与互联网上其他的计算机通信时,我们需要将我们的unicode字符串能够转换至一个能够被发送和接受的格式,这个格式叫做utf-8.
案例:
# encoding=utf-8
import io
f = io.open('abc.txt','wt',encoding="utf-8")
f.write(u"Imagine none-English language here")
f.close()
text = io.open('abc.txt',encoding="utf-8").read()
print(text)
输出:
每当我们诸如上面那样使用unicode字面量编写一款程序时,我们必须确保python已经被告知我们使用的是utf-8,因此我们必须将#encoding=utf-8这一注释放在我们程序的顶端. 我们使用io.open并提供了编码与解码参数来告诉python我们正在使用unicode.
当程序出现例外的情况就会发生异常(Exception).
如果我们在编写代码时候不小心平措了单词,python就会跑出一个语法错误.
注意到一个NameError的错误会被抛出,同时python还会打印出检测到的错误发生的位置.这就是一个错误处理器(Error Handler)为这个错误所做的事情.
我们尝试读取用户输入的内容,如果按下ctrl-d:
>>>s = input('enter something')
Enter something --> Traceback (most recent call last):
File "<stdin>", line 1, in <module>
EOFError
我们可以通过使用try..except
来处理异常的情况.
案例(exceptions_handle.py):
try:
text = input('enter something-->')
except EOFError:
print('why did you do an eof one me?')
except KeyboardInterrupt:
print('You cancelled the operation')
else:
print('you entered {}'.format(text))
输出结果:
else 子句在没有发生异常的时候执行
我们可以通过raise语句来引发一次异常,具体的方法就是提供错误名称或者异常名以及要跑出的异常的对象.
案例:(exceptions_raise.py)
假设你正在读取其中的一份文件,你应该如何确保文件对象被正确关闭,无论是否会发生异常,可以通过finally来完成.
案例(exceptions_finally.py)
import sys
import time
f = None
try:
f = open('poem.txt')
while True:
line = f.readline()
if len(line) == 0:
break
print(line,end = ' ')
sys.stdout.flush()
print('-------press ctrl+c now-------')
time.sleep(2)
except IOError:
print('could not find file poem.txt')
except KeyboardInterrupt:
print("! you cancelled the reading from the line.")
finally:
if f:
f.close()
print('cleaning up:closed the file')
输出:
在try中获取资源然后在finally中释放资源使用常见的模式,因此还有一个with语句使得这一过程可以以一种干净的姿态得以完成.
案例:(exceptions_using_with.py)
with open("poem.txt") as f:
for line in f:
print(line,end='')
它会在代码开始之前调用thefile.__enter__函数,在代码执行完毕之后调用thefile.__exit__
python的标准库(Python Standrad Library)包含了大量有用的模块,同时也是每个标准python安装包中的一部分,熟悉python标准库十分重要,你要你数值这些苦就可以做到很多事情.
sys模块包含一个version元祖可以提供给我们版本信息.
案例:
import os
import platform
import logging
if platform.platform().startswith('Windows'):
logging_file = os.path.join(os.getenv('HOMEDRIVE'),
os.getenv('HOMEPATH'),
'test.log')
else:
logging_file = os.path.join(os.getenv('HOME'),
'test.log')
print('logging to',logging_file)
logging.basicConfig(
level=logging.DEBUG,
format='%(asctime)s:%(levelname)s:%(message)s',
filename=logging_file,
filemode='w'
)
logging.debug('start of the program')
logging.info('doing something')
logging.warning('dying now')
结果:
我们使用了三个模块:
- os模块用于和操作系统交互
- platform用于获取操作系统的信息
- logging用来记录信息
更多的功能模块参考python library
到这里python的大部分内容已经涉及到了,现在我们再来探讨其他的一些方面,让我对python的认识更加全面.
你希望一个函数返回多个值吗?python是可以轻松做到的!
这意味有一个快速的方法来交换两个元素的值:
诸如__init__和__del__ 等一些方法对于类来说有特殊的意义
比如说你希望使用x[key]操作,你只需要实现__getitem__()
方法
下面列出了一些特殊的方法:
我们已经见识过每一个与语句块都由其自身的缩进级别与其他部分相区分.如果你的语句块只包括单独的一句语句,你可以在同一行指定它.
案例:
points = [{'x':2,'y':3},
{'x':4,'y':1}]
points.sort(key=lambda i:i['y'])
print(points)
输出:
listone = [2,3,4]
listtwo = [2*i for i in listone if i>2]
print(listtwo)
结果:
有一种特殊的方法,即分别使用* 或者 ** 作为元祖或者字典的前缀.
- *一个星号将传递元组
- **两个星号传递字典
assert用于断言某事是真的,当断言失败时就会抛出AssertionError.
装饰器(Decorators)是应用包装函数的快捷方式,这将有利于不断地对一些功能代码一遍又一遍的包装.
例如我们自己创建了一个retry
的装饰器,我们可以将其运用到任何函数之中,如果在一次运行中抛出了任何错误,他就会尝试重新运行,知道最大次数为5 次.
实例代码:
from time import sleep
from functools import wraps
import logging
logging.basicConfig()
log = logging.getLogger('retry')
# 定义retry
def retry(f):
@wraps(f)
def wrapped_f(*args,**kwargs):
MAX_ATTEMPTS = 5
for attempt in range(1,MAX_ATTEMPTS+1):
try:
return f(*args,**kwargs)
except:
log.exception("Attempt %s/%s failed: %s",
attempt,
MAX_ATTEMPTS,
(args,kwargs))
# 休眠
sleep(10*attempt)
log.critical('All is %s attempts failed:%s',
MAX_ATTEMPTS,
(args,kwargs))
return wrapped_f
counter = 0
@retry
def save_to_database(arg):
print('write to a database or make a net work call or etc.')
print('this will be automatically retried if exceptions is thrown.')
global counter
counter += 1
if counter < 2:
raise ValueError(arg)
if __name__ == "__main__":
save_to_database("some bad value")
输出结果:
红色的并不是代码有问题,而是程序故意在counter<2的时候故意抛出的异常,然后装饰器会没间隔一段时间去重新调用函数.如果尝试的次数超过5次则代表调用函数失败.