第八章
面向对象和正则表达式
8.1面向对象编程(OOP)术语概述
(1)类(Class)
用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。
(2)类变量
类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。
(3)数据成员
类变量或者实例变量,用于处理类及其实例对象的相关的数据。
(4)方法重写
如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override),也称为方法的重写。
(5)局部变量
定义在方法中的变量,只作用于当前实例的类。
(6)实例变量
在类的声明中,属性是用变量来表示的。这种变量就称为实例变量,是在类声明的内部但是在类的其他成员方法之外声明的。
(7)继承
即一个派生类(derivedclass)继承基类(baseclass)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。
(8)实例化
创建一个类的实例,类的具体对象。
(9)方法
类中定义的函数。
(10)对象
通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。
8.2创建类
使用class语句来创建一个新类,class之后为类的名称并以冒号结尾:
类的帮助信息可以通过ClassName.__doc__查看,class_suite由类成员,方法,数据属性组成。
看下面类的简单例子:
empCount变量是一个类变量,它的值将在这个类的所有实例之间共享。可在内部类或外部类使用Employee.empCount访问。
第一种方法__init__()方法是一种特殊的方法,被称为类的构造函数或初始化方法,当创建了这个类的实例时就会调用该方法
self代表类的实例,self在定义类的方法时是必须有的,虽然在调用时不必传入相应的参数。
类的方法必须有一个额外的第一个参数名称,这是跟普通函数的区别。
上面例子执行结果为:
从运行结果可以看出,self代表的是类的实例,代表当前对象的地址,而self._class_则指向类。
self不是python关键字,我们换成其他参数也是可以正常执行:
以上实例执行结果为:
8.3创建实例对象
实例化类其他编程语言中一般用关键字new,但是在Python中并没有这个关键字,类的实例化类似函数调用方式。
以下使用类的名称Employee来实例化,并通过__init__方法接收参数。
"创建Employee类的第一个对象"
emp1=Employee("LiQiang",)
"创建Employee类的第二个对象"
emp2=Employee("WangXing",)
8.4访问属性
您可以使用点号.来访问对象的属性。使用如下类的名称访问类变量:
emp1.displayEmployee()
emp2.displayEmployee()
print"TotalEmployee%d"%Employee.empCount
实例
执行以上代码输出结果如下:
你可以添加,删除,修改类的属性,如下所示:
emp1.age=7#添加一个age属性
emp1.age=8#修改age属性
delemp1.age#删除age属性
你也可以使用以下函数的方式来访问属性:
getattr(obj,name[,default])
访问对象的属性。
getattr(emp1,age)#返回age属性的值
hasattr(obj,name)
检查是否存在一个属性。
hasattr(emp1,age)#如果存在age属性返回True。
setattr(obj,name,value)
设置一个属性。如果属性不存在,会创建一个新属性。
setattr(emp1,age,8)#添加属性age值为8
delattr(obj,name)
删除属性。
delattr(emp1,age)#删除属性age
8.5Python内置类属性
__dict__:类的属性(包含一个字典,由类的数据属性组成)
__doc__:类的文档字符串
__name__:类名
__module__:类定义所在的模块(类的全名是__main__.className,如果类位于一个导入模块mymod中,那么className.__module__等于mymod)
__bases__:类的所有父类构成元素(包含了一个由所有父类组成的元组)
Python内置类属性调用实例如下:
实例
执行以上代码输出结果如下:
8.6python对象销毁(垃圾回收)
Python使用了引用计数技术来跟踪和回收垃圾。在其内部记录着所有使用中的对象各有多少引用。
一个内部跟踪变量,称为一个引用计数器。
当对象被创建时,就创建了一个引用计数,而当这个对象不再需要时,引用计数变为0,它被垃圾回收。但是回收不是"立即"的,由解释器在适当的时机,将垃圾对象占用的内存空间回收。
a=40#创建对象40
b=a#增加引用,40的计数
c=#增加引用.40的计数
dela#减少引用40的计数
b=#减少引用40的计数
c[0]=-1#减少引用40的计数
垃圾回收机制不仅针对引用计数为0的对象,同样也可以处理循环引用的情况。循环引用是指两个对象相互引用,但没有其他变量引用他们。在这种情况下,仅仅使用引用计数是不够的。Python的垃圾收集器实际上是一个引用计数器和一个循环垃圾收集器。作为引用计数的补充,垃圾收集器也会留心被分配的总量很大(即未通过引用计数销毁的那些)的对象。在这种情况下,解释器会暂停下来,试图清理所有未引用的循环。
析构函数__del__,__del__在对象销毁的时候被调用,当对象不再被使用时,__del__方法运行:
实例
以上实例运行结果如下:
注意:通常你需要在单独的文件中定义一个类,
8.7类的继承
面向对象的编程带来的主要好处之一是代码的重用,实现这种重用的方法之一是通过继承机制。
通过继承创建的新类称为子类或派生类,被继承的类称为基类、父类或超类。
继承语法
class派生类名(基类名)
...
在python中继承中的一些特点:
1、如果在子类中需要父类的构造方法就需要显式的调用父类的构造方法,或者不重写父类的构造方法。
2、在调用基类的方法时,需要加上基类的类名前缀,且需要带上self参数变量。区别在于类中调用普通函数时并不需要带上self参数
3、Python总是首先查找对应类型的方法,如果它不能在派生类中找到对应的方法,它才开始到基类中逐个查找。(先在本类中查找调用的方法,找不到才去基类中找)。
4、如果在继承元组中列了一个以上的类,那么它就被称作"多重继承"。
派生类的声明,与他们的父类类似,继承的基类列表跟在类名之后,如下所示:
语法:
classSubClassName(ParentClass1[,ParentClass2,...]):
...
实例
以上代码执行结果如下:
你可以继承多个类
classA:#定义类A
.....
classB:#定义类B
.....
classC(A,B):#继承类A和B
.....
你可以使用issubclass()或者isinstance()方法来检测。
issubclass()-布尔函数判断一个类是另一个类的子类或者子孙类,语法:issubclass(sub,sup)
isinstance(obj,Class)布尔函数如果obj是Class类的实例对象或者是一个Class子类的实例对象则返回true。
8.8方法重写
如果你的父类方法的功能不能满足你的需求,你可以在子类重写你父类的方法:
实例:
执行以上代码输出结果如下:
8.8.1基本重载方法
下表列出了一些通用的功能:
8.8.2运算符重载
Python同样支持运算符重载:
实例
以上代码执行结果如下所示:
8.9类属性与方法
8.9.1类的私有属性
__private_attrs:两个下划线开头,声明该属性为私有,不能在类的外部被使用或直接访问。在类内部的方法中使用时self.__private_attrs。
8.9.2类的方法
在类的内部,使用def关键字可以为类定义一个方法,与一般函数定义不同,类方法必须包含参数self,且为第一个参数
8.9.3类的私有方法
__private_method:两个下划线开头,声明该方法为私有方法,不能在类的外部调用。在类的内部调用self.__private_methods
实例
编译通过后运行上面实例如下:
运行后报异常:在程序第14行。Python不允许实例化的类访问私有数据。
但你可以使用object._className__attrName(对象名._类名__私有属性名)访问属性,参考以下实例:
执行以上代码,执行结果如下:
8.10单下划线、双下划线、头尾双下划线说明:
__foo__:定义的是特殊方法,一般是系统定义名字,类似__init__()之类的。
_foo:以单下划线开头的表示的是protected类型的变量,即保护类型只能允许其本身与子类进行访问,不能用于frommoduleimport*
__foo:双下划线的表示的是私有类型(private)的变量,只能是允许这个类本身进行访问了。
8.11正则表达式
正则表达式是一个特殊的字符序列,它能帮助我们方便的检查一个字符串是否与某种模式匹配。这节我们主要介绍一下Python常用的正则表达式处理函数。
8.11.1re.match函数
函数功能:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
基本语法:re.match(pattern,string,flags=0)
参数说明:
pattern
匹配的正则表达式
string
要匹配的字符串。
flags
标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
下面我们来看一个实例:
以上实例运行输出结果为:
re.match方法匹配成功返回一个匹配的对象,否则返回None。
我们可以使用group(num)或groups()匹配对象函数来获取匹配表达式:
group(num=0)
匹配的整个表达式的字符串,group()可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups()
返回一个包含所有小组字符串的元组,从1到所含的小组号。
下面我们看实例:
以上实例执行结果如下:
8.11.2re.search()方法
re.search()方法用于扫描整个字符串并返回第一个成功的匹配。
基本语法:re.search(pattern,string,flags=0)
参数说明:
pattern
匹配的正则表达式
string
要匹配的字符串。
flags
标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
如果re.search()方法匹配成功,则返回一个匹配的对象,否则返回None。
实例演示:
以上实例运行输出结果如下:
实例演示:
以上实例运行输出结果如下:
8.11.3re.match()与re.search()的区别
re.match()只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search()匹配整个字符串,直到找到一个匹配。
实例
#!/usr/bin/python
importre
line="Catsaresmarterthandogs";
matchObj=re.match(rdogs,line,re.M
re.I)
ifmatchObj:
print("match--matchObj.group():",matchObj.group())
else:
print("Nomatch!!")
matchObj=re.search(rdogs,line,re.M
re.I)
ifmatchObj:
print("search--searchObj.group():",matchObj.group())
else:
print("Nomatch!!")
以上实例运行输出结果如下:
8.11.4检索和替换
re模块提供了re.sub()用于替换字符串中的匹配项。
基本语法:re.sub(pattern,repl,string,count=0,flags=0)
参数说明:
pattern:正则中的模式字符串。
repl:替换的字符串,也可为一个函数。
string:要被查找替换的原始字符串。
count:模式匹配后替换的最大次数,默认0表示替换所有的匹配。
实例
以上实例运行输出结果如下:
下面这个例子,利用自定义函数double,将字符串S中匹配到的数字乘以2并返回:
上面实例中,字符串S的第4、5、6、8、9、12、13和14位对应的数字分别为:3、4、5、2、8、1、6和3,将数字乘以2后,得到新的字符串“abcG56MY”:
8.11.5re.