第 25 章 面向对象的 Lisp
第 25 章 面向对象的 Lisp
本章讨论了 Lisp 中的面向对象编程。Common Lisp 提供了一组操作符可供编写面向对象的程序时使用。
这些操作符和起来,并称为 Common Lisp Object System,或者叫 CLOS 。在这里我们不把 CLOS仅仅看作一种编写面向对象程序的手段,而把它本身就当成一个 Lisp 程序。从这个角度来看待 CLOS是理解 Lisp 和面向对象编程之间关系的关键。
25.1 万变不离其宗
面向对象的编程意味着程序组织方式的一次变革。历史上的另一个变化与这个变革有几分类似,即发生在处理器计算能力分配方式上的变化。在 1970 年代,多用户计算机系统指的就是联接到大量哑终端的一两个大型机。时至今日,这个词更有可能说的是大量用网络互相联接的工作站。现在,系统的处理能力散布于多个独立用户中,而不是集中在一台大型计算机上。
这与面向对象编程有很大程度上的相似,后者把传统的程序结构拆分开来:它不再让单一的程序逻辑去操纵那些被动的数据,而是让数据自己知道该做些什么,程序逻辑就隐含在这些新的数据 "对象" 间的交互过程之中。
举例来说,假设我们要算出一个二维图形的面积。解决这个问题的一个办法就是写一个单独的函数,让它检查参数的类型,然后分情况处理:
(defun area (x)
(cond ((rectangle-p x) (* (height x) (width x)))
((circle-p x) (* pi (expt (radius x) 2)))))
面向对象的方法则是让每种对象自己就能够计算出自身的面积。area 这个函数就被拆开,同时每条语句都被分到对象的对应类型中去,比如rectangle 类可能就会看起来像这样:
#'(lambda (x) (* (height x) (width x)))
至于 circle 则会是这样:
#'(lambda (x) (* pi (expt (radius x) 2)))
在这种模式下,我们向对象询问该对象的面积,然后对象则根据所属类型所提供的方法来作出回应。
CLOS 的到来似乎意味着 Lisp 正在改变自己,以拥抱面向对象的编程方式。与其这样说,不如改成:Lisp 还在墨守成规,用老样子来拥抱面向对象编程,这样还确切一些。不过 Lisp 中的那些基本概念没有名字,面向对象编程却有,所以时下有种趋势要把 Lisp 算成面向对象的语言。另一种说法:Lisp 是一门可扩展的语言,在这种语言里,面向对象编程的机制和结构可以轻松实现,这种说法恐怕更接近真相。
由于 CLOS 是原来就有的,所以把 Lisp 说成面向对象的编程语言并没有误导。然而,如果就这样看待 Lisp 未免太小觑它了。诚然,Lisp 是一种面向对象的编程语言,但是原因并不是它采纳了面向对象的编程模式。
事实在于,这种编程模式只是 Lisp 的抽象系统提供的又一种可能性而已。为了证明这种可能性,我们有了 CLOS 一个Lisp 程序,它让Lisp 成为了一门面向对象的语言。
本章的主旨在于:通过把 CLOS 作为一个嵌入式语言的实例来研究,进而揭示 Lisp 和面向对象编程之间的联系。这同时也是了解 CLOS 本身的一个很好的手段,要学习一个编程语言的特性,没什么方法能比了解这个特性的实现更有效的了。在第 7.6 节,那些宏就是用这种方式来讲解的。下一节将会有一个类似的对面向对象抽象是如何建立在 Lisp 之上的一个粗略的介绍。其中提到的程序将被第 25.3 节到第 25.5 节作为一个基准实现来参考。
25.2 阳春版 Lisp 中的对象
我们可以用 Lisp 来模拟各种各样不同种类的语言。有一种特别直接的办法可以把面向对象编程的理念对应到Lisp 的基本抽象机制上。不过, CLOS 的庞大规模让我们难以认清这个事实。因此,在我们开始了解 CLOS 能让我们做什么之前,不妨先看看我们用最原始的Lisp 都能干些什么。
我们在面向对象编程中想要的大多数特性,其实在Lisp 里面已经有了。我们可以用少得出奇的代码来得
到剩下的那部分。在本节中,我们将会用两页纸的代码实现一个对象系统,这个系统对于相当多真实的应
用已经够用了。面向对象编程,简而言之,就是:
-
具有属性的对象
-
它能对各种消息作出反应,
- 而且对象能从它的父对象继承相应的属性和方法。
在 Lisp 里面已经有好几种存放成组属性的方法。其中一种就是把对象实现成哈希表,把对象的属性作为哈希表里的表项。这样我们就可以用 gethash 来访问指定的属性:
(gethash 'color obj)
由于函数是数据对象,我们同样可以把它们当作属性保存起来。这就是说,我们的对象系统也可以有方法了,要调用对象的特定方法就 funcall 一下哈希表里的同名属性:
(funcall (gethash 'move obj) obj 10)
据此,我们可以定义一种 Smalltalk 风格的消息传递语法:
(defun tell (obj message &rest args)
(apply (gethash message obj) obj args))
这样的话,要告诉 (tell) obj 移动 10 个单位,就可以说
(tell obj 'move 10)
事实上,阳春版 Lisp 唯一缺少的要素就是继承机制,不过我们可以用六行代码来实现一个初步的版本,这个版本用一个递归版的 gethash 来完成这个功能:
(defun rget (obj prop)
(multiple-value-bind (val win) (gethash prop obj)
(if win
(values val win)
(let ((par (gethash 'parent obj)))
(and par (rget par prop))))))
如果我们在原本用 gethash 的地方用 rget ,就会得到继承而来的属性和方法。如此这般,就可以指定对象的父类:
(setf (gethash 'parent obj) obj2)
到现在为止,我们只是有了单继承 即一个对象只能有一个父类。不过我们可以把 parent 属性改成一个列表,这样就能有多继承了,如 [示例代码 25.1] 中定义的 rget 。
[示例代码 25.1] 多继承
(defun rget (obj prop)
(some2 #'(lambda (a) (gethash prop a))
(get-ancestors obj)))
(defun get-ancestors (obj)
(labels ((getall (x)
(append (list x)
(mapcan #'getall
(gethash 'parent x)))))
(stable-sort (delete-duplicates (getall obj))
#'(lambda (x y)
(member y (gethash 'parents x))))))
(defun some2 (fn lst)
(if (atom lst)
nil
(multiple-value-bind (val win) (funcall fn (car lst))
(if (or val win)
(values val win)
(some2 fn (cdr lst))))))
在单继承体系里面,当我们需要得到对象的某个属性时,只需要递归地在对象的祖先中向上搜索。如果在对象本身里面没有我们想要的属性信息时,就检查它的父类,如此这般直到找到。在多继承体系里,我们一样会需要做这样的搜索,但是这次的搜索会有点复杂,因为对象的多个祖先会构成一个图,而不再只是个简单列表了。我们不能用深度优先来搜索这个图。如果允许有多个父类,我们有如 [示例代码 25.2] 中所示的继承树:
a 继承自 b 和 c ,而 b 和 c 均继承于 d 。深度优先(或叫高度优先) 的遍历会依次走过 a、b、|d|、c 和d 。倘若想要的属性同时存在于在 d 和 c 里,那么我们将会得到 d 中的属性,而非 c 中的。这种情况会违反一个原则:即子类应当会覆盖基类中提供的缺省值。
d
b c
a
[示例代码 25.2]: 到同一基类的多条路径
如果需要实现继承系统的基本理念,我们就绝不能在检查一个对象的子类之前,提前检查该对象。在本例中,正确的搜索顺序应该是a、b、c、d 。那怎么样才能保证搜索的顺序是先尝试子孙再祖先呢?最简单的办法是构造一个列表,列表由原始对象的所有祖先构成,然后对列表排序,让列表中没有一个对象出现在它的子孙之前,最后再依次查看每个元素。
get-ancestors 采用了这种策略,它会返回一个按照上面规则排序的列表,列表中的元素是对象和它的祖先们。为了避免在排序时把同一层次的祖先顺序打乱,get-ancestors 使用的是 stable-sort 而非 sort。
一旦排序完毕,rget 只要找到第一个具有期望属性的对象就可以了。(实用工具 some2 是 some 的一个修改版,它能适用于 gethash 这类用第二个返回值表示成功或失败的函数。)
对象的祖先列表中元素的顺序是先从最具体的开始,最后到最一般的类型。如果 orange 是citrus 的子类型,后者又是 fruit 的子类型,那么列表的顺序就会像这样:(orange citrus fruit)。
倘若有个对象,它具有多个父类,那么这些前辈的座次会是从左到右排列的。也就是,如果我们说
(setf (gethash 'parents x) (list y z))
那么当我们在搜索一个继承得来的属性时,y 就会优先于z 被考虑。举个例子,我们可以说爱国的无赖首先是一个无赖,然后才是爱国者:
> (setq scoundrel (make-hash-table)
patriot (make-hash-table)
patriotic-scoundrel (make-hash-table))
#<Hash-Table C4219E>
> (setf (gethash 'serves scoundrel) 'self
(gethash 'serves patriot) 'country
(gethash 'parents patriotic-scoundrel)
(list scoundrel patriot))
(#<Hash-Table C41C7E> #<Hash-Table C41F0E>)
> (rget patriotic-scoundrel 'serves)
SELF
T
现在让我们对这个简陋的系统加以改进。可以从对象创建函数着手。这个函数将会在新建对象时,构造一个该对象祖先的列表。虽然当前的版本是在进行查询的时候构造这种表的,但是我们没有理由不把这件事情提前完成。[示例代码 25.3] 中定义了一个名为 obj 的函数,这个函数被用于生成新的对象,对象的祖先列表被保存在对象本身里。为了用上保存的祖先列表,我们同时重新定义了 rget 。
[示例代码 25.3] 用来新建对象的函数
(defun obj (&rest parents)
(let ((obj (make-hash-table)))
(setf (gethash 'parents obj) parents)
(ancestors obj)
obj))
(defun ancestors (obj)
(or (gethash 'ancestors obj)
(setf (gethash 'ancestors obj) (get-ancestors obj))))
(defun rget (obj prop)
(some2 #'(lambda (a) (gethash prop a))
(ancestors obj)))
另一个可以改进的地方是消息调用的语法。tell 本身是多余的东西,并且由于它的原因,动词被排到了第二位。这意味着我们的程序读起来不再像是熟悉的Lisp 前缀表达式了:
(tell (tell obj 'find-owner) 'find-owner)
我们可以通过把每个属性定义成函数来去掉tell 这种语法,如[示例代码 25.4] 所示。可选参数meth? 的值如果是真的话,那表示这个属性应该被当作方法来处理,否则它应该被当成一个slot,并径直返回rget 所取到的值。一旦我们把这两种属性中任一种,像这样定义好了:
(defprop find-owner t)
我们就可以用函数调用的方式来引用它,同时代码读起来又有 Lisp 的样子了:
[示例代码 25.4] 函数式的语法
(find-owner (find-owner obj))
(defmacro defprop (name &optional meth?)
'(progn
(defun ,name (obj &rest args)
,(if meth?
'(run-methods obj ',name args)
'(rget obj ',name)))
(defsetf ,name (obj) (val)
'(setf (gethash ',',name ,obj) ,val))))
(defun run-methods (obj name args)
(let ((meth (rget obj name)))
(if meth
(apply meth obj args)
(error "No ~A method for ~A." name obj))))
现在,原先的例子也变得更有可读性了:
> (progn
(setq scoundrel (obj))
(setq patriot (obj))
(setq patriotic-scoundrel (obj scoundrel patriot))
(defprop serves)
(setf (serves scoundrel) 'self)
(setf (serves patriot) 'country)
(serves patriotic-scoundrel))
SELF
T
在当前的实现里,对象中每个名字最多对应一个方法。这个方法要么是对象自己的,要么是通过继承得来的。要是能在这个问题上有更多的灵活性,允许把本地的方法和继承来的方法组合起来,那肯定会方便很多。比如说,我们会希望某个对象的 move 方法沿用其父类的 move 方法,但是除此之外还要在调用之前或者之后运行一些其它的代码。
为了让这个设想变成现实,我们将修改程序,加上 before、 after 和around 方法。before 方法让我们能吩咐程序,"先别急,把这事做完再说"。这些方法会在该方法中其余部分运行前,作为前奏,被先行调用。 after 方法让我们可以要求程序说,"还有,把这事也给办了"。而这些方法会作为收场在最后调用。在两者之间,我们会执行曾经自己就是整个方法的函数,现在被称为主方法(primarymethod)。它的返回值将被作为整个方法的返回值,即使 after 方法在其后调用。
before 和 after 方法让我们能用新的行为把主方法包起来。around 方法则以一种更奇妙的方法实现了这个功能。如果存在around 方法,那么被调用的就不再是主方法,而是around 方法。并且,around 方法有办法调用主方法(用call-next ,该函数在[示例代码 25.7] 中提供),至于调不调则是它的自由。
如[示例代码 25.5] 和[示例代码 25.6] 所示,为了让这些辅助的方法生效,我们对run-methods 和rget 加以了改进。在之前的版本里,当我们调用对象的某个方法时,运行的仅是一个函数:即最匹配的那个主函数。我们将会运行搜索祖先列表时找到的第一个方法。加上辅助方法的支持,调用的顺序将变成这样:
-
倘若有的话,先是最匹配的around 方法
-
否则的话,依次是:
(a) 所有的before 方法,从最匹配的到最不匹配的。
(b) 最匹配的主方法(这是我们以前会调用的)。
(c) 所有的 after 方法,从最不匹配的到最匹配的。
(defstruct meth around before primary after)
(defmacro meth- (field obj) (let ((gobj (gensym))) '(let ((,gobj ,obj)) (and (meth-p ,gobj) (,(symb 'meth- field) ,gobj)))))
(defun run-methods (obj name args) (let ((pri (rget obj name :primary))) (if pri (let ((ar (rget obj name :around))) (if ar (apply ar obj args) (run-core-methods obj name args pri))) (error "No primary ~A method for ~A." name obj))))
(defun run-core-methods (obj name args &optional pri) (multiple-value-prog1 (progn (run-befores obj name args) (apply (or pri (rget obj name :primary)) obj args)) (run-afters obj name args)))
(defun rget (obj prop &optional meth (skip 0)) (some2 #'(lambda (a) (multiple-value-bind (val win) (gethash prop a) (if win (case meth (:around (meth- around val)) (:primary (meth- primary val)) (t (values val win)))))) (nthcdr skip (ancestors obj))))
[示例代码 25.5]: 辅助的方法
(defun run-befores (obj prop args)
(dolist (a (ancestors obj))
(let ((bm (meth- before (gethash prop a))))
(if bm (apply bm obj args)))))
(defun run-afters (obj prop args)
(labels ((rec (lst)
(when lst
(rec (cdr lst))
(let ((am (meth- after
(gethash prop (car lst)))))
(if am (apply am (car lst) args))))))
(rec (ancestors obj))))
[示例代码 25.6]: 辅助的方法(续)
同时也注意到,方法不再作为单个的函数出现,它成了有四个成员的结构。现在要定义一个(主) 方法,不能再像这样说了:
(setf (gethash 'move obj) #'(lambda ...))
我们改口说:
(setf (meth-primary (gethash 'move obj)) #'(lambda ...))
基于上面、还有其它一些原因,我们下一步将会定义一个宏,让它帮我们定义方法。
[示例代码 25.7] 定义方法
(defmacro defmeth ((name &optional (type :primary))
obj parms &body body)
(let ((gobj (gensym)))
'(let ((,gobj ,obj))
(defprop ,name t)
(unless (meth-p (gethash ',name ,gobj))
(setf (gethash ',name ,gobj) (make-meth)))
(setf (,(symb 'meth- type) (gethash ',name ,gobj))
,(build-meth name type gobj parms body)))))
(defun build-meth (name type gobj parms body)
(let ((gargs (gensym)))
'#'(lambda (&rest ,gargs)
(labels
((call-next ()
,(if (or (eq type :primary)
(eq type :around))
'(cnm ,gobj ',name (cdr ,gargs) ,type)
'(error "Illegal call-next.")))
(next-p ()
,(case type
(:around
'(or (rget ,gobj ',name :around 1)
(rget ,gobj ',name :primary)))
(:primary
'(rget ,gobj ',name :primary 1))
(t nil))))
(apply #'(lambda ,parms ,@body) ,gargs)))))
(defun cnm (obj name args type)
(case type
(:around (let ((ar (rget obj name :around 1)))
(if ar
(apply ar obj args)
(run-core-methods obj name args))))
(:primary (let ((pri (rget obj name :primary 1)))
(if pri
(apply pri obj args)
(error "No next method."))))))
[示例代码 25.7] 定义的就是这样的一个宏。代码中有很大篇幅被用来实现两个函数,这两个函数让方法能引用其它的方法。around
和主方法可以使用 call-next
来调用下一个方法,所谓下一个方法,指的是倘若当前方法不存在,就会被调用的方法。举个例子,如果当前运行的方法是唯一的一个around
方法,那么下一个方法就是常见的由 before
方法、最匹配的主方法和 after
方法三者合体而成的夹心饼干。在最匹配的主方法里, 下一个方法则会是第二匹配的主方法。由于 call-next
的行为取决于它被调用的地方,因此 call-next
绝对不会用一个 defun
来在全局定义,不过它可以在每个由 defmeth
定义的方法里局部定义。
around 方法或者主方法可以用 next-p
来获知下一个方法是否存在。如果当前的方法是个主方法,而且主方法所属的对象是没有父类的,那么就不会有下一个方法。由于当没有下个方法时,call-next
会报错, 因此应该经常调用 next-p
试试深浅。像 call-next
,next-p
也是在方法里面单独地局部定义的。
下面将介绍新宏 defmeth
的使用方法。如果我们只是希望定义 rectangle
对象的 area
方法,我们会说
(setq rectangle (obj))
(defprop height)
(defprop width)
(defmeth (area) rectangle (r)
(* (height r) (width r)))
现在,一个 rectangle
实例的面积就会由类型中对应方法计算得出:
> (let ((myrec (obj rectangle)))
(setf (height myrec) 2
(width myrec) 3)
(area myrec))
6
这里有个复杂一些的例子,假设我们为 filesystem
对象定义了一个 backup
方法:
(setq filesystem (obj))
(defmeth (backup :before) filesystem (fs)
(format t "Remember to mount the tape.~%"))
(defmeth (backup) filesystem (fs)
(format t "Oops, deleted all your files.~%")
'done)
(defmeth (backup :after) filesystem (fs)
(format t "Well, that was easy.~%"))
正常的调用次序如下:
> (backup (obj filesystem))
Remember to mount the tape.
Oops, deleted all your files.
Well, that was easy.
DONE
接下来,我们想要知道备份一次会花费多少时间,所以可以定义下面的 around
方法:
(defmeth (backup :around) filesystem (fs)
(time (call-next)))
现在只要调用 filesystem
子类的 backup
(除非有更匹配的 around 方法介入),那么我们的around 方法就会执行。它会运行平常时候在 backup 里运行的那些代码,不同之处是把它们放到了一个 time 的调用里执行。time 的返回值则会被作为 backup 方法调用的值返回。
> (backup (obj filesystem))
Remember to mount the tape.
Oops, deleted all your files.
Well, that was easy.
Elapsed Time = .01 seconds
DONE
一旦知道了备份操作需要的时间,我们就会想要去掉这个around 方法。调用undefmeth 可达到这个目的(如[示例代码 25.8]),它的参数和defmeth 的前两个参数相同:
[示例代码 25.8] 去掉方法
(undefmeth (backup :around) filesystem)
(defmacro undefmeth ((name &optional (type :primary)) obj)
'(setf (,(symb 'meth- type) (gethash ',name ,obj))
nil))
[示例代码 25.9] 维护父类和子类的联系
(defmacro children (obj)
'(gethash 'children ,obj))
(defun parents (obj)
(gethash 'parents obj))
(defun set-parents (obj pars)
(dolist (p (parents obj))
(setf (children p)
(delete obj (children p))))
(setf (gethash 'parents obj) pars)
(dolist (p pars)
(pushnew obj (children p)))
(maphier #'(lambda (obj)
(setf (gethash 'ancestors obj)
(get-ancestors obj)))
obj)
pars)
(defsetf parents set-parents)
(defun maphier (fn obj)
(funcall fn obj)
(dolist (c (children obj))
(maphier fn c)))
(defun obj (&rest parents)
(let ((obj (make-hash-table)))
(setf (parents obj) parents)
obj))
另外一个我们可能需要修改的是对象的父类列表。但是进行了这种修改之后,我们还应该相应地更新该对象以及其所有子类的的祖先列表。到目前为止,还没有办法从对象那里获知它的子类信息,所以我们必须另加一个 children 属性。
[示例代码 25.9] 中的代码被用来操作对象的父类和子类。这里不再用 gethash 来获得父类和子类信息,而是分别改用操作符 parents 和children。其中后者是个宏,因而它对于 setf 是透明的。前者是一个函数,它的逆操作被 defsetf 定义为 set-parents ,这个函数包揽了所有的相关工作,让新的双向链接系统能保持其一致性。
为了更新一颗子树里所有对象的祖先,set-parents 调用了 maphier ,这个函数的作用相当于继承树里的mapc 。mapc 对列表里每个元素运行一个函数,同样的,maphier 也会对对象和它所有的后代应用指定的函数。除非这些节点构成没有公共子节点的树,否则有的对象会被传入这个函数一次以上。在这里,这不会导致问题,因为调用多次get-ancestors 和调用一次的效果是相同的。
现在,要修改继承层次结构的话,我们只要在对象的 parents 上调用 setf 就可以了:
> (progn (pop (parents patriotic-scoundrel))
(serves patriotic-scoundrel))
COUNTRY
T
当这个层次结构被修改的时候,受到影响的子孙列表和祖先列表会同时自动地更新。(children 本不是让人直接修改的,但是这也不是不可以。只要我们定义一个和 set-parents 对应的 set-children 就可以了。) 为了配合新代码,我们在[示例代码 25.9] 的最后重新定义了 obj 函数。
这次我们要开发一个新的手段来组合方法,作为对这个系统的最后一项改进。现在,会被调用的唯一主方法将是最匹配的那个(虽然它可以用 call-next 来调用其它的主方法)。要是我们希望能把对象所有祖先的主方法的结果组合起来呢?比如说,假设 my-orange 是 orange 的子类,而 orange 又是 citrus 的子类。如果props 方法用在 citrus 上的返回值是 (round acidic),相应的,orange 的返回值是(orange sweet) ,my-orange 的结果是(dented)。要是能让 (props my-orange) 能返回这些值的并集就好办多了:(dented orange sweet round acidic)。
(defmacro defcomb (name op)
'(progn
(defprop ,name t)
(setf (get ',name 'mcombine)
,(case op
(:standard nil)
(:progn '#'(lambda (&rest args)
(car (last args))))
(t op)))))
(defun run-core-methods (obj name args &optional pri)
(let ((comb (get name 'mcombine)))
(if comb
(if (symbolp comb)
(funcall (case comb (:and #'comb-and)
(:or #'comb-or))
obj name args (ancestors obj))
(comb-normal comb obj name args))
(multiple-value-prog1
(progn (run-befores obj name args)
(apply (or pri (rget obj name :primary))
obj args))
(run-afters obj name args)))))
(defun comb-normal (comb obj name args)
(apply comb
(mapcan #'(lambda (a)
(let* ((pm (meth- primary
(gethash name a)))
(val (if pm
(apply pm obj args))))
(if val (list val))))
(ancestors obj))))
[示例代码 25.10]: 方法的组合
假如能让方法对所有主方法的返回值应用某个函数,而不是仅仅返回最匹配的那个主函数的返回值,那就能解决这个问题了。[示例代码 25.10] 中定义有一个宏,这个宏让我们能指定方法的组合手段,图中还定义了新版本的 run-core-methods ,它允许我们把方法组合在一起使用。我们用 defcomb 定义方法的组合形式,它把方法名作为第一个参数,第二个参数描述了期望的组合方式。通常,这第二个参数应该是一个函数。不过,它也可以是 :progn :and :or 和 :standard 中的一个。如果使用前三个,系统就会用相应的操作符来组合主方法,用 :standard 的话,就表示我们想用以前的办法来执行方法。
[示例代码 25.10] 中的核心函数是新的run-core-methods 。如果被调用的方法没有名为mcombine 的属性,那么一切如常。否则,mcombine 应该是个函数(比如+),或是个关键字(比如:or)。前面一种情况,所有主方法返回值构成的列表会被送进这个函数。如果是后者的情况,我们会用和这个关键字对应的函数对主方法一一进行操作。
如果代码写得更讲究一些,可以考虑用 reduce ,这样可以避免手动 cons。
(defun comb-and (obj name args ancs &optional (last t))
(if (null ancs)
last
(let ((pm (meth- primary (gethash name (car ancs)))))
(if pm
(let ((new (apply pm obj args)))
(and new
(comb-and obj name args (cdr ancs) new)))
(comb-and obj name args (cdr ancs) last)))))
(defun comb-or (obj name args ancs)
(and ancs
(let ((pm (meth- primary (gethash name (car ancs)))))
(or (and pm (apply pm obj args))
(comb-or obj name args (cdr ancs))))))
[示例代码 25.11]: 方法的组合(续)
如[示例代码 25.11] 所示,and 和 or 这两个操作符必须要特殊处理。它们被特殊对待的原因不是因为它们是special form,而是因为它们的短路(short-circuit) 求值方式:
> (or 1 (princ "wahoo"))
1
这里,什么都不会被打印出来,因为or 一看到非nil 的参数就会立即返回。与之类似,如果有一个更匹配的方法返回真的话,那么剩下的用or 组合的主方法将不会被调用。为了实现 and 和 or 的这种短路求值,我们用了两个专门的函数:comb-and 和 comb-or。
为了实现我们之前的例子,可以这样写:
(setq citrus (obj))
(setq orange (obj citrus))
(setq my-orange (obj orange))
(defmeth (props) citrus (c) '(round acidic))
(defmeth (props) orange (c) '(orange sweet))
(defmeth (props) my-orange (m) '(dented))
(defcomb props #'(lambda (&rest args) (reduce #'union args)))
这样定义之后,props 就能返回所有主方法返回值的并集了:⁴
> (props my-orange)
(DENTED ORANGE SWEET ROUND ACIDIC)
这个例子恰巧显示了一个只有在 Lisp 里用面向对象编程才会面临的选择:是把信息保存在slot 里,还是保存在方法里。
以后,如果想要 props 方法恢复到缺省的行为,只要把方法的组合方式改回标准模式(standard) 即可:
> (defcomb props :standard)
NIL
> (props my-orange)
(DENTED)
要注意,before 和 after 方法只是在标准的组合模式下才会有效。而 around 方法会像以前那样工作。
本节中展示的程序只是作为一个演示模型,而不是想以它为基础,进行面向对象编程。写这个模型的着眼点是简洁而非效率。不管如何,这至少是一个可以工作的模型,因此也可以被用在试验性质的开发和原型【注4】由于 props 里用的组合函数是 union ,因此列表里的元素不一定会按照原来的顺序排列。
开发中。如果你有意这样用它的话,有一个小改动可以让它的效率有相当的改进:如果对象只有一个父类的话,就不要计算或者保存它的祖先列表。
25.3 类和实例
上一节中写了一个尽可能短小的程序来重新实现 CLOS 。理解它为我们进而理解 CLOS 铺平了道路。在下面几节中,我们会仔细考察 CLOS 本身。
在我们的这个简单实现里,没有把类和实例作语法上的区分,也没有把 slot 和方法分开。在 CLOS里,我们用defclass 定义类,同时把各slot 组成列表一并声明:
(defclass circle ()
(radius center))
这个表达式的意思是,circle 类没有父类,但是有两个slot:radius 和center。我们用下面的语句可以新建一个 circle 类的实例:
(make-instance 'circle)
不幸的是,我们还没有定义读取circle 中slot 的方式,因此我们创建的任何实例都只是个摆设。为了访问特定的slot,我们需要为它定义一个访问(accessor) 函数:
(defclass circle ()
((radius :accessor circle-radius)
(center :accessor circle-center)))
现在,如果我们建立了一个circle 的实例,就可以用setf 和与之对应的访问函数来设置它的radius 和center slot:
> (setf (circle-radius (make-instance 'circle)) 2)
2
如果像下面那样定义slot,那么我们也可以在make-instance 里直接完成这种初始化的工作:
(defclass circle ()
((radius :accessor circle-radius :initarg :radius)
(center :accessor circle-center :initarg :center)))
在slot 定义中出现的 :initarg 关键字表示:接下来的实参将要在make-instance 中成为一个关键字形参。这个关键字实参的值将会被作为该slot 的初始值:
> (circle-radius (make-instance 'circle
:radius 2
:center '(0 . 0)))
2
使用:initform,我们也可以定义一些slot,让它们能初始化自己。shape 类中的visible
(defclass shape ()
((color :accessor shape-color :initarg :color)
(visible :accessor shape-visible :initarg :visible
:initform t)))
会缺省地被设置成t :
> (shape-visible (make-instance 'shape))
T
如果一个slot 同时具有initarg 和initform,那么当initarg 被指定的时候,它享有优先权:
> (shape-visible (make-instance 'shape :visible nil))
NIL
slot 会被实例和子类继承下来。如果一个类有多个父类,那么它会继承得到这些父类slot 的并集。因此,如果我们把screen-circle 类同时定义成circle 和shape 两个类的子类,
(defclass screen-circle (circle shape)
nil)
那么 screen-circle 会具有四个 slot,每个父类继承两个 slot。注意到,一个类并不一定要自己新建一些新的 slot,screen-circle 的意义就在于提供了一个可以实例化的类型,它同时继承自 circle 和 shape。
以前可以用在 circle 和 shape 实例的那些访问函数和 initarg 会对 screen-circle 类型的实例继续生效:
> (shape-color (make-instance 'screen-circle
:color 'red :radius 3))
RED
如果在 defclass
里给 color
指定一个 initform
,我们就可以让所有的 screen-circle
的对应slot
都有个缺省值:
(defclass screen-circle (circle shape)
((color :initform 'purple)))
这样,screen-circle
类型的实例在缺省情况下就会是紫色的了:
> (shape-color (make-instance 'screen-circle))
PURPLE
不过我们还是可以通过显式地指定一个:colorinitarg
,来把这个 slot
初始化成其他颜色。
在我们之前实现的简装版面向对象编程框架里,实例的值可以直接从父类的slot 继承得到。在 CLOS中, 实例包含 slot 的方式却和类不一样。我们通过在父类里定义 initform 来为实例定义可被继承的缺省值。
在某种程度上,这样处理更有灵活性。因为initform 不仅可以是一个常量,它还可以是一个每次都返回不同值的表达式:
(defclass random-dot ()
((x :accessor dot-x :initform (random 100))
(y :accessor dot-y :initform (random 100))))
每创建一个random-dot 实例,它在x 和y 轴上的坐标都会是从0 到99 之间的一个随机整数:
> (mapcar #'(lambda (name)
(let ((rd (make-instance 'random-dot)))
(list name (dot-x rd) (dot-y rd))))
'(first second third))
((FIRST 25 8) (SECOND 26 15) (THIRD 75 59))
在我们的简装版实现里,我们对两种slot 不加区别:一种是实例自己具有的slot,这种slot 实例和实例之间可以不同;另一种slot 应该是在整个类里面都相同的。在 CLOS 中,我们可以指定某些slot 是共享的,换句话说,就是让这些slot 的值在每个实例里都是相同的。为了达到这个效果,我们可以把slot 声明成 :allocation :class 的。(另一个选项是 :allocation :instance。不过由于这是缺省的设置,因此就没有必要再显式地指定了。) 比如说,如果所有的猫头鹰都是夜间生活的动物,那么我们可以让nocturnal 这个slot 作为owl 类的共享slot,同时让它的初始值为t :
(defclass owl ()
((nocturnal :accessor owl-nocturnal
:initform t
:allocation :class)))
现在,所有的owl 实例都会继承这个slot 了:
> (owl-nocturnal (make-instance 'owl))
T
如果我们改动了这个slot 的"局部" 值,那么我们实际上修改的是保存在这个类里面的值:
> (setf (owl-nocturnal (make-instance 'owl)) 'maybe)
MAYBE
> (owl-nocturnal (make-instance 'owl))
MAYBE
这种机制或许会造成一些困扰,所以我们可能会希望让这个slot 成为只读的。在我们为一个slot 定义访问函数的同时,也是在为这个slot 的值定义一个读和写的方法。如果我们需要让这个值可读,但是不可写,那么我们可以给这个slot 仅仅设置一个reader 函数,而不是全功能的访问函数:
(defclass owl ()
((nocturnal :reader owl-nocturnal
:initform t
:allocation :class)))
现在如果尝试修改owl 实例的nocturnal slot 的话,就会产生一个错误:
> (setf (owl-nocturnal (make-instance 'owl)) nil)
>> Error: The function (SETF OWL-NOCTURNAL) is undefined.
25.4 方法
在我们的简装版实现中,强调了这样一个思想,即在具有词法作用域的语言里,其slot 和方法间是有其相似性的。在实现的时候,保存和继承主方法的方式和对slot 值的处理方式没有什么不同。slot 和方法区别只在于:把一个名字定义成slot,是通过
(defprop area)
把area 作为一个函数实现的,这个函数得到并返回一个值。而把这个名字定义成一个方法,则是通过
(defprop area t)
把area 实现成一个函数,这个函数在得到值之后,会funcall 这个值,同时把函数的参数传给它。
在 CLOS 中,实现这个功能的单元仍然被称为"方法",同时也可以定义这些方法,让它们看上去就像类的属性一样。这里,我们为circle 类定义一个名为area 的方法:
(defmethod area ((c circle))
(* pi (expt (circle-radius c) 2)))
这个方法的参数列表表示,这是个接受一个参数的函数,参数应该是circle 类型的实例。
和简单实现里一样,我们像调用一个函数那样调用这个方法:
> (area (make-instance 'circle :radius 1))
3.14...
我们同样可以让方法接受更多的参数:
(defmethod move ((c circle) dx dy)
(incf (car (circle-center c)) dx)
(incf (cdr (circle-center c)) dy)
(circle-center c))
如果我们对一个circle 的实例调用这个方法,circle 实例的中心会移动⟨dx,dy⟩ :
> (move (make-instance 'circle :center '(1 . 1)) 2 3)
(3 . 4)
方法的返回值表明了圆形的新位置。
和我们的简装版实现一样,如果一个实例对应的类及其父类有个方法,那么调用这个方法会使最匹配的方法被调用。因此,如果unit-circle 是 circle 的子类,同时具有如下所示的area 方法:
(defmethod area ((c unit-circle)) pi)
那么当我们对一个unit-circle 的实例调用area 方法的时候,将被调用的不是更一般的那个方法,而是在上面定义area。
当一个类有多个父类时,它们的优先级从左到右依次降低。patriotic-scoundrel 类的定义如下:
(defclass scoundrel nil nil)
(defclass patriot nil nil)
(defclass patriotic-scoundrel (scoundrel patriot) nil)
我们认为爱国的无赖,他首先是一个无赖,然后才是一个爱国者。当两个父类都有合适的方法时,
(defmethod self-or-country? ((s scoundrel))
'self)
(defmethod self-or-country? ((p patriot))
'country)
scoundrel 类的方法会这样被执行:
> (self-or-country? (make-instance 'patriotic-scoundrel))
SELF
到目前为止,所以的例子都让人觉得 CLOS 中的方法只针对某一个类。实际上, CLOS 中的方法是更为通用的一个概念。在move 方法的参数列表中,我们称 (c circle) 为特化(specialized) 参数,它表示,如果move 的第一个参数是circle 类的一个实例的话,就适用这个方法。对于 CLOS 方法,不止一个参数可以被特化。下面的方法就有两个特化参数和一个可选的非特化参数:
(defmethod combine ((ic ice-cream) (top topping)
&optional (where :here))
(append (list (name ic) 'ice-cream)
(list 'with (name top) 'topping)
(list 'in 'a
(case where
(:here 'glass)
(:to-go 'styrofoam))
'dish)))
如果combine 的前两个参数分别是ice-cream 和topping 的实例的话,上面定义的方法就会被调用。如果我们定义几个最简单类以便构造实例
(defclass stuff () ((name :accessor name :initarg :name)))
(defclass ice-cream (stuff) nil)
(defclass topping (stuff) nil)
那么我们就能定义并运行这个方法了:
> (combine (make-instance 'ice-cream :name 'fig)
(make-instance 'topping :name 'olive)
:here)
(FIG ICE-CREAM WITH OLIVE TOPPING IN A GLASS DISH)
倘若方法特化了一个以上的参数,这时就没有办法再把方法当成类的属性了。我们的combine 方法是属于ice-cream 类还是属于topping 类呢?在 CLOS 里,所谓"对象响应消息" 的模型不复存在。如果我们像下面那样调用函数,这种模型似乎还是顺理成章的:
(tell obj 'move 2 3)
显而易见,在这里我们调用的是obj 的move 方法。但是一旦我们废弃这种语法,而改用函数风格的等价操作:
(move obj 2 3)
我们就需要定义move ,让它能根据它的第一个参数dispatch 操作,即按照第一个参数的类型来调用适合的方法。
走出这一步,于是有个问题浮出了水面:为什么只能根据第一个参数来进行dispatch 呢? CLOS 的回答是:
就是呀,为什么非得这样呢?在 CLOS 中,方法能够指定任意个数的参数进行特化,而且这并不限于用户自定义的类,Common Lisp 类型⁵也一样可以,甚至能针对单个的特定对象特化。下面是一个名为combine 的方法,它被用于字符串:
(defmethod combine ((s1 string) (s2 string) &optional int?)
(let ((str (concatenate 'string s1 s2)))
(if int? (intern str) str)))
这不仅意味着方法不再是类的属性,而且还表明,我们可以根本不用定义类就能使用方法了。
> (combine "I am not a " "cook.")
"I am not a cook."
下面,第二个参数将对符号palindrome 进行特化:
(defmethod combine ((s1 sequence) (x (eql 'palindrome))
&optional (length :odd))
(concatenate (type-of s1)
s1
(subseq (reverse s1)
(case length (:odd 1) (:even 0)))))
上面的这个方法能生成任意元素序列的回文:⁶
> (combine '(able was i ere) 'palindrome)
(ABLE WAS I ERE I WAS ABLE)
到现在,我们讲述的内容已经不仅仅局限于面向对象的范畴,它有着更普遍的意义。 CLOS 在设计的时候就已经认识到,在对象方法的背后,更深层次的思想是分派(dispatch) 的概念,即选择合适方法的依据可以不仅仅是单独的一个参数,还可以基于多个参数的类型。当我们基于这种更通用的表示手段来构造方法时, 方法就可以脱离特定的类而存在了。方法不再在逻辑上从属于类,它现在和其它的同名方法成为了一体。
CLOS 把这样的一组方法称为generic 函数。所有的combine 方法隐式地定义了名为combine 的generic 函数。
我们可以显式地用defgeneric 宏定义generic 函数。虽然没有必要专门调用defgeneric 来定义一个generic 函数,但是这个定义却是一个安置文档,或者为一些错误加入保护措施的好地方。我们在下面的定义中两样都用上了:
(defgeneric combine (x y &optional z)
(:method (x y &optional z)
"I can't combine these arguments.")
(:documentation "Combines things."))
由于这里为combine 定义的方法没有特化任何参数,所以如果没有其它方法适用的话,这个方法就会被调用。
> (combine #'expt "chocolate")
"I can't combine these arguments."
倘若没有显式定义上面的generic 函数,这个调用就会报错。
⁵或者更准确地说,是 CLOS 定义的一系列形似类型的类,这些类的定义和Common Lisp 的内建类型体系是平行对应的。
⁶在一个Common Lisp 实现中(否则这个实现就完美了),concatenate 不会接受cons 作为它的第一个参数,因此这个方法调用在这种情况下将无法正常工作。
generic 函数也加入了一个我们把方法当成对象属性时没有的限制:当所有的同名方法加盟一个generic 方法时,这些同名方法的参数列表必须一致。这就是为什么我们所有的combine 方法都另有一个可选参数的原因。如果让第一个定义的combine 方法接受三个参数,那么当我们试着去定义另一个只有两个参数的方法时,就会出错。
CLOS 要求所有同名方法的参数列表必须是一致的。两个参数列表取得一致的前提是:它们必须具有相同数量的必选参数,相同数量的可选参数,并且&rest 和&key 的使用也要相互兼容。不同方法最后用的关键字参数(keywordparameter) 可以不一样,不过defgeneric 会坚持要求让它的所有方法接受一个特定的最小集。下面每对参数列表,两两之间是相互一致的:
(x) (a)
(x &optional y) (a &optional b)
(x y &rest z) (a b &rest c)
(x y &rest z) (a b &key c d)
而下列的每组都不一致:
(x) (a b)
(x &optional y) (a &optional b c)
(x &optional y) (a &rest b)
(x &key x y) (a)
重新定义方法就像重定义函数一样。由于只有必选参数才能被特化,每个方法都唯一地对应着它的generic function 及其必选参数的类型。如果我们定义另一个有着相同特化参数的方法,那么新的方法就会覆盖原来的方法。因而,如果我们这样写道:
(defmethod combine ((x string) (y string)
&optional ignore)
(concatenate 'string x " + " y))
那么就会重新定义头两个参数都是string 时,combine 方法的行为。
(defmacro undefmethod (name &rest args)
(if (consp (car args))
(udm name nil (car args))
(udm name (list (car args)) (cadr args))))
(defun udm (name qual specs)
(let ((classes (mapcar #'(lambda (s)
'(find-class ',s))
specs)))
'(remove-method (symbol-function ',name)
(find-method (symbol-function ',name)
',qual
(list ,@classes)))))
[示例代码 25.12]: 用于删除方法的宏
不幸的是,如果我们不希望重新定义方法,而是想删除它, CLOS 中并没有一个内建的defmethod 的逆操作。万幸的是,这是Lisp,所以我们可以自己写一个。[示例代码 25.12] 中的undefmethod 记录了手动删除一个方法的具体细节。就像调用defmethod 时一样,我们在使用这个宏的时候,把参数传入它,不过不同之处在于,这次我们并没有把整个的参数列表作为第二个或者第三个参数传进去,只是把必选参数的类名送入这个宏。所以,如果要删除两个string 的combine 方法,可以这样写:
(undefmethod combine (string string))
没有特化的参数被缺省指定为类t ,所以,如果我们之前定义了一个方法,而且这个方法有必选参数,但是这些参数没有特化的话:
(defmethod combine ((fn function) &optional y)
(funcall fn x y))
我们可以用下面的语句把它去掉
(undefmethod combine (function t))
如果希望删除整个的genericfunction,那么我们可以用和删除任意函数相同的方法来达到这个目的,即调用fmakunbound :
(fmakunbound 'combine)
25.5 辅助方法和组合
在 CLOS 里,辅助函数还是和我们的精简版实现一样的运作。到现在,我们只看到了主方法,但是我们一样可以用before、 after 和around 方法。可以通过在方法的名字后面加上限定关键字(qualifyingkeyword),来定义这些辅助函数。假如我们为speaker 类定义一个主方法speak 如下:
(defclass speaker nil nil)
(defmethod speak ((s speak) string)
(format t "~A" string)
那么,对一个speaker 的实例调用speak 方法,就会把方法的第二个参数打印出来:
> (speak (make-instance 'speaker)
"life is not what it used to be")
life is not what it used to be
NIL
现在定义一个名为intellectual 的子类,让它把主方法speak 用before 和 after 方法包装起来,
(defclass intellectual (speaker) nil)
(defmethod speak :before ((i intellectual) string)
(princ "Perhaps "))
(defmethod speak :after ((i intellectual) string)
(princ " in some sense"))
然后,我们就能新建一个speaker 的子类,让这个子类总是会自己加上最后一个(以及第一个) 词:
> (speak (make-instance 'intellectual)
"life is not what it used to be")
Perhaps life is not what it used to be in some sense
NIL
在标准的方法组合方式中,方法调用的顺序和我们精简版实现中规定的顺序是一样的:所有的before 方法是从最匹配的开始,然后是最匹配的主方法,接着是 after 方法, after 方法是最匹配的最后才调用。因此,如果我们像下面这样为父类speaker 定义before 或者 after 方法,
(defmethod speak :before ((s speaker) string)
(princ "I think "))
这些方法会在夹心饼干的中间被调用:
> (speak (make-instance 'intellectual)
"life is not what it used to be")
Perhaps I think life is not what it used to be in some sense
NIL
无论被调用的是什么before 或 after 方法,generic 函数的返回值总是最匹配的主方法的值,在本例中,返回的值就是format 返回的nil 。
如果有around 方法的话,这个论断就要稍加改动。倘若一个对象的继承树中有一个类具有around 方法, 或者更准确地说,如果有around 方法特化了generic 函数的某些参数,那么这个around 方法会被首先调用, 然后其余的这些方法是否会被运行将取决于这个around 方法。在我们的精简版实现中,一个around 方法或者主方法能够通过运行一个函数,调用下一个方法:我们以前定义的名为call-next 的函数在 CLOS 中叫做call-next-method。与我们的next-p 相对应, CLOS 中同样也有一个叫next-method-p 的函数。有了around 方法,我们可以定义speaker 的另一个子类,这个子类说话会更慎重一些:
(defclass courtier (speaker) nil)
(defmethod speak :around ((c courtier) st