函数的部分应用和柯里化
上一章重点在于代码重复:提升现有的函数功能、或者将函数进行组合。这一章,我们来看看另外两种函数重用的机制:函数的部分应用(Partial Application of Functions) 、 柯里化(Currying) 。
部分应用的函数
和其他遵循函数式编程范式的语言一样,Scala 允许_部分_应用一个函数。调用一个函数时,不是把函数需要的所有参数都传递给它,而是仅仅传递一部分,其他参数留空;这样会生成一个新的函数,其参数列表由那些被留空的参数组成。(不要把这个概念和偏函数混淆)
为了具体说明这一概念,回到上一章的例子:假想的免费邮件服务,能够让用户配置筛选器,以使得满足特定条件的邮件显示在收件箱里,其他的被过滤掉。
Email
类看起来仍然是这样:
case class Email(
subject: String,
text: String,
sender: String,
recipient: String)
type EmailFilter = Email => Boolean
过滤邮件的条件用谓词 Email => Boolean
表示, EmailFilter
是其别名。调用适当的工厂方法可以生成这些谓词。
上一章,我们创建了两个这样的工厂方法,它们检查邮件内容长度是否满足给定的最大值或最小值。这一次,我们使用部分应用函数来实现这些工厂方法,做法是,修改 sizeConstraint
,固定某些参数可以创建更具体的限制条件:
其修改后的代码如下:
type IntPairPred = (Int, Int) => Boolean
def sizeConstraint(pred: IntPairPred, n: Int, email: Email) =
pred(email.text.size, n)
上述代码为一个谓词函数定义了别名 IntPairPred
,该函数接受一对整数(值 n
和邮件内容长度),检查邮件长度对于 n
是否 OK。
请注意,不像上一章的 sizeConstraint
,这一个并不返回新的 EmailFilter
,它只是简单的用参数做计算,返回一个布尔值。秘诀在于,你可以部分应用这个 sizeConstraint
来得到一个 EmailFilter
。
遵循 DRY 原则,我们先来定义常用的 IntPairPred
实例,这样,在调用 sizeConstraint
时,不需要重复的写相同的匿名函数,只需传递下面这些:
val gt: IntPairPred = _ > _
val ge: IntPairPred = _ >= _
val lt: IntPairPred = _ < _
val le: IntPairPred = _ <= _
val eq: IntPairPred = _ == _
最后,调用 sizeConstraint
函数,用上面的 IntPairPred
传入第一个参数:
val minimumSize: (Int, Email) => Boolean = sizeConstraint(ge, _: Int, _: Email)
val maximumSize: (Int, Email) => Boolean = sizeConstraint(le, _: Int, _: Email)
对所有没有传入值的参数,必须使用占位符 _
,还需要指定这些参数的类型,这使得函数的部分应用多少有些繁琐。Scala 编译器无法推断它们的类型,方法重载使编译器不可能知道你想使用哪个方法。
不过,你可以绑定或漏掉任意个、任意位置的参数。比如,我们可以漏掉第一个值,只传递约束值 n
:
val constr20: (IntPairPred, Email) => Boolean =
sizeConstraint(_: IntPairPred, 20, _: Email)
val constr30: (IntPairPred, Email) => Boolean =
sizeConstraint(_: IntPairPred, 30, _: Email)
得到的两个函数,接受一个 IntPairPred
和一个 Email
作为参数,然后利用谓词函数 IntPairPred
把邮件长度和 20
、 30
比较,只不过比较方法的逻辑 IntPairPred
需要另外指定。
由此可见,虽然函数部分应用看起来比较冗长,但它要比 Clojure 的灵活,在 Clojure 里,必须从左到右的传递参数,不能略掉中间的任何参数。
从方法到函数对象
在一个方法上做部分应用时,可以不绑定任何的参数,这样做的效果是产生一个函数对象,并且其参数列表和原方法一模一样。通过这种方式可以将方法变成一个可赋值、可传递的函数!
val sizeConstraintFn: (IntPairPred, Int, Email) => Boolean = sizeConstraint _
更有趣的函数
部分函数应用显得太啰嗦,用起来不够优雅,幸好还有其他的替代方法。
也许你已经知道 Scala 里的方法可以有多个参数列表。下面的代码用多个参数列表重新定义了 sizeConstraint
:
def sizeConstraint(pred: IntPairPred)(n: Int)(email: Email): Boolean =
pred(email.text.size, n)
如果把它变成一个可赋值、可传递的函数对象,它的签名看起来会像是这样:
val sizeConstraintFn: IntPairPred => Int => Email => Boolean = sizeConstraint _
这种单参数的链式函数称做 柯里化函数 ,以发明人 Haskell Curry 命名。在 Haskell 编程语言里,所有的函数默认都是柯里化的。
sizeConstraintFn
接受一个 IntPairPred
,返回一个函数,这个函数又接受 Int
类型的参数,返回另一个函数,最终的这个函数接受一个 Email
,返回布尔值。
现在,可以把要传入的 IntPairPred
传递给 sizeConstraint
得到:
val minSize: Int => Email => Boolean = sizeConstraint(ge)
val maxSize: Int => Email => Boolean = sizeConstraint(le)
被留空的参数没必要使用占位符,因为这不是部分函数应用。
现在,可以通过这两个柯里化函数来创建 EmailFilter
谓词:
val min20: Email => Boolean = minSize(20)
val max20: Email => Boolean = maxSize(20)
也可以在柯里化的函数上一次性绑定多个参数,直接得到上面的结果。传入第一个参数得到的函数会立即应用到第二个参数上:
val min20: Email => Boolean = sizeConstraintFn(ge)(20)
val max20: Email => Boolean = sizeConstraintFn(le)(20)
函数柯里化
有时候,并不总是能提前知道要不要将一个函数写成柯里化形式,毕竟,和只有单参数列表的函数相比,柯里化函数的使用并不清晰。而且,偶尔还会想以柯里化的形式去使用第三方的函数,但这些函数的参数都在一个参数列表里。
这就需要一种方法能对函数进行柯里化。这种的柯里化行为本质上也是一个高阶函数:接受现有的函数,返回新函数。这个高阶函数就是 curried
:curried
方法存在于 Function2
、 Function3
这样的多参数函数类型里。如果存在一个接受两个参数的 sum
,可以通过调用 curried
方法得到它的柯里化版本:
val sum: (Int, Int) => Int = _ + _
val sumCurried: Int => Int => Int = sum.curried
使用 Funtion.uncurried
进行反向操作,可以将一个柯里化函数转换成非柯里化版本。
函数化的依赖注入
在这一章的最后,我们来看看柯里化函数如何发挥其更大的作用。来自 Java 或者 .NET 世界的人,或多或少都用过依赖注入容器,这些容器为使用者管理对象,以及对象之间的依赖关系。在 Scala 里,你并不真的需要这样的外部工具,语言已经提供了许多功能,这些功能简化了依赖注入的实现。
函数式编程仍然需要注入依赖:应用程序中上层函数需要调用其他函数。把要调用的函数硬编码在上层函数里,不利于它们的独立测试。从而需要把被依赖的函数以参数的形式传递给上层函数。
但是,每次调用都传递相同的依赖,是不符合 DRY 原则的,这时候,柯里化函数就有用了!柯里化和部分函数应用是函数式编程里依赖注入的几种方式之一。
下面这个简化的例子说明了这项技术:
case class User(name: String)
trait EmailRepository {
def getMails(user: User, unread: Boolean): Seq[Email]
}
trait FilterRepository {
def getEmailFilter(user: User): EmailFilter
}
trait MailboxService {
def getNewMails(emailRepo: EmailRepository)(filterRepo: FilterRepository)(user: User) =
emailRepo.getMails(user, true).filter(filterRepo.getEmailFilter(user))
val newMails: User => Seq[Email]
}
这个例子有一个依赖两个不同存储库的服务,这些依赖被声明为 getNewMails
方法的参数,并且每个依赖都在一个单独的参数列表里。
MailboxService
实现了这个方法,留空了字段 newMails
,这个字段的类型是一个函数: User => Seq[Email]
,依赖于 MailboxService
的组件会调用这个函数。
扩展 MailboxService
时,实现 newMails
的方法就是应用 getNewMails
这个方法,把依赖 EmailRepository
、 FilterRepository
的具体实现传递给它:
object MockEmailRepository extends EmailRepository {
def getMails(user: User, unread: Boolean): Seq[Email] = Nil
}
object MockFilterRepository extends FilterRepository {
def getEmailFilter(user: User): EmailFilter = _ => true
}
object MailboxServiceWithMockDeps extends MailboxService {
val newMails: (User) => Seq[Email] =
getNewMails(MockEmailRepository)(MockFilterRepository) _
}
调用 MailboxServiceWithMockDeps.newMails(User("daniel")
无需指定要使用的存储库。在实际的应用程序中,这个服务也可能是以依赖的方式被使用,而不是直接引用。
这可能不是最强大、可扩展的依赖注入实现方式,但依旧是一个非常不错的选择,对展示部分函数应用和柯里化更广泛的功用来说,这也是一个不错的例子。如果你想知道更多关于这一点的知识,推荐看 Debasish Ghosh 的幻灯片“Dependency Injection in Scala”。
总结
这一章讨论了两个附加的可以避免代码重复的函数式编程技术,并且在这个基础上,得到了很大的灵活性,可以用多种不同的形式重用函数。部分函数应用和柯里化,这两者或多或少都可以实现同样的效果,只是有时候,其中的某一个会更为优雅。下一章会继续探讨保持灵活性的方法:类型类(type class)。