functor
本文最初是我们使用RxJava进行React式编程的附录。 但是,尽管与React式编程非常相关,但对monad的介绍却不太适合。 因此,我决定将其取出并作为博客文章单独发布。 我知道,“ 我对单子的自己的,一半正确和一半的完整解释 ”是编程博客上的新“ Hello,world ”。 然而,本文从Java数据结构和库的特定角度研究了函子和monad。 因此,我认为值得分享。
RxJava的设计和构建基于非常基本的概念,例如函子 , monoid和monad 。 尽管Rx最初是为命令式C#语言建模的,并且我们正在学习RxJava,并在类似的命令式语言上工作,但该库还是源于函数式编程。 在意识到RxJava API的紧凑性之后,您应该不会感到惊讶。 几乎只有少数几个核心类,通常是不可变的,并且所有内容都主要由纯函数组成。
随着函数式编程(或函数式样式)的最新兴起(最普遍地用Scala或Clojure等现代语言表示),monads成为了广泛讨论的话题。 他们周围有很多民间传说:
monad是endofunctors类别中的monoid,这是什么问题?
詹姆斯·伊里
该monad的诅咒是,一旦您获得了顿悟,一旦您理解了“哦,就是这样”,您就失去了向任何人解释它的能力。
道格拉斯·克罗克福德
绝大多数程序员,尤其是那些没有函数式编程背景的程序员,都倾向于认为monad是某种神秘的计算机科学概念,因此从理论上讲,它对他们的编程事业无济于事。 这种消极的观点可以归因于数十篇文章或博客文章太抽象或太狭窄。 但是事实证明,甚至标准的Java库都存在monad,特别是自Java Development Kit(JDK)8起(稍后会有更多介绍)。 绝对妙不可言的是,一旦您第一次了解monad,突然之间就会有几个完全不相同的目的无关的类和抽象变得熟悉。
Monad概括了各种看似独立的概念,因此学习Monad的另一种化身只需很少的时间。 例如,您不必学习CompletableFuture
在Java 8中的工作方式,一旦意识到它是monad,就可以精确地知道它是如何工作的,并且可以从其语义中得到什么。 然后您会听说RxJava听起来有很多不同,但是由于Observable
是monad,因此没有太多可添加的。 您已经不知不觉中已经遇到过许多其他的单子示例。 因此,即使您实际上没有使用RxJava,本节也将是有用的复习。
函子
在解释什么是monad之前,让我们研究一个称为functor的简单结构。 函子是封装某些值的类型化数据结构。 从语法的角度来看,函子是具有以下API的容器:
import java.util.function.Function;interface Functor<T> {<R> Functor<R> map(Function<T, R> f);}
但是仅仅语法是不足以了解什么是函子。 functor提供的唯一操作是带函数f
map()
。 此函数接收框内的任何内容,对其进行转换并将结果按原样包装到另一个函子中。 请仔细阅读。 Functor<T>
始终是不可变的容器,因此map
不会使执行该操作的原始对象发生突变。 取而代之的是,它返回包装在全新函子中的结果(或结果–请耐心等待),该函子可能是类型R
此外,在应用标识函数(即map(x -> x)
时,函子不应执行任何操作。 这种模式应始终返回相同的函子或相等的实例。
通常将Functor<T>
与保存T
实例进行比较,其中与该值交互的唯一方法是对其进行转换。 但是,没有从函子解开或逃逸的惯用方式。 值始终在函子的上下文内。 函子为什么有用? 它们使用一个统一的,适用于所有对象的统一API来概括多个通用习语,如集合,promise,Optionals等。 让我介绍几个函子,以使您更流畅地使用此API:
interface Functor<T,F extends Functor<?,?>> {<R> F map(Function<T,R> f);
}class Identity<T> implements Functor<T,Identity<?>> {private final T value;Identity(T value) { this.value = value; }public <R> Identity<R> map(Function<T,R> f) {final R result = f.apply(value);return new Identity<>(result);}}
需要额外的F
类型参数来进行Identity
编译。 在前面的示例中,您看到的是最简单的函子,仅包含一个值。 您只能使用map
方法内部的值对其进行转换,但无法提取它。 这被认为超出了纯函子的范围。 与函子进行交互的唯一方法是应用类型安全的转换序列:
Identity<String> idString = new Identity<>("abc");
Identity<Integer> idInt = idString.map(String::length);
或流利地,就像您编写函数一样:
Identity<byte[]> idBytes = new Identity<>(customer).map(Customer::getAddress).map(Address::street).map((String s) -> s.substring(0, 3)).map(String::toLowerCase).map(String::getBytes);
从这个角度来看,在函子上的映射与调用链式函数没有太大不同:
byte[] bytes = customer.getAddress().street().substring(0, 3).toLowerCase().getBytes();
您为什么还要烦恼这种冗长的包装,不仅不提供任何附加值,而且也无法将内容提取回去? 好吧,事实证明您可以使用此原始函子抽象对其他几个概念建模。 例如,从Java 8开始的java.util.Optional<T>
是带有map()
方法的函子。 让我们从头开始实现它:
class FOptional<T> implements Functor<T,FOptional<?>> {private final T valueOrNull;private FOptional(T valueOrNull) {this.valueOrNull = valueOrNull;}public <R> FOptional<R> map(Function<T,R> f) {if (valueOrNull == null)return empty();elsereturn of(f.apply(valueOrNull));}public static <T> FOptional<T> of(T a) {return new FOptional<T>(a);}public static <T> FOptional<T> empty() {return new FOptional<T>(null);}}
现在变得有趣了。 FOptional<T>
函子可以保存一个值,但也可以为空。 这是一种对null
进行编码的类型安全的方法。 构造FOptional
方法有两种:通过提供值或创建empty()
实例。 在这两种情况下,就像Identity
, FOptional
是不可变的,我们只能从内部与值交互。 FOptional
不同之FOptional
在于,如果转换函数f
为空,则它可能不会应用于任何值。 这意味着函子可能不必完全封装类型T
一个值。 它也可以包装任意数量的值,就像List
…functor:
import com.google.common.collect.ImmutableList;class FList<T> implements Functor<T, FList<?>> {private final ImmutableList<T> list;FList(Iterable<T> value) {this.list = ImmutableList.copyOf(value);}@Overridepublic <R> FList<?> map(Function<T, R> f) {ArrayList<R> result = new ArrayList<R>(list.size());for (T t : list) {result.add(f.apply(t));}return new FList<>(result);}
}
API保持不变:在转换T -> R
使用函子,但是行为却大不相同。 现在,我们对FList
每个项目应用转换,以声明方式转换整个列表。 因此,如果您有一个customers
列表,并且想要他们的街道列表,则非常简单:
import static java.util.Arrays.asList;FList<Customer> customers = new FList<>(asList(cust1, cust2));FList<String> streets = customers.map(Customer::getAddress).map(Address::street);
这不再像说customers.getAddress().street()
那样简单,您不能在一组客户上调用getAddress()
,必须在每个单独的客户上调用getAddress()
,然后将其放回一个集合中。 顺便说一句,Groovy发现这种模式是如此普遍,以至于实际上有一个语法糖: customer*.getAddress()*.street()
。 该运算符称为散点图,实际上是变相的map
。 也许您想知道为什么我要在map
list
手动遍历list
而不是使用Java 8中的Stream
: list.stream().map(f).collect(toList())
? 这会响吗? 如果我告诉您Java java.util.stream.Stream<T>
也是一个函子怎么办? 顺便说一句,一个单子?
现在,您应该看到函子的第一个好处–它们抽象了内部表示形式,并为各种数据结构提供了一致且易于使用的API。 作为最后一个示例,让我介绍类似于Future
promise函数。 Promise
“承诺”某一天将提供一个值。 它尚未出现,可能是因为产生了一些后台计算,或者我们正在等待外部事件。 但是它将在将来出现。 完成Promise<T>
的机制并不有趣,但是函子的性质是:
Promise<Customer> customer = //...
Promise<byte[]> bytes = customer.map(Customer::getAddress).map(Address::street).map((String s) -> s.substring(0, 3)).map(String::toLowerCase).map(String::getBytes);
看起来很熟悉? 这就是重点! Promise
函子的实现超出了本文的范围,甚至不重要。 不用说,我们非常接近从Java 8实现CompletableFuture
,并且几乎从RxJava中发现了Observable
。 但是回到函子。 Promise<Customer>
尚未持有Customer
的值。 它有望在将来具有这种价值。 但是我们仍然可以像使用FOptional
和FList
一样映射此类函子–语法和语义完全相同。 行为遵循函子表示的内容。 调用customer.map(Customer::getAddress)
产生Promise<Address>
,这意味着map
是非阻塞的。 customer.map()
不会等待基础的customer
承诺完成。 相反,它返回另一个不同类型的承诺。 当上游承诺完成时,下游承诺将应用传递给map()
的函数并将结果传递给下游。 突然,我们的函子使我们能够以非阻塞方式流水线进行异步计算。 但是您不必理解或学习-因为Promise
是函子,所以它必须遵循语法和法则。
函子还有许多其他很好的例子,例如以组合方式表示值或错误。 但是现在是时候看看单子了。
从函子到单子
我假设您了解函子是如何工作的,为什么它们是有用的抽象。 但是函子并不像人们期望的那样普遍。 如果您的转换函数(作为参数传递给map()
那个)返回函子实例而不是简单值,会发生什么? 好吧,函子也只是一个值,所以没有坏事发生。 将返回的所有内容放回函子中,以便所有行为都保持一致。 但是,假设您有以下方便的方法来解析String
:
FOptional<Integer> tryParse(String s) {try {final int i = Integer.parseInt(s);return FOptional.of(i);} catch (NumberFormatException e) {return FOptional.empty();}
}
例外是会破坏类型系统和功能纯度的副作用。 在纯函数语言中,没有例外的地方,毕竟我们从来没有听说过在数学课上抛出例外,对吗? 错误和非法条件使用值和包装器明确表示。 例如, tryParse()
接受一个String
但并不简单地返回int
或在运行时静默引发异常。 通过类型系统,我们明确告知tryParse()
可能失败,字符串格式错误不会有任何异常或错误。 此半故障由可选结果表示。 有趣的是,Java已经检查了必须声明和处理的异常,因此从某种意义上讲,Java在这方面比较纯净,它没有隐藏副作用。 但是,无论好坏,通常在Java中不建议使用检查异常,因此让我们回到tryParse()
。 用已经包装在FOptional
String
组成tryParse
似乎很有用:
FOptional<String> str = FOptional.of("42");
FOptional<FOptional<Integer>> num = str.map(this::tryParse);
这不足为奇。 如果tryParse()
返回一个int
您将得到FOptional<Integer> num
,但是由于map()
函数返回FOptional<Integer>
本身,因此它被包装两次,成为笨拙的FOptional<FOptional<Integer>>
。 请仔细查看类型,您必须了解为什么在这里获得此双重包装。 除了看上去很恐怖之外,在函子中放一个函子会破坏构图和流畅的链接:
FOptional<Integer> num1 = //...
FOptional<FOptional<Integer>> num2 = //...FOptional<Date> date1 = num1.map(t -> new Date(t));//doesn't compile!
FOptional<Date> date2 = num2.map(t -> new Date(t));
在这里,我们尝试通过将int
转换为+ Date +来映射FOptional
的内容。 具有Functor<Integer>
int -> Date
的功能,我们可以轻松地从Functor<Integer>
为Functor<Date>
,我们知道它是如何工作的。 但是在num2
情况下情况变得复杂。 num2.map()
接收的输入不再是int
而是FOoption<Integer>
,显然java.util.Date
没有这样的构造函数。 我们通过双重包裹来破坏了函子。 但是,具有返回函子而不是简单值的函数非常普遍(例如tryParse()
),因此我们不能简单地忽略这种要求。 一种方法是引入一种特殊的无参数join()
方法,以“展平”嵌套函子:
FOptional<Integer> num3 = num2.join()
它可以工作,但是因为这种模式太普遍了,所以引入了一种名为flatMap()
特殊方法。 flatMap()
与map
非常相似,但希望作为参数接收的函数返回函子-或monad是精确的:
interface Monad<T,M extends Monad<?,?>> extends Functor<T,M> {M flatMap(Function<T,M> f);
}
我们仅得出结论, flatMap
只是一种语法糖,可以实现更好的组合。 但是flatMap
方法(通常称为Haskell的bind
或>>=
)具有所有不同之处,因为它允许以纯函数式的形式构成复杂的转换。 如果FOptional
是monad的实例,则解析突然可以按预期进行:
FOptional<Integer> num = FOptional.of(42);
FOptional<Integer> answer = num.flatMap(this::tryParse);
Monads不需要实现map
,可以轻松地在flatMap()
之上实现它。 实际上, flatMap
是启用全新转换领域的基本运算符。 显然,就像函子一样,语法顺从性还不足以将某个类称为monad, flatMap()
运算符必须遵循monad定律,但它们非常直观,就像flatMap()
与标识的关联性一样。 后者要求m(x).flatMap(f)
与持有值x
任何monad和函数f
f(x)
相同。 我们不会深入研究monad理论,而让我们关注实际含义。 当内部结构并非无关紧要时,Monad便会发光,例如Promise
monad,它将在将来具有一定的价值。 您可以从类型系统中猜测Promise
在以下程序中的表现吗? 首先,所有可能花费一些时间才能完成的方法都会返回Promise
:
import java.time.DayOfWeek;Promise<Customer> loadCustomer(int id) {//...
}Promise<Basket> readBasket(Customer customer) {//...
}Promise<BigDecimal> calculateDiscount(Basket basket, DayOfWeek dow) {//...
}
现在,我们可以将这些函数组合起来,就好像它们都是使用单子运算符进行了阻塞一样:
Promise<BigDecimal> discount = loadCustomer(42).flatMap(this::readBasket).flatMap(b -> calculateDiscount(b, DayOfWeek.FRIDAY));
这变得很有趣。 flatMap()
必须保留monadic类型,因为所有中间对象都是Promise
。 不仅仅是保持类型有序-先前的程序突然完全异步! loadCustomer()
返回Promise
因此不会阻塞。 readBasket()
接受Promise
拥有(将要拥有的一切)并应用返回另一个Promise
的函数,依此类推。 基本上,我们建立了一个异步计算管道,其中后台完成一个步骤会自动触发下一步。
探索
有两个单子并将它们包含的值组合在一起是很常见的。 但是函子和monad均不允许直接访问其内部,这是不纯的。 相反,我们必须谨慎地应用转换,而不能逃脱monad。 假设您有两个单子,并且您想将它们合并
import java.time.LocalDate;
import java.time.Month;Monad<Month> month = //...
Monad<Integer> dayOfMonth = //...Monad<LocalDate> date = month.flatMap((Month m) ->dayOfMonth.map((int d) -> LocalDate.of(2016, m, d)));
请花点时间研究前面的伪代码。 我没有使用任何真正的monad实现(例如Promise
或List
来强调核心概念。 我们有两个独立的monad,一个是Month
类型,另一个是Integer
类型。 为了从中构建LocalDate
,我们必须构建一个嵌套的转换,该转换可以访问两个monad的内部。 仔细研究这些类型,尤其要确保您了解为什么我们在一个地方使用flatMap
在另一个地方使用map()
。 想想如果您还有第三个Monad<Year>
,那么您将如何构造此代码。 这种应用两个参数(在本例中为m
和d
)的函数的模式非常普遍,以至于Haskell中有一个特殊的辅助函数,称为liftM2
,它完全在map
和flatMap
上实现了这种转换。 在Java伪语法中,它看起来像这样:
Monad<R> liftM2(Monad<T1> t1, Monad<T2> t2, BiFunction<T1, T2, R> fun) {return t1.flatMap((T1 tv1) ->t2.map((T2 tv2) -> fun.apply(tv1, tv2)));
}
您不必为每个monad实现此方法, flatMap()
足够了,而且它对所有monad都一致地起作用。 当您考虑如何将其与各种monad一起使用时, liftM2
非常有用。 例如listM2(list1, list2, function)
将对list1
和list2
(笛卡尔积)中的每对可能的项应用function
。 另一方面,对于可选选项,仅当两个可选选项均为非空时,它将应用功能。 更好的是,对于Promise
monad,当两个Promise
都完成时,将异步执行一个函数。 这意味着我们只是发明了一个简单的同步机制(分叉联接算法中的join()
,该同步机制包含两个异步步骤。
我们可以轻松地在flatMap()
之上构建的另一个有用的运算符是filter(Predicate<T>)
,该运算符接收monad内部的所有内容,如果不符合某些谓词,则将其完全丢弃。 在某种程度上,它类似于map
但不是1-to-1映射,而是1-to-0-or-1。 同样, filter()
对于每个monad具有相同的语义,但是取决于我们实际使用的monad,其功能相当惊人。 显然,它允许从列表中过滤掉某些元素:
FList<Customer> vips = customers.filter(c -> c.totalOrders > 1_000);
但是它也可以正常工作,例如对于可选项目。 在这种情况下,如果可选内容不符合某些条件,我们可以将非空可选内容转换为空值。 空的可选部分保持不变。
从单子列表到单子列表
另一个来自flatMap()
有用运算符是sequence()
。 您只需查看类型签名即可轻松猜测其作用:
Monad<Iterable<T>> sequence(Iterable<Monad<T>> moands)
通常,我们有一堆相同类型的monad,而我们想要一个具有该类型列表的monad。 对您来说,这听起来似乎很抽象,但却非常有用。 想象一下,您想通过ID同时从数据库中加载一些客户,因此您多次对不同的ID使用loadCustomer(id)
方法,每次调用都返回Promise<Customer>
。 现在,您有了Promise
的列表,但您真正想要的是客户列表,例如要在Web浏览器中显示的客户列表。 sequence()
(在RxJava中sequence()
称为concat()
或merge()
,具体取决于用例)是为此目的而构建的:
FList<Promise<Customer>> custPromises = FList.of(1, 2, 3).map(database::loadCustomer);Promise<FList<Customer>> customers = custPromises.sequence();customers.map((FList<Customer> c) -> ...);
通过为每个ID调用database.loadCustomer(id)
,我们可以在其上map
一个表示客户ID的FList<Integer>
(您看到FList
是一个函子吗?) 这导致Promise
列表非常不便。 sequence()
节省了一天的时间,但是再次这不仅是语法糖。 前面的代码是完全非阻塞的。 对于不同种类的monads, sequence()
仍然有意义,但是在不同的计算上下文中。 例如,可以将FList<FOptional<T>>
更改为FOptional<FList<T>>
。 顺便说一句,您可以在flatMap()
之上实现sequence()
(就像map()
一样flatMap()
。
一般而言,这只是关于flatMap()
和monad有用性的冰山一角。 尽管源于晦涩的类别理论,但即使在Java之类的面向对象的编程语言中,monad也被证明是极其有用的抽象。 能够组成返回单子函数的函数非常有用,以至于数十个无关的类遵循单子行为。
而且,一旦将数据封装在monad中,通常很难显式地将其取出。 这种操作不是monad行为的一部分,并且经常导致非惯用语代码。 例如, Promise<T>
上的Promise.get()
可以从技术上返回T
,但是只能通过阻塞来返回,而所有基于flatMap()
运算符都是非阻塞的。 另一个示例是FOptional.get()
可能会失败,因为FOptional
可能为空。 即使FList.get(idx)
从列表偷窥特定元素听起来很别扭,因为你可以替换for
与循环map()
经常。
我希望您现在了解为什么单子如此流行。 即使在像Java这样的面向对象的语言中,它们也是非常有用的抽象。
翻译自: https://www.javacodegeeks.com/2016/06/functor-monad-examples-plain-java.html
functor