fold函数
免责声明:我不是函数式编程的参考,本文不过是一个简短的介绍。 FP爱好者可能不太喜欢它。
您已经熟悉了
想象一下不含增值税的数量的List <Double>。 我们希望将此列表转换为包含增值税的另一个相应列表。 首先,我们定义一种将增值税加到一个单一金额中的方法:
public double addVAT(double amount, double rate) {return amount * (1 + rate);}
现在让我们将此方法应用于列表中的每个金额:
public List<Double> addVAT(List<Double> amounts, double rate){final List<Double> amountsWithVAT = new ArrayList<Double>();for(double amount : amounts){amountsWithVAT.add(addVAT(amount, rate));}return amountsWithVAT;
}
在这里,我们创建了另一个输出列表,对于输入列表的每个元素,我们对其应用addVAT()方法,然后将结果存储到大小完全相同的输出列表中。 恭喜,正如我们刚刚手工完成的,在方法addVAT()的输入列表上有一个Map。 让我们再做一次。
现在我们要使用货币汇率将每个金额转换为另一种货币,因此我们需要一种新的方法:
public double convertCurrency(double
public double convertCurrency(double amount, double currencyRate){return amount / currencyRate;}
现在,我们可以将此方法应用于列表中的每个元素:
public List<Double> convertCurrency(List<Double> amounts, double currencyRate){final List<Double> amountsInCurrency = new ArrayList<Double>();for(double amount : amounts){amountsInCurrency.add(convertCurrency(amount, currencyRate));}return amountsInCurrency;
}
注意,除了在步骤2处调用的方法外,两种接受列表的方法是如何相似的:
- 创建一个输出列表,
- 为输入列表中的每个元素调用给定方法 ,并将结果存储到输出列表中
- 返回输出列表。
您经常在Java中执行此操作,而这恰恰是Map运算符:将给定方法someMethod (T):T应用于list <T>的每个元素,这将为您提供另一个相同大小的list <T>。
功能语言认识到这种特殊需求(在集合的每个元素上应用一种方法)非常普遍,因此他们将其直接封装到内置的Map运算符中。 这样,给定addVAT(double,double)方法,我们可以使用Map运算符直接编写如下代码:
List amountsWithVAT = map (addVAT, amounts, rate)
是的,第一个参数是函数,因为函数是函数语言中的一等公民,因此可以将它们作为参数传递。 与for循环相比,使用Map运算符更简洁,更不易出错,其意图也更加明确,但是我们在Java中没有它……
因此,这些示例的要点在于,您已经不熟悉甚至不知道函数式编程的关键概念:Map运算符。
现在是Fold运算符
回到金额列表,现在我们需要将总金额计算为每个金额的总和。 超级容易,让我们循环执行一下:
public double totalAmount(List<Double> amounts){double sum = 0;for(double amount : amounts){sum += amount;}return sum;
}
基本上,我们只是在列表上进行了折叠,使用函数“ + =”将每个元素折叠为一个元素,这里是一个数字,一次递增地折叠。 这类似于Map运算符,除了结果不是列表而是单个元素(标量)。
这又是您通常用Java编写的那种代码,现在您已经用功能语言为它命名:“ Fold ”或“ Reduce”。 Fold运算符通常在函数式语言中是递归的,因此在此不再对其进行描述。 但是,我们可以使用某种可变状态在迭代之间累加结果,从而以迭代形式实现相同的目的。 在这种方法中,Fold采用一种内部可变状态的方法,该方法期望一个元素,例如someMethod(T),并将其重复应用于输入列表<T>中的每个元素,直到我们得到一个单个元素T,即折叠操作的结果。
与Fold一起使用的典型函数是求和,逻辑与与或,List.add()或List.addAll(),StringBuilder.append(),max或min等。Fold的思维方式类似于SQL中的聚合函数 。
形状思考
直观地思考(带有草率的图片),Map接收一个大小为n的列表,并返回另一个大小相同的列表:
另一方面,Fold获取大小为n的列表,并返回单个元素(标量):
您可能还记得我之前关于谓词的文章 ,这些文章通常用于将集合过滤为元素较少的集合。 实际上,此过滤器运算符是在大多数功能语言中补充Map和Fold的第三种标准运算符。
Eclipse模板
由于Map和Fold很常见,因此有必要为它们创建Eclipse模板,例如Map:
在Java中更接近地图和折叠
Map和Fold是期望函数作为参数的构造,而在Java中,传递方法的唯一方法是将其包装到接口中。
在Apache Commons Collections中,有两个接口对于我们的需求特别有趣: Transformer (具有一个方法transform(T):T )和Closure (具有一个方法execute(T):void) 。 类CollectionUtils提供了方法collect(Iterator,Transformer) ,它基本上是Java集合的穷人Map运算符,以及提供了可以使用闭包来模拟Fold运算符的forAllDo()方法。
使用Google Guava, Iterables类提供了静态方法transform(Iterable,Function) ,该方法基本上是Map运算符。
List<Double> exVat = Arrays.asList(new Double[] { 99., 127., 35. });Iterable<Double> incVat = Iterables.transform(exVat, new Function<Double, Double>() {public Double apply(Double exVat) {return exVat * (1.196);}});System.out.println(incVat); //print [118.404, 151.892, 41.86]
类似的变换()方法,也可在类解释为解释和地图为地图。
要在Java中模拟Fold运算符,可以使用Closure接口,例如Apache Commons Collection中的Closure接口,仅使用一个带有一个参数的单一方法,因此必须在内部保留当前的-mutable-状态,就像'+ =确实。
不幸的是,Guava中没有Fold,尽管它经常被要求提供 ,甚至没有类似闭包的函数,但是创建自己的函数并不难,例如,您可以使用以下方式实现上述总计:
// the closure interface with same input/output type
public interface Closure<T> {T execute(T value);
}// an example of a concrete closure
public class SummingClosure implements Closure<Double> {private double sum = 0;public Double execute(Double amount) {sum += amount; // apply '+=' operatorreturn sum; // return current accumulated value}
}// the poor man Fold operator
public final static <T> T foreach(Iterable<T> list, Closure<T> closure) {T result = null;for (T t : list) {result = closure.execute(t);}return result;
}@Test // example of use
public void testFold() throws Exception {SummingClosure closure = new SummingClosure();List<Double> exVat = Arrays.asList(new Double[] { 99., 127., 35. });Double result = foreach(exVat, closure);System.out.println(result); // print 261.0
}
不仅用于收藏:可折叠在树木和其他建筑物上
Map and Fold的功能不仅限于简单的集合,还可以扩展到任何可导航的结构,尤其是树和图。
想象一棵使用带有其子节点的类Node的树。 最好将深度优先搜索和广度优先搜索(DFS和BFS)编码成两个接受Closure作为单个参数的通用方法:
public class Node ...{...public void dfs(Closure closure){...}public void bfs(Closure closure){...}
}
过去,我经常使用这种技术,我可以说它可以大大减少类的大小,仅使用一种通用方法,而不是许多看起来相似的方法(每个方法都会重做自己的树遍历)。 更重要的是,可以使用模拟闭包对遍历本身进行单元测试。 每个封盖也可以独立进行单元测试,所有这些都使您的生活变得更加简单。
访客模式可以实现非常相似的想法,您可能已经很熟悉。 我在代码和其他几个团队的代码中多次看到,Visitor非常适合在遍历数据结构期间累积状态。 在这种情况下,Visitor只是闭合中传递给折叠的一种特殊情况。
Map-Reduce上的一个字
您可能听说过Map-Reduce模式,是的,其中的“ Map”和“ Reduce”一词指的是我们刚刚看到的相同的函数运算符Map和Fold(也称为Reduce)。 尽管实际应用更加复杂,但很容易注意到Map 令人尴尬地是并行的,这对并行计算有很大帮助。
参考:来自我们的JCG合作伙伴的 日常Java中的Map和Fold功能编程思考 Cyrille Martraire 博客上的Cyrille Martraire 。
翻译自: https://www.javacodegeeks.com/2012/03/functional-programming-with-map-and.html
fold函数