lambda表达式
- 前言
- 前置知识
- λ小故事
- 函数式编程起源: λ演算法
- 概念
- Lambda && 匿名类
- 无参类型的简写
- 带参函数的简写
- 简写的依据
- 自定义函数接口
- lambda && 匿名类JVM层面区别
- 匿名内部类实现
- Lambda表达式实现
- 推论,this引用的意义
- lambda && 集合
- Collection中的新方法
- forEach()
- removeIf()
- replaceAll()
- sort()
- spliterator()
- stream() && parrllelStream()
- Map中的新方法
- forEach()
- getOrDefault()
- putIfAbsent()
- remove()
- replace()
- replaceAll()
- merge()
- compute()
- computeIfAbsent()
- computeIfPresent()
前言
函数式编程,曾经有过一段黄金时代,后来又因面向对象范式的崛起而逐步变为小众范式。但是,函数式编程目前又开始在不同的语言中流行起来了,像Java 8、JS、Rust等语言都有对函数式编程的支持。
面向对象编程是对数据进行抽象,而函数式编程是对行为进行抽象.
这种抽象方式好处还是有很多的,可以让程序员写出更容易阅读的代码,这种代码更清晰的表达了业务逻辑,而不是从机制上如何实现.
在写回调函数和事件处理器时,我们不用再纠缠于匿名内部类的冗繁和可读性.
核心思想: 使用不可变值和函数,函数对一个值进行处理,映射成另一个值
前置知识
λ小故事
这块有时间填坑
函数式编程起源: λ演算法
λ演算(读作lambda演算),它从数理逻辑(Mathematical logic)发展而来,使用变量绑定(binding)和代换规则(substitution)来研究函数如何抽象化定义(define),函数如何被应用(apply)以及递归(recursion)的形式系统.
λ演算式有三个要点:
- 绑定关系 : 变量任意性,x,y,z都可以,它仅仅是具体数据的代称
- 递归定义 : λ项递归定义,M可以是一个λ项
- 替换归约 : λ项可应用,空格分隔表示对M应用N ,N可以是一个λ项
注意,在λ演算法里面,任何东西都是在函数之上建立起来的,而且λ里面的函数和我们编程中的函数几乎是一模一样的,举个例子来看:
λ函数如下:
λx.xy
对应的函数如下
def add(i,j):
return i+j
add括号里面的i和j就是形参
所以对应λ演算法的函数就是一个x,而它.后面就是函数体(定义了函数要做什么),在调用函数的时候,形参和函数体会被形参括起来,比如:(λx.xy)a == add(1,3) 其中这个a就是函数里的实参,如下图
我们习惯中的编程语言的函数在里面写的都是操作和指令,告诉计算机传进来的参数要对其进行什么操作.
也就是先有的数据和指令,函数是被定义在数据和指令这两个基础概念之上的
而对于λ演算法来说,函数是第一概念,最初是没有数据和指令的,也就是说数据和指令也需要建立在函数这个概念之上.
我们用上图的例子来说明
对于上图例子而言,x我们知道是实参,但是y是什么呢??
其实y是什么根本就不重要,因为在λ演算法里,重点不是符号是什么,而是两个符号之间的关系.
第一个x是形参,第二个y是什么无所谓,它只要和第一个符号不一样就行.
为了帮助我们更好的理解,我们拿过来一个例子来看符号之间的关系
上面的内容看不太明白也没关系,可以去看一下这个b站视频:【4. 用“λ演算法”去理解,为什么函数式编程会有更少的bug】https://www.bilibili.com/video/BV1d34y1v7xr?vd_source=e69b8b220e292b8e4922bf6622e13c51
受限于时间和篇幅,没办法把视频中的思想很好的表达出来,不妨直接去看一下这个视频,相信就可以更好理解了.
概念
lambda表达式,也称λ表达式,是一种匿名函数,即没有函数名的函数.
它是基于数学中的λ演算得名,直接对应其中的lambda抽象.
在编程语言中,lambda允许我们以简洁的方式表示函数,无需进行完整的函数定义.
具体来说,lambda表达式由参数和表达式组成,其中参数是函数的输入,表达式是函数的输出.
lambda表达式主要特点是其匿名性和简洁性,使得我们可以快速定义简单的函数,并在需要的地方使用它们.
此外,它可以作为参数传递给其他函数,或者从其他函数中返回,从而实现函数的灵活组合和调用.
lambda表达式不仅仅是匿名内部类的语法糖,JVM内部通过invokedynamic指令来实现lambda表达式的.
Lambda && 匿名类
lambda表达式可以简化匿名内部类的书写,但lambda表达式并不能取代所有的匿名内部类,只能用来取代函数接口(Functional Interface)的简写.
无参类型的简写
如果需要一个线程,常见的写法是:
new Thread( new Runnable(){@Overridepublic void run(){System.out.println("Thread run()");}
}).start();
Thread类传递了一个匿名的Runnable对象,重载Runnable接口的run()方法来实现相应逻辑,这是JDK7及其以前的做法,虽然省去了为类起名字的烦恼,但是还不够简化,在JDK8中可以简化如下方式:
new Thread(() -> System.out.println("Thread run()"); //省略接口名和方法名
)
上述代码和匿名内部类作用是一样的,但比匿名内部类更进一步,连着接口名和函数名都一同省掉了.
带参函数的简写
如果给一个字符串列表通过自定义比较器,按照字符串长度进行排序,JDK7书写形式
List<String> list = Arrays.asList("I", "love", "you", "too");
Collections.sort(list,new Comparator<String>(){@Overridepublic int compare(String s1,String s2){if(s1==null)return -1;if(s2 == null)return 1;return s1.length() - s2.length();}});
上述代码通过内部类存储重载了Comparator接口的compare()方法,实现比较逻辑.
采用lambda表达式可简写如下:
// JDK8 Lambda表达式写法
List<String> list = Arrays.asList("I", "love", "you", "too");
Collections.sort(list,(s1,s2)->{if(s1 == null)return -1;if(s2 == null)return 1;return s1.length() - s2.length();{);
除了省略接口名和方法名,代码中把参数表的类型也忽略了.
得益于javac的类型推断机制,编译期能够根据上下文信息推断出参数的类型,当然也有推断失败的时候,这时候就需要手动指明参数类型了.
注意: Java是强类型语言,每个变量和对象都必需有明确的类型.
简写的依据
并不是所有的接口都可以使用lambda简写,能够使用lambda的依据是必须有相应的函数接口(函数接口,是指内部只有一个抽象方法的接口).这一点跟Java是强类型语言吻合,也就是说你并不能在代码的任何地方任性的写lambda表达式.
lambda的类型就是对应函数接口的类型.
lambda表达式另一个依据就是类型推断机制,在上下文信息足够多的情况下,编译期可以推断出参数表的类型,而不需要显示指名.lambda表达更多合法的书写形式如下:
// Lambda表达式的书写形式
Runnable run = () -> System.out.println("Hello World");// 1 :无参函数的简写
ActionListener listener = event -> System.out.println("button clicked");// 2 有参函数的简写
Runnable multiLine = () -> {// 3 代码块写法System.out.print("Hello");System.out.println(" Hoolee");
};
BinaryOperator<Long> add = (Long x, Long y) -> x + y;// 4
BinaryOperator<Long> addImplicit = (x, y) -> x + y;// 5 类型推断机制
自定义函数接口
自定义函数接口很容易,只需要编写一个只有一个抽象方法的接口即可
@FunctionalInterface
public interface ConsumerInterface<T>{void accept(T t)
}
有了上述接口定义,我们可以写出下面的代码
ConsumerInterface<String> consumer = str -> System.out.println(str)
进阶一点的用法
class Mystream<T>{private List<T> list;public void myForEach(ConsumerInterface<T> consumer){for(T t:list){consumer.accept(t);}}
}
MyStream<String> stream = new MyStream<String>();
stream.myForEach(str -> System.out.println(str)); // 自定义函数接口书写lambda表达式
lambda && 匿名类JVM层面区别
lambda表达式似乎只是为了简化匿名内部类书写,看起来仅仅是通过语法糖在编译阶段把所有的lambda表达式替换成匿名内部类就可以了.
但其实并非如此,在JVM层面,lambda表达式和匿名内部类有着明显的差别.
匿名内部类实现
匿名内部类仍然是一个类,只是不需要程序员显示指定类名,编译期会自动为该类取名,编译之后会产生两个class文件:
public class MainAnonymousClass {public static void main(String[] args) {new Thread(new Runnable(){@Overridepublic void run(){System.out.println("Anonymous Class Thread run()");}}).start();;}
}
进一步分析主类MainAnonymousClass.class字节码,可发现其创建了匿名内部类的对象:
// javap -c MainAnonymousClass.class
public class MainAnonymousClass {...public static void main(java.lang.String[]);Code:0: new #2 // class java/lang/Thread3: dup4: new #3 // class MainAnonymousClass$1 /*创建内部类对象*/7: dup8: invokespecial #4 // Method MainAnonymousClass$1."<init>":()V11: invokespecial #5 // Method java/lang/Thread."<init>":(Ljava/lang/Runnable;)V14: invokevirtual #6 // Method java/lang/Thread.start:()V17: return
}
Lambda表达式实现
Lambda表达式通过invokedynamic指令实现,书写lambda表达式不会产生新的类,如果有如下代码,编译之后只有一个class文件:
public class MainLambda {public static void main(String[] args) {new Thread(() -> System.out.println("Lambda Thread run()")).start();;}
}
编译后的结果:
通过javap反编译命名,我们可以看到Lambda表达式内部表示的不同:
// javap -c -p MainLambda.class
public class MainLambda {...public static void main(java.lang.String[]);Code:0: new #2 // class java/lang/Thread3: dup4: invokedynamic #3, 0 // InvokeDynamic #0:run:()Ljava/lang/Runnable; /*使用invokedynamic指令调用*/9: invokespecial #4 // Method java/lang/Thread."<init>":(Ljava/lang/Runnable;)V12: invokevirtual #5 // Method java/lang/Thread.start:()V15: returnprivate static void lambda$main$0(); /*Lambda表达式被封装成主类的私有方法*/Code:0: getstatic #6 // Field java/lang/System.out:Ljava/io/PrintStream;3: ldc #7 // String Lambda Thread run()5: invokevirtual #8 // Method java/io/PrintStream.println:(Ljava/lang/String;)V8: return
}
反编译之后我们发现lambda表达式被封装了主类的一个私有方法,并通过invokedynamic
指令进行调用
推论,this引用的意义
既然lambda表达式不是内部类的简写,那么lambda内部的this引用和内部类对象没关系了.
在Lambda表达式中this的意义跟在表达式外部完全一样。因此下列代码将输出两遍Hello Hoolee,而不是两个引用地址。
public class Hello {Runnable r1 = () -> { System.out.println(this); };Runnable r2 = () -> { System.out.println(toString()); };public static void main(String[] args) {new Hello().r1.run();new Hello().r2.run();}public String toString() { return "Hello Hoolee"; }
}
可能你会问,r1会输入Hello Hoolee
呢?
我们来详细解释一下:
- r1的lambda表达式中,this直接引用了Hello类实例,并调用了toString方法(当你尝试打印一个对象时,Java会自动调用该对象的toString方法)
- 在 r2 的 Lambda 表达式中,你调用了 toString() 方法,没有显式使用 this,但由于 toString() 是 Hello 类的一个成员方法,它隐式地使用了 this 来调用该方法。
lambda && 集合
为引入lambda表达式,Java8新增了java.util.function
包,里面包含常用函数接口,这是lambda表达式的基础,java集合框架也新增部分接口,以便与lambda表达式对接.
回顾一下Java集合框架的接口继承结构:
上图中绿色标注的接口类,表示在Java8中加入了新的接口方法,由于继承关系,他们相应的子类都会继承这些新方法,下面详细列举了这些方法.
接口名 | 兼容的方法 |
---|---|
Collection | forEach, stream, parallelStream, spliterator,removeIf |
List | sort, replaceAll |
Map | forEach,getOrDefault,replaceAll,putIfAbsent,remove,replace, computeIfAbsent,computeIfPresent,compute,merge |
这些新加入的方法大部分都要用到java.util.function 包下的接口,意味着这些方法大部分都跟lambda表达式相关. | |
下面我们逐一学习这些方法. |
Collection中的新方法
接口Collection和List新加入了一些方法,我们是以List的子类ArrayList为例来说明.
forEach()
default void forEach(Consumer<? super T> action) {Objects.requireNonNull(action);for (T t : this) {action.accept(t);}}public interface Consumer<T> {/*** Performs this operation on the given argument.** @param t the input argument*/void accept(T t);//无关代码省略
}
方法签名为void forEach(Consumer<? super E> action)
,作用是对容器中的每个元素执行action指定的动作,其中Consumer是函数接口,里面只有一个待实现方法void accept(T t)
(后面可以看到,这个方法叫什么根本不重要,甚至不需要记忆它的名字)
需求: 假设有一个字符串列表,需要打印出其中所有长度大于3的字符串
Java7及以前我们可以用增强for循环实现:
//使用增强for循环迭代
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
for(String str : list){if(str.length()>3)System.out.println(str)
}
使用forEach方法结合匿名内部类可以这样实现:
//使用forEach()结合匿名内部类迭代
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.forEach(new Consumer<String>(){@Overridepublic void accept(String str){if(str.length()>3)System.out.println(str)}
});
上面调用forEach且使用匿名内部类实现Consumer接口,目前为止没看到这种设计的好处,但我们还有Lambda表达式,如下
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.forEach( str -> {if(str.length() > 3)System.out.println(str);
});
我们不需要知道accept方法,也不需要知道Consumer接口,类型推导帮我们做了一切.
removeIf()
default boolean removeIf(Predicate<? super E> filter) {Objects.requireNonNull(filter);boolean removed = false;final Iterator<E> each = iterator();while (each.hasNext()) {if (filter.test(each.next())) {each.remove();removed = true;}}return removed;}@FunctionalInterface
public interface Predicate<T> {/*** Evaluates this predicate on the given argument.** @param t the input argument* @return {@code true} if the input argument matches the predicate,* otherwise {@code false}*/boolean test(T t);//省略无关代码
}
方法签名boolean removeIf(Predicate <? super E> filter)
,作用是删除容器中所有满足filter指定条件的元素.
其中Predicate是一个函数接口,里面只有一个待实现的方法 boolean test(T t)
,同样这个方法的名字不重要,用的时候不需要写这个名字.
需求: 假设有一个字符串列表,需要删除其中所有长度大于3的字符串。
在迭代过程中对容器进行删除操作必须使用迭代器,否则会抛出ConcurrentModificationException
,所有上述需求传统写法为:
// 使用迭代器删除列表元素
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
while(it.hasNext()){
if(it.next().length()>3) // 删除长度大于3的元素it.remove();
}
现在使用removeIf()
方法结合匿名内部类,我们可以这样实现:
// 使用removeIf()结合匿名名内部类实现
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.removeIf(new Predicate<String>(){ //删除长度大于3的元素@Overridepublic boolean test(String str){return str.length() >3;}});
上述代码使用removeIf()
方法,并使用匿名内部类实现Precicate
接口.相信你已经可以使用lambda表达式写了
// 使用removeIf()结合Lambda表达式实现
ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.removeIf(str -> str.length() >3); //删除长度大于3的元素
看的出来,使用lambda
不需要记忆Predicate
接口名,也不需要记忆test()
方法名,只需要知道此处需要一个返回布尔类型的lambda
表达式就可以了.
replaceAll()
public void replaceAll(UnaryOperator<E> operator) {root.replaceAllRange(operator, offset, offset + size);
}