本章概要
- 中间操作
- 跟踪和调试
- 流元素排序
- 移除元素
- 应用函数到元素
- 在 map() 中组合流
中间操作
中间操作用于从一个流中获取对象,并将对象作为另一个流从后端输出,以连接到其他操作。
跟踪和调试
peek()
操作的目的是帮助调试。它允许你无修改地查看流中的元素。代码示例:
Peeking.java
class Peeking {public static void main(String[] args) throws Exception {FileToWords.stream("Cheese.dat").skip(21).limit(4).map(w -> w + " ").peek(System.out::print).map(String::toUpperCase).peek(System.out::print).map(String::toLowerCase).forEach(System.out::print);}
}
FileToWords.java
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.regex.Pattern;
import java.util.stream.Stream;public class FileToWords {public static Stream<String> stream(String filePath)throws Exception {return Files.lines(Paths.get(filePath)).skip(1) // First (comment) line.flatMap(line ->Pattern.compile("\\W+").splitAsStream(line));}
}
Cheese.dat
// streams/Cheese.dat
Not much of a cheese shop really, is it?
Finest in the district, sir.
And what leads you to that conclusion?
Well, it's so clean.
It's certainly uncontaminated by cheese.
输出结果:
FileToWords
稍后定义,但它的功能实现貌似和之前我们看到的差不多:产生字符串对象的流。之后在其通过管道时调用 peek()
进行处理。
因为 peek()
符合无返回值的 Consumer 函数式接口,所以我们只能观察,无法使用不同的元素来替换流中的对象。
流元素排序
在 Randoms.java
中,我们熟识了 sorted()
的默认比较器实现。其实它还有另一种形式的实现:传入一个 Comparator 参数。代码示例:
import java.util.*;public class SortedComparator {public static void main(String[] args) throws Exception {FileToWords.stream("D:\\onJava\\myTest\\base\\Cheese.dat").skip(10).limit(10).sorted(Comparator.reverseOrder()).map(w -> w + " ").forEach(System.out::print);}
}
输出结果:
sorted()
预设了一些默认的比较器。这里我们使用的是反转“自然排序”。当然你也可以把 Lambda 函数作为参数传递给 sorted()
。
移除元素
distinct()
:在Randoms.java
类中的distinct()
可用于消除流中的重复元素。相比创建一个 Set 集合来消除重复,该方法的工作量要少得多。filter(Predicate)
:过滤操作,保留如下元素:若元素传递给过滤函数产生的结果为true
。
在下例中,isPrime()
作为过滤函数,用于检测质数。
import java.util.stream.*;import static java.util.stream.LongStream.*;public class Prime {public static Boolean isPrime(long n) {return rangeClosed(2, (long) Math.sqrt(n)).noneMatch(i -> n % i == 0);}public LongStream numbers() {return iterate(2, i -> i + 1).filter(Prime::isPrime);}public static void main(String[] args) {new Prime().numbers().limit(10).forEach(n -> System.out.format("%d ", n));System.out.println();new Prime().numbers().skip(90).limit(10).forEach(n -> System.out.format("%d ", n));}
}
输出结果:
rangeClosed()
包含了上限值。如果不能整除,即余数不等于 0,则 noneMatch()
操作返回 true
,如果出现任何等于 0 的结果则返回 false
。 noneMatch()
操作一旦有失败就会退出。
应用函数到元素
map(Function)
:将函数操作应用在输入流的元素中,并将返回值传递到输出流中。mapToInt(ToIntFunction)
:操作同上,但结果是 IntStream。mapToLong(ToLongFunction)
:操作同上,但结果是 LongStream。mapToDouble(ToDoubleFunction)
:操作同上,但结果是 DoubleStream。
在这里,我们使用 map()
映射多种函数到一个字符串流中。代码示例:
import java.util.*;
import java.util.stream.*;
import java.util.function.*;class FunctionMap {static String[] elements = {"12", "", "23", "45"};static Stream<String>testStream() {return Arrays.stream(elements);}static void test(String descr, Function<String, String> func) {System.out.println(" ---( " + descr + " )---");testStream().map(func).forEach(System.out::println);}public static void main(String[] args) {test("add brackets", s -> "[" + s + "]");test("Increment", s -> {try {return Integer.parseInt(s) + 1 + "";} catch (NumberFormatException e) {return s;}});test("Replace", s -> s.replace("2", "9"));test("Take last digit", s -> s.length() > 0 ?s.charAt(s.length() - 1) + "" : s);}
}
输出结果:
在上面的自增示例中,我们用 Integer.parseInt()
尝试将一个字符串转化为整数。如果字符串不能被转化成为整数就会抛出 NumberFormatException
异常,此时我们就回过头来把原始字符串放到输出流中。
在以上例子中,map()
将一个字符串映射为另一个字符串,但是我们完全可以产生和接收类型完全不同的类型,从而改变流的数据类型。下面代码示例:
// Different input and output types (不同的输入输出类型)import java.util.stream.*;class Numbered {final int n;Numbered(int n) {this.n = n;}@Overridepublic String toString() {return "Numbered(" + n + ")";}
}class FunctionMap2 {public static void main(String[] args) {Stream.of(1, 5, 7, 9, 11, 13).map(Numbered::new).forEach(System.out::println);}
}
输出结果:
我们将获取到的整数通过构造器 Numbered::new
转化成为 Numbered
类型。
如果使用 Function 返回的结果是数值类型的一种,我们必须使用合适的 mapTo数值类型
进行替代。代码示例:
// Producing numeric output streams( 产生数值输出流)import java.util.stream.*;class FunctionMap3 {public static void main(String[] args) {Stream.of("5", "7", "9").mapToInt(Integer::parseInt).forEach(n -> System.out.format("%d ", n));System.out.println();Stream.of("17", "19", "23").mapToLong(Long::parseLong).forEach(n -> System.out.format("%d ", n));System.out.println();Stream.of("17", "1.9", ".23").mapToDouble(Double::parseDouble).forEach(n -> System.out.format("%f ", n));}
}
输出结果:
遗憾的是,Java 设计者并没有尽最大努力去消除基本类型。
在 map()
中组合流
假设我们现在有了一个传入的元素流,并且打算对流元素使用 map()
函数。现在你已经找到了一些可爱并独一无二的函数功能,但是问题来了:这个函数功能是产生一个流。我们想要产生一个元素流,而实际却产生了一个元素流的流。
flatMap()
做了两件事:将产生流的函数应用在每个元素上(与 map()
所做的相同),然后将每个流都扁平化为元素,因而最终产生的仅仅是元素。
flatMap(Function)
:当 Function
产生流时使用。
flatMapToInt(Function)
:当 Function
产生 IntStream
时使用。
flatMapToLong(Function)
:当 Function
产生 LongStream
时使用。
flatMapToDouble(Function)
:当 Function
产生 DoubleStream
时使用。
为了弄清它的工作原理,我们从传入一个刻意设计的函数给 map()
开始。该函数接受一个整数并产生一个字符串流:
import java.util.stream.*;public class StreamOfStreams {public static void main(String[] args) {Stream.of(1, 2, 3).map(i -> Stream.of("Gonzo", "Kermit", "Beaker")).map(e -> e.getClass().getName()).forEach(System.out::println);}
}
输出结果:
我们天真地希望能够得到字符串流,但实际得到的却是“Head”流的流。我们可以使用 flatMap()
解决这个问题:
import java.util.stream.*;public class FlatMap {public static void main(String[] args) {Stream.of(1, 2, 3).flatMap(i -> Stream.of("Gonzo", "Fozzie", "Beaker")).forEach(System.out::println);}
}
输出结果:
从映射返回的每个流都会自动扁平为组成它的字符串。
下面是另一个演示,我们从一个整数流开始,然后使用每一个整数去创建更多的随机数。
import java.util.*;
import java.util.stream.*;public class StreamOfRandoms {static Random rand = new Random(47);public static void main(String[] args) {Stream.of(1, 2, 3, 4, 5).flatMapToInt(i -> IntStream.concat(rand.ints(0, 100).limit(i), IntStream.of(-1))).forEach(n -> System.out.format("%d ", n));}
}
输出结果:
在这里我们引入了 concat()
,它以参数顺序组合两个流。 如此,我们在每个随机 Integer
流的末尾添加一个 -1 作为标记。你可以看到最终流确实是从一组扁平流中创建的。
因为 rand.ints()
产生的是一个 IntStream
,所以我必须使用 flatMap()
、concat()
和 of()
的特定整数形式。
让我们再看一下将文件划分为单词流的任务。我们最后使用到的是 FileToWordsRegexp.java,它的问题是需要将整个文件读入行列表中 —— 显然需要存储该列表。而我们真正想要的是创建一个不需要中间存储层的单词流。
下面,我们再使用 flatMap()
来解决这个问题:
import java.nio.file.*;
import java.util.stream.*;
import java.util.regex.Pattern;public class FileToWords {public static Stream<String> stream(String filePath) throws Exception {return Files.lines(Paths.get(filePath)).skip(1) // First (comment) line.flatMap(line ->Pattern.compile("\\W+").splitAsStream(line));}
}
stream()
现在是一个静态方法,因为它可以自己完成整个流创建过程。
注意:\\W+
是一个正则表达式。表示“非单词字符”,+
表示“可以出现一次或者多次”。小写形式的 \\w
表示“单词字符”。
我们之前遇到的问题是 Pattern.compile().splitAsStream()
产生的结果为流,这意味着当我们只是想要一个简单的单词流时,在传入的行流(stream of lines)上调用 map()
会产生一个单词流的流。幸运的是,flatMap()
可以将元素流的流扁平化为一个简单的元素流。或者,我们可以使用 String.split()
生成一个数组,其可以被 Arrays.stream()
转化成为流:
.flatMap(line -> Arrays.stream(line.split("\\W+"))))
因为有了真正的流(而不是FileToWordsRegexp.java
中基于集合存储的流),所以每次需要一个新的流时,我们都必须从头开始创建,因为流不能被复用:
public class FileToWordsTest {public static void main(String[] args) throws Exception {FileToWords.stream("D:\\onJava\\myTest\\base\\Cheese.dat").limit(7).forEach(s -> System.out.format("%s ", s));System.out.println();FileToWords.stream("D:\\onJava\\myTest\\base\\Cheese.dat").skip(7).limit(2).forEach(s -> System.out.format("%s ", s));}
}
输出结果:
在 System.out.format()
中的 %s
表明参数为 String 类型。