Java8 Stream 的最佳实践


Java8 Stream 的最佳实践

java8stream提供了对于集合类的流失处理,其具有以下特点:

Lazy Evaluation(长度可以无限)

只能使用一次

内部迭代

Lazy Evaluation类似函数式中的LazyList,只有在需要时才去求值。减少了内存消耗,Java中可以用Iterator模拟。只有在进行终端操作时,stream才会执行。但是这个延迟计算不能保证流中的某个值单独延迟,需要时单独分配资源。

内部迭代的意思是我们告诉程序要实现的功能,迭代由程序自己控制。如filter时,我们只提供Predicate,而不是自己写for循环,至于程序自己是如何实现过滤数据的,我们并不关心。可能随着stream类库的迭代,实现效率会逐步提升。PS:新版本的Java类库String终于可以直接拼串了 ??,而且性能很好。

使用Stream的原则:

可读性、bugfree、短

Do

  1. 开发过程中最常用的Stream实现就是filter map reduce/collect操作,这种处理可以替代很大部分的(至少50%)的for循环。
// 读入数据,笔试用
Scanner sc = new Scanner(System.in);
String ss = sc.nextLine();
int[] nums = Arrays.stream(ss.split("\\s")).mapToInt(Integer::valueOf).toArray();

// flatMap只使用一次
// 这个例子来自于On Java 8
// 字符串打散,注意不要打散成char
// 常见的模式(方法返回流)
public static Stream stream(String filePath) throws Exception {
    return Files.lines(Paths.get(filePath))
    .skip(1) // First (comment) line
    .flatMap(line ->
    Pattern.compile("\\W+").splitAsStream(line));
}

// 一对多关系,保存到数据库,命令式编程需要两层for循环
List roles = users.stream().flatMap(user -> user.getRoles().stream()).collect(toList());
saveBatch(roles);

// 生成随机数组
int[] nums = new Random().ints(0, 100).limit(10).toArray();

// optional流的处理
stream1.filter(Optional::isPresent).map(Optional::get).collect(toList());
stream2.map(opt -> opt.orElse(defaultValue)).collect(toList());

// forEach
stream3.forEach(System.out::println);

// 生成Map,这种最终操作我后面会发文章详细分析Collectors工具类
Map idToUserMap = users.stream().collect(toMap(User::getId, it -> it));

// 获取角色到用户的映射(一对多)
HashMultiMap roleIdToUsersMap = userVos.stream().collect(toMultiMap(UserVo::getRoleId, UserVo::getUser, HashMultimap::create));

// 分组
Map> usersByLevelMap = users.collect(groupingBy(User::getLevel));

// 字符串拼接
subscriptions.stream().map(Object::toString).collect(joining(",", "(", ")"));

// 参数校验
boolean validated = request.getResources().stream().allMatch(authorities::contains);
if (!validated) throw ...

IntStream::sum, max, min, average, count...

// 教学意义
质数流,完全数流...
  1. 开发中的大部分时候我们不需要特别在意性能,仅在需要时优化。

比如你需要一个字符串匹配算法,需要自己实现一些特殊功能,先写出暴力匹配,之后再优化。

比如我想获取一个前十名的排行榜,我不必在自己编写优先队列,或者使用其他类库。当需要优化时,再考虑优化。

// 至少我们可以确定:使用stream的内部迭代中时间复杂度最多是nlogn。
Comparator compScore = Comparator.comparingDouble(User::getScore).reversed();
List top10 = users.stream().sorted(compScore).limit(10).collect(toList());

Don’t

毕竟Java不是纯函数式的语言,还要前向兼容,所以只能部分利用函数式的思想。以下这些做法在开发中应该避免。

  1. 忽略空指针。对于可能存在空指针的类直接使用Stream,特别是类中具有复杂的引用关系时,比如我通过Feign获取的对象。即使使用Optional,也会令可读性大大下降。
  2. 包含复杂的异常处理。异常处理时不要使用stream,stream天生和异常相冲突,函数式编程中异常也是一类副作用,两种很难相容。Java也没有Either类。尽量少用,非要用可以使用Optional或者 try-catch 包装,
  3. 使用stream类中的flatMap实现多重循环。这样可读性很差。就想try-catch嵌套一样难受。英文里叫boilerplate,不知道中文用哪个词,大意就是跟八股文一样繁杂。
  4. 使用forEach。尽量不要使用forEach,forEach只限定在几种特定的编程模式。这个方法很难调试。
  5. 在代码面试或笔试中使用。因为人家面试官考的就是你对命令式编程的理解、算法与数据结构、函数内部状态的追踪,而且代码笔试中特别看重性能,stream会生成很多不可变的中间变量,占用空间,在在线编程环境上性能不稳定。
  6. 使用parallel方法。这个方法对于性能的提升有限,只有在进行大量计算时有用。几乎用不到。