Java8-Stream流式操作

Stream流式操作

1、简介

1.1 定义

Stream（流）是一种以声明性（只声明，不实现）的方式来处理数据的API，使用一种类似用 SQL 语句从数据库查询数据的直观方式来提供一种对 Java 集合运算和表达的高阶抽象。

元素是特定类型的对象，形成一个队列。 Java中的Stream并不会存储元素，而是按需计算。
数据源 流的来源。可以是集合，数组，I/O channel，产生器generator 等。
聚合操作 类似SQL语句一样的操作，比如filter, map, reduce, find, match, sorted等。

1.2特征

和以前的Collection操作不同， Stream操作还有两个基础的特征：

Pipelining: 中间操作都会返回流对象本身。这样多个操作可以串联成一个管道，如同流式风格（fluent style）。这样做可以对操作进行优化，比如延迟执行(laziness)和短路( short-circuiting)。
内部迭代：以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代，这叫做外部迭代。 Stream提供了内部迭代的方式，通过访问者模式(Visitor)实现

1.3分类

无状态：指元素的处理不受之前元素的影响；

有状态：指该操作只有拿到所有元素之后才能继续下去。

非短路操作：指必须处理所有元素才能得到最终结果；

短路操作：指遇到某些符合条件的元素就可以得到最终结果，如 A || B，只要A为true，则无需判断B的结果。3.4 流中方法

2、具体用法

2.1常用创建方法

2.1.1 使用Collection下的 stream() 和 parallelStream() 方法

List list = new ArrayList<>();
Stream stream = list.stream(); //获取一个顺序流
Stream parallelStream = list.parallelStream(); //获取一个并行流

2.1.2 使用Arrays 中的 stream() 方法，将数组转成流

Integer[] nums = new Integer[10];
Stream stream = Arrays.stream(nums);

2.1.3 使用Stream中的静态方法：of()、iterate()、generate()

Stream stream = Stream.of(1,2,3,4,5,6);
Stream stream2 = Stream.iterate(0, (x) -> x + 2).limit(6);
stream2.forEach(System.out::println); // 0 2 4 6 8 10
Stream stream3 = Stream.generate(Math::random).limit(2);
stream3.forEach(System.out::println);

2.1.4 使用 BufferedReader.lines() 方法，将每行内容转成流

BufferedReader reader = new BufferedReader(new FileReader("F:\\test_stream.txt"));
Stream lineStream = reader.lines();
lineStream.forEach(System.out::println);

2.1.5 使用 Pattern.splitAsStream() 方法，将字符串分隔成流

Pattern pattern = Pattern.compile(",");
Stream stringStream = pattern.splitAsStream("a,b,c,d");
stringStream.forEach(System.out::println);

2.2 流的中间操作

2.2.1 筛选与切片

filter ：过滤流中的某些元素 limit ( n ) ：获取n个元素 skip ( n ) ：跳过n元素，配合limit(n)可实现分页 distinct ：通过流中元素的 hashCode() 和 equals() 去除重复元素

Stream stream = Stream.of(6, 4, 6, 7, 3, 9, 8, 10, 12, 14, 14);
Stream newStream = stream.filter(s -> s > 5) // 6 6 7 9 8 10 12 14 14  过滤
        .distinct() // 6 7 9 8 10 12 14  去重
        .skip(2) // 9 8 10 12 14 跳过那个数据
        .limit(2); // 9 8 获取那个数据
newStream.forEach(System.out::println);

2.2.2 映射

map：接收一个函数作为参数，该函数会被应用到每个元素上，并将其映射成一个新的元素。 flatMap：接收一个函数作为参数，将流中的每个值都换成另一个流，然后把所有流连接成一个流。

List list = Arrays.asList("a,b,c", "1,2,3");
//将每个元素转成一个新的且不带逗号的元素
Stream s1 = list.stream().map(s -> s.replaceAll(",", ""));
s1.forEach(System.out::println); // abc  123
Stream s3 = list.stream().flatMap(s -> {
  //将每个元素转换成一个stream
   String[] split = s.split(",");
   Stream s2 = Arrays.stream(split);
   return s2;
});
s3.forEach(System.out::println); // a b c 1 2 3

2.2.3 排序

sorted () ：自然排序，流中元素需实现 Comparable 接口 sorted ( Comparator com ) ：定制排序，自定义 Comparator 排序器

List list = Arrays.asList("aa", "ff", "dd");
//String 类自身已实现Compareable接口
list.stream().sorted().forEach(System.out::println);// aa dd ff
Student s1 = new Student("aa", 10);
Student s2 = new Student("bb", 20);
Student s3 = new Student("aa", 30);
Student s4 = new Student("dd", 40);
List studentList = Arrays.asList(s1, s2, s3, s4);
?
//自定义排序：先按姓名升序，姓名相同则按年龄升序
studentList.stream().sorted(
        (o1, o2) -> {
            if (o1.getName().equals(o2.getName())) {
                return o1.getAge() - o2.getAge();
            } else {
                return o1.getName().compareTo(o2.getName());
            }
        }
).forEach(System.out::println);

2.2.4 消费

peek：如同于map，能得到流中的每一个元素。但map接收的是一个Function表达式，有返回值；而peek接收的是Consumer表达式，没有返回值。

Student s1 = new Student("aa", 10);
Student s2 = new Student("bb", 20);
List studentList = Arrays.asList(s1, s2);
studentList.stream()
        .peek(o -> o.setAge(100))
        .forEach(System.out::println);   
?
//结果：
Student{name='aa', age=100}
Student{name='bb', age=100}

2.3 流的终止操作

2.3.1 匹配、聚合操作

allMatch：接收一个 Predicate 函数，当流中每个元素都符合该断言时才返回true，否则返回false noneMatch：接收一个 Predicate 函数，当流中每个元素都不符合该断言时才返回true，否则返回false anyMatch：接收一个 Predicate 函数，只要流中有一个元素满足该断言则返回true，否则返回false findFirst：返回流中第一个元素 findAny：返回流中的任意元素 count：返回流中元素的总个数 max：返回流中元素最大值 min：返回流中元素最小值

List list = Arrays.asList(1, 2, 3, 4, 5);
boolean allMatch = list.stream().allMatch(e -> e > 10); //false
boolean noneMatch = list.stream().noneMatch(e -> e > 10); //true
boolean anyMatch = list.stream().anyMatch(e -> e > 4);  //true
Integer findFirst = list.stream().findFirst().get(); //1
Integer findAny = list.stream().findAny().get(); //1
long count = list.stream().count(); //5
Integer max = list.stream().max(Integer::compareTo).get(); //5
Integer min = list.stream().min(Integer::compareTo).get(); //1

2.3.2 规约操作

Optional< T > reduce ( BinaryOperator< T > accumulator )：第一次执行时，accumulator函数的第一个参数为流中的第一个元素，第二个参数为流中元素的第二个元素；第二次执行时，第一个参数为第一次函数执行的结果，第二个参数为流中的第三个元素；依次类推。

T reduce ( T identity , BinaryOperator< T > accumulator )：流程跟上面一样，只是第一次执行时，accumulator函数的第一个参数为identity，而第二个参数为流中的第一个元素。

< U > U reduce ( U identity , BiFunction< U , ? super T , U > accumulator , BinaryOperator< U > combiner )：在串行流(stream)中，该方法跟第二个方法一样，即第三个参数combiner不会起作用。在并行流(parallelStream)中,我们知道流被fork join出多个线程进行执行，此时每个线程的执行流程就跟第二个方法reduce(identity,accumulator)一样，而第三个参数combiner函数，则是将每个线程的执行结果当成一个新的流，然后使用第一个方法reduce(accumulator)流程进行规约。

//经过测试，当元素个数小于24时，并行时线程数等于元素个数，当大于等于24时，并行时线程数为16
List list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24);
Integer v = list.stream().reduce((x1, x2) -> x1 + x2).get();
System.out.println(v);   // 300
Integer v1 = list.stream().reduce(10, (x1, x2) -> x1 + x2);
System.out.println(v1);  //310
Integer v2 = list.stream().reduce(0,
       (x1, x2) -> {
           System.out.println("stream accumulator: x1:" + x1 + "  x2:" + x2);
            return x1 - x2;
       },
       (x1, x2) -> {
          System.out.println("stream combiner: x1:" + x1 + "  x2:" + x2);
            return x1 * x2;
        });
System.out.println(v2); // -300
Integer v3 = list.parallelStream().reduce(0,
       (x1, x2) -> {
            System.out.println("parallelStream accumulator: x1:" + x1 + "  x2:" + x2);
            return x1 - x2;
        },
        (x1, x2) -> {
            System.out.println("parallelStream combiner: x1:" + x1 + "  x2:" + x2);
            return x1 * x2;
        });
System.out.println(v3); //197474048

2.3.3 收集操作

collect：接收一个Collector实例，将流中元素收集成另外一个数据结构。
Collector< T, A, R > 是一个接口，有以下5个抽象方法：
- Supplier< A > supplier()：创建一个结果容器A
- BiConsumer< A, T > accumulator()：消费型接口，第一个参数为容器A，第二个参数为流中元素T。
- BinaryOperator< A > combiner ()：函数接口，该参数的作用跟上一个方法(reduce)中的combiner参数一样，将并行流中各个子进程的运行结果(accumulator函数操作后的容器A)进行合并。
- Function< A, R > finisher ()：函数式接口，参数为：容器A，返回类型为：collect方法最终想要的结果R。
- Set< Characteristics > characteristics ()：返回一个不可变的Set集合，用来表明该Collector的特征。有以下三个特征：
  - CONCURRENT：表示此收集器支持并发。（官方文档还有其他描述，暂时没去探索，故不作过多翻译）
  - UNORDERED：表示该收集操作不会保留流中元素原有的顺序。
  - IDENTITY_FINISH：表示finisher参数只是标识而已，可忽略。
注：如果对以上函数接口不太理解的话，可参考我另外一篇文章：Java 8 函数式接口

2.3.4 Collector 工具库：Collectors

Student s1 = new Student("aa", 10,1);
Student s2 = new Student("bb", 20,2);
Student s3 = new Student("cc", 10,3);
List list = Arrays.asList(s1, s2, s3);
//装成list
List ageList = list.stream().map(Student::getAge).collect(Collectors.toList()); // [10, 20, 10]
//转成set
Set ageSet = list.stream().map(Student::getAge).collect(Collectors.toSet()); // [20, 10]
//转成map,注:key不能相同，否则报错
Map studentMap = list.stream().collect(Collectors.toMap(Student::getName, Student::getAge)); // {cc=10, bb=20, aa=10}
//字符串分隔符连接
String joinName = list.stream().map(Student::getName).collect(Collectors.joining(",", "(", ")")); // (aa,bb,cc)
//聚合操作
//1.学生总数
Long count = list.stream().collect(Collectors.counting()); // 3
//2.最大年龄 (最小的minBy同理)
Integer maxAge = list.stream().map(Student::getAge).collect(Collectors.maxBy(Integer::compare)).get(); // 20
//3.所有人的年龄
Integer sumAge = list.stream().collect(Collectors.summingInt(Student::getAge)); // 40
//4.平均年龄
Double averageAge = list.stream().collect(Collectors.averagingDouble(Student::getAge)); // 13.333333333333334
// 带上以上所有方法
DoubleSummaryStatistics statistics = list.stream().collect(Collectors.summarizingDouble(Student::getAge));
System.out.println("count:" + statistics.getCount() + ",max:" + statistics.getMax() + ",sum:" + statistics.getSum() + ",average:" + statistics.getAverage());
//分组
Map> ageMap = list.stream().collect(Collectors.groupingBy(Student::getAge));
//多重分组,先根据类型分再根据年龄分
Map>> typeAgeMap = list.stream().collect(Collectors.groupingBy(Student::getType, Collectors.groupingBy(Student::getAge)));
//分区
//分成两部分，一部分大于10岁，一部分小于等于10岁
Map> partMap = list.stream().collect(Collectors.partitioningBy(v -> v.getAge() > 10));
//规约
Integer allAge = list.stream().map(Student::getAge).collect(Collectors.reducing(Integer::sum)).get(); //40

3.3.2 Collectors.toList() 解析

//toList 源码
public static  Collector> toList() {
    return new CollectorImpl<>((Supplier>) ArrayList::new, List::add,
            (left, right) -> {
                left.addAll(right);
                return left;
            }, CH_ID);
}
//为了更好地理解，我们转化一下源码中的lambda表达式
public  Collector> toList() {
    Supplier> supplier = () -> new ArrayList();
    BiConsumer, T> accumulator = (list, t) -> list.add(t);
    BinaryOperator> combiner = (list1, list2) -> {
        list1.addAll(list2);
        return list1;
    };
    Function, List> finisher = (list) -> list;
    Set characteristics = Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH));
    return new Collector, List>() {
        @Override
        public Supplier supplier() {
            return supplier;
        }
        @Override
        public BiConsumer accumulator() {
            return accumulator;
        }
        @Override
        public BinaryOperator combiner() {
            return combiner;
        }
        @Override
        public Function finisher() {
            return finisher;
        }
        @Override
        public Set characteristics() {
            return characteristics;
        }
    };
}

3、流的操作步骤

3.1 定义

流的操作分三步走：创建流、中间操作、终端操作

3.2 注意：

不是数据结构，不会保存数据。
不会修改原来的数据源，它会将操作后的数据保存到另外一个对象中。（保留意见：毕竟peek方法可以修改流中元素）
惰性求值，流在中间处理过程中，只是对操作进行了记录，并不会立即执行，需要等到执行终止操作的时候才会进行实际的计算。

3.3 循环合并

我们可以打印一些东西来看下：

List list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  .collect(Collectors.toList());

输出如下：

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}
filter: Cat{age=2}
map:Cat{age=2}

可以看到，中间操作的filter和map组合到一起交叉执行了，尽管他们是两个独立的操作（这个技术叫作循环合并）

3.4 短路技巧

短路这个词大家应该比较熟悉（比如脑子短路什么的），指的是本来A->B->C是都要执行的，但是在B的地方短路了，所以就变成了A->C了

这里的短路指的是中间操作，由于某些原因（比如下面的limit），导致只执行了部分，没有全部去执行

我们来修改下上面的例子（加了一个中间操作limit)：

List list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  // 只加了这一行
  .limit(1)
  .collect(Collectors.toList());

输出如下：

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}

可以看到，因为limit(1)只需要一个元素，所以filter过滤时，只要找到一个满足条件的，就会停止过滤操作（后面的元素就放弃了），这个技巧叫做短路技巧

这个就很大程度上体现了中间操作的组合顺序带来的优点：需要多少，处理多少，即按需处理

3.5 流式操作和集合操作的区别：

	流式操作	集合操作
功能	处理数据为主	存储数据为主
迭代方式	内部迭代（只迭代一次)，只需声明，不需要实现，流内部自己有实现）	外部迭代（可一直迭代）需要自己foreach
处理数据	直到终端操作，才会开始真正处理数据（按需处理）	一直都在处理数据（全部处理）

用生活中的例子来对比的话，可以用电影来比喻，流就好比在线观看，集合就好本地观看（下载到本地）

Java8-Stream流式操作

Stream流式操作

1、简介

1.1 定义

1.2特征

1.3分类

2、具体用法

2.1常用创建方法

2.1.1 使用Collection下的 stream() 和 parallelStream() 方法

2.1.2 使用Arrays 中的 stream() 方法，将数组转成流

2.1.3 使用Stream中的静态方法：of()、iterate()、generate()

2.1.4 使用 BufferedReader.lines() 方法，将每行内容转成流

2.1.5 使用 Pattern.splitAsStream() 方法，将字符串分隔成流

2.2 流的中间操作

2.2.1 筛选与切片

2.2.2 映射

2.2.3 排序

2.2.4 消费

2.3 流的终止操作

2.3.1 匹配、聚合操作

2.3.2 规约操作

2.3.3 收集操作

2.3.4 Collector 工具库：Collectors

3、流的操作步骤

3.1 定义

3.2 注意：

3.3 循环合并

3.4 短路技巧

3.5 流式操作和集合操作的区别：

相关

标签

Java8-Stream流式操作

Stream流式操作

1、简介

1.1 定义

1.2特征

1.3分类

2、具体用法

2.1常用创建方法

2.1.1 使用Collection下的 stream() 和 parallelStream() 方法

2.1.2 使用Arrays 中的 stream() 方法，将数组转成流

2.1.3 使用Stream中的静态方法：of()、iterate()、generate()

2.1.4 使用 BufferedReader.lines() 方法，将每行内容转成流

2.1.5 使用 Pattern.splitAsStream() 方法，将字符串分隔成流

2.2 流的中间操作

2.2.1 筛选与切片

2.2.2 映射

2.2.3 排序

2.2.4 消费

2.3 流的终止操作

2.3.1 匹配、聚合操作

2.3.2 规约操作

2.3.3 收集操作

2.3.4 Collector 工具库：Collectors

3、 流的操作步骤

3.1 定义

3.2 注意：

3.3 循环合并

3.4 短路技巧

3.5 流式操作和集合操作的区别：

相关

标签

3、流的操作步骤