Java【译】java8之stream

Streams

  • 原稿作者:
    shekhargulati
  • 译者: leege100
  • 状态: 完成

在其次章中,我们学习到了lambda表达式允许我们在不创制新类的状态下传递行为,从而协理我们写出到底简单的代码。lambda表达式是一种简单的语法结构,它经过应用函数式接口来扶持开发者简单明了的传递意图。当使用lambda表达式的计划思想来规划API时,lambda表明式的雄强就会收获反映,比如我们在第二节商量的应用函数式接口编程的APIlambdas
chapter

Stream是java8引入的一个重度使用lambda表明式的API。Stream使用一种恍若用SQL语句从数据库查询数据的直观情势来提供一种对Java集合运算和发挥的高阶抽象。直观意味着开发者在写代码时只需关注他们想要的结果是什么而无需关注实现结果的切切实实方法。这一章节中,大家将介绍为什么我们需要一种新的数额处理API、Collection和Stream的不同之处以及哪些将StreamAPI应用到我们的编码中。

本节的代码见 ch03
package
.

怎么我们需要一种新的数量处理抽象概念?

在我看来,首要有两点:

  1. Collection API
    无法提供更高阶的构造来询问数据,由此开发者不得不为兑现多数零星的职责而写一大堆样板代码。

2、对聚集数据的并行处理有早晚的限制,怎么着利用Java语言的产出结构、咋样连忙的拍卖数据以及怎么样神速的出现都需要由程序员自己来考虑和兑现。

Java 8从前的多寡处理

翻阅下面这一段代码,猜猜看它是拿来做什么的。

public class Example1_Java7 {

    public static void main(String[] args) {
        List<Task> tasks = getTasks();

        List<Task> readingTasks = new ArrayList<>();
        for (Task task : tasks) {
            if (task.getType() == TaskType.READING) {
                readingTasks.add(task);
            }
        }
        Collections.sort(readingTasks, new Comparator<Task>() {
            @Override
            public int compare(Task t1, Task t2) {
                return t1.getTitle().length() - t2.getTitle().length();
            }
        });
        for (Task readingTask : readingTasks) {
            System.out.println(readingTask.getTitle());
        }
    }
}

地点这段代码是用来按照字符串长度的排序打印所有READING类型的task的title。所有Java开发者每日都会写这么的代码,为了写出如此一个简短的顺序,我们只可以写下15行Java代码。不过下边这段代码最大的题材不在于其代码长度,而介于不可以清晰传达开发者的意向:过滤出具有READING的task、按照字符串的尺寸排序然后生成一个String类型的List。

Java8中的数据处理

可以像下边这段代码这样,使用java8中的Stream
API来实现与地方代码同等的效能。

public class Example1_Stream {

    public static void main(String[] args) {
        List<Task> tasks = getTasks();

        List<String> readingTasks = tasks.stream()
                .filter(task -> task.getType() == TaskType.READING)
                .sorted((t1, t2) -> t1.getTitle().length() - t2.getTitle().length())
                .map(Task::getTitle)
                .collect(Collectors.toList());

        readingTasks.forEach(System.out::println);
    }
}

地方这段代码中,形成了一个由三个stream操作结合的管道。

  • stream() – 通过在近似下面tasks List<Task>的集合源上调用
    stream()艺术来成立一个stream的管道。

  • filter(Predicate<T>)
    这么些操效率来领取stream中匹配predicate定义规则的元素。假若你有一个stream,你可以在它上边调用零次要么反复搁浅的操作。lambda表达式task -> task.getType() == TaskType.READING概念了一个用来过滤出富有READING的task的条条框框。

  • sorted(Comparator<T>): This operation returns a stream
    consisting of all the stream elements sorted by the Comparator
    defined by lambda expression i.e. in the example shown
    above.此操作再次来到一个stream,此stream由所有依照lambda表明式定义的Comparator来排序后的stream元素组成,在下面代码中排序的表达式是(t1,
    t2) -> t1.getTitle().length() – t2.getTitle().length().

  • map(Function<T,R>):
    此操作重返一个stream,该stream的各类元一向自原stream的每个元素通过Function<T,R>处理后取得的结果。

  • collect(toList())
    -此操作把下面对stream举行各个操作后的结果装进一个list中。

为啥说Java8更好

In my opinion Java 8 code is better because of following reasons:
在我看来,Java8的代码更好重要有以下几点原因:

  1. Java8代码能够清楚地发布开发者对数码过滤、排序等操作的企图。

  2. 透过接纳Stream
    API格式的更高抽象,开发者表明他们所想要的是哪些而不是怎么去赢得这几个结果。

  3. Stream
    API为多少处理提供一种统一的语言,使得开发者在钻探数据处理时有共同的词汇。当三个开发者探究filter函数时,你都会精通他们都是在进展一个多少过滤操作。

  4. 开发者不再需要为贯彻数量处理而写的各个规范代码,也不再需要为loop代码或者暂时集结来囤积数据的冗余代码,Stream
    API会处理这整个。

  5. Stream不会修改潜在的集纳,它是非换换的。

Stream是什么

Stream是一个在一些数据上的悬空视图。比如,Stream可以是一个list或者文件中的几行依然其他随意的一个要素连串的视图。Stream
API提供可以顺序表现依旧并行表现的操作总和。开发者需要精晓某些,Stream是一种更高阶的抽象概念,而不是一种数据结构。Stream不会储存数据Stream天生就很懒,只有在被利用到时才会执行统计。它同意大家发出无限的数据流(stream
of
data)。在Java8中,你可以像下边这样,相当轻松的写出一个无限制生成特定标识符的代码:

public static void main(String[] args) {
    Stream<String> uuidStream = Stream.generate(() -> UUID.randomUUID().toString());
}

在Stream接口中有诸如ofgenerateiterate等多种静态工厂方法能够用来创建stream实例。下边提到的generate方法包含一个SupplierSupplierJava,是一个足以用来描述一个不需要其他输入且会时有发生一个值的函数的函数式接口,大家向generate方法中传递一个supplier,当它被调用时会生成一个一定标识符。

Supplier<String> uuids = () -> UUID.randomUUID().toString()

运行方面这段代码,什么都不会发出,因为Stream是懒加载的,直到被使用时才会进行。假如我们改成如下这段代码,大家就会在控制台看到打印出来的UUID。这段程序会一向施行下去。

public static void main(String[] args) {
    Stream<String> uuidStream = Stream.generate(() -> UUID.randomUUID().toString());
    uuidStream.forEach(System.out::println);
}

Java8运行开发者通过在一个Collection上调用stream主意来创制Stream。Stream辅助数据处理操作,从而开发者可以应用更高阶的数额处理社团来表述运算。

Collection vs Stream

下边这张表解说了Collection和Stream的不同之处

Java 1

Collection vs Stream

下面我们来探索内迭代(internal iteration)和外迭代(external
iteration)的区分,以及懒赋值的概念。

外迭代(External iteration) vs (内迭代)internal iterationvs

地点谈到的Java8 Stream API代码和Collection
API代码的分别在于由什么人来控制迭代,是迭代器本身依旧开发者。Stream
API仅仅提供他们想要实现的操作,然后迭代器把这多少个操作使用到秘密Collection的各类元素中去。当对神秘的Collection举行的迭代操作是由迭代器本身决定时,就叫着内迭代;反之,当迭代操作是由开发者控制时,就叫着外迭代。Collection
API中for-each结构的行使就是一个外迭代的例子。

有人会说,在Collection
API中我们也不需要对神秘的迭代器举办操作,因为for-each布局早已替我们处理得很好了,可是for-each布局其实只是是一种iterator
API的语法糖罢了。for-each即便很粗略,可是它有部分缺陷 —
1)唯有固有各类 2)容易写出生硬的命令式代码(imperative code)
3)难以并行。

Lazy evaluation懒加载

stream表明式在被终极操作方法调用往日不会被赋值总结。Stream
API中的大多数操作会再次来到一个Stream。这么些操作不会做任何的推行操作,它们只会构建那个管道。看着下边这段代码,预测一下它的输出会是什么。

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Stream<Integer> stream = numbers.stream().map(n -> n / 0).filter(n -> n % 2 == 0);

地点这段代码中,我们将stream元素中的数字除以0,我们也许会认为那段代码在运行时会抛出ArithmeticExceptin可怜,而实在不会。因为stream表明式只有在有终点操作被调用时才会被执行运算。假使我们为地点的stream加上终极操作,stream就会被实践并抛出相当。

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Stream<Integer> stream = numbers.stream().map(n -> n / 0).filter(n -> n % 2 == 0);
stream.collect(toList());

咱俩会博得如下的stack trace:

Exception in thread "main" java.lang.ArithmeticException: / by zero
    at org._7dayswithx.java8.day2.EagerEvaluationExample.lambda$main$0(EagerEvaluationExample.java:13)
    at org._7dayswithx.java8.day2.EagerEvaluationExample$$Lambda$1/1915318863.apply(Unknown Source)
    at java.util.stream.ReferencePipeline$3$1.accept(ReferencePipeline.java:193)
    at java.util.Spliterators$ArraySpliterator.forEachRemaining(Spliterators.java:948)
    at java.util.stream.AbstractPipeline.copyInto(AbstractPipeline.java:512)
    at java.util.stream.AbstractPipeline.wrapAndCopyInto(AbstractPipeline.java:502)
    at java.util.stream.ReduceOps$ReduceOp.evaluateSequential(ReduceOps.java:708)
    at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:234)
    at java.util.stream.ReferencePipeline.collect(ReferencePipeline.java:499)

使用Stream API

Stream
API提供了一大堆开发者能够用来从集合中询问数据的操作,这多少个操作分为两种–过渡操作和顶峰操作。

连通操作从已存在的stream上暴发另一个新的stream的函数,比如filter,map,
sorted,等。

终端操作从stream上发生一个非stream结果的函数,如collect(toList())
, forEach, count等。

连通操作允许开发者构建在调用终极操作时才实施的管道。下边是Stream
API的局部函数列表:

<a
href=”https://whyjava.files.wordpress.com/2015/07/stream-api.png"&gt;

Java 2

stream-api

</a>

示例类

在本教程中,我们将会用Task管理类来表明那几个概念。例子中,有一个叫Task的类,它是一个由用户来展现的类,其定义如下:

import java.time.LocalDate;
import java.util.*;

public class Task {
    private final String id;
    private final String title;
    private final TaskType type;
    private final LocalDate createdOn;
    private boolean done = false;
    private Set<String> tags = new HashSet<>();
    private LocalDate dueOn;

    // removed constructor, getter, and setter for brevity
}

事例中的数据集如下,在任何Stream API例子中大家都会用到它。

Task task1 = new Task("Read Version Control with Git book", TaskType.READING, LocalDate.of(2015, Month.JULY, 1)).addTag("git").addTag("reading").addTag("books");

Task task2 = new Task("Read Java 8 Lambdas book", TaskType.READING, LocalDate.of(2015, Month.JULY, 2)).addTag("java8").addTag("reading").addTag("books");

Task task3 = new Task("Write a mobile application to store my tasks", TaskType.CODING, LocalDate.of(2015, Month.JULY, 3)).addTag("coding").addTag("mobile");

Task task4 = new Task("Write a blog on Java 8 Streams", TaskType.WRITING, LocalDate.of(2015, Month.JULY, 4)).addTag("blogging").addTag("writing").addTag("streams");

Task task5 = new Task("Read Domain Driven Design book", TaskType.READING, LocalDate.of(2015, Month.JULY, 5)).addTag("ddd").addTag("books").addTag("reading");

List<Task> tasks = Arrays.asList(task1, task2, task3, task4, task5);

本章节暂不钻探Java8的Data 提姆(Tim)e
API,这里咱们就把它当着一个平凡的日子的API。

Example 1: 找出具有READING Task的标题,并依照它们的创制时间排序。

率先个例证我们将要实现的是,从Task列表中找出富有正在读书的天职的题目,并依照它们的创始时间排序。我们要做的操作如下:

  1. 过滤出富有TaskType为READING的Task。
  2. 按照创建时间对task举行排序。
  3. 得到每个task的title。
  4. 将赢得的那些title装进一个List中。

地点的多少个操作步骤可以相当简单的翻译成上面这段代码:

private static List<String> allReadingTasks(List<Task> tasks) {
        List<String> readingTaskTitles = tasks.stream().
                filter(task -> task.getType() == TaskType.READING).
                sorted((t1, t2) -> t1.getCreatedOn().compareTo(t2.getCreatedOn())).
                map(task -> task.getTitle()).
                collect(Collectors.toList());
        return readingTaskTitles;
}

在上头的代码中,大家利用了Stream API中如下的片段主意:

  • filter:允许开发者定义一个论断规则来从地下的stream中领到符合此规则的部分因素。规则task
    -> task.getType() ==
    TaskType.READING
    意为从stream中挑选所有TaskType 为READING的元素。

  • sorted:
    允许开发者定义一个相比较器来排序stream。上例中,我们依照创立时间来排序,其中的lambda表明式(t1,
    t2) ->
    t1.getCreatedOn().compareTo(t2.getCreatedOn())
    就对函数式接口Comparator中的compare函数举办了实现。

  • map:
    需要一个落实了力所能及将一个stream转换成另一个stream的Function<? super T, ? extends R>的lambda表明式作为参数,Function<?
    super T, ? extends
    R>接口可以将一个stream转换为另一个stream。lambda表达式task
    -> task.getTitle()
    将一个task转化为标题。

  • collect(toList())
    这是一个终极操作,它将富有READING的Task的标题的卷入一个list中。

我们可以透过动用Comparator接口的comparing模式和模式引用来将方面的代码简化成如下代码:

public List<String> allReadingTasks(List<Task> tasks) {
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            sorted(Comparator.comparing(Task::getCreatedOn)).
            map(Task::getTitle).
            collect(Collectors.toList());

}

从Java8始发,接口可以蕴涵通过静态和默认方法来兑现格局,在ch01业已介绍过了。
方法引用Task::getCreatedOn是由Function<Task,LocalDate>而来的。

地方代码中,我们利用了Comparator接口中的静态接济方法comparing,此措施需要吸收一个用来提取ComparableFunction作为参数,重回一个经过key举行相比的Comparator。方法引用Task::getCreatedOn
是由 Function<Task, LocalDate>而来的.

大家可以像如下代码这样,使用函数组合,通过在Comparator上调用reversed()办法,来极度轻松的颠倒排序。

public List<String> allReadingTasksSortedByCreatedOnDesc(List<Task> tasks) {
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            sorted(Comparator.comparing(Task::getCreatedOn).reversed()).
            map(Task::getTitle).
            collect(Collectors.toList());
}

Example 2: 去除重复的tasks

一旦我们有一个有诸多再一次task的数据集,可以像如下代码这样经过调用distinct办法来轻松的删减stream中的重复的元素:

public List<Task> allDistinctTasks(List<Task> tasks) {
    return tasks.stream().distinct().collect(Collectors.toList());
}

distinct()艺术把一个stream转换成一个不含重复元素的stream,它经过对象的equals办法来判定目的是不是等于。遵照目的相等方法的判断,假使多少个目标相等就代表有再次,它就会从结果stream中移除。

Example 3: 遵照创制时间排序,找出前5个处于reading状态的task

limit措施可以用来把结果集限定在一个加以的数字。limit是一个打断操作,意味着它不会为了博取结果而去运算所有因素。

public List<String> topN(List<Task> tasks, int n){
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            sorted(comparing(Task::getCreatedOn)).
            map(Task::getTitle).
            limit(n).
            collect(toList());
}

可以像如下代码这样,同时利用skip方法和limit艺术来创制某一页。

// page starts from 0. So to view a second page `page` will be 1 and n will be 5.
//page从0开始,所以要查看第二页的话,`page`应该为1,n应该为5
List<String> readingTaskTitles = tasks.stream().
                filter(task -> task.getType() == TaskType.READING).
                sorted(comparing(Task::getCreatedOn).reversed()).
                map(Task::getTitle).
                skip(page * n).
                limit(n).
                collect(toList());

Example 4:总括情形为reading的task的多少

要得到所有正处在reading的task的数据,我们得以在stream中运用count形式来拿到,这些措施是一个极端方法。

public long countAllReadingTasks(List<Task> tasks) {
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            count();
}

Example 5: 非重复的列出所有task中的全部标签

要找出不重复的价签,我们需要下边多少个步骤

  1. 取得每个task中的标签。
  2. 把具有的竹签放到一个stream中。
  3. 删除重复的标签。
  4. 把最终结出装进一个列表中。

第一步和第二步能够由此在stream上调用flatMap来得到。flatMap操作把通过调用task.getTags().stream获取的各样stream合成到一个stream。一旦我们把持有的tag放到一个stream中,我们就可以通过调用distinct办法来取得非重复的tag。

private static List<String> allDistinctTags(List<Task> tasks) {
        return tasks.stream().flatMap(task -> task.getTags().stream()).distinct().collect(toList());
}

Example 6: 检查是否享有reading的task都有book标签

Stream
API有一些得以用来检测数据集中是否包含某个给定属性的情势,allMatch,anyMatch,noneMatch,findFirst,findAny。要一口咬定是否具有状况为reading的task的title中都带有books标签,可以用如下代码来实现:

public boolean isAllReadingTasksWithTagBooks(List<Task> tasks) {
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            allMatch(task -> task.getTags().contains("books"));
}

要一口咬定所有reading的task中是否留存一个task包含java8标签,可以由此anyMatch来实现,代码如下:

public boolean isAnyReadingTasksWithTagJava8(List<Task> tasks) {
    return tasks.stream().
            filter(task -> task.getType() == TaskType.READING).
            anyMatch(task -> task.getTags().contains("java8"));
}

Example 7: 创造一个具有title的总览

当您想要创设一个富有title的总览时就可以运用reduce操作,reduce能够把stream变成成一个值。reduce函数接受一个可以用来连续stream中具有因素的lambda表明式。

public String joinAllTaskTitles(List<Task> tasks) {
    return tasks.stream().
            map(Task::getTitle).
            reduce((first, second) -> first + " *** " + second).
            get();
}

Example 8: 基本项目stream的操作

除了常见的按照对象的stream,Java8对诸如int,long,double等主题项目也提供了一定的stream。上边一起来看一些主干类型的stream的事例。

要创制一个值区间,能够调用range方法。range方法创制一个值为0到9的stream,不带有10。

IntStream.range(0, 10).forEach(System.out::println);

rangeClosed措施允许我们成立一个带有上限值的stream。由此,下边的代码会暴发一个从1到10的stream。

IntStream.rangeClosed(1, 10).forEach(System.out::println);

还足以像下边那样,通过在主题类型的stream上应用iterate措施来创设无限的stream:

LongStream infiniteStream = LongStream.iterate(1, el -> el + 1);

要从一个极致的stream中过滤出所有偶数,可以用如下代码来落实:

infiniteStream.filter(el -> el % 2 == 0).forEach(System.out::println);

可以透过利用limit操作来现在结果stream的个数,代码如下:
We can limit the resulting stream by using the limit operation as
shown below.

infiniteStream.filter(el -> el % 2 == 0).limit(100).forEach(System.out::println);

Example 9: 为数组创制stream

可以像如下代码这样,通过调用Arrays类的静态方法stream来把为数组建立stream:

String[] tags = {"java", "git", "lambdas", "machine-learning"};
Arrays.stream(tags).map(String::toUpperCase).forEach(System.out::println);

还足以像如下这样,依据数组中一定起先下标和停止下标来成立stream。这里的序幕下标包括在内,而告终下标不含有在内。

Arrays.stream(tags, 1, 3).map(String::toUpperCase).forEach(System.out::println);

Parallel Streams并发的stream

使用Stream有一个优势在于,由于stream采纳其中迭代,所以java库可以使得的管制处理并发。可以在一个stream上调用parallel主意来使一个stream处于并行。parallel措施的最底层实现基于JDK7中引入的fork-joinAPI。默认情形下,它会发出与机具CPU数量相当于的线程。下面的代码中,我们按照拍卖它们的线程来对将数字分组。在第4节大校学习collectgroupingBy函数,现在临时通晓为它可以遵照一个key来对元素举行分组。

public class ParallelStreamExample {

    public static void main(String[] args) {
        Map<String, List<Integer>> numbersPerThread = IntStream.rangeClosed(1, 160)
                .parallel()
                .boxed()
                .collect(groupingBy(i -> Thread.currentThread().getName()));

        numbersPerThread.forEach((k, v) -> System.out.println(String.format("%s >> %s", k, v)));
    }
}

在自我的机械上,打印的结果如下:

ForkJoinPool.commonPool-worker-7 >> [46, 47, 48, 49, 50]
ForkJoinPool.commonPool-worker-1 >> [41, 42, 43, 44, 45, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130]
ForkJoinPool.commonPool-worker-2 >> [146, 147, 148, 149, 150]
main >> [106, 107, 108, 109, 110]
ForkJoinPool.commonPool-worker-5 >> [71, 72, 73, 74, 75]
ForkJoinPool.commonPool-worker-6 >> [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160]
ForkJoinPool.commonPool-worker-3 >> [21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 76, 77, 78, 79, 80]
ForkJoinPool.commonPool-worker-4 >> [91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145]

并不是各样工作的线程都处理相等数量的数字,可以经过变更系统性能来控制fork-join线程池的数目System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism", "2")

其它一个会用到parallel操作的例证是,当您像下边这样要拍卖一个URL的列表时:

String[] urls = {"https://www.google.co.in/", "https://twitter.com/", "http://www.facebook.com/"};
Arrays.stream(urls).parallel().map(url -> getUrlContent(url)).forEach(System.out::println);

假诺你想更好的主宰哪些时候理应利用并发的stream,推荐你读书由Doug
Lea和任何几位Java大牛写的稿子http://gee.cs.oswego.edu/dl/html/StreamParallelGuidance.html

相关文章