Java Stream이란? 2탄 Stream API.

Java Stream이란? 2탄 Stream API.

2021, Mar 17    

정리를 하게 된 이유.

함수형 프로그래밍에 대해서 정리를 한번 한 뒤, 다시 정리를 해보려고 한다.

자바는 객체지향 언어이기 때문에 기본적으로 함수형 프로그래밍이 불가능하다.

하지만 JDK8부터 Stream API와 람다식, 함스형 인터페이스 등을 지원하면서 자바를 이용해 함수형으로 프로그래밍 할 수 있는 API들을 제공해주고 있다.

이 중에서도 Stream API는 데이터를 추상화하고, 처리하는데 자주 사용되는 함수들을 정의해두었다. 여기서 데이터를 추상화했다는 것은 데이터의 종류에 상관 없이 같은 방식으로 데이터를 처리할 수 있다는 것을 의미하며, 그에 따라 재사용을 높일 수 있다.

Stream API를 사용하지 않은 경우 다음과 같이 코드를 작성한다.

    // Stream 사용 전
    String[] nameArr = {"IronMan", "Captain", "Hulk", "Thor"}
    List<String> nameList = Arrays.asList(nameArr);
    
    //원본의 데이터가 직접 정렬됨
    Arrays.sort(nameArr);
    Collection.sort(nameList);
    
    for(String str: nameArr){
    System.out.println(str);
    }
    
    for(String str: nameList){
    System.out.println(str);
    }

자바의 Stream API는 원본의 데이터에 변경 없이 위의 코드를 더욱 간략하게 할 수 있다.

    // Stream 사용 전
    String[] nameArr = {"IronMan", "Captain", "Hulk", "Thor"}
    List<String> nameList = Arrays.asList(nameArr);
    
    //원본의 데이터가 아닌 별도의 Stream을 생성함
    Stream<String> nameStream = nameList.stream();
    Stream<String> arrayStream = Arrays.stream();
    
    nameStream.sorted().forEach(System.out::println);
    arrayStream.sorted().forEach(System.out::println);

Stream API의 특징

  • 원본의 데이터를 변경하지 않는다.
  • 일회용이다.
  • 내부 반복으로 작업을 처리한다.
  1. 원본의 데이터를 변경하지 않는다. Stream api는 원본의 데이터를 조회하여 원본의 데이터가 아닌 별도의 요소들로 Stream을 생성한다. 그렇기 때문에 원본의 데이터로부터 읽기만 할 뿐이며, 정렬이나 필터링 등의 작업은 별도의 Stream요소들에서 처리가 된다.

  2. 일회용이다. Stream api는 일회용이기 때문에 한번 사용이 끝나면 재사용이 불가능하다. Stream이 또 필요한 경우에는 Stream을 다시 생성해주어야 한다. 만약 닫힌 Stream을 다시 사용하면 IllegalStateException이 발생하게 된다.

  3. 내부 반복으로 작업을 처리한다. Stream을 이용하면 코드가 간결해지는 이유 중 하나는 ‘내부 반복’때문이다. 기존에는 반복문을 사용하기 위해서 for나 while문과 같은 문법을 사용해야 했지만, Stream에서는 반복 문법을 메소드 내부에 숨기고 있기 때문에 보다 간결한 코드의 작성이 가능하다.

Stream API의 연산 종류

Stream은 데이터를 처리하기 위해 다양한 연산들을 지원한다. Stream이 제공하는 연산을 이용하면 복잡한 작업들을 간단히 처리 할 수 있는데, 스트림에 대한 연산은 크게 생성하기, 가공하기, 결과만들기 3가지 단계로 나눌 수 있다.

  • 생성하기
    • Stream 객체를 생선하는 단계
    • Stream은 재사용이 불가능하므로, 닫히면 다시 생성해주어야 한다.

Stream 연산을 하기 위해서는 먼저 Stream 객체를 생성해주어야 한다. 배열, 컬렉션, 임의의 수, 파일등 거의 모든 것을 가지고 스트림을 생성할 수 있다. 연산이 끝나면 Stream이 닫히기 때문에, Stream이 닫혔을 경우 다시 Stream을 생성해야 한다는 것이다.

  • 가공하기
    • 원본의 데이터를 별도의 데이터로 가공하기 위한 중간 연산
    • 연산 결과를 Stream으로 다시 반환하기 때문에 연속해서 중간 연산을 이어갈 수 있다.
  • 결과 만들기
    • 가공된 데이터로부터 원하는 결과를 만들기 위한 최종 연산
    • Stream의 요소들을 소모하면서 연산이 수행되기 때문에 1번만 처리가능하다.

[Stream 연산 예시코드]

    // Stream 사용 전
    List<String> myList = Arrays.asList("a1", "a2", "b1", "c2", "c1");
    
    myList
        .stream()                       //생성하기
        .filter(s -> s.startsWith("c")) //가공하기  
        .map(String::toUpperCase)       //가공하기
        .sorted()                       //가공하기      
        .count();                       //결과만들기
    

위에 코드에서는 먼저 stream()을 통해 객체를 생성한다. 그리고 원하는 데이터를 필터링하고, 변형하고, 정렬하는 중간 연산을 진행한다. 이렇게 연산이 연결되는 것을 연산 파이프라인이라고 하며, 최종 연산에서는 필요한 결과를 만들 수 있다. count()를 통해 남아있는 요소의 갯수를 최종적으로 반환하도록 되어있다. 물론 forEach와 같이 값을 반환하지 않는 최종 연산도 존재한다.

이후에는 연산들을 알아보기 전에 함수형 인터페이스와 람다식을 먼저 정리 할 예정이다.