본문 바로가기

Java

JVM(Java Virtual Machine)

역할

  • 자바 애플리케이션을 클래스 로더를 통해 읽어들여서 자바 API와 함께 실행
  • Java와 OS 사시의 중재자 역할 -> Wirte Once Run AnyWhere
  • 메모리 관리, Garbage Collection을 수행

한정된 메모리를 효율적으로 활용하기 위해 JVM 메모리 구조를 알아야 한다.

JVM은 JRE에 포함되어 있다.

java 프로그램 실행 과정

  1. 프로그램이 실행되면 JVM은 OS로부터 메모리를 할당 받는다. JVM은 이 메모리를 용도에 따라 여러 구역으로 나누어 관리
  2. 자바 컴파일러(javac)가 자바 소스코드(.java)를 읽어들여 자바 바이트코드(.class)로 변환
  3. Class Loader를 통해 class파일들을 JVM으로 로딩
  4. 로딩된 class파일들은 Execution engine을 통해 해석
  5. 해석된 바이트 코드는 Runtime Data Areas에 배치되어 실질적인 수행
  6. 이러한 실행 과정 속 JVM은 필요에 따라 GC같은 작업 관리를 수행

Java Compiler

JAVA Source파일을 JVM이 해석할 수 있는 JAVA Byte Code(.class 파일)로 변경한다. 일반적인 윈도우 프로그램은 Compile 이후 Assembly 언어로 구성된 파일이 생성된다. JVM을 통해 OS 환경에 구애 받지 않는 것, 자바 컴파일러는 JDK에 포함되어 있다.

Class Loader

JVM내로 .class 파일을 로드하고 링크를 통해 배치하는 작업을 수행한다. Runtime에 클래스를 처음으로 참조할 때 동적으로 로드하고 링크한다.

Execution Engine

클래스를 실행시키는 역할, 컴파일러를 통해 번역된 자바 바이트코드는 기계가 바로 수행할 수 있는 기계어같은 언어보다는 인간 친화적인 형태로 기술되어있다. 그래서 Execution Engine에서 기계가 실행할 수 있는 형태로 변환한다. 이 때 두 가지 방식을 사용한다.

  • Interpreter
    • 자바 바이트 코드를 명령어 단위로 읽어서 한 줄씩 번역한다. 한 줄씩 수행하기에 매우 느리다.
  • JIT(Just In Time)
    • 인터프리티의 단점을 보완하기 위해 도입된 컴파일러이다. 인터프리티 방식으로 수행하다가 적절한 시점에 바이트 코드 전체를 컴파일하여 네이티브 코드로 변경한다. 이후에는 인터프리티는 수행되지 않는다. 네이티브 코드는 캐시에 보관하기 때문에 한 번 컴파일 된 코드는 빠르게 수행된다. 한 번만 실행되는 코드 같은 경우엔 전체를 컴파일 하는 JIT 보다는 Interpreter로 컴파일하는게 더 빠르다. JVM이 내부적으로 해당 메서드가 얼마나 자주 수행되는지를 판단하여 일정 정도가 넘을 때만 JIT로 컴파일 한다.

Runtime Data Area

프로그램을 수행하기 위해 OS에서 할당받은 공간

PC Resgister

하나의 Thread가 시작될 때 생성, Thread가 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분으로 현재 수행중인 JVM 명령의 주소를 갖고있다.

JVM Stack Area

메소드가 시작할 때 { 에서 임시로 할당 되었다가 }를 만나면 소멸되는 데이터를 위한 영역, 메서드들의 놀이터이다. 각종 형태의 변수나, 메서드, 스레드 정보를 저장한다. 메서드 호출 시마다 각각의 스택 프레임이 생성되고 수행이 끝날 때마다 프레임이 삭제 된다. 메서드에서 생성, 연산된 값을 전부 저장한다.

Native Method Stack

바이트 코드(.class)가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역, Java가 아닌 다른 언어로 작성된 코드를 위한 공간이다. C언어나 자바나 기계어로 번역하면 똑같기 때문에 다른 언어로도 접근 가능하다. Native Method Interface를 통해 바이트 코드로 전환하여 저장한다.

Method Area(Static Area)

클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간, 클래스들의 놀이터이다. 모든 클래스 정보 등등 거의 모든 바이트 코드가 이곳에 올라가기 때문에 프로그램의 흐름을 구성하는 공간이다. 대부분의 인스턴스 생성도 이곳에서 명령하고 호출한다. Runtime Constant Pool이라는 별도의 관리 영역을 통해 상수 자료형을 저장하여 참조하고 중복을 막는다. Method Area도 Heap Area와 마찬가지로 GC의 관리 대상에 포함된다.

Heap Area

객체를 저장하는 공간, new로 생성된 객체와 배열을 저장한다. 물론 Method Area에 올라온 클래스들만 객체로 생성할 수 있다. 힙은 세부분으로 나뉘어진다.

  • Permanent Generation
    • 생성된 객체들의 주소 값이 저장된 공간. Class Loader에 의해 Load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용, Reflaction을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다. 자바 8부터는 Mata space라는 영역으로 대체되었다.
  • Meta Space
    • 기존 Permanent Generation JVM에 의해 크기가 강제되었었다. MetaSpace는 Native 메모리 영역으로 OS가 자동으로 크기를 조절한다. 그 결과 기존과 비교해 큰 메모리를 사용할 수 있게 되었다. Permanent 영역 크기로 인한 java.lang.OutOfMemoryError를 더 보기 힘들어졌다.
  • New/Young Generation
    • Eden: 객체들이 최초로 생성되는 공간
    • Survivor 0/1: Eden에서 참조되는 객체들이 저장되는 공간
    • Eden 영역이 가득차면 첫 번째 GC가 발생하게 된다. Eden영역에 있는 값들을 survivor 영역 중 한 곳에 복사하고 나머지 영역에 있는 객체들을 삭제한다. -> Minor GC
  • Tenured Generation
    • New/Young Generation에서 일정 시간 이상 참조되고 있는 객체들이 저장되는 공간, survivor 영역에 계속해서 살아남는 객체들을 이곳으로 옮긴다. 모든 객체들을 검사하여 참조되지 않은 객체를 전부 삭제한다. 시간이 오래걸리고 GC를 실행하는 스레드를 제외하고는 전부 작업을 멈추고 GC가 완료되면 다시 실행된다. stop-the-world 라고도 한다. -> Major GC

인스턴스는 지역 변수처럼 소멸되는 시점을 예상할 수 없기에 Heap 영역에 저장된다. JVM은 인스턴스의 존재 이유가 더 이상 없을 때 합리적으로 소멸시킨다.
참조되고 있지 않은 객체를 Garbage라고 한다.

참고자료