달나라 노트

Hive : hive.vectorized.execution (Vector화 사용하기) 본문

SQL/Apache Hive

Hive : hive.vectorized.execution (Vector화 사용하기)

CosmosProject 2021. 6. 4. 03:24
728x90
반응형

 

 

 

Hive는 기본적으로 한번에 1개의 row를 처리합니다.

 

Hive에선 vectorized option이 있는데 이 option을 활성화하여 벡터화를 이용하면

한 번에 1024개의 row를 처리하여 table scan, join, aggregate 등의 과정에서 실행 속도를 높일 수 있습니다.

 

 

set hive.vectorized.execution.enabled = true;
set hive.vectorized.execution.reduce.enabled = true;
set hive.vectorized.execution.reduce.groupby.enabled=true;

 

vectorization option은 위와 같습니다.

 

 

 

 

 

 

 

728x90
반응형
Comments