반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- PySpark
- Apache
- Github
- Mac
- matplotlib
- 파이썬
- array
- google apps script
- django
- Java
- PANDAS
- c#
- PostgreSQL
- math
- Redshift
- Excel
- hive
- Google Excel
- string
- Google Spreadsheet
- GIT
- list
- Python
- gas
- numpy
- SQL
- dataframe
- Kotlin
- Tkinter
Archives
- Today
- Total
달나라 노트
Hive : hive.mapred.mode (Hive data full scan하기. partition 모두 조회하기) 본문
SQL/Apache Hive
Hive : hive.mapred.mode (Hive data full scan하기. partition 모두 조회하기)
CosmosProject 2021. 6. 4. 02:15728x90
반응형
Hive에서는 기본적으로 partition이 있는 table은 partition 조건을 명시해야합니다.
(data full scan은 성능에 영향을 미칠 수 있기 때문이죠.)
만약 partition 조건을 명시하지 않으면 Error가 발생합니다.
그런데 사용하다보면 partition 조건 없이 table full scan을 해야하는 경우가 있죠.
set hive.mapred.mode = nonstrict;
이 경우 위처럼 hive.mapred.mode를 nonstrict 모드로 설정해주면 partition table에 대해서도 table full scan이 가능해집니다.
참고
위같은 option은 그냥 쿼리돌리듯이 돌리면 설정됩니다.
Apache Hive document = https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties#ConfigurationProperties-Tez
728x90
반응형
'SQL > Apache Hive' 카테고리의 다른 글
Hive : hive.execution.engine (hive engine 설정) (0) | 2021.06.04 |
---|---|
Hive : hive.exec.dynamic.partition (동적 partition, 정적 partition, dynamic partition, static partition) (0) | 2021.06.04 |
Hive : hive.exec.reducers (Reducer에 메모리 할당하기) (0) | 2021.06.04 |
Hive : first_value, last_value : 첫 번째 값, 마지막 값 뽑기(window function) (0) | 2021.06.03 |
Hive : GREATEST, LEAST (여러 값 중 최대/최소값 return) (0) | 2021.06.03 |
Comments