| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- django
- Google Spreadsheet
- PySpark
- SQL
- Presto
- PANDAS
- matplotlib
- hive
- GIT
- Google Excel
- numpy
- dataframe
- string
- Redshift
- PostgreSQL
- gas
- c#
- Apache
- math
- Tkinter
- Kotlin
- Java
- Github
- Excel
- array
- 파이썬
- google apps script
- list
- Python
- Today
- Total
목록dataframe (22)
달나라 노트
DataFrame의 행이 많아서 일부 행만 확인하고 싶을 때 또는 어떠한 이유로 처음 또는 끝의 일부 행만 추출해야할 때 사용할 수 있는 method가 있습니다. Syntax DataFrame.head() # 상위 5개 행 반환 DataFrame.tail() # 하위 5개 행 반환 DataFrame.head(n) # 상위 n개 행 반환 DataFrame.tail(n) # 하위 n개 행 반환 사용법은 위와 같습니다. DataFrame에 적용할 수 있으며, head는 기본적으로 DataFrame의 가장 위쪽 5개 행을 return해주고 tail은 기본적으로 DataFrame의 가장 아래쪽 5개 행을 return해줍니다. head, tail의 parameter로 어떤 숫자를 넣게 되면 해당 숫자만큼의 행만큼 ..
pandas의 to_dict는 DataFrame에 적용하여 DataFrame을 dictionary로 변경해줍니다. import pandas as pd dict_1 = { 'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10], 'col3': [11, 12, 13, 14, 15] } df_1 = pd.DataFrame(dict_1) print(df_1) dict_1 = df_1.to_dict() print(dict_1) -- Result col1 col2 col3 0 1 6 11 1 2 7 12 2 3 8 13 3 4 9 14 4 5 10 15 {'col1': {0: 1, 1: 2, 2: 3, 3: 4, 4: 5}, 'col2': {0: 6, 1: 7, 2: 8, 3: 9..
DataFrame은 기본적으로 index가 0부터 1씩 증가하는 정수로 생성됩니다. 다만 set_index를 이용하면 DataFrame의 index를 원하는대로 변경할 수 있습니다. Syntax set_index(keys=[k1, k2, ...], inplace=True/False, drop=True/False) 사용법은 위와 같습니다. keys=[k1, k2, ...] index로 설정할 list 형태의 데이터입니다. index는 보통 1줄이지만 2줄 3줄 또는 그 이상이 될 수도 있습니다. (다중 index가 가능하다는 의미입니다.) k1은 index 한 줄 이라고 보시면 됩니다. 예를들어 총 10행의 데이터를 가진 DataFrame의 index를 변경하려면 k1의 자리에 [1, 2, 3, 4, 5,..
min, max method를 이용하면 컬럼간의 값 비교가 가능해집니다. import pandas as pd import numpy as np dict_test = { 'col1': [1, 2, np.nan, 4, 5], 'col2': [6, 2, 7, 3, 9], 'col3': [10, 6, 22, np.nan, 21] } df_test = pd.DataFrame(dict_test) print(df_test) -- Result col1 col2 col3 0 1.0 6 10.0 1 2.0 2 6.0 2 NaN 7 22.0 3 4.0 3 NaN 4 5.0 9 21.0 먼저 test용 DataFrame을 위처럼 생성합시다. import pandas as pd import numpy as np dict_tes..