일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- PySpark
- PANDAS
- Excel
- Mac
- google apps script
- GIT
- Python
- Redshift
- SQL
- array
- Apache
- Tkinter
- Google Spreadsheet
- dataframe
- 파이썬
- string
- c#
- math
- list
- matplotlib
- Java
- Kotlin
- django
- hive
- Google Excel
- Github
- gas
- PostgreSQL
- numpy
- Today
- Total
목록series (7)
달나라 노트
nunique() method는 DataFrame이나 Series에 있는 값들 중 중복값을 제거한 unique한 값의 개수를 return합니다. 바로 예시를 봅시다. import pandas as pd df_test = pd.DataFrame( { 'col1': [1, 1, 3, 3, 4, 4, 4], 'col2': [8, 8, 8, 8, 8, 9, 9], } ) print(df_test) nunique_result = df_test.nunique() print(nunique_result) print(type(nunique_result)) -- Result col1 col2 0 1 8 1 1 8 2 3 8 3 3 8 4 4 8 5 4 9 6 4 9 col1 3 col2 2 dtype: int64 df_t..
pandas의 empty는 Series 또는 DataFrame이 비어있으면 True를 return합니다. 반대로 비어있지 않으면 False를 return합니다. import pandas as pd dict_test = { } df_test = pd.DataFrame(dict_test) print(df_test) print(df_test.empty) -- Result Empty DataFrame Columns: [] Index: [] True 위 예시는 비어있는 DataFrame인 df_test를 만들고 df_test의 empty를 적용한 결과입니다. DataFrame에 column도 row도 아무것도 없으니 비어있죠. 따라서 True가 return됩니다. import pandas as pd dict_te..
Syntax Series.unique() unique method는 Series에 적용할 수 있으며 적용한 Series에 있는 값들 중 중복 없는 unique한 값들만을 numpy array의 형태로 return합니다. 다음은 unique method의 적용 예시입니다. import pandas as pd dict_item = { 'col1': [1, 2, 3, 4, 5, 4, 3, 2, 1], 'col2': [5, 4, 3, 2, 1, 8, 9, 2, 6], } df_item = pd.DataFrame(dict_item) unique_values = df_item.loc[:, 'col1'].unique() print(type(unique_values)) print(unique_values) -- Res..
Pandas에서 제공하는 to_list method는 Series에 적용할 수 있으며 적용된 Series를 list 형태로 변환해주는 역할을 합니다. import pandas as pd dict_main = { 'col1': [1, 2, 3, 4, 5, 6], 'col2': ['alpha', 'beta', 'gamma', 'delta', 'epsilon', 'zeta'] } df_main = pd.DataFrame(dict_main) print(df_main) list_col2 = df_main.loc[:, 'col2'].to_list() print(list_col2) list_col2 = list(df_main.loc[:, 'col2']) print(list_col2) -- Result col1 col..