일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Mac
- PySpark
- Google Spreadsheet
- matplotlib
- Python
- Google Excel
- SQL
- array
- numpy
- Redshift
- Apache
- PostgreSQL
- Java
- list
- math
- google apps script
- 파이썬
- Kotlin
- Github
- Tkinter
- hive
- dataframe
- django
- Excel
- c#
- PANDAS
- gas
- GIT
- string
- Today
- Total
목록PANDAS (70)
달나라 노트
pandas의 to_json() method는 DataFrame을 json 파일로 생성해주는 기능을 가집니다. Syntax DataFrame.to_json(file_name, orient) - file_name 생성할 json 파일의 이름을 적습니다. json 파일은 test_file.json 처럼 json이라는 확장자를 갖습니다. - orient 생성할 json 파일의 format을 의미합니다. columns, index, records, values, split의 다섯 종류가 있습니다. 각각의 orient 값이 어떤 형태를 의미하는지는 예시를 통해 알아봅시다. import pandas as pd dict_test = { 'name': ['apple', 'banana', 'peach'], 'price'..
pandas의 empty는 Series 또는 DataFrame이 비어있으면 True를 return합니다. 반대로 비어있지 않으면 False를 return합니다. import pandas as pd dict_test = { } df_test = pd.DataFrame(dict_test) print(df_test) print(df_test.empty) -- Result Empty DataFrame Columns: [] Index: [] True 위 예시는 비어있는 DataFrame인 df_test를 만들고 df_test의 empty를 적용한 결과입니다. DataFrame에 column도 row도 아무것도 없으니 비어있죠. 따라서 True가 return됩니다. import pandas as pd dict_te..
Syntax Series.unique() unique method는 Series에 적용할 수 있으며 적용한 Series에 있는 값들 중 중복 없는 unique한 값들만을 numpy array의 형태로 return합니다. 다음은 unique method의 적용 예시입니다. import pandas as pd dict_item = { 'col1': [1, 2, 3, 4, 5, 4, 3, 2, 1], 'col2': [5, 4, 3, 2, 1, 8, 9, 2, 6], } df_item = pd.DataFrame(dict_item) unique_values = df_item.loc[:, 'col1'].unique() print(type(unique_values)) print(unique_values) -- Res..
Syntax DataFrame.min(axis=1) DataFrame.max(axis=1) min method는 DataFrame에 적용하여 컬럼간에 가장 작은 값을 return합니다. max method는 DataFrame에 적용하여 컬럼간에 가장 작은 값을 return합니다. import pandas as pd dict_item = { 'col1': [1, 2, 3, 4, 5], 'col2': [5, 4, 3, 2, 1], } df_item = pd.DataFrame(dict_item) df_item.loc[:, 'min_col'] = df_item.loc[:, ['col1', 'col2']].min(axis=1) df_item.loc[:, 'max_col'] = df_item.loc[:, ['col..