일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- string
- Redshift
- Apache
- Github
- array
- Google Spreadsheet
- c#
- Tkinter
- PostgreSQL
- hive
- Kotlin
- 파이썬
- list
- django
- SQL
- Mac
- gas
- GIT
- Google Excel
- numpy
- PANDAS
- Excel
- math
- matplotlib
- PySpark
- dataframe
- Python
- Java
- google apps script
- Today
- Total
목록Python/Python Pandas (80)
달나라 노트
pandas의 read_json() method는 json 파일을 읽어와서 DataFrame으로 변환해주는 기능을 합니다. Syntax pandas.read_json(json_file, orient) - json_file 읽어올 json 파일의 경로와 이름입니다. (경로는 상대경로, 절대경로 모두 가능합니다.) - orient json 파일의 format입니다. columns, index, records, values, split의 다섯 종류가 있습니다. 각 orient 값이 어떠한 json format을 의미하는지는 본 글의 아래 부분에서 다루겠습니다. (format에 대한 자세한 설명은 다음 링크를 참고하시면 좋습니다. https://cosmosproject.tistory.com/684) fruits..
pandas의 to_json() method는 DataFrame을 json 파일로 생성해주는 기능을 가집니다. Syntax DataFrame.to_json(file_name, orient) - file_name 생성할 json 파일의 이름을 적습니다. json 파일은 test_file.json 처럼 json이라는 확장자를 갖습니다. - orient 생성할 json 파일의 format을 의미합니다. columns, index, records, values, split의 다섯 종류가 있습니다. 각각의 orient 값이 어떤 형태를 의미하는지는 예시를 통해 알아봅시다. import pandas as pd dict_test = { 'name': ['apple', 'banana', 'peach'], 'price'..
pandas의 empty는 Series 또는 DataFrame이 비어있으면 True를 return합니다. 반대로 비어있지 않으면 False를 return합니다. import pandas as pd dict_test = { } df_test = pd.DataFrame(dict_test) print(df_test) print(df_test.empty) -- Result Empty DataFrame Columns: [] Index: [] True 위 예시는 비어있는 DataFrame인 df_test를 만들고 df_test의 empty를 적용한 결과입니다. DataFrame에 column도 row도 아무것도 없으니 비어있죠. 따라서 True가 return됩니다. import pandas as pd dict_te..
Syntax Series.unique() unique method는 Series에 적용할 수 있으며 적용한 Series에 있는 값들 중 중복 없는 unique한 값들만을 numpy array의 형태로 return합니다. 다음은 unique method의 적용 예시입니다. import pandas as pd dict_item = { 'col1': [1, 2, 3, 4, 5, 4, 3, 2, 1], 'col2': [5, 4, 3, 2, 1, 8, 9, 2, 6], } df_item = pd.DataFrame(dict_item) unique_values = df_item.loc[:, 'col1'].unique() print(type(unique_values)) print(unique_values) -- Res..