일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- SQL
- Mac
- google apps script
- gas
- array
- numpy
- Java
- Tkinter
- Kotlin
- 파이썬
- Excel
- PostgreSQL
- matplotlib
- dataframe
- PySpark
- django
- Google Spreadsheet
- PANDAS
- Apache
- Python
- Github
- list
- hive
- string
- GIT
- Redshift
- math
- c#
- Google Excel
- Today
- Total
목록Python/Python Pandas (76)
달나라 노트
xlrd.biffh.XLRDError: Excel xlsx file; not supported pandas의 read_excel method를 사용하다보면 위같은 Error가 발생할 수도 있습니다. 그럴 때에는 아래의 2가지 방법을 체크해볼 수 있습니다. 1. openpyxl을 이용하는 방법. openpyxl을 설치한 후 read_excel method의 option에 다음 내용을 추가한다. engine='openpyxl' import pandas as pd pd.read_excel('test_file.xlsx', sheet_name='test', engine='openpyxl') 3. pandas의 version을 더 높은 version으로 업데이트한다. (가장 최신 version으로 하는 것도 좋지만..
Pandas에서 제공하는 to_list method는 Series에 적용할 수 있으며 적용된 Series를 list 형태로 변환해주는 역할을 합니다. import pandas as pd dict_main = { 'col1': [1, 2, 3, 4, 5, 6], 'col2': ['alpha', 'beta', 'gamma', 'delta', 'epsilon', 'zeta'] } df_main = pd.DataFrame(dict_main) print(df_main) list_col2 = df_main.loc[:, 'col2'].to_list() print(list_col2) list_col2 = list(df_main.loc[:, 'col2']) print(list_col2) -- Result col1 col..

tabulate을 이용하여 DataFrame을 terminal에서 더 가독성 좋게(이쁘게) 출력하는 방법을 알아봅시다. import pandas as pd dict_test = { 'col1': [1, 2, 3, 4, 5], 'col2': ['Apple', 'Banana', 'Watermelon', 'Grape', 'Melon'], 'col3': ['a', 'b', 'c', 'd', 'e'], } df_test = pd.DataFrame(dict_test) print(df_test) 위 코드를 실행해보면 그 결과로 아래 이미지와 같은 내용이 출력됩니다. 정상적으로 DataFrame이 출력되긴 했죠. 그러나 가독성이 그닥 좋아보이진 않습니다. 지금 예시로 사용된 DataFrame은 굉장히 간단해서 이것만으..
Pandas의 shift method는 DataFrame이나 Series에 적용해서 행의 위치를 일정 칸수씩 이동시킵니다. 바로 예시를 통해 알아봅시다. import pandas as pd dict_test = { 'col1': [ 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4 ], 'col2': [ 'a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'b', 'b', 'a', 'a', 'b', 'a', 'b', 'b' ], 'col3': [ 1000, 1100, 1200, 1300, 1050, 1100, 2100, 2050, 2000, 2200, 3000, 3100, 3200, 4200, 4100, 4150 ], 'col4': [ 1, 2, 3,..