일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- SQL
- Github
- hive
- Kotlin
- Java
- matplotlib
- Mac
- string
- PostgreSQL
- Apache
- c#
- PANDAS
- Python
- dataframe
- numpy
- Redshift
- Excel
- GIT
- PySpark
- list
- Google Excel
- google apps script
- gas
- 파이썬
- Google Spreadsheet
- django
- math
- Tkinter
- array
- Today
- Total
목록Python/Python Pandas (76)
달나라 노트
Syntax DataFrame.min(axis=1) DataFrame.max(axis=1) min method는 DataFrame에 적용하여 컬럼간에 가장 작은 값을 return합니다. max method는 DataFrame에 적용하여 컬럼간에 가장 작은 값을 return합니다. import pandas as pd dict_item = { 'col1': [1, 2, 3, 4, 5], 'col2': [5, 4, 3, 2, 1], } df_item = pd.DataFrame(dict_item) df_item.loc[:, 'min_col'] = df_item.loc[:, ['col1', 'col2']].min(axis=1) df_item.loc[:, 'max_col'] = df_item.loc[:, ['col..
Pandas의 isna method는 어떤 값이 NaN값인지 아닌지를 체크합니다. NaN값이라면 True, NaN값이 아니라면 False를 return합니다. 아래 예씨를 보시죠. import numpy as np import pandas as pd print(pd.isna(np.nan)) -- Result True isna method가 NaN값을 받으니 True값을 return하는 것을 볼 수 있습니다. 마치 아래 글에 있는 numpy의 isnan과 비슷한 기능을 하죠. https://cosmosproject.tistory.com/367 Python numpy : isnan (NaN값 다루기, None값 다루기, null값 다루기, NaN값 테스트, None값 테스트, nvl, coalesce 어느 ..
Pandas를 사용하다보면 아래와 같은 error가 발생할 때가 있습니다. AttributeError: type object 'object' has no attribute 'dtype' 이런 경우 코드 자체에 문제가 없다면 pandas와 numpy의 version간에 적당한 호환이 되지 않기 때문일 가능성이 큽니다. 따라서 pandas와 numpy의 version을 아래처럼 유지하거나 version을 아래에 명시된 것을 기준으로 서서히 바꿔보면서 Error가 사라지는지 테스트해봅시다. pandas -> 1.0.1 이상 numpy -> 1.20.0 미만 (numpy version이 1.20.0 이상으로 올라가면 이상하게 error가 더 잘 발생하는 것 같습니다.) 저는 현재 아래의 version을 사용중입..
간혹 read_csv method로 csv 파일을 읽을 때 아래와 같은 error가 발생하는 경우가 있습니다. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte encoding관련 문제가 생겨서 발생하는 error인데 이러한 error가 발생하면 먼저 원본 csv 파일에 한글이 섞여있는지 확인해보면 좋습니다. import pandas as pd df_test = pd.read_csv('test.csv', sep=',', encoding='euc-kr') df_test = pd.read_csv('test.csv', sep=',', encoding='cp949') 만약 한글이 포함되어있다면 위처럼..