일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- math
- Excel
- Kotlin
- 파이썬
- dataframe
- c#
- Github
- Mac
- numpy
- Tkinter
- GIT
- google apps script
- Python
- Java
- Apache
- PostgreSQL
- gas
- Google Spreadsheet
- list
- PySpark
- PANDAS
- SQL
- Redshift
- hive
- django
- Google Excel
- string
- array
- matplotlib
- Today
- Total
목록PANDAS (70)
달나라 노트
아래처럼 pip show 명령어를 이용하면 어떤 Python library의 상세한 정보를 볼 수 있습니다. pip show module_name pip show pandas 예를들어 현재 제 컴퓨터에 설치된 pandas의 상세정보를 보려고 할 때 위처럼 pip show pandas를 terminal에 적으면 아래와 같이 pandas에 관한 상세 정보가 나옵니다. Name: pandas Version: 1.0.5 Summary: Powerful data structures for data analysis, time series, and statistics Home-page: https://pandas.pydata.org Author: None Author-email: None License: BSD Lo..
Pandas에서 제공하는 to_list method는 Series에 적용할 수 있으며 적용된 Series를 list 형태로 변환해주는 역할을 합니다. import pandas as pd dict_main = { 'col1': [1, 2, 3, 4, 5, 6], 'col2': ['alpha', 'beta', 'gamma', 'delta', 'epsilon', 'zeta'] } df_main = pd.DataFrame(dict_main) print(df_main) list_col2 = df_main.loc[:, 'col2'].to_list() print(list_col2) list_col2 = list(df_main.loc[:, 'col2']) print(list_col2) -- Result col1 col..
tabulate을 이용하여 DataFrame을 terminal에서 더 가독성 좋게(이쁘게) 출력하는 방법을 알아봅시다. import pandas as pd dict_test = { 'col1': [1, 2, 3, 4, 5], 'col2': ['Apple', 'Banana', 'Watermelon', 'Grape', 'Melon'], 'col3': ['a', 'b', 'c', 'd', 'e'], } df_test = pd.DataFrame(dict_test) print(df_test) 위 코드를 실행해보면 그 결과로 아래 이미지와 같은 내용이 출력됩니다. 정상적으로 DataFrame이 출력되긴 했죠. 그러나 가독성이 그닥 좋아보이진 않습니다. 지금 예시로 사용된 DataFrame은 굉장히 간단해서 이것만으..
Pandas의 shift method는 DataFrame이나 Series에 적용해서 행의 위치를 일정 칸수씩 이동시킵니다. 바로 예시를 통해 알아봅시다. import pandas as pd dict_test = { 'col1': [ 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4 ], 'col2': [ 'a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'b', 'b', 'a', 'a', 'b', 'a', 'b', 'b' ], 'col3': [ 1000, 1100, 1200, 1300, 1050, 1100, 2100, 2050, 2000, 2200, 3000, 3100, 3200, 4200, 4100, 4150 ], 'col4': [ 1, 2, 3,..