일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Apache
- numpy
- c#
- PANDAS
- Tkinter
- Java
- SQL
- string
- Mac
- Excel
- PySpark
- matplotlib
- PostgreSQL
- GIT
- hive
- Redshift
- Github
- Google Excel
- dataframe
- Python
- google apps script
- math
- Kotlin
- gas
- Google Spreadsheet
- array
- django
- 파이썬
- list
- Today
- Total
목록GROUPBY (5)
달나라 노트
groupby와 rank를 이용하면 window function에서 row_number() 함수와 같은 기능을 구현할 수 있습니다. import pandas as pdimport numpy as npdict_test = { 'col1': [1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5], 'col2': [1000, 2000, 100, 300, 500, 200, 300, np.nan, 150, 180, 580, np.nan, 10, 100, 80, 55, 10]}df_test = p..
일반적으로 pandas의 groupby를 이용하면 한번에 하나의 aggregate function밖에 사용할 수 없습니다. import pandas as pd dict_item = { 'date': [ 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200104 ], 'item_id': [ 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4 ], 'item_name': [ 'a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c', 'd', 'd', 'd', 'd' ], 'price': [ 1000, ..
transform method는 DataFrame에서 groupby로 집계한 결과를 동일한 index를 가진 행에 넣어서 return해줍니다.말만 들으면 무슨 소린지 잘 감이 오지 않는데 실제 예시를 봅시다. import pandas as pddict_item = { 'date': [ 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200104 ], 'item_id': [ 1, 1, 1, 2, 2, 2, 3, 3, 3, 4..
이 글에선 Pandas의 DataFrame에 groupby와 rolling method를 동시에 사용하는 예시를 보겠습니다. 이 글 이전에 아래 2개의 글을 먼저 읽고 오면 이해하는데 도움이 됩니다. https://cosmosproject.tistory.com/156 Python Pandas : rolling (DataFrame window function) Pandas에서 사용할 수 있는 window function 기능을 알아봅시다. import pandas as pd dict_test = { 'col1': [1, 1, 2, 2, 3, 3, 3, 4], 'col2': [1000, 1100, 2100, 2050, 3000, 3100, 3200, 4200], 'col3': ['a.. cosmosproje..