일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Google Excel
- 파이썬
- django
- c#
- PostgreSQL
- math
- google apps script
- Google Spreadsheet
- SQL
- Python
- Kotlin
- hive
- Github
- gas
- array
- PANDAS
- Redshift
- numpy
- Apache
- Mac
- dataframe
- Tkinter
- list
- Java
- matplotlib
- PySpark
- GIT
- string
- Excel
- Today
- Total
목록Python/Python Pandas (77)
달나라 노트
DataFrame.merge sql에서의 window function과 비슷한 기능을 pandas에서 어떻게 사용할 수 있는지를 알아봅시다. 먼저 test용 DataFrame을 생성합니다. import pandas as pd dict_name = { 'item_id': [1, 2, 4], 'item_name': ['a', 'b', 'd'] } dict_price = { 'item_id': [1, 2, 3], 'price': [1000, 2000, 3000] } df_name = pd.DataFrame(dict_name) df_price = pd.DataFrame(dict_price) print(df_name) print(type(df_name)) print(df_price) print(type(df_pr..
DataFrame.groupby groupby는 특정 컬럼에 존재하는 값들에 대해서 동일한 값을 가진 행끼리 그룹화하고 그룹화된 행들에 어떤 연산(합, 평균, 최대, 최소 등)을 해주는 기능을 가집니다. 먼저 test용 DataFrame을 생성합니다. import pandas as pd dict_item = { 'date': [ 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200101, 20200102, 20200103, 20200104 ], 'item_id': [ 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4 ], 'item_name': [ 'a', 'a', 'a..
DataFrame.assign assign은 apply와 비슷하게 내가 원하는 로직을 DataFrame의 어떤 컬럼에 적용시킨 후, 새로운 컬럼을 추가하여 변경된 DataFrame을 반환합니다. 먼저 test용 DataFrame을 생성합니다. import pandas as pd dict_item = { 'item_id': [1, 2, 3, 4], 'item_name': ['a', 'b', 'c', 'd'], 'price': [1000, 2000, 3000, 4000] } df_item = pd.DataFrame(dict_item) print(df_item) print(type(df_item)) - Output item_id item_name price 0 1 a 1000 1 2 b 2000 2 3 c 3..
DataFrame.apply apply는 DataFrame에 존재하는 컬럼들의 데이터를 받아 특정 함수를 적용시켜서 해당 함수에 있는 로직대로 데이터를 반환한 데이터를 특정 컬럼에 넣어주는 기능을 가집니다. 마치 엑셀에서 내가 원하는대로 filter를 걸고 해당 행(row)에 대해 원하는 수식들을 적용시키는 것과 비슷합니다. 먼저 예시로 사용할 DataFrame을 만들어줍니다.item name과 각 item들에 대한 id, 그리고 판매가격 정보를 담은 DataFrame입니다. import pandas as pd dict_item = { 'item_id': [1, 2, 3, 4], 'item_name': ['a', 'b', 'c', 'd'], 'price': [1000, 2000, 3000, 4000] }..