일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- google apps script
- Github
- PySpark
- PostgreSQL
- c#
- Tkinter
- Google Excel
- Excel
- Redshift
- SQL
- Mac
- Python
- django
- list
- numpy
- array
- 파이썬
- dataframe
- PANDAS
- string
- Apache
- Kotlin
- hive
- Google Spreadsheet
- gas
- GIT
- math
- Java
- matplotlib
- Today
- Total
목록PANDAS (70)
달나라 노트
Pandas의 concat은 두 개 이상의 Series를 합치거나, 두 개 이상의 DataFrame을 합쳐줍니다. import pandas as pd list_test_1 = [1, 2, 3] list_test_2 = [4, 5, 6] list_test_3 = [7, 8, 9] seri_test_1 = pd.Series(list_test_1) seri_test_2 = pd.Series(list_test_2) seri_test_3 = pd.Series(list_test_3) print(seri_test_1) print(seri_test_2) print(seri_test_3) - Output 0 1 1 2 2 3 dtype: int64 0 4 1 5 2 6 dtype: int64 0 7 1 8 2 9 dty..
Pandas의 Series에는 value_counts라는 method가 존재합니다. 이것은 Series에 존재하는 값들 중 동일한 값들이 몇 개 있는지를 세어줍니다. import pandas as pd list_test = [1, 2, 3, 3, 3, 4, 5, 5, 6, 7, 8, 8, 8, 9] seri_test = pd.Series(list_test) - Output 0 1 1 2 2 3 3 3 4 3 5 4 6 5 7 5 8 6 9 7 10 8 11 8 12 8 13 9 dtype: int64 먼저 위처럼 test용Series를 만들어줍시다. val_cnt = seri_test.value_counts() print(val_cnt) print(type(val_cnt)) - Output 8 3 3 3..
import psycopg2 import pandas as pd def query_runner(query): dbname = 'sandbox' host = 'test_host' port = 1111 # port_number user_id = 'redshift_user_id' password = 'redshift_user_name' connection_info = "dbname='{}' host='{}' port={} user='{}' password='{}'".format(dbname, host, port, user_id, password) connection = psycopg2.connect(connection_info) cursor = connection.cursor() cursor.execute(q..
pandas.to_numeric to_numeric은 데이터를 숫자 형식으로 바꿔주는 역할을 합니다. to_numeric의 대표적 인자는 아래와 같습니다. pd.to_numeric(숫자로 변경할 대상, errors='ignore/raise/coerce') 숫자로 변경할 대상: to_numeric을 적용시켜 숫자형식으로 변경시킬 대상이며 스칼라값, list, tuple, Series 등이 대상으로 지정될 수 있습니다. errors: error는 총 3개의 옵션이 존재합니다. - errors = 'ignore' -> 만약 숫자로 변경할 수 없는 데이터라면 숫자로 변경하지 않고 원본 데이터를 그대로 반환합니다. - errors = 'coerce' -> 만약 숫자로 변경할 수 없는 데이터라면 기존 데이터를 지우..