일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- Github
- SQL
- list
- GIT
- numpy
- c#
- Kotlin
- Google Excel
- Excel
- matplotlib
- string
- array
- Redshift
- PostgreSQL
- Mac
- Java
- Google Spreadsheet
- google apps script
- Apache
- PANDAS
- django
- 파이썬
- gas
- math
- PySpark
- Python
- Tkinter
- hive
- dataframe
- Today
- Total
목록Python/Python Pandas (76)
달나라 노트
pandas.to_datetime to_datetime은 어떤 날짜를 나타내는 문자열을 정해진 format을 기반으로 Date 형식으로 바꿔주는 역할을 합니다. Pandas 공식 문서를 보면 굉장히 많은 인자가 to_datetime에 적용될 수 있지만 여기서는 한번 간단하게 실사용 위주로 알아봅시다. import pandas as pd x = pd.to_datetime('20200123') print(x) print(type(x)) x = pd.to_datetime('2020-01-23') print(x) print(type(x)) - Output 2020-01-23 00:00:00 2020-01-23 00:00:00 결과를 보면 20200123이라는 문자가 2020-01-23 00:00:00이라는 Ti..
DataFrame.to_excel &emp; DataFrame.to_csv &emp; pandas.ExcelWriter to_excel은 DataFrame 정보를 담아 xlsx 파일로 만들어주는 기능을 제공합니다. to_csv는 DataFrame 정보를 담아 csv 파일로 만들어주는 기능을 제공합니다. 먼저 test용 DataFrame을 생성합니다. import pandas as pd dict_1 = { 'col1': [1, 1, 1, 2, 3, 3, 3, 3, 4, 4, 5], 'col2': [1, 1, 1, 2, 3, 3, 3, 4, 4, 4, 5], 'col3': [1, 2, 3, 2, 2, 3, 3, 3, 3, 4, 4] } df_1 = pd.DataFrame(dict_1) print(df_1) ..

pandas.read_excel &emp; pandas.read_csv read_excel은 .xlsx 파일을 읽어 DataFrame의 형태로 가져오는 기능을 제공합니다. read_csv는 .csv 파일을 읽어 DataFrame의 형태로 가져오는 기능을 제공합니다. 엑셀을 실행하여 다음과 같은 데이터를 입력한 후 test.xlsx, test.csv라는 이름으로 동일한 데이터를 가진 2개의 파일을 생성하였습니다. 각각의 파일은 root directory(~/)의 Documents 폴더해 저장해놨기 때문에 경로를 이처럼 지정해주고 아래처럼 read_excel과 read_csv를 이용하여 파일을 읽어봅시다. xlsx_dir = '~/Documents/test.xlsx' csv_dir = '~/Documents..
DataFrame.drop_duplicates DataFrame의 drop_duplicates는 중복된 값을 가진 행을 제거하고 unique한 행만 남도록 해주는 기능을 제공합니다. Syntax DataFrame.drop_duplicates(subset=[column_names], keep='first'/'last', inplace=True/False, ignore_index=True/False) drop_duplicates에 들어갈 수 인자 중 자주 쓰이는 것들은 같습니다. 1. subset에 명시한 컬럼들 기준으로 중복제거가 진행됩니다. 2. keep='first' -> 중복된 컬럼 중 가장 위쪽의 행을 남기고 그 아래의 행들은 삭제 keep='last' -> 중복된 컬럼 중 가장 아래쪽의 행을 남기..