일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Kotlin
- SQL
- PySpark
- dataframe
- Tkinter
- Apache
- array
- PANDAS
- math
- 파이썬
- Python
- string
- Google Spreadsheet
- matplotlib
- Redshift
- Excel
- Github
- GIT
- google apps script
- hive
- Google Excel
- numpy
- Mac
- PostgreSQL
- list
- django
- gas
- c#
- Java
- Today
- Total
목록Python (379)
달나라 노트
숫자가 1000, 10000단위 이상으로 커지게 되면 천단위 콤마를 찍어주는게 가독성이 좋습니다. 이런저런 로직을 넣어서 직접 python 함수를 만들 수도 있겠지만, 굳이 이런 번거로운 일을 할 필요 없이 Python에서는 format이라는 함수를 제공합니다. Syntax format(number, ',d/f') number --> format을 적용하여 천단위 콤마를 찍을 숫자입니다. ',d/f' --> format을 적용할때 받은 number의 자료형이 무엇인지 입력하고 천단위 콤마를 찍는다는 의미입니다. d는 정수이고, f는 실수입니다. 예시를 보시죠. print(format(12345678910, ',d')) # 1. 12,345,678,910 print(format(12345678910, ',..
먼저 python의 기본 반올림 함수로 round 가 있습니다. round(number, digit) number --> 반올림을 적용할 숫자입니다. digit --> 반올림 하여 얻은 결과에 소수점이 몇개나 있을지에 대한 숫자입니다. 이것의 의미는 아래 예시에서 보겠습니다. print(round(1738.7926)) # 1 --> 1739 print(round(1738.7926, 0)) # 2 --> 1739.0 print(round(1738.7926, 1)) # 3 --> 1739.8 print(round(1738.7926, 2)) # 4 --> 1739.79 print(round(1738.7926, 3)) # 5 --> 1739.793 print(round(1738.7926, -1)) # 6 -->..
Python pandas에는 duplicated라는 method가 있습니다. duplicated method는 DataFrame에 있는 행들 중 중복된 값을 가진 행이 뭔지 True, False의 형태로 알려줍니다. Syntax DataFrame.duplicated(subset=list/none, keep='first'/'last'/False) subset subset에는 중복값 테스트를 할 기준 column을 적습니다. 만약 subset을 적지 않으면 모든 컬럼의 데이터를 기준으로 중복값을 가진 row를 체크합니다. keep='first' --> 중복된 row 중에서 가장 위에 있는 row를 제외하고 나머지 row에 중복 flag(True)를 달아줍니다. keep='last' --> 중복된 row 중에..
DataFrame을 다루다보면 DataFrame에 있는 하나하나의 행을 참조하여 for loop를 돌리는 등의 경우가 발생합니다. 이럴때에는 여러 가지 방법이 있지만 그 중에서 pandas에서 제공하는 iterrows를 사용해봅시다. import pandas as pd dict_1 = { 'col1': [4, 1, 5, 3, 2], 'col2': [6, 7, 8, 9, 10], 'col3': [11, 12, 13, 14, 15], 'col4': [16, 17, 18, 19, 20] } df_1 = pd.DataFrame(dict_1) print(df_1) print(df_1.iterrows()) -- Result col1 col2 col3 col4 0 4 6 11 16 1 1 7 12 17 2 5 8 1..