일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- math
- PostgreSQL
- GIT
- django
- Excel
- 파이썬
- dataframe
- Apache
- gas
- array
- google apps script
- c#
- list
- Tkinter
- Redshift
- Python
- Mac
- string
- PANDAS
- PySpark
- Google Excel
- numpy
- Java
- Kotlin
- matplotlib
- Google Spreadsheet
- Github
- SQL
- hive
- Today
- Total
목록Python (384)
달나라 노트
먼저 python의 기본 반올림 함수로 round 가 있습니다. round(number, digit) number --> 반올림을 적용할 숫자입니다. digit --> 반올림 하여 얻은 결과에 소수점이 몇개나 있을지에 대한 숫자입니다. 이것의 의미는 아래 예시에서 보겠습니다. print(round(1738.7926)) # 1 --> 1739 print(round(1738.7926, 0)) # 2 --> 1739.0 print(round(1738.7926, 1)) # 3 --> 1739.8 print(round(1738.7926, 2)) # 4 --> 1739.79 print(round(1738.7926, 3)) # 5 --> 1739.793 print(round(1738.7926, -1)) # 6 -->..
Python pandas에는 duplicated라는 method가 있습니다. duplicated method는 DataFrame에 있는 행들 중 중복된 값을 가진 행이 뭔지 True, False의 형태로 알려줍니다. Syntax DataFrame.duplicated(subset=list/none, keep='first'/'last'/False) subset subset에는 중복값 테스트를 할 기준 column을 적습니다. 만약 subset을 적지 않으면 모든 컬럼의 데이터를 기준으로 중복값을 가진 row를 체크합니다. keep='first' --> 중복된 row 중에서 가장 위에 있는 row를 제외하고 나머지 row에 중복 flag(True)를 달아줍니다. keep='last' --> 중복된 row 중에..
DataFrame을 다루다보면 DataFrame에 있는 하나하나의 행을 참조하여 for loop를 돌리는 등의 경우가 발생합니다. 이럴때에는 여러 가지 방법이 있지만 그 중에서 pandas에서 제공하는 iterrows를 사용해봅시다. import pandas as pd dict_1 = { 'col1': [4, 1, 5, 3, 2], 'col2': [6, 7, 8, 9, 10], 'col3': [11, 12, 13, 14, 15], 'col4': [16, 17, 18, 19, 20] } df_1 = pd.DataFrame(dict_1) print(df_1) print(df_1.iterrows()) -- Result col1 col2 col3 col4 0 4 6 11 16 1 1 7 12 17 2 5 8 1..
어느 프로그래밍 언어에서나 데이터를 다룰 때 가장 중요한 부분 중 하나는 null, NaN, None 등의 값을 다루는겁니다. 어떤 데이터가 null 값일 때에는 다른 숫자를 return한다던지, Pandas DataFrame의 어느 위치의 값이 NaN이면 해당 위치에 다른 값을 집어넣는다던지, 어떤 변수에 할당된 값이 NaN이라면 다른 값을 해당 변수에 재할당한다던지 등의 상황이 상당히 자주 발생합니다. SQL에서는 null값을 다루기 위해 nvl, coalesce등의 함수가 있죠. 그러면 Python에서 None, NaN값을 다루기 위해선 어떻게 해야할까요? 이 방법을 알아보기 전에 Python에서 NaN과 None의 특징을 알아봅시다. import numpy as np print(np.NaN == ..