달나라 노트

Python Pandas : notna (누락값 여부 체크하기) 본문

Python/Python Pandas

Python Pandas : notna (누락값 여부 체크하기)

CosmosProject 2021. 3. 18. 20:08
728x90
반응형

 

 

 

Python에 있는 notna method는 dataframe이나 seires에 적용하여 dataframe이나 series에 있는 값들이 누락값(NaN, null 등)인지를 체크합니다.

 

누락값이라면 False를

누락값이 아닌 어떠한 정상적인 값이 입력되어있다면 True를 반환합니다.

 

 

import pandas as pd
import numpy as np

dict_test = {
    'col1': [1, np.NaN, 3, 4, np.NaN],
    'col2': ['a', 'b', 'c', 'd', 'e']
}

df_test = pd.DataFrame(dict_test) # 1
print(df_test)


print(df_test.notna()) # 2


sr_test = df_test['col1'] # 3
print(sr_test.notna())


df_new = df_test[df_test['col1'].notna()] # 4
print(df_new)


-- Result
   col1 col2
0   1.0    a
1   NaN    b
2   3.0    c
3   4.0    d
4   NaN    e

    col1  col2
0   True  True
1  False  True
2   True  True
3   True  True
4  False  True

0     True
1    False
2     True
3     True
4    False
Name: col1, dtype: bool

   col1 col2
0   1.0    a
2   3.0    c
3   4.0    d

1. Test용 DataFrame을 생성합니다. col1 컬럼에 NaN값이 2개 존재합니다.

 

2. DataFrame 자체에 notna method를 적용하였습니다. 따라서 notna는 DataFrame에 속한 모든 값들에 대해 누락값 여부를 테스트한 후 누락값이 아닌 자리에 True를 누락값인 자리에 False를 반환하여 보여줍니다.

 

3. 2번과 동일하지만 Series에 notna method를 적용한 경우입니다.

 

4. notna method는 DataFrame에서 특정 컬럼에 대해 누락값(NaN, null 등)이 있는 행을 필터링할 때 유용합니다.

 

 

 

728x90
반응형
Comments