요약
1. 누락 값 정의
| 환경/라이브러리 | 자료형 | 누락값 | 비고 |
|---|---|---|---|
| Python | 모든 타입 | None | 일반적인 null |
| NumPy | float | np.nan | 수치형 |
| Pandas | object | None, np.nan | 문자열/객체형 |
| Pandas | float64 | np.nan | 수치형 |
| Pandas | int64 | 불가능 | pd.Int64Dtype() 사용 |
| Pandas | datetime64 | NaT | 시계열 누락값 |
2. 누락 값 확인
df.isna().sum() # 누락 값 개수
df.notna().sum() # 누락이 아닌 값 개수3. 누락 값 처리
# 누락된 행 가져오기
df.loc[df['column1'].isna(), :]
# 모든 누락값을 공백으로
df.fillna('', inplace=True)
# 특정 열만 처리
df.fillna({'column1': '없음'}, inplace=True)참고사이트