상세 컨텐츠

본문 제목

[개미의 걸음 Pandas 7차시] null값 처리(isnull().sum(), isna().sum(), fillna(),dropna())

Python

by IT개미 데이터 2021. 1. 7. 07:07

본문

728x90

null값 확인

데이터프레임의 null값의 개수를 확인할때는 isnull().sum()나 isna().sum()을 사용하여 확인

 

 

null값 대체

null값을 평균값, 0 등으로 처리할때는 fillna(0, inplace=True)을 사용하여 대체

  • 특정컬럼의 결측치값만 대체하고 싶을 때는 데이터프레임['특정 컬럼명'].fillna(0, inplace=True)를 사용
        ex> titanic['age'].fillna(0, inplace=True)
        ex> titanic['age'].fillna(
    int(titanic['age'].mean()), inplace=True)

 

 

null값 제거

null값을 제거할 때는 dropna(subset=["특정컬럼명'], inplace=True)을 사용하여 제거

  • 특정컬럼의 결측치 열들을 제거할 때는 데이터프레임.dropna(subset=['특정컬러명'], inplace=True)를 사용
        ex> titanic.dropna(subset=["age"], inplace=True)
  • 전체 891개 데이터 중 age컬럼의 결측치가 있는 177개 데이터를 뺀 714개 데이터만 남게됨

 

 

 

 

 

 

 

728x90

관련글 더보기

댓글 영역