만약 데이터를 불러올 때 'index_col'을 통해 지정하지 않았거나 데이터 가공 도중 임의의 인덱스(0,1,2, ... )로 지정되었을 경우 다시 인덱스를 지정할 필요가 있음
데이터를 로딩할 때 인덱스 지정 | 데이터를 로딩할 때 'index_col' 인자를 사용하여 인덱스가 될 column을 지정 0 : 첫번째 컬럼의 데이터들이 인덱스로 지정됨 1 : 두번째 컬럼의 데이터들이 인덱스로 지정됨 ex> df=pd.read_excel('titanic.xlsx', index_col=0) |
.set_index('컬럼명') | 데이터프레밍명.set_index('인덱스로 지정할 컬럼명') ex> titanic.set_index('age') 데이터프레임의 인덱스를 영구적으로 변경할 때는 'inplace=True'를 사용 ex> titanic.set_index('age', inplace=True) |
.reset_index() | 인덱스가 연속된 int숫자형 데이터가 아닐 때, 연속 int 숫자형 데이터로 만들려고 사용 reset_index()를 사용하면 새로운 index 생성되며 기존 index는 새로운 컬럼이 됨 ex> titanic.reset_index(inplace=True) Seris에서 reset_index()를 사용할 경우 DataFrame이 반환됨! → 기존 인덱스가 Column으로 추가되므로!! |
.index=데이터프레임명['컬럼명'] | 주로 다른 데이터프레임의 컬럼을 인덱스로 사용하고 싶을 때 사용 ex> df1.index=df2['datetime'] df2의 datetime컬럼을 df1의 인덱스로 사용 |
인덱스를 0이 아닌 1부터 시작하고 싶을 때는 df_name.index=df_name.index+1을 사용하면 됨
[개미의 걸음 scikit-learn 1차시] 사이킷런의 이해 (0) | 2021.02.01 |
---|---|
[개미의 걸음 Pandas 9차시] 데이터 제거(drop) (0) | 2021.01.09 |
[개미의 걸음 Pandas 7차시] null값 처리(isnull().sum(), isna().sum(), fillna(),dropna()) (0) | 2021.01.07 |
[개미의 걸음 Pandas 6차시] DataFrame 조회(info(), describe(),dtypes, quantile, max, median, min) (0) | 2021.01.06 |
[개미의 걸음 Pandas 5차시] DataFrame 정렬(sort_values, sort_index) (0) | 2021.01.05 |
댓글 영역