[개미의 걸음 Pandas 8차시] 인덱스 지정(.index, set_index, reset

[개미의 걸음 Pandas 8차시] 인덱스 지정(.index, set_index, reset_index, .index +1)

Python

by IT개미 데이터 2021. 1. 8. 07:07

728x90

인덱스 지정

만약 데이터를 불러올 때 'index_col'을 통해 지정하지 않았거나 데이터 가공 도중 임의의 인덱스(0,1,2, ... )로 지정되었을 경우 다시 인덱스를 지정할 필요가 있음

데이터를 로딩할 때 인덱스 지정	데이터를 로딩할 때 'index_col' 인자를 사용하여 인덱스가 될 column을 지정 0 : 첫번째 컬럼의 데이터들이 인덱스로 지정됨 1 : 두번째 컬럼의 데이터들이 인덱스로 지정됨 ex> df=pd.read_excel('titanic.xlsx', index_col=0)
.set_index('컬럼명')	데이터프레밍명.set_index('인덱스로 지정할 컬럼명') ex> titanic.set_index('age') 데이터프레임의 인덱스를 영구적으로 변경할 때는 'inplace=True'를 사용 ex> titanic.set_index('age', inplace=True)
.reset_index()	인덱스가 연속된 int숫자형 데이터가 아닐 때, 연속 int 숫자형 데이터로 만들려고 사용 reset_index()를 사용하면 새로운 index 생성되며 기존 index는 새로운 컬럼이 됨 ex> titanic.reset_index(inplace=True) Seris에서 reset_index()를 사용할 경우 DataFrame이 반환됨! → 기존 인덱스가 Column으로 추가되므로!!
.index=데이터프레임명['컬럼명']	주로 다른 데이터프레임의 컬럼을 인덱스로 사용하고 싶을 때 사용 ex> df1.index=df2['datetime'] df2의 datetime컬럼을 df1의 인덱스로 사용

인덱스를 0이 아닌 1부터 시작하고 싶을 때는 df_name.index=df_name.index+1을 사용하면 됨

728x90

[개미의 걸음 scikit-learn 1차시] 사이킷런의 이해 (0)	2021.02.01
[개미의 걸음 Pandas 9차시] 데이터 제거(drop) (0)	2021.01.09
[개미의 걸음 Pandas 7차시] null값 처리(isnull().sum(), isna().sum(), fillna(),dropna()) (0)	2021.01.07
[개미의 걸음 Pandas 6차시] DataFrame 조회(info(), describe(),dtypes, quantile, max, median, min) (0)	2021.01.06
[개미의 걸음 Pandas 5차시] DataFrame 정렬(sort_values, sort_index) (0)	2021.01.05