Python
[개미의 걸음 Pandas 8차시] 인덱스 지정(.index, set_index, reset_index, .index +1)
IT개미 데이터
2021. 1. 8. 07:07
728x90
인덱스 지정
만약 데이터를 불러올 때 'index_col'을 통해 지정하지 않았거나 데이터 가공 도중 임의의 인덱스(0,1,2, ... )로 지정되었을 경우 다시 인덱스를 지정할 필요가 있음
데이터를 로딩할 때 인덱스 지정 | 데이터를 로딩할 때 'index_col' 인자를 사용하여 인덱스가 될 column을 지정 0 : 첫번째 컬럼의 데이터들이 인덱스로 지정됨 1 : 두번째 컬럼의 데이터들이 인덱스로 지정됨 ex> df=pd.read_excel('titanic.xlsx', index_col=0) |
.set_index('컬럼명') | 데이터프레밍명.set_index('인덱스로 지정할 컬럼명') ex> titanic.set_index('age') 데이터프레임의 인덱스를 영구적으로 변경할 때는 'inplace=True'를 사용 ex> titanic.set_index('age', inplace=True) ![]() |
.reset_index() | 인덱스가 연속된 int숫자형 데이터가 아닐 때, 연속 int 숫자형 데이터로 만들려고 사용 reset_index()를 사용하면 새로운 index 생성되며 기존 index는 새로운 컬럼이 됨 ex> titanic.reset_index(inplace=True) ![]() Seris에서 reset_index()를 사용할 경우 DataFrame이 반환됨! → 기존 인덱스가 Column으로 추가되므로!! |
.index=데이터프레임명['컬럼명'] | 주로 다른 데이터프레임의 컬럼을 인덱스로 사용하고 싶을 때 사용 ex> df1.index=df2['datetime'] df2의 datetime컬럼을 df1의 인덱스로 사용 |
인덱스 1부터 시작하기
인덱스를 0이 아닌 1부터 시작하고 싶을 때는 df_name.index=df_name.index+1을 사용하면 됨
- ex> titanic.index=titanic.index + 1
728x90