상세 컨텐츠

본문 제목

[개미의 걸음 Pandas 8차시] 인덱스 지정(.index, set_index, reset_index, .index +1)

Python

by IT개미 데이터 2021. 1. 8. 07:07

본문

728x90

인덱스 지정

만약 데이터를 불러올 때 'index_col'을 통해 지정하지 않았거나 데이터 가공 도중 임의의 인덱스(0,1,2, ... )로 지정되었을 경우 다시 인덱스를 지정할 필요가 있음

데이터를 로딩할 때 인덱스 지정 데이터를 로딩할 때 'index_col' 인자를 사용하여 인덱스가 될 column을 지정
0 : 첫번째 컬럼의 데이터들이 인덱스로 지정됨
1 : 두번째 컬럼의 데이터들이 인덱스로 지정됨
    ex> df=pd.read_excel('titanic.xlsx', index_col=0)
.set_index('컬럼명') 데이터프레밍명.set_index('인덱스로 지정할 컬럼명')
    ex> titanic.set_index('age')
데이터프레임의 인덱스를 영구적으로 변경할 때는 'inplace=True'를 사용
    ex> titanic.set_index('age', inplace=True)

.reset_index() 인덱스가 연속된 int숫자형 데이터가 아닐 때, 연속 int 숫자형 데이터로 만들려고 사용
reset_index()를 사용하면 새로운 index 생성되며 기존 index는 새로운 컬럼이 됨
    ex> titanic.reset_index(inplace=True)

Seris에서 reset_index()를 사용할 경우 DataFrame이 반환됨!
    → 기존 인덱스가 Column으로 추가되므로!!
.index=데이터프레임명['컬럼명'] 주로 다른 데이터프레임의 컬럼을 인덱스로 사용하고 싶을 때 사용
   ex> df1.index=df2['datetime']
        df2의 datetime컬럼을 df1의 인덱스로 사용

 

 

인덱스 1부터 시작하기

인덱스를 0이 아닌 1부터 시작하고 싶을 때는 df_name.index=df_name.index+1을 사용하면 됨

  • ex>  titanic.index=titanic.index + 1

 

 

 

728x90

관련글 더보기

댓글 영역