상세 컨텐츠

본문 제목

[개미의 걸음 ADsP 3과목] R 데이터의 구조 - ⑥Factor(요인)

자격증/ADsP

by IT개미 데이터 2020. 7. 27. 17:17

본문

728x90

Factor[요인]

집단별로 자료를 분석하고자 할 때, 특정 자료를 범주형 자료로 변경해줌

  • 벡터와 Factor 모두 1차원 형태로 되어있음
  • 벡터를 이용해 Factor를 만듦[벡터에 있는 고유값[Unique Value]의 정보를 얻어냄]
  • 벡터에 있는 고유값들을 Factor의 level[수준]이라고 함
        → 요인은 벡터처럼 생겼지만 원소들이 level로 이뤄진 구조
  • 벡터는 범주형 자료를 인식하지 못하지만 Factor는 범주형 자료를 인식
  • Factor는 연속형 변수를 범주형 변수로 만들 수 있다.
Argument 설명
x 벡터로 지정
levels 그룹으로 짖어할 문자형 벡터를 지정[labels와 함께 사용]
levels를 쓰지 않으면 오름차순으로 구분해 자체적으로 그룹지정
어느 집단을 먼저 인식할 것인지 결정할 때 사용
labels levels에 대한 문자형 벡터를 지정
벡터에 있는 각각의 원소값을 다른 문자 유형으로 변경할 경우 사용
ordered levels에 대해 특정한 순서를 정하고 싶으면 TRUE를 지정
ordered=TRUE를 추가한 경우, 집단으로써 뿐만 아니라 선서도 의미가 있게 됨[순서형 자료로 변경됨]

<factor의 예>

※ levels : factor가 가지는 level들이 무엇인지 알려줌
※ nlevels : factor의 level 개수를 알려줌

 

 

 

728x90

관련글 더보기

댓글 영역