작업 디렉토리 지정 setwd( ) + read.csv( ) |
|
전체 파일 경로 입력 read.csv( ) |
|
파일을 불러오는 창에서 파일 선택 file.choose( ) |
|
① Rstudio 메뉴에서 [Tools]-[Global Option]-[Code]-[Saving]에서 한글 옵션 설정을 UTF-8로 지정
② Excel에서 파일을 읽은 후 파일포맷을 .csv(UTF-8)로 설정하여 다른 이름으로 저장
③ R에서 파일 읽을 때 encoding옵션 추가
→ read.csv("test.scv", header=TRUE, encoding="utf-8"
엑셀 파일[xls,xlsx] 불러오기 | 1. 엑셀 파일을 csv파일 형식으로 저장한 뒤 csv파일 불러오기 |
2. RODBC라는 패키지를 사용해 엑셀 파일 불러오기 library(RODBC) xlsfile <- odbcConnectExcel("파일경로") ※ 단, 이때 파일경로에 확장자를 생략하고 작성한다!! myxls <- sqlFetch(xlsfile, "sheet1") close(xlsfile) |
|
txt파일 불러오기 | read.table("파일이름") 'sep=' 옵션 사용 못함 |
고정자리수 데이터 파일 [Fixed-width file] 불러오기 |
read.fwf("파일이름", widths=c(w1, w2,...wn) |
테이블로 된 데이터 파일 불러오기 |
read.table("파일이름", sep="구분자") |
* 주소, 이름, 성 등의 텍스트를 요인으로 인식할 경우 → read.table("파일이름",sep="구분자", stringsASFactor=F) * 결측치를 NA가 아닌 다른 문자열로 표현하고 싶은 경우 → read.table("파일이름",sep="구분자", na.strings="." * 파일의 첫행을 변수명으로 인식하고자 할 경우 → read.table("파일이름", sep="구분자", header=T |
|
웹에서 데이터 파일 불러오기 | read.csv("http://~~~") read.table("http://~~~") |
what=numeric(0) → 토큰을 숫자로 해석 what=integer(0) → 토큰을 정수로 해석 what=complex(0) → 토큰을 복소수로 해석 what=character(0) → 토큰을 문자로 해석 what=logical(0) → 토큰을 논리값으로 해석 |
|
html에서 테이블 불러오기 | library(XML) url<-'http://~~~/table.html' t<-readHTMLTable(url) |
복잡한 구조의 파일 [웹 테이블] 불러오기 |
lines<-readLines("a.txt", n=num) token<-scan("a.txt", what=numeric(0)) token<-scan("a.txt", what=list(v1=character(0), v2=numeric(0)) token<-scan("a.txt", what=list(v1=character(0), v2(numeric(0), n=num, nlines=num, skip=num, na.strings=list) |
데이터 양이 적을 경우, c( )함수를 활용하여 데이터를 입력
빈 데이터 프레임을 생성한 후, 편집기를 불러와서 편집한 후 데이터 프레임에 덮어 씌울 수 있음
# 파일 목록보기
list.files( )
list.files(recursive=T, all.files=T)
recursive=TURE로 지정하면 하위 디렉토리까지 모두 확인
list.files( )
list.files(recursive=T, all.files=T)
recursive=TURE로 지정하면 하위 디렉토리까지 모두 확인
[개미의 걸음 ADsP 3과목] paste(), strsplit(), substr(), sub(), gsub(), nchar() (0) | 2020.07.30 |
---|---|
[개미의 걸음 ADsP 3과목] str()함수 & head()함수와 tail()함수 & class()함수 (0) | 2020.07.29 |
[개미의 걸음 ADsP 3과목] R 데이터의 구조 - ⑥Factor(요인) (0) | 2020.07.27 |
[개미의 걸음 ADsP 3과목] R 데이터의 구조 - ⑤list(리스트) (0) | 2020.07.26 |
[개미의 걸음 ADsP 3과목] R 데이터의 구조 - ④Data Frame(데이터 프레임) (0) | 2020.07.25 |
댓글 영역