R
-
크롤링하여 영화 리뷰에 대한 워드 클라우드 만들기R 2019. 6. 9. 01:29
사용할 패키지 rvest : 웹 크롤링 패키지 wordcloud : 워드 클라우드 만들어줌 dplyr : 추출 용이하게 해줌 텍스트 마이닝 : 문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법 #rvest : html 문서로 되어 있는 웹에서의 텍스트 데이터를 가져와서 크롤링. 제일많이 씀 ##rvest의동작 순서(text 가져오기) #1. html문서 데이터 가져오기 : read_html(url) #2. 필요한 노드 선택하기 : html_nodes(html) #3. 노드 내에 text를 가져오기 : html_text(node) #4. 노드 내에 attribute 가져오기 : html_attr(node, attr) #웹 크롤링 install.packages("rvest"); library(rv..
-
문자열조합, 숫자조합, 난수 생성하기R 2019. 6. 8. 21:00
문자조합 생성 함수 설명 인자 rep (x, times, each) x를 반복한 x와 같은 타입의 벡터 반환 times : 전체 반복횟수 each : 개별반복횟수 paste0 (..., collapse=NULL) 각 요소 붙여서 문자형 벡터 반환 collapse : 전체 요소를 하나의 문자열로 만들고 각 요소의 구분자를 지정 paste (..., sep=" ", collapse=NULL) 각 요소 붙여서 문자형 벡터 반환 sep : 구분자 strsplit (x, split, fixed=FALSE) 구분자를 기준으로 문자 분리 split : 구분자 fixed : FALSE는 구분자로 정규식 검사 substr (x, start, stop) x 각 요소의 start부터 stop까지 부분 추출 숫자조합 생성 함..
-
N차원 객체 일괄 처리 (apply 계열 함수)R 2019. 6. 8. 20:30
정보 요약/추출 함수 정리 https://imar.tistory.com/38 데이터 구조 한꺼번에 일괄처리 함수형태 반환타입 DATA 설명 apply(DATA, 적용방향, 함수) vector/array/list array/matrix 적용방향 : 1은 행/2는 열/ c(1,2)는 행과열 모두 lapply(DATA, 함수, 함수 인자...) DATA와 같은 길이의 list vector/list/dataf.frame/표현식 sapply(DATA, 함수, 함수인자..) 함수 반환값이 길이가 1인 벡터: vector / 1보다 큰 벡터 : matrix / 그외 array vector/list/data.frame/표현식 tapply(DATA, 그룹색인, 함수,함수인자..) array vector 그룹으로 묶을 색..
-
-
R 객체 저장하고 불러오기R 2019. 6. 8. 20:10
저장하고 불러오기 전 작업공간 확인 : getwd( ) 작업공간 지정 : setwd("절대경로") 지정하면 상대경로 쓸 수 있음 저장하기 save(..., list = character(), file = stop("'file' must be specified"), ascii = FALSE, version = NULL, envir = parent.frame(), compress = isTRUE(!ascii), compression_level, eval.promises = TRUE, precheck = TRUE) 옵션 설명 ... # 저장할 객체 list # 저장할 객체 이름 지정 file # 파일이름. 지정안하면 stop( ) 함수로 에러발생됨 불러오기 바이너리 파일을 읽어서 로드 load(file, en..
-
키보드 입력, 콘솔 출력R 2019. 6. 8. 20:01
보통 시스템의 표준입력 stdin 은 키보드 표준출력 stdout 콘솔(화면) 이다 키보드 입력 readline(prompt="") 한줄 입력 scan(file = "", what = double(), nmax = -1, n = -1, sep = "", quote = if(identical(sep, "\n")) "" else "'\"", dec = ".", skip = 0, nlines = 0, na.strings = "NA", flush = FALSE, fill = FALSE, strip.white = FALSE, quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE, comment.char = "", allowEscapes = FALSE, fileEn..