본문 바로가기

r studio

(8)
R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 iris 데이터의 주성분 분석을 하는 R 코드를 만들어 보자. - (1) 데이터 준비하기 (2) PCA 하기 (3) PCA 결과 확인하기 (4) PCA 결과 시각화하기1 - Scree Chart (5) PCA 결과 시각화하기2 - ggbiplot (6) 군집분석으로 검증하기 - (1) 데이터 준비하기 데이터는 R에서 기본 제공되는 iris 데이터를 사용하겠다. 일단 PCA에는 연속형 변수(Continuous Variable)만 사용하기 때문에 연속형 변수와 범주형 변수(Categorical Variable)를 분리한다. # 연속형 변수 dt
R에서 JAVA / rJava / JAVA_HOME 설정하기 R에서 JAVA / rJava / JAVA_HOME 설정하기 여러가지 패키지를 설치하다 보면 Dependent Library로 rJava가 같이 설치되는 경우를 볼 수 있다. 사전에 R 외에 다른 언어로의 개발로 인해 Java가 설치/설정 되어 있는 경우 잘 설치가 완료되는 경우가 있지만 그렇지 않은 대부분의 경우에는 설치시 오류 메시지가 나오게 된다. 그럴 때 어떻게 하는지 자세히 포스팅 해보려고 한다. - (1) R 패키지 설치하기 (2) R 라이브러리 불러오기 (3) Java 설치여부 확인하기 (4) Java 설치하기 (5) 환경변수 설정하기 - JAVA_HOME, PATH (6) R에서 JAVA_HOME 경로 설정하기 - (1) 패키지 설치하기 내가 설치하려고 하는 패키지는 엑셀 파일을 불러오고 ..
[R 예제 코드] Logistic Regression / 로지스틱 회귀분석 R 예제 코드 - Logistic Regression / 로지스틱 회귀분석 로지스틱 회귀분석을 drama_genre.csv 데이터에 적용해서 genre를 분류하는 R 코드를 만들어 보자. ▼ 로지스틱 회귀분석 알고리즘에 대한 이론적인 설명이 궁금하다면? ▼ 2017/03/21 - [Analysis/ALGORITHM] - Logistic Regression / 로지스틱 회귀분석 1. 데이터 준비하기 아래에서 drama_genre.csv 데이터를 다운로드 한다. 이 데이터는 iris 데이터를 약간 변형식켜서 만든 샘플 데이터이다. 다운로드 받았으면 csv 파일을 불러온다. 경로는 csv 파일을 저장했던 폴더로 지정한다. \가 아닌 / 를 사용하는 것에 주의하자. data
한눈에 정리하는 ggplot2를 이용한 R 시각화 기초 1 한눈에 정리하는 ggplot2 를 이용한 R 시각화 기초 1 ggplot2는 R 시각화에서 빠지지 않고 등장하는 시각화 라이브러리이다. ggplot2 라이브러리를 이용해서 할 수 있는 시각화에는 크게 ggplot과 qplot이 있다. ggplot 내가 원하는 특정 옵션을 상세하게 지정해서 예쁘게 시각화 할 때 사용한다. qplot 옵션을 상세하게 지정하지 않아도 basic plot 보다 예쁘게 시각화 하고 싶을 때 사용한다. 나의 경우 데이터 기초 분석(EDA)을 할 때는 basic plot과 qplot을 주로 사용하고 보고서나 shiny로 구현할 때는 필요에 따라 ggplot을 사용하는 편인데 이번 포스팅에서는 ggplot만 다루겠다. 일단 ggplot2 패키지를 설치하고 라이브러리를 불러오자. # g..
Train vs. Validation vs. Test Data Train vs. Validation vs. Test Data 데이터를 구하고 나서 분석을 시작할 때 대부분 처음 하는 작업은 데이터를 3등분으로 나누는 작업이다. - Train Data 분석 모델을 만들기 위한 학습용 데이터이다. Validation Data 여러 분석 모델 중 어떤 모델이 적합한지 선택하기 위한 검증용 데이터이다. Test Data 최종적으로 선택된 분석 모델이 얼마나 잘 작동하는지 확인하기 위한 결과용 데이터이다. - 3등분으로 나누는 비율은 대체적으로 6 : 2 : 2 를 가장 많이 쓰는데, 이렇게 나누는 방법을 Simple Validation 이라고 한다. Simple Validation 외에 k-Fold Validation 이나 Leave-One-Out Validation 방법..
R Studio 옵션 설정하기 (Global Options) R Studio 옵션 설정하기 (Global Options) R Studio 설치 후 기본적인 설정을 해보자. R 설치와 R Studio 설치가 전제되어야 하니 혹시 아직 설치를 안 했다면 아래 포스팅을 참고하자! ▼ R 설치하는 법 ▼ 2017/03/09 - [R] - R 설치 (Version 3.3.3) ▼ R 설치 후 R Studio 설치하는 법 ▼ 2017/03/09 - [R] - R Studio 설치 -(0) 옵션 설정 메뉴로 들어가기(1) 한글 주석 깨짐 방지 설정하기 (인코딩)(2) 전체 라인 실행하기(3) 창 레이아웃 변경하기(4) 테마 / 글꼴 / 폰트 사이즈 변경하기 - (0) 옵션 설정 메뉴로 들어가기 아래 설명되는 모든 설정은 Global Options 라는 곳에서 설정하게 되어있으..
R Studio 설치 (Version 1.0.136) R Studio 설치 (Version 1.0.136) R 버전 3.3.3 설치에 이어서 R Studio도 설치해보자. R Studio 설치 전에 R이 먼저 설치되어 있어야 한다. ▼ R 설치하는 방법 ▼ 2017/03/09 - [R] - R 설치 (Version 3.3.3) (1) R Studio 설치하기 1. R Studio 공식 사이트에 접속한다. (https://www.rstudio.com/) 2. RStudio Download 버튼을 클릭한다. 3. R Studio Desktop Open Source License FREE 아래에 Download 버튼을 클릭한다. 4. Installers for Supported Platforms 아래 링크 중에서 자신의 OS와 맞는 링크를 클릭하여 RStudio..
R 설치 (Version 3.3.3) R 설치 (Version 3.3.3) 2017. 03. 06. R for Windows 버전이 3.3.2에서 3.3.3으로 업데이트 되었다. 프로젝트 인수인계 대비 겸, 강의자료 준비 겸, R 업데이트 겸, R과 R Studio 설치 방법을 첫 글로 올려보려고 한다. (1) R 버전 확인하기 R 설치 전에 자신이 가지고 있는 R의 버전을 확인해보자.> version _ platform x86_64-w64-mingw32 arch x86_64 os mingw32 system x86_64, mingw32 status major 3 minor 3.2 year 2016 month 10 day 31 svn rev 71607 language R version.string R version 3.3.2 (2016-10-..