본문 바로가기

회사생활/R

(21)
오프라인 환경에서 git에 있는 R Package 설치하기 - LightGBM 설치 기본적으로 R에서 패키지를 설치할 때는 아래와 같이 간단하게 설치할 수 있다. # xgboost 패키지 설치하기 install.packages("xgboost") 그런데 LightGBM과 같이 CRAN에 등록된 패키지가 아닌, git에 있는 패키지를 설치할 때에는 아래와 같이 설치한다. # LightGBM 패키지 설치하기 remotes::install_url("https://github.com/microsoft/LightGBM/releases/download/v3.0.0/lightgbm-3.0.0-r-cran.tar.gz") 출처 : github.com/Microsoft/LightGBM/tree/master/R-package 하지만 설치 환경이 (외부 사이트로 접속이 안되는) 오프라인인 경우에는 위 코드..
맥 또는 서버에서 ggplot 한글 깨짐 해결방법 맥 또는 서버 환경에서 ggplot2 라이브러리 사용시 한글이 깨지는 경우가 있는데 아래 3가지를 해결해야 한다. 1. 내 맥 또는 서버에 한글 글꼴(ttf 폰트)이 설치하기 나는 네이버 나눔고딕을 받아서 설치했는데, 여기서 중요한 것은 꼭 ttf 폰트를 설치해야 한다는 것이다. 폰트 설치 후에는 /Library/Fonts/, /System/Library/Fonts, /~Library/Fonts/ 등 폴더에 한글 ttf 폰트 파일이 있는지 확인하자. [네이버 한글한글아름답게 : 마루 프로젝트] 마루 프로젝트는 디지털 화면용 부리 글꼴을 사용자와 함께 만들어 갑니다. hangeul.naver.com 2. R에 한글 글꼴을 import 하기 R에서 아래 코드를 실행한다. install.packages("ex..
R에서 DB 사용하기 - SQLite R에서 DB 사용하기 - SQLite How to use DB in R R로 분석할 때 엑셀이나 csv 파일 외에 DB를 구축해서 DB 내 테이블에서 데이터를 불러오고 싶다면 간단하게 SQLite를 사용하는 방법이 있다. SQLite란? SQLite는 MySQL나 PostgreSQL와 같은 데이터베이스 관리 시스템이지만, 서버가 아니라 응용 프로그램에 넣어 사용하는 비교적 가벼운 데이터베이스이다. 영어권에서는 '에스큐엘라이트(ˌɛskjuːɛlˈlaɪt)'또는 '시퀄라이트(ˈsiːkwəl.laɪt)'라고 읽는다. 일반적인 RDBMS에 비해 대규모 작업에는 적합하지 않지만, 중소 규모라면 속도에 손색이 없다. 또 API는 단순히 라이브러리를 호출하는 것만 있으며, 데이터를 저장하는 데 하나의 파일만을 사용하..
R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 iris 데이터의 주성분 분석을 하는 R 코드를 만들어 보자. - (1) 데이터 준비하기 (2) PCA 하기 (3) PCA 결과 확인하기 (4) PCA 결과 시각화하기1 - Scree Chart (5) PCA 결과 시각화하기2 - ggbiplot (6) 군집분석으로 검증하기 - (1) 데이터 준비하기 데이터는 R에서 기본 제공되는 iris 데이터를 사용하겠다. 일단 PCA에는 연속형 변수(Continuous Variable)만 사용하기 때문에 연속형 변수와 범주형 변수(Categorical Variable)를 분리한다. # 연속형 변수 dt
R 패키지 설치가 안 되는 경우 해결방법 R 패키지 설치가 안 되는 경우 해결방법 Installation failed: Peer certificate cannot be authenticated with given CA certificates install.packages 또는 install_github 함수를 사용해서 R 패키지를 설치할 때 가끔 위와 같은 에러가 나는데 이를 해결하기 위한 방법을 간단히 소개한다. 나의 경우 PCA 시각화를 위해 ggbiplot과 vqv 패키지를 Git Hub에서 다운받기 위해 아래 코드를 실행하니 에러 메시지를 만나게 되었다. 이런 에러가 발생하는 이유를 추측하자면 내가 실제 있는 국가랑 사용하는 인터넷 망의 국가가 달라서 생기는 것 같아서 대부분의 사용자들은 만날 일이 없을 것 같기도 하다. 이런 에러를 해..
R apply 계열 함수 총 정리 2 ( lapply / mclapply ) apply 계열 함수 총 정리 2 ( mclapply ) apply 계열 함수를 정리하는 시리즈 중 멀티코어를 이용하여 빠른 속도로 반복문을 처리하는 mclapply를 다뤄보고자 한다. 기본적인 apply 계열 함수에 대한 이해와 mcapply 외의 함수들에 대한 설명은 아래 포스팅을 참고하자. ▼ apply 계열 함수에 대한 기본적인 이해가 필요하다면? ▼ 2017/06/25 - [Analysis/R] - R apply 계열 함수 총 정리 1 ( apply / lapply / sapply / vapply ) -(1) R 멀티코어(Multi Core) 사용을 위한 환경(2) apply 계열, 특히 mclapply는 얼마나 빠른가?(3) 첫번째 테스트 : iris를 500번 rbind 하기(4) 두번째 테..
R에서 JAVA / rJava / JAVA_HOME 설정하기 R에서 JAVA / rJava / JAVA_HOME 설정하기 여러가지 패키지를 설치하다 보면 Dependent Library로 rJava가 같이 설치되는 경우를 볼 수 있다. 사전에 R 외에 다른 언어로의 개발로 인해 Java가 설치/설정 되어 있는 경우 잘 설치가 완료되는 경우가 있지만 그렇지 않은 대부분의 경우에는 설치시 오류 메시지가 나오게 된다. 그럴 때 어떻게 하는지 자세히 포스팅 해보려고 한다. - (1) R 패키지 설치하기 (2) R 라이브러리 불러오기 (3) Java 설치여부 확인하기 (4) Java 설치하기 (5) 환경변수 설정하기 - JAVA_HOME, PATH (6) R에서 JAVA_HOME 경로 설정하기 - (1) 패키지 설치하기 내가 설치하려고 하는 패키지는 엑셀 파일을 불러오고 ..
R apply 계열 함수 총 정리 1 ( apply / lapply / sapply / vapply ) apply 계열 함수 총 정리 1 ( apply / lapply / sapply / vapply ) apply 계열 함수는 주어진 함수 연산을 특정 단위로 쉽게 할 수 있도록 지원하는 함수 군이다. 어떤 함수이냐에 따라 1) 연산 대상 데이터의 종류, 2) 결과 출력 형태, 3) 연산 단위 등이 달라지게 된다. apply 계열의 함수는 사용하기가 조금 까다로운 함수이지만 미리 익혀두어 편하게 사용할 수 있도록 연습해두는 것이 좋다. 그 이유는 for, while 등의 반복문 보다 (빠른 속도와 (경우에 따라) 짧은 코드로 반복 연산을 처리할 수 있는 함수이기 때문에 대용량 데이터에 대한 반복 연산은 apply 계열 함수를 적절히 사용하는 것을 추천한다. ▼ for / lapply / mclapply(멀티..