빅데이터분석 (9) 썸네일형 리스트형 R 패키지 설치가 안 되는 경우 해결방법 R 패키지 설치가 안 되는 경우 해결방법 Installation failed: Peer certificate cannot be authenticated with given CA certificates install.packages 또는 install_github 함수를 사용해서 R 패키지를 설치할 때 가끔 위와 같은 에러가 나는데 이를 해결하기 위한 방법을 간단히 소개한다. 나의 경우 PCA 시각화를 위해 ggbiplot과 vqv 패키지를 Git Hub에서 다운받기 위해 아래 코드를 실행하니 에러 메시지를 만나게 되었다. 이런 에러가 발생하는 이유를 추측하자면 내가 실제 있는 국가랑 사용하는 인터넷 망의 국가가 달라서 생기는 것 같아서 대부분의 사용자들은 만날 일이 없을 것 같기도 하다. 이런 에러를 해.. Recommendation Algorithms / 추천 알고리즘 개요 Recommendation Algorithms / 추천 알고리즘 개요 (1) Association Rules 연관규칙(2) Collaborative Filtering 협업 필터링(3) Content-based Filtering 내용 기반 추천 (1) Association Rules 연관규칙 구매 이력을 분석해서 아이템a -> 아이템b 라는 규칙을 찾아 아이템a를 구매한 고객에게 아이템 b를 추천해주는 방식이다. 예시1단계 : "토너를 구매하면 화장솜도 구매한다."는 규칙을 발견했다.2단계 : 고객 A가 토너를 구매하면 화장솜을 추천한다. 주의할 점. 너무나 당연한 결과가 규칙으로 나올 수 있다.. 규칙이 나오지 않을 수 있다. (2) Collaborative Filtering 협업 필터링 사회적인 분류(.. 한눈에 정리하는 ggplot2를 이용한 R 시각화 기초 2 한눈에 정리하는 ggplot2 를 이용한 R 시각화 기초 2 1달 반만에 정리해서 포스팅하는 R 시각화 기초 2탄이다. 1탄에서는 ggplot2를 이용한 기본이 되는 옵션들 전반에 대하여 알아보았다. 2탄에서는 시계열 데이터를 중심으로 하는 시계열 그래프, 선 그래프를 시각화하는 방법에 대하여 포스팅해보려고 한다. ▼ ggplot2 라이브러리를 이용한 기본적인 시각화 코드 ▼2017/03/17 - [Analysis/R] - 한눈에 정리하는 ggplot2를 이용한 R 시각화 기초 1 특히 시계열 데이터를 다룰 때 x축은 고정하고 여러 변수의 값을 같은 y축에 여러 선으로 표현하는 그래프를 그리는 법과 범례를 다루는 법에 대하여 정리해보았다. 우선 시계열 데이터를 만들기 위해 iris 데이터에 seq 변수를.. party::cforest vs. randomForest::randomForest 랜덤 포레스트를 위한 2가지 R 함수 party::cforest vs. randomForest::randomForest 비교하기 (1) {party} cforest를 사용하여 랜덤 포레스트 구현하기(2) {randomForest} randomForest를 사용하여 랜덤 포레스트 구현하기(3) 두 함수의 성능 비교하기 랜덤 포레스트를 구현하기 위한 R 패키지와 함수는 크게 2가지가 있다.Ⅰ party 패키지의 cforest 함수로 Ⅱ. randomForest 패키지의 randomForest 함수 (caret 패키지를 이용하는 경우에도 이 함수를 사용하는 것과 같다.) 이번 포스팅에서는 두 함수를 사용하는 방법과 두 함수를 이용해 Variable Importance를 구하는 방법, 그리고 성능을 비교해보고자.. 로컬에서 데이터 불러오기 / 데이터 저장하기 로컬에서 데이터 불러오기 / 데이터 내보내기 (로컬에서 데이터 열기 / 저장하기) 온라인에서 CSV 또는 TXT 또는 TSV로 된 샘플 데이터를 다운로드 받았다고 하자.이렇게 다운로드 받은 데이터를 어떻게 R에서 작업하고 어떻게 다시 로컬 PC에 저장하는지 알아보자. (0) 온라인에서 데이터 다운로드 받기 사전에 준비된 CSV 파일이 없다면 아래 포스팅에서 다운로드 하자. ▼ 샘플 데이터 drama_genre.csv CSV 파일 다운로드 ▼2017/03/22 - [Analysis/R] - [R 예제 코드] Logistic Regression / 로지스틱 회귀분석 파일을 저장한 경로를 기억하자. 나는 C:\kkokkilkon 폴더에 drama_genre.csv 파일을 저장했다. (1) Working Dir.. [R 예제 코드] KNN / k-NN / k-Nearest Neighber / k-최근접 이웃 R 예제 코드 - KNN / k-NN / k-Nearest Neighber / k-최근접 이웃 k-NN을 iris 데이터에 적용해서 Species를 분류하는 R 코드를 만들어 보자. ▼ k-NN 알고리즘에 대한 이론적인 설명이 궁금하다면? ▼2017/03/14 - [Analysis/ALGORITHM] - KNN / k-NN / k-Nearest Neighber / k-최근접 이웃 알고리즘 1. 데이터 준비하기 iris 데이터를 Sepal.Length / Sepal.Width / Species 3가지 변수만 있는 데이터로 단순한 데이터 data 로 바꿔보자. data R 시각화 - 산점도 (Basic Scatter Plot) R 시각화 - 산점도 (Basic Scatter Plot) 샘플 데이터를 불러와서 어떻게 생긴 데이터인지 보기 쉽게 시각화를 해보자. ▼ 샘플 데이터 불러오는 법 ▼2017/03/09 - [Analysis/R] - R 샘플 데이터 불러오기 (1) 데이터 내보내기 R에서 가공한 데이터를 로컬 PC에 CSV 파일로 저장해보자. 왜 불러오기가 아니라 내보내기 먼저 하냐면 R에서 제공하는 샘플 데이터를 CSV 파일로 내보내고 다시 R로 CSV 파일을 불러와 보려고 하기 때문이다. iris 데이터를 지정한 경로에 sample_iris.csv 파일로 저장하는 구문이다. 동일한 코드인데 경로에 \\를 썼느냐 / 를 썼느냐의 차이이다. write.csv(x = iris, file = "D:\\R\\kkokkilkon\.. R 사용을 위한 R Stuido 기본 단축키 R 사용을 위한 R Stuido 기본 단축키 R Studio를 사용할 때 단축키를 꽤나 많이 사용하는데, 자주 사용하는 것들만 정리해보려고 한다. 물론 이것들 말고도 많은 단축키가 있긴 한대, 다른 것들은 잘 안 쓰게 되는 것 같으니 이 정도만 기억해 두자. (1) Source 창에서의 단축키 1. 코드 실행 해당 라인에 커서를 두고 ctrl + enter 2. 소스 저장 ctrl + s 3. 주석 처리/해제 해당 라인에 커서를 두고 ctrl + shift + c 4. 함수 또는 R 소스파일의 내용보기 확인하려는 함수 또는 R 소스파일에 커서를 올리고 F2 - - (2) Console 창에서의 단축키 1. 코드 실행 enter 2. 실행됐던 코드 지우기 ctrl + l 이전 1 2 다음