본문 바로가기

통계분석

(3)
R 패키지 설치가 안 되는 경우 해결방법 R 패키지 설치가 안 되는 경우 해결방법 Installation failed: Peer certificate cannot be authenticated with given CA certificates install.packages 또는 install_github 함수를 사용해서 R 패키지를 설치할 때 가끔 위와 같은 에러가 나는데 이를 해결하기 위한 방법을 간단히 소개한다. 나의 경우 PCA 시각화를 위해 ggbiplot과 vqv 패키지를 Git Hub에서 다운받기 위해 아래 코드를 실행하니 에러 메시지를 만나게 되었다. 이런 에러가 발생하는 이유를 추측하자면 내가 실제 있는 국가랑 사용하는 인터넷 망의 국가가 달라서 생기는 것 같아서 대부분의 사용자들은 만날 일이 없을 것 같기도 하다. 이런 에러를 해..
Recommendation Algorithms / 추천 알고리즘 개요 Recommendation Algorithms / 추천 알고리즘 개요 (1) Association Rules 연관규칙(2) Collaborative Filtering 협업 필터링(3) Content-based Filtering 내용 기반 추천 (1) Association Rules 연관규칙 구매 이력을 분석해서 아이템a -> 아이템b 라는 규칙을 찾아 아이템a를 구매한 고객에게 아이템 b를 추천해주는 방식이다. 예시1단계 : "토너를 구매하면 화장솜도 구매한다."는 규칙을 발견했다.2단계 : 고객 A가 토너를 구매하면 화장솜을 추천한다. 주의할 점. 너무나 당연한 결과가 규칙으로 나올 수 있다.. 규칙이 나오지 않을 수 있다. (2) Collaborative Filtering 협업 필터링 사회적인 분류(..
party::cforest vs. randomForest::randomForest 랜덤 포레스트를 위한 2가지 R 함수 party::cforest vs. randomForest::randomForest 비교하기 (1) {party} cforest를 사용하여 랜덤 포레스트 구현하기(2) {randomForest} randomForest를 사용하여 랜덤 포레스트 구현하기(3) 두 함수의 성능 비교하기 랜덤 포레스트를 구현하기 위한 R 패키지와 함수는 크게 2가지가 있다.Ⅰ party 패키지의 cforest 함수로 Ⅱ. randomForest 패키지의 randomForest 함수 (caret 패키지를 이용하는 경우에도 이 함수를 사용하는 것과 같다.) 이번 포스팅에서는 두 함수를 사용하는 방법과 두 함수를 이용해 Variable Importance를 구하는 방법, 그리고 성능을 비교해보고자..