본문 바로가기

빅데이터

(5)
Recommendation Algorithms / 추천 알고리즘 개요 Recommendation Algorithms / 추천 알고리즘 개요 (1) Association Rules 연관규칙(2) Collaborative Filtering 협업 필터링(3) Content-based Filtering 내용 기반 추천 (1) Association Rules 연관규칙 구매 이력을 분석해서 아이템a -> 아이템b 라는 규칙을 찾아 아이템a를 구매한 고객에게 아이템 b를 추천해주는 방식이다. 예시1단계 : "토너를 구매하면 화장솜도 구매한다."는 규칙을 발견했다.2단계 : 고객 A가 토너를 구매하면 화장솜을 추천한다. 주의할 점. 너무나 당연한 결과가 규칙으로 나올 수 있다.. 규칙이 나오지 않을 수 있다. (2) Collaborative Filtering 협업 필터링 사회적인 분류(..
한눈에 정리하는 ggplot2를 이용한 R 시각화 기초 2 한눈에 정리하는 ggplot2 를 이용한 R 시각화 기초 2 1달 반만에 정리해서 포스팅하는 R 시각화 기초 2탄이다. 1탄에서는 ggplot2를 이용한 기본이 되는 옵션들 전반에 대하여 알아보았다. 2탄에서는 시계열 데이터를 중심으로 하는 시계열 그래프, 선 그래프를 시각화하는 방법에 대하여 포스팅해보려고 한다. ▼ ggplot2 라이브러리를 이용한 기본적인 시각화 코드 ▼2017/03/17 - [Analysis/R] - 한눈에 정리하는 ggplot2를 이용한 R 시각화 기초 1 특히 시계열 데이터를 다룰 때 x축은 고정하고 여러 변수의 값을 같은 y축에 여러 선으로 표현하는 그래프를 그리는 법과 범례를 다루는 법에 대하여 정리해보았다. 우선 시계열 데이터를 만들기 위해 iris 데이터에 seq 변수를..
party::cforest vs. randomForest::randomForest 랜덤 포레스트를 위한 2가지 R 함수 party::cforest vs. randomForest::randomForest 비교하기 (1) {party} cforest를 사용하여 랜덤 포레스트 구현하기(2) {randomForest} randomForest를 사용하여 랜덤 포레스트 구현하기(3) 두 함수의 성능 비교하기 랜덤 포레스트를 구현하기 위한 R 패키지와 함수는 크게 2가지가 있다.Ⅰ party 패키지의 cforest 함수로 Ⅱ. randomForest 패키지의 randomForest 함수 (caret 패키지를 이용하는 경우에도 이 함수를 사용하는 것과 같다.) 이번 포스팅에서는 두 함수를 사용하는 방법과 두 함수를 이용해 Variable Importance를 구하는 방법, 그리고 성능을 비교해보고자..
R 사용을 위한 R Stuido 기본 단축키 R 사용을 위한 R Stuido 기본 단축키 R Studio를 사용할 때 단축키를 꽤나 많이 사용하는데, 자주 사용하는 것들만 정리해보려고 한다. 물론 이것들 말고도 많은 단축키가 있긴 한대, 다른 것들은 잘 안 쓰게 되는 것 같으니 이 정도만 기억해 두자. (1) Source 창에서의 단축키 1. 코드 실행 해당 라인에 커서를 두고 ctrl + enter 2. 소스 저장 ctrl + s 3. 주석 처리/해제 해당 라인에 커서를 두고 ctrl + shift + c 4. 함수 또는 R 소스파일의 내용보기 확인하려는 함수 또는 R 소스파일에 커서를 올리고 F2 - - (2) Console 창에서의 단축키 1. 코드 실행 enter 2. 실행됐던 코드 지우기 ctrl + l
R 샘플 데이터 불러오기 R 샘플 데이터 불러오기 R로 데이터를 분석하기 위해서는 일단 데이터를 R에 불러와야 한다. 데이터를 어디서 불러오느냐에 따라 방법이 다양하지만 가장 간단하게 R 샘플 데이터를 가져오는 방법부터 포스팅 해본다. ▼ 로컬 PC에 있는 CSV TSV TXT 파일 불러오기 ▼ 2017/03/26 - [Analysis/R] - 로컬에서 데이터 불러오기 / 데이터 저장하기 (1) R 샘플 데이터 목록 확인하기 R에는 자체적으로 제공하는 샘플 데이터가 많이 있다. 본인이 가지고 있는 데이터가 없다면 우선은 이 데이터들을 사용해 보자. > data() 위 코드를 실행하면 R data sets 라는 탭이 새로 뜨면서 R에서 제공하고 있는 샘플 데이터 목록을 확인할 수 있다. (2) R 샘플 데이터 불러오기 - iris..