본문 바로가기

clustering

(2)
PCA (Principal Component Analysis) / 주성분 분석 PCA (Principal Component Analysis) / 주성분 분석 지난 포스팅에서 차원을 축소하기 위한 방법으로 1) 변수선택 (Feature Selection) 과 2) 변수 추출 (Feature Extraction) 이렇게 2가지를 이야기 했었는데, 오늘은 그 중 변수 추출의 한 기법인 PCA, 주성분 분석에 대하여 포스팅 해보려고 한다. - (1) 주성분 분석 PCA란? (2) 주성분을 추출하는 방법 (3) 몇 번째 주성분까지 필요할까? - Scree Plot (4) 주성분 분석 PCA의 사용처 (5) R 코드 예제 - (1) 주성분 분석 PCA란? 주성분 분석은 말 그대로 여러 변수가 있는 데이터 차원에서 가장 주요한 성분을 순서대로 추출하는 기법을 말한다. 여러 변수의 값을 합쳐서 ..
R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 R 예제 코드 - PCA / Principal Component Analysis / 주성분 분석 iris 데이터의 주성분 분석을 하는 R 코드를 만들어 보자. - (1) 데이터 준비하기 (2) PCA 하기 (3) PCA 결과 확인하기 (4) PCA 결과 시각화하기1 - Scree Chart (5) PCA 결과 시각화하기2 - ggbiplot (6) 군집분석으로 검증하기 - (1) 데이터 준비하기 데이터는 R에서 기본 제공되는 iris 데이터를 사용하겠다. 일단 PCA에는 연속형 변수(Continuous Variable)만 사용하기 때문에 연속형 변수와 범주형 변수(Categorical Variable)를 분리한다. # 연속형 변수 dt