본문 바로가기

전체 글

(104)
오프라인 환경에서 git에 있는 R Package 설치하기 - LightGBM 설치 기본적으로 R에서 패키지를 설치할 때는 아래와 같이 간단하게 설치할 수 있다. # xgboost 패키지 설치하기 install.packages("xgboost") 그런데 LightGBM과 같이 CRAN에 등록된 패키지가 아닌, git에 있는 패키지를 설치할 때에는 아래와 같이 설치한다. # LightGBM 패키지 설치하기 remotes::install_url("https://github.com/microsoft/LightGBM/releases/download/v3.0.0/lightgbm-3.0.0-r-cran.tar.gz") 출처 : github.com/Microsoft/LightGBM/tree/master/R-package 하지만 설치 환경이 (외부 사이트로 접속이 안되는) 오프라인인 경우에는 위 코드..
맥 또는 서버에서 ggplot 한글 깨짐 해결방법 맥 또는 서버 환경에서 ggplot2 라이브러리 사용시 한글이 깨지는 경우가 있는데 아래 3가지를 해결해야 한다. 1. 내 맥 또는 서버에 한글 글꼴(ttf 폰트)이 설치하기 나는 네이버 나눔고딕을 받아서 설치했는데, 여기서 중요한 것은 꼭 ttf 폰트를 설치해야 한다는 것이다. 폰트 설치 후에는 /Library/Fonts/, /System/Library/Fonts, /~Library/Fonts/ 등 폴더에 한글 ttf 폰트 파일이 있는지 확인하자. [네이버 한글한글아름답게 : 마루 프로젝트] 마루 프로젝트는 디지털 화면용 부리 글꼴을 사용자와 함께 만들어 갑니다. hangeul.naver.com 2. R에 한글 글꼴을 import 하기 R에서 아래 코드를 실행한다. install.packages("ex..
분석 리포트 잘 쓰는 법? 데이터 시각화 잘하는 법? 내 첫 직장에서의 직군은 컨설팅이었다. 그 당시에 경험하고 배운 것 중에서 현재까지 나에게 가장 도움이 되는 부분은 빠르게 새로운 비즈니스 로직을 이해하는 것, 그리고 내가 한 업무를 상대방이 이해하기 편하게, 있어 보이게 표현하는 것이라고 생각한다. 그 중 오늘 이야기해볼 시각화에 대한 내용은 내가 한 업무를 상대방이 이해하기 편하게, 있어 보이게 표현하는 것과 이어져 있다. (1) 리포트를 왜 잘 써야 하는가? 사람들은 똑같은 기능을 하는 전자제품이라도 디자인이 예쁜 제품을 산다. 옛 말에도 보기 좋은 떡이 먹기도 좋다, 같은 값이면 다홍치마라는 말도 있다. 하다못해 이 글을 읽는 사람들도 예쁘게 읽기 편하게 쓰인 블로그가 아니면 눈에 안 들어와서 뒤로가기를 누른다. 이 모든 게 다 같은 맥락이다. ..
수원 영통 트래블앤아트 / 파스타 피자 배달 #영통맛집 #파스타 #피자 #배달음식 #트래블앤아트 - 파스타 배달 처음 해봤는데, 나가기 귀찮고 느끼한 거 먹고 싶을 때 강추 - 배달의 민족에 다른 분들이 쓴 리뷰를 봐도 일주일에 한번씩 시켜드신다는 분도 등장 - 두번 시켜봤는데 두번 다 배송이 빨랐음 주소/위치 영업시간 (배달) 평일/토요일 11:00 ~ 01:30 (익일 새벽) 일요일 11:00 ~ 00:00 (자정) 메뉴판 메뉴가 너무 많아서 어떤 종류가 있는지 알 수 있을 정도만 캡처했다. (출처 : 배달의 민족 앱) 인기/행사 메뉴 파스타 피자 (L) 피자 (M) 사이드 메뉴 샐러드 오늘의 한줄평 " 까르보나라랑 버팔로윙은 진짜 완전 맛있음! 근데 알리오올리오는 제발 시키지 마세요ㅠ " 금요일 저녁에 퇴근하는데 넘나 느끼한 파스타가 먹고 싶..
선형 회귀분석의 4가지 기본가정 선형 회귀분석의 4가지 기본가정 How to make good linear regression model? 선형 회귀분석을 통해 좋은 모델을 만들기 위해서는 분석 데이터가 아래 4가지 기본가정을 만족해야 한다.아래 4가지 기본가정을 만족하지 않으면 제대로 된 선형 회귀모델이 생성될 수 없다. -(1) 선형성(2) 독립성(3) 등분산성(4) 정규성- 각 기본가정의 의미와 지켜지지 않았을 때 어떻게 되는지,그리고 이 기본가정을 만족하지 않는 경우 어떻게 해야하는지 해결방법을 R 코드 예제를 통해 살펴보도록 하자. ▼ 선형 회귀분석 이론 ▼2017/07/02 - [ANALYSIS/Algorithm] - Linear Regression / 선형 회귀분석 (1) 선형성선형성은 "선형" 회귀분석에서 중요한 기본가정..
티스토리 반응형 스킨의 폐해일까? CCL 때문일까? 몇일 전부터 얼마 되지도 않는 블로그 방문자수가 떨어지는 것 같았다.ㅠㅠ 특히 네이버를 통해서 유입되는 방문자수가 줄어든 것 같아어떤 페이지의 주 단위 조회수가 전월 대비 떨어졌는지 확인해보기로 했다. 오른 포스팅도 있지만 대부분 떨어졌는데 그 중 큰 폭으로 떨어진 것들을 살펴보기로 했다. 먼저 첫번째로 살펴본 포스팅은 50%가 떨어진 /36 포스팅이었다. ▼ /36 포스팅 내용 ▼2017/03/29 - [ANALYSIS/Algorithm] - 추론통계 - 가설 검정 한번에 정리하기 근데 이 포스팅은 나름 인기있었던 심층 포스팅으로, 갑자기 떨어진 이유가 이해가 되지 않았다.네이버에서 직접 '추론통계 가설검정'이라는 키워드로 검색해보기로 했다. 검색 결과... 헐 어머나 세상에! 이게 뭐얔ㅋㅋㅋ내 포스팅..
수원 영통 먹개비촌 / 해물 간장게장 #영통맛집 #간장게장 #먹개비촌 - 눈여겨 보고 있었는데 마침 영통에서 오래 산 지인 추천 받아서 방문했던 집 - 지나가면서 볼 때마다 손님이 꽤 많았고 특히 단골들이 많은 듯 - 간장게장이 맛있는데 가격이 저렴하지는 않았고, 다른 손님들은 다들 다른 찜이나 탕 음식을 먹고 계셨음 주소/위치 ▼ 네이버 지도 ▼ http://naver.me/FZ4fetvu 영업시간 매일 10:00 ~ 22:00 메뉴판 오늘의 한줄평 " 엄마가 해준 것처럼 맛있지만 가격 대비 양에 눙무리ㅠ... " 계속 가야지 해놓고 못가다가 영화관에서 팝콘으로 배를 다 채우고 나니 배가 별로 안고파서 간장게장을 먹으러 갈까 하는 남편에 말에 홀랑 넘어가 방문하게 되었다. 여기는 남편의 지인분이 맛집이라고 추천해준 곳이라 더욱 기대를 가지..
PCA (Principal Component Analysis) / 주성분 분석 PCA (Principal Component Analysis) / 주성분 분석 지난 포스팅에서 차원을 축소하기 위한 방법으로 1) 변수선택 (Feature Selection) 과 2) 변수 추출 (Feature Extraction) 이렇게 2가지를 이야기 했었는데, 오늘은 그 중 변수 추출의 한 기법인 PCA, 주성분 분석에 대하여 포스팅 해보려고 한다. - (1) 주성분 분석 PCA란? (2) 주성분을 추출하는 방법 (3) 몇 번째 주성분까지 필요할까? - Scree Plot (4) 주성분 분석 PCA의 사용처 (5) R 코드 예제 - (1) 주성분 분석 PCA란? 주성분 분석은 말 그대로 여러 변수가 있는 데이터 차원에서 가장 주요한 성분을 순서대로 추출하는 기법을 말한다. 여러 변수의 값을 합쳐서 ..