본문 바로가기

회사생활

(36)
오프라인 환경에서 git에 있는 R Package 설치하기 - LightGBM 설치 기본적으로 R에서 패키지를 설치할 때는 아래와 같이 간단하게 설치할 수 있다. # xgboost 패키지 설치하기 install.packages("xgboost") 그런데 LightGBM과 같이 CRAN에 등록된 패키지가 아닌, git에 있는 패키지를 설치할 때에는 아래와 같이 설치한다. # LightGBM 패키지 설치하기 remotes::install_url("https://github.com/microsoft/LightGBM/releases/download/v3.0.0/lightgbm-3.0.0-r-cran.tar.gz") 출처 : github.com/Microsoft/LightGBM/tree/master/R-package 하지만 설치 환경이 (외부 사이트로 접속이 안되는) 오프라인인 경우에는 위 코드..
맥 또는 서버에서 ggplot 한글 깨짐 해결방법 맥 또는 서버 환경에서 ggplot2 라이브러리 사용시 한글이 깨지는 경우가 있는데 아래 3가지를 해결해야 한다. 1. 내 맥 또는 서버에 한글 글꼴(ttf 폰트)이 설치하기 나는 네이버 나눔고딕을 받아서 설치했는데, 여기서 중요한 것은 꼭 ttf 폰트를 설치해야 한다는 것이다. 폰트 설치 후에는 /Library/Fonts/, /System/Library/Fonts, /~Library/Fonts/ 등 폴더에 한글 ttf 폰트 파일이 있는지 확인하자. [네이버 한글한글아름답게 : 마루 프로젝트] 마루 프로젝트는 디지털 화면용 부리 글꼴을 사용자와 함께 만들어 갑니다. hangeul.naver.com 2. R에 한글 글꼴을 import 하기 R에서 아래 코드를 실행한다. install.packages("ex..
분석 리포트 잘 쓰는 법? 데이터 시각화 잘하는 법? 내 첫 직장에서의 직군은 컨설팅이었다. 그 당시에 경험하고 배운 것 중에서 현재까지 나에게 가장 도움이 되는 부분은 빠르게 새로운 비즈니스 로직을 이해하는 것, 그리고 내가 한 업무를 상대방이 이해하기 편하게, 있어 보이게 표현하는 것이라고 생각한다. 그 중 오늘 이야기해볼 시각화에 대한 내용은 내가 한 업무를 상대방이 이해하기 편하게, 있어 보이게 표현하는 것과 이어져 있다. (1) 리포트를 왜 잘 써야 하는가? 사람들은 똑같은 기능을 하는 전자제품이라도 디자인이 예쁜 제품을 산다. 옛 말에도 보기 좋은 떡이 먹기도 좋다, 같은 값이면 다홍치마라는 말도 있다. 하다못해 이 글을 읽는 사람들도 예쁘게 읽기 편하게 쓰인 블로그가 아니면 눈에 안 들어와서 뒤로가기를 누른다. 이 모든 게 다 같은 맥락이다. ..
선형 회귀분석의 4가지 기본가정 선형 회귀분석의 4가지 기본가정 How to make good linear regression model? 선형 회귀분석을 통해 좋은 모델을 만들기 위해서는 분석 데이터가 아래 4가지 기본가정을 만족해야 한다.아래 4가지 기본가정을 만족하지 않으면 제대로 된 선형 회귀모델이 생성될 수 없다. -(1) 선형성(2) 독립성(3) 등분산성(4) 정규성- 각 기본가정의 의미와 지켜지지 않았을 때 어떻게 되는지,그리고 이 기본가정을 만족하지 않는 경우 어떻게 해야하는지 해결방법을 R 코드 예제를 통해 살펴보도록 하자. ▼ 선형 회귀분석 이론 ▼2017/07/02 - [ANALYSIS/Algorithm] - Linear Regression / 선형 회귀분석 (1) 선형성선형성은 "선형" 회귀분석에서 중요한 기본가정..
PCA (Principal Component Analysis) / 주성분 분석 PCA (Principal Component Analysis) / 주성분 분석 지난 포스팅에서 차원을 축소하기 위한 방법으로 1) 변수선택 (Feature Selection) 과 2) 변수 추출 (Feature Extraction) 이렇게 2가지를 이야기 했었는데, 오늘은 그 중 변수 추출의 한 기법인 PCA, 주성분 분석에 대하여 포스팅 해보려고 한다. - (1) 주성분 분석 PCA란? (2) 주성분을 추출하는 방법 (3) 몇 번째 주성분까지 필요할까? - Scree Plot (4) 주성분 분석 PCA의 사용처 (5) R 코드 예제 - (1) 주성분 분석 PCA란? 주성분 분석은 말 그대로 여러 변수가 있는 데이터 차원에서 가장 주요한 성분을 순서대로 추출하는 기법을 말한다. 여러 변수의 값을 합쳐서 ..
R에서 DB 사용하기 - SQLite R에서 DB 사용하기 - SQLite How to use DB in R R로 분석할 때 엑셀이나 csv 파일 외에 DB를 구축해서 DB 내 테이블에서 데이터를 불러오고 싶다면 간단하게 SQLite를 사용하는 방법이 있다. SQLite란? SQLite는 MySQL나 PostgreSQL와 같은 데이터베이스 관리 시스템이지만, 서버가 아니라 응용 프로그램에 넣어 사용하는 비교적 가벼운 데이터베이스이다. 영어권에서는 '에스큐엘라이트(ˌɛskjuːɛlˈlaɪt)'또는 '시퀄라이트(ˈsiːkwəl.laɪt)'라고 읽는다. 일반적인 RDBMS에 비해 대규모 작업에는 적합하지 않지만, 중소 규모라면 속도에 손색이 없다. 또 API는 단순히 라이브러리를 호출하는 것만 있으며, 데이터를 저장하는 데 하나의 파일만을 사용하..
파이썬 데이터 핸들링 함수 | Python Data Handling Function ​ 파이썬 데이터 핸들링 함수 | Python Data Handling Function ​ 내가 가진 데이터를 원하는 형태로 자르고 붙이고 나누고 바꾸는데 도움이 되는 기본적인 데이터 핸들링 함수에 대하여 포스팅하려고 한다. 크게 변형하려는 데이터가 문자열(String) 형태인 경우와 데이터프레임(DataFrame) 형태인 경우로 나누어서 포스팅해보겠다. 앞으로도 또 자주 사용할만한 함수가 나오면 계속 추가할 계획이다. ​ - (1) 문자열 처리 (2) 데이터프레임 처리 - ​ (1) 문자열 처리 ​ 1. 숫자 앞에 0으로 자리 수 채우기 숫자 1 앞에 0으로 채워 2자리수의 문자열 만들기 str(1).zfiil(2)실행결과: '01' ​ 2. 기호로 문자열 나누기 (Split) 기호 ~ 을 기준으로 문..
파이썬에서 DB 연결하기 - SQL 사용하기 파이썬에서 DB 연결하기 - SQL 사용하기 웹 크롤링한 데이터를 저장하기 위해 PostgreSQL을 설치해서 DB를 구성하고 테이블을 만들었다. 파이썬에서 DB를 연결하고 SQL문을 사용하는 방법을 포스팅하려고 한다. - (1) 모듈 설치하고 불러오기 (2) DB 연결하기 (3) SQL문 날리기 (4) DB 연결 끊기 - (1) 모듈 설치하기 불러오기 파이썬에서 DB를 연결하기 위해서는 psycopg2를 사용한다. 이 모듈을 먼저 설치한다. ▼ 파이썬 모듈 설치방법은 아래 포스팅을 참고하자! ▼ 2018/01/13 - [Analysis/PYTHON] - 파이썬과 파이썬 모듈 설치하기 | Install Python and Python Modules 터미널에서 아래 코드를 실행한다.pip install p..