Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 특징
- 주성분행렬
- princomp
- 반정형 데이터
- R 부분합
- R 통계분석
- R merge
- 데이터 분석 정의
- 정보 생산량
- 데이터 스케일링
- R프로그래밍
- 데이터 정제
- 스크리산점도
- 변수축소
- 분석 프로세스
- 정형 데이터
- 데이터프레임 생성
- 변수선택
- 데이터 개념
- 조건문
- 데이터 분석 순서
- 데이터란
- 데이터 분석 프로세스
- R 데이터프레임
- 데이터 병합
- prcomp
- R 프로그래밍
- 데이터 분석 과정
- 데이터 과학
- 비정형 데이터
Archives
- Today
- Total
목록변수축소 (1)
D-과학 이야기

# R 프로그래밍 / 주성분 분석 이해와 변수 축소/ 다중공선성/ 스크리 산점도/ 상관관계/ 데이터 과학 1. 주성분 분석에 대한 이해 주성분 분석이란, 데이터를 축소하는 기법으로, 데이터 내에서 서로 상관성이 높은 변수들의 선형결합으로 이루어진 주성분이라는 새 변수를 생성한다. 주성분으로 전체 변동을 가장 많이 설명할 수 있도록 해야하며, 각 주성분은 서로 독립이어야 한다. 첫번째 주성분으로는 전체 변동을 가장 많이 설명 가능해야 한다. 다중공선성이란, 독립변수들 간에 강한 상관관계가 존재하는 성질이다. 즉, 다중공선성이 크면, 독립변수들이 서로 독립이어야 한다는 회귀분석의 가정을 위배하는 경우라고 판단할 수 있다. 다중공선성이 존재하면, 주성분 분석을 통해 변수를 축소하여야 한다. 주성분(Princi..
PROGRAMMING/R studio
2020. 11. 27. 17:25