728x90 비선형회귀1 궁금증3. 상관계수가 낮은데 R2가 높은 이유(1편) 안녕하세요 미래대비자입니다. 오늘은 데이터 모델링을 하는 경우 상관계수는 0에 가까운데 회귀분석 모델링의 R2는 80%가 넘는 경우가 있는데 이런경우는 어떻게 이해를 해야 할까?'라는 주제로 글을 써보려고합니다. 상관계수의 공식을 보면 이해하는데 도움이 됩니다. 1. 모집단의 상관계수 공식(전체 데이터) 2. 표본집단의 상관계수 공식(전체 데이터에서 n개를 샘플링) 상관계수는 두개의 X,Y 집단에 대해 비교하는 상관도를 보는 측도이며 공분산을 각표준편차로 나눠주는 것입니다. * 공분산을 표준편차로 나눠주는 이유는? 공분산은 두개 변수가 같은 방향으로 움직이는 정도이며 변수의 측정 단위가 다른경우 상관성 해석이 어렵습니다. 이러한 단점을 극복하기 위해 각 표준편차로 나눠주어 측정단위와 상관없이 두 변수 X.. 2022. 5. 9. 이전 1 다음