목록전체 글 (129)
부업으로 1년에 1억씩 버는 직장인입니다
궁금증1 에서 우리는 자유도에 대한 개념을 알게되었다. '표본평균은 자유도가 n이기 때문에, 표본분산 자유도가 n-1이기 때문에 나누어 주는건 알겠는데 그게 뭐 어쩌라고?' 라는 생각이 먼저 들것이다. 이게 무슨 의미가 있기는 한데... 그 의미에 대해서 설명하려고 한다. 이를 설명하기 위해 우리는 불편성(Unbiased)에 대한 개념을 알아야 한다. 모수(parametor)를 알기하기 위해 우리는 샘플을 뽑아 통계학이라는 이론에 기대어 모수를 추정하는 작업을 할 것이다. 만약에.... 통계학 이론없이 전수조사를 통해 모평균과 모분산을 구하는 경우에는 자유도의 개념이 필요하지 않다. 모평균은 n으로 나눠주고 모분산도 n으로 나눠주면 된다. 왜냐면 그게 곧 우리가 구하고자 했던 parameter였으니까!!..
통계를 깊이 공부하게 되면 자주보지만 이해 하지 못하는 자유도에 대해서 알아보자. 자유도란? 통계적 추정(Inference)을 할 때, 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수(어떤 조건하에서)이다. 이러한 자유도를 식으로 표현하면 다음과 같이 나타낼 수 있다. df = N (사례수) - K (통계적 제한 조건의 수) 이해를 돕기 위해 연립방정식을 예로 들어보자. 상황1 : 변수가 2개이고 방정식이 2개인 연린방정식이다. 2x + 8y = 50 2x + 7y = 48 여기서 사례수(변수의 갯수)는 2개이고 통계적 제한 조건(방정식 수)도 2개인 것을 알 수 있다. 상황1의 자유도는 0이다. (df = 2 - 2 = 0 ) 즉, 자유롭게 선택할 수 있는 변수가 없다. (x = 17, y=..
통계학과 학부생이었던 2011년 당시에 회귀분석 교수님께서 "'빅데이터' 쪽으로 전공하면 전망이 밝을거야"라고 말씀하셨던게 떠오른다. 2021년 지금, 아이들 때부터 코딩을 정규교육으로 할 만큼 4차산업 관련의 한 꼭지로 빅데이터에 대한 관심이 크다. 나는 통계학을 전공하고 학부를 졸업한 뒤 지금은 직장생활을 하고 있지만 데이터분석에 매력에 아직까지 기웃기웃 거리며 공부를 하고있다. 블로그를 통해 내가 배우고 느꼈던 수학과 통계에 대한 다양한 이야기를 나누고자 한다. 스스로의 정리 노트로 활용 할 뿐아니라 빅데이터 시대를 맞이하는 많은 꿈나무들과 동료들에게 도움이 되었으면 한다. 물론 일기 형식으로 주저리 주저리 작성할 때도 있을것 같다.. 많이 부족하지만 게시글에 대한 많은 지적도 받고 토론도 하며 상..