본문 바로가기
부동산 이야기

데이터 분석, 2022년 집값은 앞으로 오를까 내릴까?

by 미래대비자 2022. 4. 26.

 

데이터 분석 관점에서 부동산의 가격은 Target이고

 

통계학 관점에서 부동산 가격은 종속변수(Y)가 된다.

 

 

타겟은 무엇으로 하느냐에 따라 다르다.

 

'대구의 집값을 예측하고 싶어?' 그렇다면 대구가 타겟이고 종속변수다. 그리고 데이터분석을 통해 집값을 예측하는 것이 문제를 푸는 것이다.

 

'서울의 XX아파트를 사야하나 말아야하나?'는 문제에서 타겟은 XX아파트를 사느냐?(Y=1) 마느냐? (Y=0) 문제이고 데이터 분석을 통해 살지 말지를 예측하는 문제가 된다.

 

 

즉, 문제를 풀면 얼마가 될지? 살지 말지?
의사결정을 할 수 있다.



우리는 두가지 도구를 통해 답을 구할 것이다.
1. 통계학
2. 머신러닝(ML)

 

통계학은 모집단 전체를 조사할 수 없으니 샘플링을 하여 통계량을 통해 모수를 추정하는 방식이고 이것을 추론이라고 한다. 일반적으로 분산을 최소화하는 것에 집중한다.

ML은 가중치를 조정하며 일반적으로 손실함수를 정의하고 손실함수가 최소화가 되게 하는 계수를 추정한다.

 

오늘은 모집단의 전체 흐름을 시스템을 통해서 보려고 한다.

 

집값에 영향을 미치는 것은 ? (이것을 찾는 것이 중요하다)

일반적으로 인구, 거래량, 미분양, 매매/전세, 물가, 소득, 공급, 일자리 등 복합적인 문제다. 몇개만 살펴보자.

 

출처 : 부동산통계정보시스템

 

인구는 로그함수와 비슷하다. 인구 증가속도는 감소하고 있다. (근데 왜 집값이 오를까?)

 

 

다음은 집값에 핵심요소인 미분양이다.

일반적으로 미분양이 쌓여가면 집값은 나락으로.. 

 

출처 : 부동산통계정보시스템

 

2021년 저점을 기준으로 2022년은 미분양이 약간 증가했다. 즉, 집값이 하락으로 접어들었다(?)

하지만 같이봐야할 정책적인 변수는? 정부에서 매수세를 누르고 있다는 것!! 이와 관련된 변수를 같이 고려해야 한다.

데이터 분석 입장에서는 모델링할 때 피처(변수)를 추가해야 한다.

 

 

주택 거래량도 봐보자.

 

월별 데이터를 봐야 최신이 보이기 때문에 월별로 필터했다.

출처 : 부동산통계정보시스템

 

월별 데이터를 보면 거래량이 감소하고 있다. 거래량은 통계학 관점에서는 샘플링과 비슷하다.

모든 아파트 거래를 모집단이라고 하고 무조건 팔지 말지 의견을 명확히 내놓는다면(이항분포)

이러한 거래들은 정규분포로 분포수렴하게 되고 정확한 가격을 형성하게 된다(이론적 이야기.. 너무 어려우면 우선은 SKIP ㄱㄱ)

 

일반적으로 거래가 되면서 가격이 올라가기도 하고 내려가기도 한다.

데이터 분석 관점에서는 추세를 잘 볼 수 있게 된다. 하지만 지금같이 매수세가 얼어붙은 시장에서는 추세를 잘 볼 수 없다. 샘플(거래량)이 많이 뽑혀야 시장가격을 잘 볼 수 있는 것이다.(재밌지 않나? ㅎㅎ)

 

내가 하고 싶은 말은...

시스템은 정형화된 변수로 보여주는 것이라 시각화 및 통찰에 한계가 있다.
내가 직접 코딩해서 봐야지 통찰력있게 부동산 시장을 리딩할 수 있다.
그래서 시작했다.
파이썬으로 부동산 분석
나만의 모델링을 통해서 부동산 투자를 하자
모델 만드는것은 컴퓨터와 상상력만 있으면 된다.

 

2022년 시장은 그 어느 해 보다 어렵다.

무주택자는 주춤하는 시장을 보며 '좀더 기다려보자'

1주택자는 최소한의 인플레이션에는 올라탔으나 '갈아탈까?', '하나 더 사야하나?'

다주택자 정권 교체와 일시적인 세금할인에 '팔까? 말까?'를 고민하고 있다.

각각의 입장에서 봤을 때 공급도 수요도 팽팽하다.

 

EDA가 많이 필요하다. (어쨋든 공부는 되는거니까 많은 EDA를 통해 인사이트를 발견해보자)

 

하나씩 파고들어보자.

댓글