728x90
반응형
데이터 분석 절차는 크게 5가지로 나눌 수 있다.
1. 데이터 수집
2. 데이터 전처리
3. 데이터 분석(모델링 포함)
4. 데이터 시각화
5. 해석 및 적용
첫째, 데이터 수집은 다양한 경로를 통해서 수집할 예정이다.
https://kbland.kr/
KB부동산
https://www.reb.or.kr/r-one/
부동산통계정보시스템
한국은행, KOSIS 등..
둘째, 전처리는 파이썬을 통해 할 예정이다.
셋째, 데이터 분석은 가장 쉽게는 상관관계분석부터 회귀분석, 머신러닝 등 목적에 따라 다양하게 나눌 수 있다.
목적은 크게 2가지다.
1. 분류 문제
2. 회귀 및 예측문제
각 분석에 대해서 간단히 설명하면 다음과 같다.
분류문제는 종속변수의 데이터 형태가 범주형인 경우를 말한다. 즉, 이진분류(Binary-Classification), 다항분류(Multi-Classification) , 회귀 및 예측문제는 종속변수의 데이터 형태가 수치형인 경우를 말한다.(향후 직접 데이터를 분석하면서 한땀한땀 설명하겠다)
넷째, 데이터 시각화는 빈도를 기반으로 막대그래프를 그려보는 것부터 산점도, 히트맵 등 다양한 방법을 통해 시각화 해 볼 예정이다.
다섯째, 사실 이게 가장 얻고자 하는 결과이며 이것을 통해 투자와 연결시키는 것까지 공부도 하고! 앞으로 의미있는 해석을 해보자!
기존에 있는 GUI식 분석 툴 이용 뿐아니라, 거기서 다룰 수 없는 나만의 데이터분석을 통해 인사이트를 도출하고 투자까지 이어가보자.
반응형
'부동산 이야기 > 투자를 시작하면서' 카테고리의 다른 글
투자의 궁극적인 목표(+경제적 자유?) (0) | 2025.01.10 |
---|---|
경매 명도 이야기(feat. 불법 점유자?)-1편 (2) | 2024.12.03 |
부동산 입지지도 무료 배포(feat. 렘군, 대구 수성구) (0) | 2023.07.22 |
17개 지역 아파트 시세 정리 (0) | 2022.08.12 |