본문 바로가기

분류 전체보기105

부동산 분석! 분석 피처 후보2. 2022년 대기업, 중소기업 대출 현황(feat. 시계열 계절성) 부동산 경제를 보기 위해 대기업과 중소기업의 대출 현황도 중요하다. 코로나 19 시작인 2019년 12월부터의 대출금리를 보면 현황을 파악할 수 있다. 코로나 19초기에는 모든 은행들이 대출금리를 급격히 낮춰서 대응하는 것을 볼 수 있다. 경기 침체 우려로 인해 국가적인 차원에서 기준금리를 낮추어 유동성을 푼것이라고 할 수 있다. 작년 2021년 여름을 기점으로 기업의 대출금리는 어려워진 상황! 주택매매지수 글을 보면, 2021년 여름을 기점으로 상승으로 집값이 횡보 또는 하락하는 모습을 보인다. 기업의 대출금리가 올라갈수록 집값이 떨어지는 결과를 내릴 수 있는 것 같다. 이번엔 기업 대출금 현황을 보자 전국적으로 기업의 대출금액은 대출이자가 증가함에도 꾸준히 오르고 있는 현상도 보인다. 기준금리가 올라.. 2022. 4. 27.
2022년 한국 기준금리와 부동산 우리나라 기준금리에 대해서 알아보자. 최근 기준금리가 0.25% 추가로 오르면서 기준금리가 1.5%가 되었다. 기준금리 역할은? (다양한 역할이 있지만) 시장의 돈을 흡수하거나 풀거나의 역할을 한다. 2016 ~ 2018년까지 1.5%수준에 있었던 기준금리는 코로나19가 찾아 온 뒤부터 엄청나게 내려가는 것을 알 수 있다. 즉, 경기가 급격하게 얼어붙었기 때문에 시장에 돈을 풀어서 경기를 활성화 하려는 목적이다. 엄청난 유동성으로 인해 기업들과 개인은 싼 이자로 은행에서 대출을 할 수 있게 되었다. 즉, 투자를 위한 돈을 쉽게 구할 수 있기 때문에 주식, 코인, 부동산 등에 엄청난 돈이 모이게 되었고, 수요와 공급으로 가격을 형성하게 되는 경제학 기본 원리에 따라 집값 폭등에 원인이 되었다. 기억해야 한.. 2022. 4. 27.
(기본) 부동산 데이터 분석 전체 흐름 데이터 분석 절차는 크게 5가지로 나눌 수 있다. 1. 데이터 수집 2. 데이터 전처리 3. 데이터 분석(모델링 포함) 4. 데이터 시각화 5. 해석 및 적용 첫째, 데이터 수집은 다양한 경로를 통해서 수집할 예정이다. https://kbland.kr/ KB부동산 https://www.reb.or.kr/r-one/ 부동산통계정보시스템 한국은행, KOSIS 등.. 둘째, 전처리는 파이썬을 통해 할 예정이다. 셋째, 데이터 분석은 가장 쉽게는 상관관계분석부터 회귀분석, 머신러닝 등 목적에 따라 다양하게 나눌 수 있다. 목적은 크게 2가지다. 1. 분류 문제 2. 회귀 및 예측문제 각 분석에 대해서 간단히 설명하면 다음과 같다. 분류문제는 종속변수의 데이터 형태가 범주형인 경우를 말한다. 즉, 이진분류(Bin.. 2022. 4. 26.
데이터 분석, 2022년 집값은 앞으로 오를까 내릴까? 데이터 분석 관점에서 부동산의 가격은 Target이고 통계학 관점에서 부동산 가격은 종속변수(Y)가 된다. 타겟은 무엇으로 하느냐에 따라 다르다. '대구의 집값을 예측하고 싶어?' 그렇다면 대구가 타겟이고 종속변수다. 그리고 데이터분석을 통해 집값을 예측하는 것이 문제를 푸는 것이다. '서울의 XX아파트를 사야하나 말아야하나?'는 문제에서 타겟은 XX아파트를 사느냐?(Y=1) 마느냐? (Y=0) 문제이고 데이터 분석을 통해 살지 말지를 예측하는 문제가 된다. 즉, 문제를 풀면 얼마가 될지? 살지 말지? 의사결정을 할 수 있다. 우리는 두가지 도구를 통해 답을 구할 것이다. 1. 통계학 2. 머신러닝(ML) 통계학은 모집단 전체를 조사할 수 없으니 샘플링을 하여 통계량을 통해 모수를 추정하는 방식이고 이것.. 2022. 4. 26.
평범한 직장인이 부자가 되기로 결심하다 저는 평범한 30대 직장인입니다. 저는 수중에 현금 5천만원이있습니다. 그리고 평범한 직장인으로서 재테크를 하고있죠!부동산, 주식, 코인, 예금, 적금 등등...최근 몇년간 코로나19로 인해 우리나라 뿐 아니라 전세계적인 M2 통화량이 늘어나면서 부동산, 주식, 코인에 유동성이 매우 몰리게되고 부자가 되는 사람들이 많아졌습니다.그리고 지금.. 러시아와 우크라이나 전쟁, 심각한 인플레이션 우려로 인해 경제적 불확실성이 커지고 있죠?이 때 우리는?'공부해야할 시기다'라고 말하고 싶습니다.그래서 꾸준히 투자하고 돈을 번 이야기들을 공유하고 싶습니다.자본주의 사회에서 돈을 버는 방법은 무엇일까요?1. 노동 2. 지대 3. 이자 4. 생산수단 소유노동은 우리가 대부분 하고 있는 거죠? 그 댓가로 임금을 받죠지대는.. 2022. 4. 22.
왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(2편-첨도 편) 안녕하세요 미래대비자 입니다. 지난편에 이어서 오늘은 첨도에 대해서 설명을 해보겠습니다. 2022.03.30 - [데이터분석 이야기/데이터 분석 이야기] - 왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(1편-왜도 편) 왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(1편-왜도 편) 안녕하세요 미래대비자입니다. 오늘은 데이터분석할 때 언급은 되지만 잘 모르겠는 ... 통계학에서 맨날 배우지만 잘 모르겠는... 왜도와 첨도에 대해 알아볼까합니다. 적률에 대해 언급하면서 stat-university.tistory.com 이번에는 4차 적률인 첨도에 대해서 알아보고 실제 데이터 분석에서는 어떤 의미를 가지고 있는지 알아봅시다. 첨도 : 분포가 얼마나 뾰족한가? (반대로 생각하면 뾰족할 수록.. 2022. 4. 15.
value_counts() 막대 그래프 그릴 때 순서 꼬일 때 연도별 빈도를 세어서 막대그래프를 그리려고한다. 데이터 프레임으로 빈도를 세서 막대 그래프를 그리는 문제를 하다가 인덱스가 꼬이는 문제가 발생했다. 그냥 막대그래프를 그린다면 문제가 되지 않는데 plt.text를 이용하여 빈도수를 넣으려고할 때 문제가 발생했다. 해결방법은 생각보다 간단했다. sort_index()를 해주면 정리가 된다. 이렇게 정렬을 해주어 plt.text()를 사용하니 문제가 완전해결되었다. 간단하지만 생각보다 오래걸렸다. 앞으로 파이썬을 하며 간단한 문제를 해결했을 때 마다 기록하고자 한다. 추가적으로 df.set_index('공시년도').loc[[2016, 2017, 2018, 2019, 2020, 2021]].plot(kind='bar')와 같은 방식으로 정렬해줄 수 도있다. 2022. 4. 1.
왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(1편-왜도 편) 안녕하세요 미래대비자입니다. 오늘은 데이터분석할 때 언급은 되지만 잘 모르겠는 ... 통계학에서 맨날 배우지만 잘 모르겠는... 왜도와 첨도에 대해 알아볼까합니다. 적률에 대해 언급하면서 시작하겠습니다. 1차 적률은 평균, 2차 적률은 분산, 3차 적률은 왜도, 4차 적률은 첨도.. 이렇게만 배워왔는데 실제 데이터 분석에서는 어떤 의미일까요? 왜도 :'분포의 비대칭 정도 양수이면 오른쪽으로 꼬리가 길다' 라는 뜻입니다. '왜도는 분포가 얼마나 치우쳐 있나?' 확인하는 지표로써 0인경우는 치우침이 없는 분포를 말합니다. 우리가 잘 아는 t분포와 정규분포는 평균을 기준으로 대칭을 이루는 skew가 0인 경우입니다. |skew| < 0.5 : 데이터가 상당히 대칭적이다. 0.5 < |skew| < 2 : 데이.. 2022. 3. 30.
ADP 24회 실기 시험 후기(일기) 3/26일 오전 10시부터 오후 2시까지 4시간 동안 시험을 치뤘다. 필기시험을 84점에 합격했지만 최초 실기시험은 2021년 20회 60점을 받았고 R로 시험을 치뤘었다. 이번엔 파이썬 시험 난이도 이번 시험은 평이했다. 통계학 전공자에게 유리하게 나와서 합격할 수 있는 절호의 기회라 여겼지만 나는 탈락할 확률이 높다. 통계학책을 안가지고 가서 문제마다 옛 기억을 더듬고 공식도 하나하나 유도하면서 허덕허덕 풀다보니 뭐라고 작성했는지 디테일한 기억은 안난다. 기초통계학을 수강했으면 50점을 가져갈 수 있는 문제들이었다. 시험문제 1. 기계학습(50점): 결석횟수를 target변수로 하여 11개의 독립변수를 통해 결석횟수를 예측하는 문제가 출제되었다. 2. 통계학(50점): 다중회귀분석 회귀계수 유의성, .. 2022. 3. 29.
ADP 데이터 분석 순서(기본편) 안녕하세요 미래대비자 입니다. 오늘은 데이터 분석 전문가로써 전체적인 분석 순서를 간단히 정리해보겠습니다. 자세한거는 꾸준히 포스팅할 계획이고 이것만 잘 공부하여 정리하면 합격까지 갈 수 있을거라고 생각합니다 1. 데이터를 수집한다.(ADP에서는 생략) 2. 파이썬에서는 statsmodels 또는 sklearn 모듈을 이용해서 데이터를 분석한다. - EDA : 데이터 피처, 개체들과의 관계를 보고 이상치/결측치를 발견 및 처리(제거/대체 등)한다. 또한, 무슨 분석을 해야하는지 염두한다. - 피처 앤지니어링 : 분석에 따라 수치형은 표준화/MinMax스케일링, 인코딩(레이블,원핫,더미)을 하여 분석에 적합한 형태로 데이터를 변형한다. 3. 데이터 분리 : 분류의 경우 클래스 불균형 문제를 고려한 업/다운.. 2022. 3. 7.