목록전체 글 (130)
부업으로 1년에 1억씩 버는 직장인입니다
데이터 분석 관점에서 부동산의 가격은 Target이고 통계학 관점에서 부동산 가격은 종속변수(Y)가 된다. 타겟은 무엇으로 하느냐에 따라 다르다. '대구의 집값을 예측하고 싶어?' 그렇다면 대구가 타겟이고 종속변수다. 그리고 데이터분석을 통해 집값을 예측하는 것이 문제를 푸는 것이다. '서울의 XX아파트를 사야하나 말아야하나?'는 문제에서 타겟은 XX아파트를 사느냐?(Y=1) 마느냐? (Y=0) 문제이고 데이터 분석을 통해 살지 말지를 예측하는 문제가 된다. 즉, 문제를 풀면 얼마가 될지? 살지 말지? 의사결정을 할 수 있다. 우리는 두가지 도구를 통해 답을 구할 것이다. 1. 통계학 2. 머신러닝(ML) 통계학은 모집단 전체를 조사할 수 없으니 샘플링을 하여 통계량을 통해 모수를 추정하는 방식이고 이것..
저는 평범한 30대 직장인입니다. 저는 수중에 현금 5천만원이있습니다. 그리고 평범한 직장인으로서 재테크를 하고있죠!부동산, 주식, 코인, 예금, 적금 등등...최근 몇년간 코로나19로 인해 우리나라 뿐 아니라 전세계적인 M2 통화량이 늘어나면서 부동산, 주식, 코인에 유동성이 매우 몰리게되고 부자가 되는 사람들이 많아졌습니다.그리고 지금.. 러시아와 우크라이나 전쟁, 심각한 인플레이션 우려로 인해 경제적 불확실성이 커지고 있죠?이 때 우리는?'공부해야할 시기다'라고 말하고 싶습니다.그래서 꾸준히 투자하고 돈을 번 이야기들을 공유하고 싶습니다.자본주의 사회에서 돈을 버는 방법은 무엇일까요?1. 노동 2. 지대 3. 이자 4. 생산수단 소유노동은 우리가 대부분 하고 있는 거죠? 그 댓가로 임금을 받죠지대는..
안녕하세요 미래대비자 입니다. 지난편에 이어서 오늘은 첨도에 대해서 설명을 해보겠습니다. 2022.03.30 - [데이터분석 이야기/데이터 분석 이야기] - 왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(1편-왜도 편) 왜도(skew)와 첨도(kurtosis)의 의미는 뭘까?(1편-왜도 편) 안녕하세요 미래대비자입니다. 오늘은 데이터분석할 때 언급은 되지만 잘 모르겠는 ... 통계학에서 맨날 배우지만 잘 모르겠는... 왜도와 첨도에 대해 알아볼까합니다. 적률에 대해 언급하면서 stat-university.tistory.com 이번에는 4차 적률인 첨도에 대해서 알아보고 실제 데이터 분석에서는 어떤 의미를 가지고 있는지 알아봅시다. 첨도 : 분포가 얼마나 뾰족한가? (반대로 생각하면 뾰족할 수록..
연도별 빈도를 세어서 막대그래프를 그리려고한다. 데이터 프레임으로 빈도를 세서 막대 그래프를 그리는 문제를 하다가 인덱스가 꼬이는 문제가 발생했다. 그냥 막대그래프를 그린다면 문제가 되지 않는데 plt.text를 이용하여 빈도수를 넣으려고할 때 문제가 발생했다. 해결방법은 생각보다 간단했다. sort_index()를 해주면 정리가 된다. 이렇게 정렬을 해주어 plt.text()를 사용하니 문제가 완전해결되었다. 간단하지만 생각보다 오래걸렸다. 앞으로 파이썬을 하며 간단한 문제를 해결했을 때 마다 기록하고자 한다. 추가적으로 df.set_index('공시년도').loc[[2016, 2017, 2018, 2019, 2020, 2021]].plot(kind='bar')와 같은 방식으로 정렬해줄 수 도있다.
안녕하세요 미래대비자입니다. 오늘은 데이터분석할 때 언급은 되지만 잘 모르겠는 ... 통계학에서 맨날 배우지만 잘 모르겠는... 왜도와 첨도에 대해 알아볼까합니다. 적률에 대해 언급하면서 시작하겠습니다. 1차 적률은 평균, 2차 적률은 분산, 3차 적률은 왜도, 4차 적률은 첨도.. 이렇게만 배워왔는데 실제 데이터 분석에서는 어떤 의미일까요? 왜도 :'분포의 비대칭 정도 양수이면 오른쪽으로 꼬리가 길다' 라는 뜻입니다. '왜도는 분포가 얼마나 치우쳐 있나?' 확인하는 지표로써 0인경우는 치우침이 없는 분포를 말합니다. 우리가 잘 아는 t분포와 정규분포는 평균을 기준으로 대칭을 이루는 skew가 0인 경우입니다. |skew| < 0.5 : 데이터가 상당히 대칭적이다. 0.5 < |skew| < 2 : 데이..
3/26일 오전 10시부터 오후 2시까지 4시간 동안 시험을 치뤘다. 필기시험을 84점에 합격했지만 최초 실기시험은 2021년 20회 60점을 받았고 R로 시험을 치뤘었다. 이번엔 파이썬 시험 난이도 이번 시험은 평이했다. 통계학 전공자에게 유리하게 나와서 합격할 수 있는 절호의 기회라 여겼지만 나는 탈락할 확률이 높다. 통계학책을 안가지고 가서 문제마다 옛 기억을 더듬고 공식도 하나하나 유도하면서 허덕허덕 풀다보니 뭐라고 작성했는지 디테일한 기억은 안난다. 기초통계학을 수강했으면 50점을 가져갈 수 있는 문제들이었다. 시험문제 1. 기계학습(50점): 결석횟수를 target변수로 하여 11개의 독립변수를 통해 결석횟수를 예측하는 문제가 출제되었다. 2. 통계학(50점): 다중회귀분석 회귀계수 유의성, ..