본문 바로가기

데이터분석 이야기/데이터분석전문가(ADP) 정리4

기록:0편. 데이터 분석을 위한 파이썬(Python) 라이브러리 정리 안녕하세요 미래대비자 입니다. 오늘부터 꾸준하게 데이터 분석 전문가(ADP) 준비를 위해 공부했던 내용을 다루고자 합니다. 진짜 시작하기 전에 주요한 라이브러리를 초보자 관점에서 아주 쉽게 정리했습니다. 1. 데이터 처리 : 판다스(Pandas), 넘파이(Numpy) import pandas as pd import numpy as np 판다스(Pandas) : 판다스(Pandas)는 우리가 알기 쉬운 데이터프레임(우리에게 익숙한 스프레드시트(엑셀) 형태) 형태에서 다양하게 데이터를 처리할 수 있습니다. 넘파이(Numpy) :넘파이(Numpy)는 데이터 프레임 형태가 아닌 array형태(1d array는 벡터, 2darray는 행렬 등)로써 선형대수적인 ndarray형태 데이터를 처리할 수 있습니다. 2... 2022. 6. 24.
ADP 실기 25회 후기(문제 포함) 데이터 분석전문가 ADP 자격 취득을 위해 2022년 6월 18일 서일대학교로 시험을 보고왔습니다. 1. 시험 환경 전날에 비가 온다고 했는데 다행히 당일에는 비가 오지 않았습니다. 고사장에 도착하면 배정된 대학교의 상태가 중요한것같습니다. 한 고사장에 약 20명정도가 배정이 되는 것 같았습니다.그리고 배정된 학교마다 컨디션이 다르기 때문에 최악의 상황을 대비하여 시험준비를 하는것이 좋습니다. 서일대학교도 복도식 아파트 처럼 되어있어서 안쪽에 배정될 경우 화장실을 갈때 바깥쪽 사람에게 양해를 구해서 그 분이 일어나셔야 지나갈 수 있었습니다. 2. 시험시간 및 분위기 ADP는 총 4시간의 시험이고 100점 만점에 75점을 득해야 합격인 시험입니다. 30분 동안에는 화장실을 가지 못하고 그 이후부터는 1명씩.. 2022. 6. 23.
value_counts() 막대 그래프 그릴 때 순서 꼬일 때 연도별 빈도를 세어서 막대그래프를 그리려고한다. 데이터 프레임으로 빈도를 세서 막대 그래프를 그리는 문제를 하다가 인덱스가 꼬이는 문제가 발생했다. 그냥 막대그래프를 그린다면 문제가 되지 않는데 plt.text를 이용하여 빈도수를 넣으려고할 때 문제가 발생했다. 해결방법은 생각보다 간단했다. sort_index()를 해주면 정리가 된다. 이렇게 정렬을 해주어 plt.text()를 사용하니 문제가 완전해결되었다. 간단하지만 생각보다 오래걸렸다. 앞으로 파이썬을 하며 간단한 문제를 해결했을 때 마다 기록하고자 한다. 추가적으로 df.set_index('공시년도').loc[[2016, 2017, 2018, 2019, 2020, 2021]].plot(kind='bar')와 같은 방식으로 정렬해줄 수 도있다. 2022. 4. 1.
정형데이터 마이닝 - 연관규칙 분석(장바구니 분석) 보호되어 있는 글 입니다. 2021. 12. 10.