본문 바로가기
반응형

pandas3

[matplotlib] colormap 형태의 산점도와 선형 회귀식, 그리고 오차 표현 - 지난 시간에 배운 산점도(plt.scatter())를 활용해서 data_result의 인구수와 소계를 표현 def drawGraph(): plt.figure(figsize=(14,10)) plt.scatter( data_result["인구수"], data_result["소계"], s=50 ) plt.xlabel("인구수") plt.ylabel("CCTV") plt.grid() plt.show() drawGraph() 선형회귀, Linear Regression - numpy에서 지원하고 있기 때문에, 항상 import numpy as np를 불러주고 시작한다. - np.polyfit(x, y, 차수) : 선형회귀식의 각 계수를 찾는 함수 - np.poly1d(계수) : 계수를 넣으면 선형회귀식을 만들어.. 2021. 10. 13.
[matplotlib] 데이터 다듬어서 간단한 시각화 다뤄보기 - 기본적으로 데이터를 다룰 때는 pandas, numpy 모듈을 늘 달고 사는 것 같다. - 시각화에는 Matplotlib 모듈을 자주 쓴다. 물론 .plot으로 자체적으로 가능하지만, 더 많은 기능이 있는 듯하다. 데이터 다듬기 - 시각화에서 중요한 것은 "데이터 정렬" CCTV_Seoul.sort_values(by="소계", ascending = False).head() # by="정렬기준" # ascending은 오름차순이다. False를 하면 내림차순. # head()는 기본 상위 5개를 보여주고, 괄호 안에 숫자를 넣으면 그 수만큼 보여준다. - 최근 증가율(2014, 2015, 2016이 2013년도 이전에 비해 얼마나 증가했는지)이 중요한 지표가 될 수 있을 것 같아서, 컬럼을 추가하려고 .. 2021. 10. 13.
[Pandas] DataFrame(데이터프레임) 알아보기 DataFrame : 2차원 형태의 데이터를 다루기 위한 자료형 - 표 형식의 데이터를 담는 자료형 - Columns, Index, Values로 구성되어 있다. - 행 / 열 = index / column - index는 각 레코드, column은 각 데이터의 특징를 설명하는 '이름' 같은 존재 (개인적으로.. 2차원 numpy array의 부가적인 기능을 가능하게 하는 것이 Pandas 같은 느낌) - 처음에 불러오면 index는 0, 1, 2 등으로 번호가 매겨져 있다. 1) CSV 파일 불러오기 - pandas를 import하고, pd라고 별칭을 만들어주는 과정을 꼭 맨 처음에 하자! - 중요한 포인트는, minho라는 폴더 안에 저 파일이 있다는 걸 인지한 상태에서 코딩하는 것이다. - 불러올 .. 2021. 10. 6.
반응형