본문 바로가기
반응형

데이터프레임4

[ADP-8] 분석도구 R의 특징 / R 시작하기(install.packages, library, ?, help) / R의 데이터 구조(벡터 c, 행렬 matrix, 데이터프레임 data.frame) 분석도구 R의 특징 - R은 무료 소프트웨어이면서도 고차원적인 계산이 가능하며 통계 분석과 시각화에 최적화된 환경을 통해 단순한 계산부터 복잡한 통계 기법까지를 폭넓게 다룰 수 있음 1) 그래픽 처리 - 상용 소프트웨어에 버금가는 상당한 수준의 그래프와 그림 - 그림의 용도와 역할에 맞게 적절한 그래프를 언제든지 쉽게 생산할 수 있음 - 매우 세부적인 부분까지 사용자가 직접 지정, 섬세한 작업을 수행할 수 있음 - 출판물로 사용해도 손색이 없을 정도의 고해상도 이미지를 생산함에도 그 처리 시간이 매우 빠름 2) 데이터 처리 및 계산 능력 - 벡터, 행렬, 배열, 데이터프레임, 리스트 등 다양한 형태의 데이터 구조 지원 - 다양한 데이터 형태의 분석이 용이함 - 복잡한 구조 내 개별 데이터에 접근하는 절차.. 2022. 8. 12.
[matplotlib] 데이터 다듬어서 간단한 시각화 다뤄보기 - 기본적으로 데이터를 다룰 때는 pandas, numpy 모듈을 늘 달고 사는 것 같다. - 시각화에는 Matplotlib 모듈을 자주 쓴다. 물론 .plot으로 자체적으로 가능하지만, 더 많은 기능이 있는 듯하다. 데이터 다듬기 - 시각화에서 중요한 것은 "데이터 정렬" CCTV_Seoul.sort_values(by="소계", ascending = False).head() # by="정렬기준" # ascending은 오름차순이다. False를 하면 내림차순. # head()는 기본 상위 5개를 보여주고, 괄호 안에 숫자를 넣으면 그 수만큼 보여준다. - 최근 증가율(2014, 2015, 2016이 2013년도 이전에 비해 얼마나 증가했는지)이 중요한 지표가 될 수 있을 것 같아서, 컬럼을 추가하려고 .. 2021. 10. 13.
[pandas] DataFrame(데이터프레임) 쪽지시험;Quiz 후기 젠장. 손 코딩이 문제에 나올거라는 생각을 못했다. - 비전공자는 웁니다 엉엉 뭐 그래도, 덕분에 이제 문제 어떻게 나올지 알겠으니까 제대로 해보자. 생각나는 문제 복기를 해보자면 아래와 같다. 1. Jupyter Notebook 에서 Pandas를 pd라는 별칭으로 불러오려면 어떻게 코딩하는가? import pandas as pd 2. "01. Seoul_CCTV.csv" 파일 불러올 때 코딩 어떻게 하는가? pd.read_csv("../data/01.Seoul_CCTV.csv") 3. 엑셀 파일 불러올 때는 어떻게 코딩하는가? pd.read_excel("파일 위치 및 파일명") 4. 데이터 프레임 생성할 때, 어떻게 코딩을 시작하는가? pd.DataFrame 5. 날짜 데이터를 pd로 만드려면 어떻게.. 2021. 10. 7.
[Pandas] DataFrame(데이터프레임) 알아보기 DataFrame : 2차원 형태의 데이터를 다루기 위한 자료형 - 표 형식의 데이터를 담는 자료형 - Columns, Index, Values로 구성되어 있다. - 행 / 열 = index / column - index는 각 레코드, column은 각 데이터의 특징를 설명하는 '이름' 같은 존재 (개인적으로.. 2차원 numpy array의 부가적인 기능을 가능하게 하는 것이 Pandas 같은 느낌) - 처음에 불러오면 index는 0, 1, 2 등으로 번호가 매겨져 있다. 1) CSV 파일 불러오기 - pandas를 import하고, pd라고 별칭을 만들어주는 과정을 꼭 맨 처음에 하자! - 중요한 포인트는, minho라는 폴더 안에 저 파일이 있다는 걸 인지한 상태에서 코딩하는 것이다. - 불러올 .. 2021. 10. 6.
반응형