본문 바로가기
반응형

데이터분석26

Function and Console I/O > Function - 어떤 일을 수행하는 코드의 덩어리 - 반복적인 수행을 1회만 작성 후 호출 - 코드를 논리적인 단위로 분리 - 캡슐화 : 인터페이스만 알면 타인의 코드 사용 - 함수 선언 문법 : function name, parameter, indentation, return value(optional) - 함수 수행 순서 : 함수 부분을 제외한 메인 프로그램부터 시작 -> 함수 호출 시 함수 부분을 수행 후 되돌아옴 - parameter : 함수의 입력 값 인터페이스 Ex) F(x)에서 x를 의미함 - argument : 실제 parameter에 대입된 값 Ex) F(x)에서 x에 들어간 실제 값을 말함 - parameter 유무, 반환 값 유무에 따라 함수의 형태가 다름 > Console I.. 2022. 1. 14.
Variable & List > Variables - 가장 기초적인 문법 - 데이터(값)을 저장하기 위한 메모리 공간의 프로그래밍상 이름 - 변수 = 값 : 변수에 값을 저장한다. - 변수는 값을 저장하는 장소 - 변수는 메모리 주소를 가지고 있고, 변수에 들어가는 값은 메모리 주소에 할당됨 Cf) 컴퓨터의 구조 - 폰 노이만 아키텍쳐 - 사용자가 컴퓨터에 값을 입력하거나 프로그램을 실행하면, 메모리에 저장하고 시작한다고 생각하자. - 선언되는 순간 메모리 특정 영역에 물리적인 공간이 할당된다. - 변수에 값이 할당되고, 해당 값은 메모리에 저장됨. - A=8의 의미는 'A라는 이름을 가진 메모리 주소에 8을 저장하라'라는 말 > 변수 이름 작명법 - 알파벳, 숫자, 언더스코어(_)로 선언 가능 - 변수명은 의미 있는 단어로 표기하.. 2022. 1. 14.
Python coding environment (Interpreter, Code Editor) > 개발 환경 (Development Environment) - 프로그램을 작성하고, 실행시키는 환경 > OS를 선정 : Windows, Linux, Max OS 1) Windows : 친숙하고 초기에 쉬움, 모듈 설치가 어렵고 과거에 참고 문서가 부족했었다. 2) Linux : 모듈 설치가 쉽고 공짜, 참고 문서가 매우 많다. OS 자체가 사용이 어려움 3) Max OS : 모듈 설치 쉽고, 참고 문서도 많다. 비싸다. > 인터프리터 (Interpreter) 선정 - 2.7와 3.X 버전이 존재함. 현재는 3.X 기준으로 모든 시스템이 작동됨 - 2020년부터는 Tensorflow에서 2.X는 지원을 하지 않음 - 최근 3.9버전이 출시 되었음 - 종류에는 Python, Anaconda 등이 있음 > .. 2022. 1. 14.
Introduction to Python > python의 시작 - 1991년 귀도 반 로섬이 발표 - 플랫폼 독립적 - 인터프리터 언어 - 객체 지향 - 동적 타이핑 언어 - 처음 C언어로 구현되었음 - 1989년 크리스마스에 할 일이 없어서 파이썬 개발 - 'Monty Python's Flying Circus' : 파이썬 이름의 유래 (코미디 그룹의 이름) - 창립자는 구글, DropBox, MS 근무 > python 특징 1) 플랫폼 = OS - 윈도우, 리눅스, 안드로이드, 맥OS, iOS 등 프로그램이 실행되는 운영체제를 플랫폼이라고 함 2) 독립적인 = 관계 없는, 상관 없는 - OS에 상관없이 한번 프로그램을 작성하면 사용 가능 3) 인터프리터 = 통역기를 사용할 수 있는 언어 - 소스코드를 바로 실행할 수 있게 지원하는 프로그램 .. 2022. 1. 14.
[Tensorflow] 회귀(Regression) 신경망 실습 본 실습은 Sklearn Boston 데이터 셋을 활용했습니다 1. Import Library and Random seed import numpy as np import tensorflow as tf np.random.seed(0) tf.random.set_seed(0) 2. Load Dataset and check target # target check - continuous from sklearn import datasets raw_boston = datasets.load_boston() X = raw_boston.data y = raw_boston.target print(X.shape) print(set(y)) 3. Train / Test Split # Split from sklearn.model_.. 2022. 1. 7.
[Tensorflow] Tensorflow로 신경망 구조 만들기 텐서플로로 신경망 구조를 만드는 방법은 크게 2가지가 있다. 1. 시퀀스 API 사용 2. 함수형 API 사용 시퀀스 API 사용 - 텐서플로에서 제공하는 Sequential()을 통해 딥러닝 구조의 층을 쌓을 수 있음 - Sequential() 선언 후, model.add() 함수를 입력함으로써 실제로 층을 쌓음 - Sequential() : 신경망 모형을 선언, 생성하는 역할 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense model = Sequential() model.add(Dense(100, activation='relu', input_shape=(32, 32, 1)) model.add.. 2022. 1. 7.
딥러닝 기본 용어 잡기(Introduction to Deep Learning) 딥러닝 : 인공신경망 기반의 학습 방식 - 수많은 뉴런이 서로 연결되어 신호를 서로 전달하는 것처럼 퍼셉트론이 연결되어 연산 결과를 주고 받음 퍼셉트론 : 신경망의 최소 단위 - 입력값(input), 가중치 벡터(w), 출력값(output) - 입력값 벡터와 가중치 벡터의 내적값이 활성화 함수(Activation Function)를 거쳐 최종 출력값을 반환 - 활성화 함수는 시그모이드(Sigmoid), 렐루(Relu), 리키 렐루(Leaky Relu) 등이 있음 - 편향(b, bias) : 가중합에 더해지는 상수 다층 퍼셉트론 : 퍼셉트론의 층 여러 개 - XOR 등 하나의 퍼셉트론으로는 해결할 수 없었던 문제를 해결할 수 있게 함 - 인공 신경망(Artificial neutral network), 줄여.. 2022. 1. 7.
Start OpenCV and draw on the picture/video 1. Import Library import cv2 import matplotlib.pyplot as plt %matplotlib inline 2. Open the File # 색감이 이상하게 나옴 imgBGR = cv2.imread('./data/apples.jpg') plt.axis('off') plt.imshow(imgBGR) plt.show() # RGB로 변환해서 열어주어야 함 imgRGB = cv2.cvtColor(imgBGR, cv2.COLOR_BGR2RGB) plt.axis('off') plt.imshow(imgRGB) plt.show() # 그레이스케일 imgGray = cv2.imread('./data/apples.jpg', cv2.IMREAD_GRAYSCALE) plt.axis('of.. 2022. 1. 3.
[홀로서기 #05] 회귀 모델링 하기 전에 꼭 확인하기 (2) - 타겟 분포 (Log Transformation) # 홀로서기 기획 연재물은 최근 개인 프로젝트를 진행하면서 겪은 어려움들을 기록한 지극히 개인적인 콘텐츠입니다. 무작정 모델링 하기 지난 시간(OneHotEncoding: 홀로서기 #04)에 이어서 본격적으로 모델링을 진행했다. 결론부터 말하자면, 모델 성능은 처참했다. 꼭 확인해주어야 하는 부분을 확인해주지 않고 넘어갔기 때문인데, 그 부분은 뒷부분에서 확인할 수 있다. 회귀모델에 대표적으로 Linear Regression 이 있고, 각 제약식을 어떻게 주느냐에 따라서, Ridge, Lasso, ElasticNet으로 분화된다. 기본적인 회귀 분석에는 제약식이 포함될 수 있는데, 제약이 없으면 우리가 추정하려는 가중치 w가 폭발적으로 커질 수 있고, 이로 인해서 분산이 커지는 문제가 발생할 수 있다. .. 2022. 1. 3.
반응형