본문 바로가기
반응형

전체 글92

Python coding environment (Interpreter, Code Editor) > 개발 환경 (Development Environment) - 프로그램을 작성하고, 실행시키는 환경 > OS를 선정 : Windows, Linux, Max OS 1) Windows : 친숙하고 초기에 쉬움, 모듈 설치가 어렵고 과거에 참고 문서가 부족했었다. 2) Linux : 모듈 설치가 쉽고 공짜, 참고 문서가 매우 많다. OS 자체가 사용이 어려움 3) Max OS : 모듈 설치 쉽고, 참고 문서도 많다. 비싸다. > 인터프리터 (Interpreter) 선정 - 2.7와 3.X 버전이 존재함. 현재는 3.X 기준으로 모든 시스템이 작동됨 - 2020년부터는 Tensorflow에서 2.X는 지원을 하지 않음 - 최근 3.9버전이 출시 되었음 - 종류에는 Python, Anaconda 등이 있음 > .. 2022. 1. 14.
Introduction to Python > python의 시작 - 1991년 귀도 반 로섬이 발표 - 플랫폼 독립적 - 인터프리터 언어 - 객체 지향 - 동적 타이핑 언어 - 처음 C언어로 구현되었음 - 1989년 크리스마스에 할 일이 없어서 파이썬 개발 - 'Monty Python's Flying Circus' : 파이썬 이름의 유래 (코미디 그룹의 이름) - 창립자는 구글, DropBox, MS 근무 > python 특징 1) 플랫폼 = OS - 윈도우, 리눅스, 안드로이드, 맥OS, iOS 등 프로그램이 실행되는 운영체제를 플랫폼이라고 함 2) 독립적인 = 관계 없는, 상관 없는 - OS에 상관없이 한번 프로그램을 작성하면 사용 가능 3) 인터프리터 = 통역기를 사용할 수 있는 언어 - 소스코드를 바로 실행할 수 있게 지원하는 프로그램 .. 2022. 1. 14.
Basic computer class for newbies > OS : Operating System, 운영체제 - 프로그램이 동작할 수 있는 구동 환경 - Application - OS - CPU - Memory - 소프트웨어가 하드웨어에 연결되서 실행될 수 있도록 하는 역할을 한다고 보면 됨 - Application은 OS에 의존할 수 밖에 없다 - 어떤 파일이 Mac에서는 열리는데, Windows에서는 안 열림 - 파이썬은 OS에 독립적인 프로그램이다. - 어떤 개발 환경에서 개발을 실행할 것인가에 대한 선택 > 파일 시스템 - File system : OS에서 파일을 저장하는 트리구조 저장 체계 - 컴퓨터 등의 기기에서 의미있는 정보를 담는 논리적인 단위, 모든 프로그램은 파일로 구성되어 있고, 파일을 사용 - 파일의 기본 체계는 파일과 디렉토리! 1) .. 2022. 1. 14.
Deep Semi-Supervised Anomaly Detection [Information] - Paper : Deep Semi-Supervised Anomaly Detection - Author : Lukas Ruff, Robert A. Vandermeulen, Nico Görnitz, Alexander Binder, Emmanuel Müller, Klaus-Robert Müller, Marius Kloft - 26 Sept 2019 (modified: 11 Mar 2020), ICLR 2020 Conference Blind Submission - URL : https://openreview.net/pdf?id=HkgH0TEYwH 일반적으로, Anomaly Detection은 비지도 학습을 가정한다. - 무엇이 정상이고 비정상인지 모르지만, 대부분의 데이터가 정상일 것.. 2022. 1. 14.
[홀로서기 #06] 회귀 Regression 결정계수(R^2), 알파(alpha) # 홀로서기 기획 연재물은 최근 개인 프로젝트를 진행하면서 겪은 어려움들을 기록한 지극히 개인적인 콘텐츠입니다. R^2, R-squared, 결정계수, 그게 뭔데. 지난 시간에 필자는 기본 회귀모델(Linear Regression)을 포함해서, Lasso, Ridge, ElasticNet까지 모두 돌려봤었다. 회귀 모델이 정규분포일 때 가장 성능이 좋다는 것을 간과하면 안 된다는 점을 깨닫고 Log Transformation(홀로서기 #05)까지 했었는데, 결국 R-sqaured 값은 쓸만하지 못했다. 다시 한번 살펴보면 아래와 같았다. 대체 '결정계수'라고 불리우는 R^2 값의 정체는 무엇일까. 데이터를 잘 정리해서 모델을 돌려도, 이 모델이 정말 유효한 모델인지 판단하는 데에는 '통계학적 지식'이 매.. 2022. 1. 11.
[SQL] JOIN JOIN - 여러 개의 테이블 사용하기 - 데이터의 규모가 커지면서 하나의 테이블로 정보를 수용하기가 어려워지면, - 테이블을 분할하고 테이블 간의 관계성을 부여한다. - 분할된 테이블을 하나로 활용할 수 있는 기능이 JOIN - 테이블간의 관계성에 따라서 복수의 테이블을 결합, 하나의 테이블인 것처럼 결과를 출력 - OUTER JOIN : 매칭되는 행이 없어도 결과를 가져오고, 매칭되는 행이 없는 경우 NULL로 표시 - OUTER JOIN에 LEFT OUTER JOIN(LEFT JOIN), RIGHT OUTER JOIN(RIGHT JOIN)이 포함됨 - INNER JOIN : 조인되는 두 개의 테이블 모두에 데이터가 존재하는 행에 대해서만 결과를 가져옴 - 아래 그림 출처 [기본 문법] SELECT .. 2022. 1. 10.
[SQL] SQL / Table / SELECT SQL ; Structured Query Language - 관계형 DB가 표의 형태로 정리정돈 되어 있는 상태이기 때문에, Structured - DB에게 데이터를 어떻게 해달라고 요청하기 때문에, Query - DB도 이해할 수 있고 사용자도 이해할 수 있는 공통의 언어이기 때문에, Language - 어떤 컴퓨터 언어보다도 쉽다. - 중요하다 (?) - 관계형 DB를 제어할 수 있는 표준화된 언어이기 때문에 매우 중요함 Table - 행 = row, record - 열 = column SELECT - 데이터를 테이블로부터 조회할 때 사용됨 - 데이터 분석가라면, 가장 많이 사용하게 될 것이므로 Advanced 파트까지 완벽하게 알아야 함! [기본 문법] SELECT column1, column2 F.. 2022. 1. 10.
[ch1. EDA] 변이 추정, 데이터 분포 탐색 본 요약 노트는 데이터 과학을 위한 통계(2판)을 참고하여 작성했습니다. 2022. 1. 10.
Deep Learning Model for Anomaly Detection: Survey 1. What are Anomalies? 1) Anomaly v.s. Novelty - Anomaly : 정상 데이터와 본질적으로 다름 - Novelty : 정상 데이터와 본질적으로 같지만 유형이 다름 - ex) 호랑이가 정상데이터일 때, 백호는 Novelty, 그 밖에 말, 치타 등은 Anormaly (Figure 4) 2) Type of Anomalies - Point : 말 그대로 이상치 -> 정상과 본질적으로 다른 희소한 데이터(발생 빈도가 매우 낮음) - Contextual of Conditional : 조건부 이상치 -> 특정 조건이 충족될 때 이상치로 판단될 수 있음 - Collective or Group : 한 번 이상치가 발생할 때, 대규모로 발생하는 경우 ex. 디도스 공격 3) Lab.. 2022. 1. 9.
반응형