반응형 R_EDA1 [ADP-11] R을 활용한 데이터 기초 통계 / 결측값 처리 / 이상값 탐색 데이터 기초 통계 head(df) # 데이터에서 앞 6줄만 보도록 함 head(df, 10) # 숫자를 넣어주면 원하는 개수만큼 볼 수 있음 str(df) # 데이터의 구조를 파악할 수 있도록 보여줌 summary(df) # 데이터의 기초 통계량을 볼 수 있음 cov(df[, 1:4]) # 컬럼 1~4의 공분산을 구해줌 cor(df[, 1:4]) # 컬럼 1~4의 상관계수를 구해줌 결측값 처리 - R에서 결측값 처리 관련 패키지는 Amelia 2, Mice, mistools 등이 있으며, Amelia가 대표적임 - R에서 결측값은 NA(Not available)로 처리함 - 불가능한 값(예를 들면 dividing by zero)는 NaN(Not a Number)으로 처리됨 - is.na(y) : 결측값인.. 2022. 8. 16. 이전 1 다음 반응형