본문 바로가기
Data Science/Data Analytics

[ADP-14] 정상성 / 자기회귀모형(AR) / 이동평균모형(MA) / 자기회귀누적이동평균모형(ARIMA) / 분해시계열

by 루크 Luke 2022. 8. 17.
반응형

정상성

- 시간의 흐름에 따라서 관측된 데이터를 시계열(Time-series) 자료라고 함

- 시계열 분석을 하기 위해서는 정상성(Stationary)을 만족해야 함

- 정상성은 시점에 상관없이 시계열의 특성이 일정하다는 것을 의미함

정상성
1) 평균이 일정하다
2) 분산이 시점에 의존하지 않는다.
3) 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다.

- 정상성 조건을 하나라도 만족하지 못하는 경우, 비정상 시계열이라고 부름

- 비정상 시계열 자료는 정상성을 만족하도록 데이터를 정상 시계열 자료로 만든 다음 시계열 분석을 수행

- 차분 : 현 시점의 자료값에서 전 시점의 자료값을 빼는 것

- 여러 시점 전의 자료를 빼는 것을 계절차분이라고 함

- 추세를 보이는(평균이 일정하지 않은) 경우에는 차분(Difference)을 통해 비정상 시계열을 정상 시계열로 바꿈

- 시간에 따라 분산이 일정하지 않은 경우에는 변환(Transformation)을 통해 정상시계열로 바꿀 수 있음

 

자기회귀모형(AR)

- Autoregressive Model(AR model)

- 현 시점의 자료가 p 시점 전의 유한 개의 과거 자료로 설명될 수 있다는 의미

- 백색잡음과정 : 대표적인 정상 시계열로, 시계열 분석에서 오차항을 의미함

- AR은 현 시점의 시계열 자료에 몇 번째 전 자료까지가 영향을 주는지 알아내는 데 있음

- 현 시점의 사계열 자료에 과거 1  시점 이전의 자료만 영향을 준다면 이를 1차 자기회귀모형이라고 하며, AR(1)모형이라 함

- 2시점 전 자료까지 영향을 주면 2차 자기회귀모형, AR(2)

- AR인지 판단하기 위한 모형 식별을 위해서 자료에서 자기상관함수(ACF)와 부분자기상관함수(PACF)을 이용해서 식별

- 일반적으로, AR은 자기상관함수는 시차가 증가함에 따라 점차적으로 감소하고, 부분자기상관함수는 p+1 시차 이후 급격히 감소하여 절단된 형태이며, 이를 AR(p) 모형이라고 판별한다.

 

이동평균모형(MA)

- Moving Average Model(MA model)

- 시계열 자료를 모형화하는데 자기회귀 모형 다음으로 많이 쓰이는 모형

- MA는 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족함 (정상성 가정 필요없음)

- 1차 이동평균모형, MA(1) 모형은 가장 간단한 이동평균모형으로, 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합

- MA를 판단하기 위한 모형 식별은 AR과 마찬가지로 자기상관함수와 부분자기상관함수를 이용하여 식별 가능

- MA는 AR과 반대로 자기상관함수는 p+1 시차 이후 절단된 형태가 되고, 이때를 MA(p) 모형이라 할 수 있음

- 부분상관함수는 점차 감소하는 형태를 띈다.

 

자기회귀누적이동평균모형(ARIMA)

- Autoregressive Integrated Moving Average model

- ARIMA 모형은 기본적으로 비정상 시계열 모형이기 때문에 차분이나 변환을 통해 AR, MA, ARMA 모형으로 정상화

- ARIMA(p, d, q) : AR(p), MA(q), ARIMA → ARMA(d번 차분)

- d=0이면, ARMA(p, q) 모형, 정상성 만족

- p=0이면, IMA(d, q) 모형이고 이를 d번 차분하면 MA(q) 모형이 됨

- q=0이면, ARI(p, d) 모형이고 이를 d번 차분한 시계열 모형이 AR(p) 모형을 따르게 됨

 

분해시계열

- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법

- 추세요인, 계절요인, 순환요인, 불규칙요인

- 분해시계열 분석법에서는 각 구성요인을 정확하게 분리하는 것이 중요하지만, 쉽지 않다.

추세요인 계절요인 순환요인 불규칙요인
형태가 오르거나 내리자료가 어떤 특정한 형태를 취함 요일, 월, 분기, 연별
고정된 주기에 따라 자료 변화
명백한 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료 위 3가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인
반응형

댓글