정상성
- 시간의 흐름에 따라서 관측된 데이터를 시계열(Time-series) 자료라고 함
- 시계열 분석을 하기 위해서는 정상성(Stationary)을 만족해야 함
- 정상성은 시점에 상관없이 시계열의 특성이 일정하다는 것을 의미함
정상성 1) 평균이 일정하다 2) 분산이 시점에 의존하지 않는다. 3) 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다. |
- 정상성 조건을 하나라도 만족하지 못하는 경우, 비정상 시계열이라고 부름
- 비정상 시계열 자료는 정상성을 만족하도록 데이터를 정상 시계열 자료로 만든 다음 시계열 분석을 수행함
- 차분 : 현 시점의 자료값에서 전 시점의 자료값을 빼는 것
- 여러 시점 전의 자료를 빼는 것을 계절차분이라고 함
- 추세를 보이는(평균이 일정하지 않은) 경우에는 차분(Difference)을 통해 비정상 시계열을 정상 시계열로 바꿈
- 시간에 따라 분산이 일정하지 않은 경우에는 변환(Transformation)을 통해 정상시계열로 바꿀 수 있음
자기회귀모형(AR)
- Autoregressive Model(AR model)
- 현 시점의 자료가 p 시점 전의 유한 개의 과거 자료로 설명될 수 있다는 의미
- 백색잡음과정 : 대표적인 정상 시계열로, 시계열 분석에서 오차항을 의미함
- AR은 현 시점의 시계열 자료에 몇 번째 전 자료까지가 영향을 주는지 알아내는 데 있음
- 현 시점의 사계열 자료에 과거 1 시점 이전의 자료만 영향을 준다면 이를 1차 자기회귀모형이라고 하며, AR(1)모형이라 함
- 2시점 전 자료까지 영향을 주면 2차 자기회귀모형, AR(2)
- AR인지 판단하기 위한 모형 식별을 위해서 자료에서 자기상관함수(ACF)와 부분자기상관함수(PACF)을 이용해서 식별
- 일반적으로, AR은 자기상관함수는 시차가 증가함에 따라 점차적으로 감소하고, 부분자기상관함수는 p+1 시차 이후 급격히 감소하여 절단된 형태이며, 이를 AR(p) 모형이라고 판별한다.
이동평균모형(MA)
- Moving Average Model(MA model)
- 시계열 자료를 모형화하는데 자기회귀 모형 다음으로 많이 쓰이는 모형
- MA는 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족함 (정상성 가정 필요없음)
- 1차 이동평균모형, MA(1) 모형은 가장 간단한 이동평균모형으로, 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합
- MA를 판단하기 위한 모형 식별은 AR과 마찬가지로 자기상관함수와 부분자기상관함수를 이용하여 식별 가능
- MA는 AR과 반대로 자기상관함수는 p+1 시차 이후 절단된 형태가 되고, 이때를 MA(p) 모형이라 할 수 있음
- 부분상관함수는 점차 감소하는 형태를 띈다.
자기회귀누적이동평균모형(ARIMA)
- Autoregressive Integrated Moving Average model
- ARIMA 모형은 기본적으로 비정상 시계열 모형이기 때문에 차분이나 변환을 통해 AR, MA, ARMA 모형으로 정상화
- ARIMA(p, d, q) : AR(p), MA(q), ARIMA → ARMA(d번 차분)
- d=0이면, ARMA(p, q) 모형, 정상성 만족
- p=0이면, IMA(d, q) 모형이고 이를 d번 차분하면 MA(q) 모형이 됨
- q=0이면, ARI(p, d) 모형이고 이를 d번 차분한 시계열 모형이 AR(p) 모형을 따르게 됨
분해시계열
- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법
- 추세요인, 계절요인, 순환요인, 불규칙요인
- 분해시계열 분석법에서는 각 구성요인을 정확하게 분리하는 것이 중요하지만, 쉽지 않다.
추세요인 | 계절요인 | 순환요인 | 불규칙요인 |
형태가 오르거나 내리자료가 어떤 특정한 형태를 취함 | 요일, 월, 분기, 연별 고정된 주기에 따라 자료 변화 |
명백한 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료 | 위 3가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인 |
댓글