티스토리 뷰

R

(macOS)[R] 시계열 예측 : 이론

jinozpersona 2022. 4. 18. 10:37

INTRO

1. 정상성(Stationary)

2. 시계열 모델(Time-Series Model)

   2.1. 자기회귀 모델(AR Model, Auto-Regressive Model)

   2.2. 이동평균 모델(MA Model, Moving Average Model)

   2.3. 자기회귀누적이동평균 모델(ARIMA Model, Auto-Regressive Intergrated Moving Average Model)

   2.4. 분해 시계열

      - 추세요인(Trend Factor)

      - 계절요인(Seasonal Factor)

      - 순환요인(Cyclical Factor)

      - 불규칙요인(Irregular Factor)

 

1. 정상성

 시간의 흐름에 따라 관측된 데이터를 시계열 자료(Time-Series Data)라고 한다. 시계열 분석(Time-Series Analysis)을 위해서는 정상성(Stationary)을 만족해야한다. 정상성은 시점에 상관없이 시계열의 특성이 일정하다는 것을 의미한다.

정상성
- 평균이 일정하다.
- 분산이 시점에 의존하지 않는다.
- 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다.

 

 위의 정상성 조건을 하나라도 만족하지 못하는 경우의 시계열 자료를 비정상 시계열이라한다. 대부분의 시계열 자료는 비정상 시계열 자료이며 정상성을 만족하도록 데이터를 정상 시계열 자료로 만든 후에 시계열 분석을 수행한다.

 가장 먼저 자료의 이상치(Outlier)와 개입(Intervention)을 살피고 정상성 만족 여부와 계략적인 추세 유무를 관찰한다. 이상치의 경우 일반적으로 해당 이상값을 제거하고, 개입의 경우 회귀분석을 수행한다. 추세를 보이는(평균이 일정하지 않은) 경우에는 차분(Difference)을 통해 비정상 시계열을 정상 시계열로 바꾸고 시간에 따라 분산이 일정하지 않은 경우 변환(Transformation)을 통해 정상 시계열로 바꿀 수 있다.

 차분이란 현 시점의 자료값에서 전 시점의 자료값을 빼는 것으로 여러 시점 전의 자료를 빼는 것을 계절차분(Seasonal Difference)이라고 한다. 계절성을 갖는 비정상 시계열을 정상 시계열로 바꿀 때 계절차분을 사용한다.

 

2. 시계열 모델

 2.1. 자기 회귀 모델(AR Model)

 현 시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명될 수 있다는 의미로 AR(p) 모형이라 한다.

$ Z_t = \phi_1 Z_{t-1} + \phi_2 Z_{t-2} + \dots + \phi_p Z_{t-p} + a_t $


$Z_t$ : 현재 시점의 시계열 자료
$Z_{t-1}, \dots ,Z_{p-1}$ : $1~p$ tㅣ점 이전의 시계열 자료
$\phi_p$ : p 시점이 현재 시점에 어느 정도 영향을 주는지 나태내는 모수
$a_t$ : 백색잡음과정(white noise process, 대표적 정상 시계열), 시계열 분석의 오차항

백색잡음과정 : 대표적 정상 시계열

백색잡음과정 $a_t$는 독립이고 같은 분포를 따르며 평균이 0이고 분산이 $\sigma_a^2$인 확률 변수
$$ a_t ~ iid(0,\sigma_a^2) $$

 1차 자기회귀모델, AR(1) 모형 : 자기 회귀 모델은 현 시점의 시계열 자료에 몇 번째 전 자료까지 영향을 주는지 알아보는 것으로 현 시점의 시계열 자료에 과거 1 시점 이전의 자료만 영향을 주는 경우

 

$ Z_t = \phi_1 Z_{t-1} + a_t $

 2차 자기회귀모델, AR(2) 모형 : 현 시점의 시계열 자료에 과거 2 시점 전의 자료만 영향을 주는 경우

 

$ Z_t = \phi_1 Z_{t-1} + \phi_2 Z_{t-2} + a_t $

 

 자기회귀모델인지 판단하기 위한 모형 식별을 위해 자료에서 자기상관함수(AGF, Auto-Correlation Function)와 부분자기상관함수(PACF, Partial Auto-Correlation Function)를 이용하여 식별한다.

 자기회귀모델은 자기상관함수에서 시차가 증가함에 따라 점차적으로 감소하고 부분자기상관함수에서 p+1 시차 이후 급격히 감소하여 절단된 형태이며 이를 AR(p) 모형이라고 판별한다.

자기회귀모형의 자기상관함수, 부분자기상관함수 형태

 

 2.2. 이동평균모델(MA Model)

 시계열 자료를 모형화 하는데 자기회귀모형을 다음으로 많이 쓰는 모형이 이동평균모델이다.

$ Z_t = a_t - \theta_1 a_{t-1} - \theta_2 a_{t-2} - \dots - \theta_p a_{t-p} $

 이동평균모델은 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족한다.

 

 1차 이동평균모델, MA(1) 모형 : 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결함 모형

 

$ Z_t = a_t - \theta_1 a_{t-1} $

 2차 이동평균모델, MA(2) 모형

 

 

$ Z_t = a_t - \theta_1 a_{t-1} - \theta_2 a_{t-2} $

 

 이동평균모델인지 판단하기 위한 모형 식별을 위해 자기회귀모델과 마찮가지로 자료에서 자기상관함수(AGF, Auto-Correlation Function)와 부분자기상관함수(PACF, Partial Auto-Correlation Function)를 이용하여 식별한다. 

이동평균모델은 자기회귀모델과 반대로 자기상관함수에서  p+1 시차 이후 급격히 감소하여 절단된 형태이며, 부분자기상관함수에서 시차가 증가함에 따라 점차적으로 감소하는 형태를 보인다.

이동평균모형의 자기상관함수, 부분자기상관함수 형태

 

 

 2.3. 자기회귀누적이동평균모델(ARIMA Model)

 대부분의 많은 시계열 자료가 따르는 모델. 비정상 시계열 모형이기 때문에 차분이나 변환을 통해서 AR Model, MA Model, ARMA Model로 정상화 할 수 있다.

 ARIMA(p,d,q) 모형은 차수 p,d,q의 값에 따라 모형 이름이 다르게 된다. 차수 p는 AR 모형, q는 MA 모형과 관련이 있는 차수이다. d는 ARIMA에서 ARMA로 정상화 할 때 몇 번 차분을 했는 지를 의미한다.

 d=0이면 ARMA(p,q) 모형이라 부르고 정상성을 만족한다.

 p=0이면 IMA(d,q) 모형이라 부르고 d번 차분하면 MA(q) 모형이 된다.

 q=0이면 ARI(p,d) 모형이며 d번 차분하면 AR(p) 모형을 따른다.

 

 

 2.4. 분해 시계열

 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법으로 회귀분석적인 방법을 주로 사용하며 시계열을 구성하는 요소를 4가지로 분류한다.

 - 추세요인(Trend Factor)
   자료의 plot 형태가 오르거나 내리는 추세를 따르는 경우가 있다. 물론 선형적이거나 이차식의 형태를 취하거나 지수적 형태일 수 있는데 이렇게 자료가 어떤 특정한 형태를 취할 때 추세요인이 있다고 한다.
 - 계절요인(Seasonal Factor)
   요일마다 반복되거나 일년 중 월, 사분기 변화 등 고정된 주기에 따라 자료가 변하는 경우 계절요인이 있다고 한다.
 - 순환요인(Cyclical Factor)
   명백한 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 경우 순환요인이 있다고 한다.
 - 불규칙요인(Irregular Factor)
   위 세가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인을 불규칙요인이라고 한다.

 

 분해 시계열 분석법에서는 각 구성요인을 정확하게 분리하는 것이 중요하나 쉽지 않을 뿐만아니라 이론적인 약점이 있는 것으로 알려져 있다. 경제학자들이나 조사통계학자들은 이러한 약점에도 불구하고 널리 사용하고 있으며 실제로 경제 분석이나 예측에서 이 방법은 성공적으로 사용되고 있다.

 분해식의 정의는 다음과 같다.

$ Z_t = f(T_t, S_t, C_t, I_t) $


$T_t$ : 경향(추세) 요인
$S_t$ : 계절 요인
$C_t$ : 순환 요인
$I_t$ : 불규칙 요인
$Z_t$ : 시계열 값
$f$ : 미지의 함수

 

반응형
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/07   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
글 보관함