• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical Engineering, Kangwon National University, Korea.)



electric power load, linear interpolation, 2nd order trend difference, IT2TSK, footprint of uncertainty

1. 서 론

전력부하 예측은 전력계통 시스템의 운영이나 계획에서 매우 중요한 요소 중 하나이지만 정확한 예측모델을 구현하는 것은 쉬운 문제가 아니다. 이는 전력부하와 연관된 산업의 규모나 소모인구, 계절성에 따른 온도변화, 지역적(또는 국가별) 기후특성 등과 같이 비선형적(nonlinear)이거나 불명확한(uncertain) 특성(패턴)이 데이터 속에 내포되어 있기 때문이다. 결국, 전력부하에 대한 정확한 예측시스템의 구현을 위해선 시스템 설계에 사용되는 기본 예측모델이 비선형적이고 불명확한 패턴 특성의 전력부하를 잘 기술(수용, 취급)할 수 있어야 한다. 고전 예측모델로 빈번히 사용되는 통계에 기반한 선형 회귀모형(ARMA: Auto-regressive moving average, ARIMA: Box-Jenkins model)들을 이용한 예측방법은 정확한 예측을 수행하기 위한 수학적 모델 구현의 어려움이나 예측성능이 기대치를 만족하지 못하는 등 한계점이 있었다(1). 최근에는 퍼지와 신경망 등과 같은 유연 연산(soft computing) 기법을 활용함으로써 강한 비선형성(nonlinearity) 또는 불명확성(uncertainty)이나 비정상성(nonstationary)을 포함한 데이터들을 보다 효과적으로 취급하고 있다. D. Ali 및 J. H. Puiar는 퍼지모델을 장기부하예측(LTLF: Long-term load forecasting) 모델 구현에 적용하여 좋은 예측결과를 얻었으며(2-3), M. Hayati 및 P. Mandal은 신경망 모델을 각각 단기전력부하예측(STLF: Short- term load forecasting)과 전력가격예측(EPF: Electricity price forecasting) 부분에 적용하여 좋은 예측성능을 얻었다(4-5). 그뿐만 아니라 M. Tamimi는 퍼지와 신경망(FNN: Fuzzy-neural network)을 결합한 모델을 단기전력부하 예측에 적용하였으며(6), B. J. Chen은 및 Y. R. Gahrooei는 각각 신경망 학습에 SVM(Support vector mahine)을 결합하여 중기부하예측(MTLF: Middle-term load forecasting) 부분과 뉴로퍼지시스템(ANFIS: Adaptive network-based fuzzy inference system)에 입자군집최적화(POS: Particle swarm optimization) 기법을 적용하여 단기부하예측 부분에서 모두 좋은 예측결과들을 얻었다(7-8). 모델 구현(설계)의 측면에서 보면 위에 나열된 방법들은 퍼지시스템이 가지는 언어적 규칙기반에 따른 데이터 포용성과 신경망 시스템의 비선형 데이터에 대한 기술능력을 상보적으로 이용하거나 결합된 하이브리드 시스템의 데이터에 대한 최적화를 위해 SVM이나 POS와 같은 추가적인 알고리즘을 사용하고 있다. 결국, 이러한 시스템 설계특성들은 예측성능에 매우 중요한 요소가 되는 데이터의 숨겨진 속성 기술 능력을 강화하기 위해 여러 모델 또는 알고리즘을 조합한 구조이므로 설계상에 복잡성이 동반되는 구조이다. 또한, 특정한 이벤트가 발생하지 않는다면 전력부하데이터는 국가의 경제발전이나 산업규모의 확장 등과 연계되어 다양한 형태의 증가 추세성을 포함할 수 있으며, 이러한 추세성은 시스템의 설계 과정에서 편향된 정보를 제공함으로써 시스템의 부정확성을 증가시키는 요인이 될 수 있다. 따라서, 추세성이나 비선형성 등과 같은 내포된 속성들이 비교적 단순화 된 데이터들을 시스템 설계를 위해 사용한다면 이는 분명 시스템 설계에 효과적이며 좋은 예측성능을 이끌 수 있을 것이다. 특히 퍼지 예측 시스템(FPS: Fuzzy prediction system)의 경우 지속적인 증가나 감소와 같은 편향적 추세성은 시스템 규칙기반의 활용에 있어 데이터 편중 현상을 초래하여 퍼지시스템의 규칙기반이 가지는 포용성에도 불구하고 예측성능을 저해하는 요인이 된다. 또한, TSK퍼지 예측시스템(TSK FPS: Takagi-Sugeno-Kang Fuzzy prediction system)의 경우, 최소자승법(LSM: Least square method)으로 추정된 파라미터들이 취급할 수 있는 데이터 범위를 크게 벗어나는 문제점들이 야기되어 추정된 모수의 부정확성을 높이는 결과를 초래하게 된다.

결국, 위와 같은 문제점들이 개선될 수만 있다면, 퍼지예측시스템의 예측성능은 충분히 개선 가능할 것이다. 이러한 문제에 대한 대안으로 기존 연구 논문 (9)에선 데이터의 정규화 과정을 제시한 바 있다. 데이터 정규화 과정은 크게 선형보간(10) 절차와 1차 추세차분 절차로 구현되어 있으며, 이는 시스템 학습에 요구되는 데이터의 정보량을 증가하는 것과 데이터의 편향적 추세성을 극복하고자 제안된 방법이었다. 물론 선형보간법으로 늘어난 정보량은 시스템 설계 과정에서 군집에 포함되는 입력데이터 군의 정보를 증가시켜 이를 토대로 추정되는 파라미터의 취급 범위를 확장할 수 있어 파라미터 추정의 부정확성을 줄일 수는 있었지만, 1차 추세 차분방법의 경우에는 학습구간 데이터의 초기시점과 말기시점의 선형변화를 이용함으로써 데이터의 추세성을 완전히 반영할 수 없는 구조였다. 예를 들어 데이터의 추세성이 초기에는 완만히 증가하고 후기에 급속히 증가하는 구조이거나 이와 반대인 구조라면, 위와 같은 방법으로는 추세성의 변화 특성을 충분히 반영할 수 없게 된다. 또한, 기존 연구에 사용된 T1TSK 퍼지논리 모델은 여러 연구에서 증명되었듯이(11-12) 데이터에 내포된 불확실성을 충분히 기술할 수 없어 예측 성능의 개선에 제한적 요소가 되었다. 이는 비록 정규화 과정을 통해 데이터의 추세성은 어느 정도 완화되었다 하더라도 데이터 차체의 피크 변화량 등에서 야기되는 불확실성과 같은 특성들은 추세차분만으로는 완화되지 못하기 때문이다. 따라서 본 논문에서는 기존 연구에서 나타난 문제점을 개선하여 더욱 정확한 예측을 수행할 수 있는 예측시스템의 설계법을 다룬다.

먼저, 데이터의 전처리 과정에서는 시스템 설계 또는 파라미터 추정에 요구되는 데이터의 정보량을 증가하기 위해 기존 연구와 같이 선형보간법을 적용한다. 다음으로 1차 추세 차분과정의 문제점을 개선하기 위해 본 논문에서는 2차 추세차분 방법을 제안한다. 제안된 방법은 원형의 학습데이터를 상반기와 하반기 두 개의 데이터군으로 분할하고, 상반기 데이터군의 추세성을 분석하여 1차 추세 차분데이터를 생성한다. 다음으로 1차 추세 차분된 데이터의 하반기 추세성을 분석하여 2차 추세 차분데이터를 생성하고 이를 시스템 학습에 요구되는 입력데이터로 사용한다. 이러한 방법은 예측과정 후 데이터 역변환 과정에서 먼저 하반기(예측 시점에 가까운)의 추세성을 반영할 수 있도록 하여 최근의 데이터 경향이 고려될 수 있도록 하며, 이후 다시 상반기 추세성에 따른 역변환 과정을 거쳐 전체적인 데이터의 추세성이 반영될 수 있도록 한 구조이다. 또한, T1TSK(Type-1 TSK) 퍼지논리모델의 불확실성에 대한 제한적 기술능력과 T2TSK(Type-2 TSK) 퍼지논리 모델의 추론 과정의 복잡성을 완화한 IT2TSK(Interval Type-2 TSK) 퍼지논리모델을 시스템 구축의 기본모델로 사용함으로써 피크 변화량에서 오는 불확실성을 취급할 수 있음과 동시에 설계의 복잡성도 완화될 수 있도록 하였다. 마지막으로 퍼지 규칙기반의 생성에 요구되는 입력데이터의 개수와 퍼지집합의 개수는 기존의 연구결과들과 시스템 설계 과정의 복잡성을 줄이기 위해 각각 3개 및 2개로 정의하여 사용함으로써 8개의 규칙기반으로도 우수한 예측을 수행할 수 있도록 하였다. 시뮬레이션에서는 선형적 추세성을 보이지만 피크 변화량이 심한 분기별 호주의 전력부하 데이터(AQEPL: Australian quarterly electric power load data)(13)와 하반기로 갈수록 급격한 증가 추세를 나타내는 대만의 총 전력부하 데이터(EPL in Taiwan)를 이용하여 예측을 수행하고 결과를 분석하여 제안된 시스템 설계방법의 효용성을 검증하였다(9,14,16).

2. 제안된 시스템의 구조

2.1 시스템 설계 개념

그림 1은 제안된 IT2TSK 퍼지 예측시스템(IT2TSK FPS: IT2TSK Fuzzy Prediction System)의 전체 설계 과정과 예측과정을 보여주는 흐름도이다.제안된 시스템은 크게 4개의 실행 절차를 가지고 있으며, 그림에서 1~3번 절차는 시스템의 설계 절차이며, 4번은 예측을 수행하는 절차를 의미한다. 먼저 1번 절차에서 선형보간(LERP: Linear interpolation) 과정은 원형의 전력부하데이터(EPL data: Electric power load data)에 적절한 개수의 보간데이터를 삽입하는 과정으로 시스템 설계 시 부족한 정보나 급변하는 추세성을 완화하기 위해 제안되었으며, 2차 추세차분(2nd order trend difference)과정은 전력부하데이터의 지속적 증감 추세에 대한 추세성을 완화하기 위한 것으로 학습데이터에 대해 상반기분의 추세성을 바탕으로 1차 차분 과정을 수행하고 이후 수행된 차분데이터의 하반기 추세성을 바탕으로 또 다시 차분을 수행하는 구조를 갖는다. 이러한 구조는 데이터의 지속적 추세성을 완화함과 동시에 예측을 수행한 후 원형으로 복원하는 과정에서 데이터의 추세성이 예측결과에 반영될 수 있도록 하기 위함이다. 다음, 두 번째 절차는 시스템 설계를 위해 전처리된 데이터를 학습데이터와 예측데이터를 분할하는 절차로 성능 비교를 위해 인용된 시스템의 조건과 동일한 조건으로 데이터를 분할하게 된다. 세 번째 절차는 학습데이터를 이용하여 IT2TSK 퍼지 규칙기반(IT2TSK FRB: Interval type-2 TSK fuzzy rule base)을 생성하는 과정으로 퍼지규칙을 생성하기 위한 퍼지분할 및 각 규칙의 후건부 파라미터 추정에는 각각 K-평균 군집화 과정(K-means clustering algorithm)과 최소자승법(LSM: Least square method)을 적용하였다. 마지막으로 네 번째 절차는 제안된 시스템의 예측결과를 얻는 과정으로 2단계 과정의 전체 데이터를 설계된 시스템의 입력으로 사용하여 IT2TSK 추론과정(IT2TSK inference process)을 통해 1차 예측결과를 얻고 이를 1단계 과정의 차분처리 전의 데이터 구조로 변환하기 위한 데이터 복원(Data restoration)처리와 선형보간으로 늘어난 데이터의 길이를 원형의 길이로 사상(Matching)하기 위한 데이터 추출(Data extraction) 과정으로 구성된 것을 보여준다.

그림. 1. 제안된 IT2TSK FPS의 전체 흐름도

Fig. 1. The flow-chart of the proposed IT2TSK FPS

../../Resources/kiee/KIEE.2020.69.8.1237/fig1.png

2.2 선형보간(LERP)

선형보간 방법은 시점과 시점 사이의 부족한 정보를 삽입하기 위해 선형추세를 이용하는 방법으로 구조가 간단한 특징을 보인다. 하지만 시점과 시점 사이에 삽입된 보간데이터의 개수가 충분하지 못하면 설계 의도와 다르게 시스템의 성능에 큰 영향을 미치지 못할뿐더러 너무 많은 보간데이터의 개수는 성능의 개선에 비해 부담스러운 연산량을 초래하게 된다. 선형보간에 따른 데이터의 길이는 식(1)과 같이 주어지며 식(1)에 따라, 70개의 원형데이터에 대하여 2개의 보간데이터를 삽입할 경우 총 데이터의 길이는 208개가 되고 5개의 보간데이터를 삽입할 경우 415개의 데이터로 그 수가 급증하게 된다. 물론 데이터의 수가 많으면 그만큼의 정보를 제공할 수 있어 시스템 설계에 이점이 있을 수 있으나 성능의 개선이 충분히 이루어지지 않는다면, 추가된 보간데이터는 연산량을 가중시키는 결과를 초래하게 된다. 이러한 문제에 대한 접근으로 논문 (9)에서는 보간데이터의 삽입 개수에 따른 데이터들에 대하여 자기상관함수를 이용한 상관계수를 탐색하고, 시점의 이동에 따른 이웃하는 상관계수의 변화량이 임계값($\alpha =0.05$) 이하가 될 때 그때의 보간 개수를 시스템 설계를 위한 보간 개수로 정의하여 사용하였으며, 비슷한 전력부하데이터의 구조일 경우 보간데이터의 삽입 수는 3개로 정의된다.

(1)
$Nt_{(L ERP)}=(N-1)\bullet a+N$

여기서 $Nt_{(L ERP)}$는 보간에 의해 늘어난 데이터의 총 길이이고 $N$은 원형의 데이터 길이, $a$는 보간데이터의 개수를 의미한다.

2.3 IT2TSK FLS(Interval Type-2 Fuzzy Logic System)

J. M. Mendel에 의해 제안된 IT2FLS(Interval type-2 fuzzy logic system)은 기존 T1FLS(Type-1 fuzzy logic system)의 데이터에 내재된 불확실성에 대한 제한적 표현과 T2FLS(Type-2 fuzzy logic system)의 소속함수 추론 과정에서 오는 복잡성을 개선한 구조로 IT2FLS에 TSK 모델을 결합한 IT2TSK 퍼지논리시스템의 $r$번째 규칙은 식(2)와 같이 정의된다(11).

(2)
$$\begin{aligned} &R^{r}: \text { If } x_{1}^{r} \text { is } \tilde{F}_{1}^{r} \text { and } x_{2} \text { is } \tilde{F}_{2}^{r} \text { and } \cdots \text { and } x_{k} \text { is } \tilde{F}_{k}^{r}\\ &\text { Then } Y_{T S K, 2}^{r}(\mathrm{d})=\sum_{k=0}^{n} P_{k}^{r} x_{k}^{r}\\ &\text { where } x_{0}^{r}=1 \text { and } P_{k}^{r}=\left[p_{k}^{r}-s_{k}^{r}, p_{k}^{r}+s_{k}^{r}\right] \end{aligned}$$

여기서 $R^{r}$는 $r$번째 IT2TSK 퍼지규칙, $x$는 $r$번째 규칙을 만족하는 입력데이터, $\widetilde F$는 $x$를 포함하고 있는 IT2 퍼지집합을 의미한다. 또한, $P$는 규칙 후건부의 추정되어야 할 모수들을 의미하고 $p$는 그 추정 모수의 평균(중심)을 의미한다. 마지막으로 $s$는 $P$의 폭을 의미한다.

3. 안된 IT2TSK FPS 설계

3.1 데이터 전처리

데이터의 전처리 과정은 그림 1의 첫 번째 절차로 선형보간 과정과 2차 추세차분 과정으로 구성된다.

3.1.1 LERP

원형의 전력부하 데이터에 삽입될 시점 간 보간데이터의 개수는 논문 (9)에서 연구된 결과를 이용하여 본 논문에서도 3개로 정의하여 사용한다. 따라서 $N$개의 원형의 전력부하 데이터에 대하여 $t$시점에서 원형의 전력부하 데이터를 $x_{t}$라 하고 $t$시점과 $t+1$시점에 삽입되는 보간데이터를 $ix_{t}^{j=[1,\:2,\:3]}$라고 하면 선형보간에 의해 표현되는 전체 데이터는 다음과 같으며

(3)
$L ERP=[x_{1}ix_{1}^{j}x_{2}ix_{2}^{j}\cdots x_{t}ix_{t}^{j}x_{t+1}\cdots x_{N-1}ix_{N-1}^{j}x_{N}]$

여기서 $L ERP$는 보간데이터가 삽입된 전력부하 데이터를 의미하고 $ix_{t}^{j}=[ix_{t}^{1}ix_{t}^{2}ix_{t}^{3}]$을 의미하며 각각 다음과 같이 정의된다.

(4)
\begin{align*} ix_{t}^{1}=\dfrac{x_{t}+(\dfrac{x_{t}+x_{t+1}}{2})}{2}=mean[x_{t},\: mean[x_{t},\: x_{t+1}]]\\ ix_{t}^{2}=\dfrac{x_{t}+x_{t+1}}{2}=mean[x_{t},\: x_{t+1}]\\ ix_{t}^{3}=\dfrac{(\dfrac{x_{t}+x_{t+1}}{2})+x_{t+1}}{2}=mean[mean[x_{t},\: x_{t+1}],\: x_{t+1}] \end{align*}

결국 선형보간데이터는 본 논문에서 시점 간 원형데이터에 대한 균등 분할 값을 나타낸다. 또한, 식(4)에 의해 모든 보간데이터가 정의되면 $L ERP$ 데이터는 다음과 같이 표현될 수 있다.

(5)
\begin{align*} L ERP=[x_{1},\: ix_{1}^{1},\: ix_{1}^{2},\: ix_{1}^{3},\:x_{2},\: ix_{2}^{1},\:\cdots ,\: \\ x_{t},\: ix_{t}^{1},\: ix_{t}^{2},\: ix_{t}^{3},\: x_{t+1},\:\cdots x_{N-1},\: ix_{N-1}^{1},\: ix_{N-1}^{2},\: ix_{N-1}^{3},\: x_{N}] \end{align*}

식(5)의 데이터 구조를 단일한 구조로 치환 적용하면 식(6)과 같이 표현할 수 있게 된다.

(6)
$$\begin{array}{r} X l=\left[x l_{1}, x l_{2}, x l_{3}, \cdots x l_{t t}, x l_{t t+1}, \cdots x l_{N t}\right] \\ \text { where } N=(N-1) \times 3+N \end{array}$$

3.1.2 2차 추세차분 데이터의 생성

일반적으로 전력부하 데이터의 특성은 산업의 발달과 인구의 증가 및 기후적 영향 속에 지속적인 증가 추세를 나타내고 피크값의 변동폭 또한 점점 더 커지는 경향을 나타낸다. 이러한 전력부하 데이터의 구조는 퍼지예측시스템의 설계에 부정적 영향을 미칠 수 있다. 왜냐하면, 시스템 설계과정에 사용된 학습데이터의 경우 현시점의 예측데이터에 비해 크기가 작고 증감 추세 역시 작은 구조로 예측을 수행해야 할 데이터는 이 학습 데이터의 범위를 완전히 벗어날 수 있다. 결국, 이러한 데이터 구조는 시스템 설계과정에서 생성된 규칙기반이나 추정된 파라미터의 부정확성을 증가시켜 예측의 성능을 저해하게 된다. 역으로 말해 예측과정의 모든 데이터의 범위가 학습 과정에서 생성된 퍼지규칙이나 추정된 파라미터가 취급 가능한 범위 내에 존재한다면, 이는 보다 정교한 예측이 가능함을 의미할 수 있다. 이러한 관점에서 논문 (9)에서는 1차 추세차분을 이용하여 데이터의 정규화를 취함으로써 극복하려 하였으며 좋은 예측결과 역시 도출할 수 있었다. 하지만 논문 (9)에서 취한 1차 추세차분의 경우 단지 학습데이터의 최댓값과 최솟값을 이용한 추세선을 이용하여 차분데이터를 생성함으로써 어느 정도 추세성이 완화된 데이터를 얻을 수는 있었지만 실 예측과정에서 추세의 역변환 시 이 또한 평균적 추세성 밖에 반영할 수 없는 구조로 그 한계점이 존재했다. 따라서 본 논문에서는 학습데이터에 대한 초기 상반기 추세성을 이용하여 1차 추세차분 데이터를 생성하고 생성된 데이터의 하반기 추세성을 분석하여 2차 추세차분을 수행함으로써 예측을 수행한 후 역변환 과정에서 원형의 데이터에 내재된 추세성을 좀 더 정교하게 수용할 수 있도록 하였다.

먼저 1차 추세차분 데이터를 생성하기 위한 1차 추세성은 다음과 같이 분석된다.

(7)
\begin{align*} TL_{1}=[\dfrac{mean(Xl[fix(\dfrac{l_{tra\in\in g}}{2})-10:fix(\dfrac{l_{tra\in\in g}}{2})+10])}{fix(l_{tra\in\in g}/2)}\\ -\dfrac{mean(Xl[1:20])}{fix(l_{tra\in\in g}/2)}]\times\dfrac{t}{4} \end{align*}

여기서 $Xl$은 식(6)의 데이터를 의미하고 $l_{tra\in\in g}$은 학습데이터의 길이를 의미한다. 또한 $fix$함수는 소수점 이하 절삭을 의미하고 $t/4$는 데이터 길이와 추세선의 길이를 사상하기 위한 시간 변수로 주어진다.

식(7)은 학습데이터 중에서 중반기 20개의 데이터에 대한 평균과 상반기 20개의 데이터에 대한 평균을 이용하여 선형 추세선을 만드는 것을 의미한다. 따라서 첫 번째 추세 차분데이터는 다음과 같이 생성된다.

(8)
$FX=Xl-TL_{1}$

여기서 $FX$는 1차 추세 차분데이터를 의미하며, $Xl$은 식(6)의 보간형 전력부하데이터, $TL_{1}$는 1차 추세선을 의미한다.

다음으로 식(8)로 생성된 1차 추세 차분데이터를 이용하여 2차 추세 차분성을 분석하면 다음과 같다.

(9)
\begin{align*} TL_{2}=[\dfrac{mean(FX[l_{tra\in\in g}-20:l_{tra\in\in g}])}{fix(l_{tra\in\in g}/2)}\\ -\dfrac{mean(FX[fix(\dfrac{l_{tra\in\in g}}{2})-10:fix(\dfrac{l_{tra\in\in g}}{2})+10]))}{fix(l_{tra\in\in g}/2)}]\times\dfrac{t}{4} \end{align*}

식(9)는 1차 추세차분데 데이터에 대하여 학습구간의 하반기 20개의 데이터에 대한 평균과 중반기 20개의 데이터에 대한 평균을 이용하여 2차 추세선을 만드는 것을 의미하고, 따라서 시스템 설계에 사용될 최종 추세 차분데이터 $TX$는 다음과 같이 생성된다.

(10)
$TX=FX-TL_{2}$

3.2 IT2TSK FRB의 설계

IT2TSK 퍼지 규칙기반을 구성하는 일반화된 규칙은 식(2)와 같이 주어진다. 따라서 퍼지 규칙기반을 생성하기 위해선 식(2)의 전건부 언어적 규칙기반 생성을 위한 퍼지분할과 후건부 선형회귀식의 국부출력을 얻기 위한 파라미터 추정이 요구된다. 이때 규칙 생성에 요구되는 입력데이터의 개수와 퍼지분할에 사용되는 퍼지집합의 개수는 퍼지규칙기반을 구성하는 총 규칙의 수와 관계되며, 입력데이터 개수 및 퍼지집합의 개수가 많으면 더 많은 규칙 생성이 가능하지만 각 규칙의 추론 및 식별을 위해 적용되는 입력데이터의 수가 그만큼 적어지므로 규칙의 포용성이 떨어질 수 있다. 이는 규칙의 후건부 파라미터 추정에 요구되는 입력데이터의 결핍으로 추정된 파라미터의 부정확성을 초래하여 예측의 성능을 저하하는 결과로 나타난다. 일반적으로 회귀모형의 입력변수로 3개의 입력데이터를 많이 사용하고 있으며, 기존 논문에서도 3개의 입력데이터와 2개의 퍼지집합을 사용하여 최소한의 규칙기반으로 좋은 예측성능을 검증하였기에, 본 논문에서도 3개의 입력데이터와 2개의 퍼지집합을 사용하여 시스템을 설계하고 예측을 수행하게 된다.

따라서 식(2)의 IT2TSK FLS의 $r$번째 규칙은 다음과 같이 수정 적용된다.

(11)
$$\begin{aligned} &R^{r}: \text { If } d_{1} \text { is } \tilde{F}_{1}^{r, c=[1,2]} \text { and } d_{2} \text { is } \tilde{F}_{2}^{r, c=[1,2]} \text { and } d_{3} \text { is } \tilde{F}_{3}^{r, c=[1,2]}\\ &\text { Then } Y_{T S K, 2}^{r}(\mathrm{d})=\sum_{k=0}^{3} P_{k}^{r} d_{k}^{r}\\ &\text { where } d_{0}^{r}=1 \text { and } P_{k}^{r}=\left[p_{k}^{r}-s_{k}^{r}, p_{k}^{r}+s_{k}^{r}\right] \end{aligned}$$

여기서 입력데이터를 3개의 입력데이터 행렬과 1개의 출력벡터로 표현하면 식(12)와 같이 표현할 수 있으며

(12)
$$D=\left[\begin{array}{ccc} t x_{1} & t x_{2} & t x_{3} \\ t x_{2} & t x_{3} & t x_{4} \\ \vdots & \vdots & \vdots \\ t x_{t r a i n i n g-3} t x_{t r a i n i g-2} t x_{t r a i n i n g-1} & \vdots & \\ \vdots & \vdots & \vdots \\ t x_{N t-3} & t x_{N t-2} & t x_{N t-1} \end{array}\right], \quad Y=\left[\begin{array}{c} t x_{4} \\ t x_{5} \\ \vdots \\ t x_{t r a i n i n g} \\ \vdots \\ t x_{N t} \end{array}\right]$$

식(11)의 $d_{1}$는 식(12)의 $D$의 1열 데이터 중에 $r$번째 규칙을 만족한 데이터들을 의미하고 $d_{2}$와 $d_{3}$는 그때의 2열과 3열의 데이터들을 의미하는 것으로 입력데이터쌍 들을 나타낸다. 또한, 식(11)의 $Y_{TSK,\:2}$는 이 입력데이터쌍들의 국부 출력값들로부터 추론을 통해 얻어지는 IT2TSK FLS의 출력으로 입력데이터쌍에 상응하는 식(12)의 $Y$값들을 이용하여 추론된다. 마지막으로 $\widetilde F_{1}^{r,\:c=[1,\:2]}$는 $d_{1}$입력데이터가 만족한 2개의 IT2 퍼지집합 중 하나를 의미한다.

식(12)에서 $tx_{tra\in\in g}$ 데이터(학습용 데이터)까지만 시스템 설계용으로 사용되고 나머지 데이터는 검증데이터로 사용된다. 또한, 식(11)에서 보이듯 규칙기반 생성을 위해선 2개의 퍼지분할 과정과 파라미터 추정과정이 요구된다.

3.2.1 IT2 퍼지집합의 설계

그림 2는 제안된 퍼지 예측시스템의 규칙기반을 위해 사용한 $k$번째 입력공간에 대한 IT2 퍼지집합의 모양을 보여준다.

그림. 2. 제안된 시스템 설계에 사용된 IT2 퍼지집합

Fig. 2. The IT2 fuzzy sets used in the proposed system

../../Resources/kiee/KIEE.2020.69.8.1237/fig2.png

IT2 퍼지집합은 퍼지집합의 중심 $z_{k}$와 불확실성을 나타내는 FOU(Foot print of uncertainty)를 이용해 그림 2에서처럼 상한소속함수(UMF: Upper Membership Function)와 하한소속함수(LMF: Lower Membership Function)(11)로 표현할 수 있다. 이때 데이터의 불확실성을 반영하기 위한 FOU는 표준편차($\sigma$: standard deviation)의 개념을 이용하여 정의할 수 있다.

(13)
$\sigma_{1}=\dfrac{1}{2}\sqrt{\dfrac{1}{ns-1}\sum_{i=1}^{ns}(m_{k}(i)-z_{k}^{1})^{2}}$

(14)
$\sigma_{2}=\dfrac{1}{2}\sqrt{\dfrac{1}{ns-1}\sum_{i=1}^{ns}(m_{k}(i)-z_{k}^{2})^{2}}$

여기서 $m_{k}(i)$는 각 퍼지집합의 중심 $z_{k}^{1}$과 $z_{k}^{2}$사이에 위치된 데이터들을 의미하고, $ns$는 이 데이터들의 개수이다.

따라서 데이터의 분포 상태에 따라 좌·우의 FOU는 서로 다른 형태로 나타난다. 이러한 IT2 퍼지집합의 동조 과정은 구조가 단순하면서도 성능이 양호한 K-평균 알고리즘을 통해 수행되며, FOU 또한 중심의 갱신에 따라 동조되게 된다. 이러한 동조 과정을 거쳐 IT2 퍼지집합이 생성되면, 입력 데이터 $d_{k}$들이 IT2 퍼지집합을 만족하는 소속정도(degree of membership)는 다음과 같이 정의되며

(15)
$\mathrm{IF}$ $$ \begin{array}{lll} d_{k} \leq z_{k}^{1} & \text { or } & d_{k} \geq z_{k}^{2} \\ \bar{\mu}_{L}\left(d_{k}\right)=1 & \text { or } & \bar{\mu}_{R}\left(d_{k}\right)=1 \\ \mu_{L}\left(d_{k}\right)=1 & \text { or } & \mu_{R}\left(d_{k}\right)=1 \end{array} $$ elseif $z_{k}^{1}<d_{k}<\left(z_{k}^{1}+\sigma_{k}^{1}\right)$ or $\left(z_{k}^{2}-\sigma_{k}^{2}\right)<d_{k}<z_{k}^{2}$ $$ \underline{\mu}_{R}\left(d_{k}\right)=0 $$ $$ \text { or } \quad \underline{\mu}_{L}\left(d_{k}\right)=0 $$ else $$ \begin{array}{l} \bar{\mu}_{L}\left(d_{k}\right)=\frac{\left(z_{k}^{2}+\sigma_{k}^{2}\right)-d_{k}}{\left(z_{k}^{2}+\sigma_{k}^{2}\right)-z_{k}^{1}}, \underline{\mu}_{L}\left(d_{k}\right)=\frac{\left(z_{k}^{2}-\sigma_{k}^{2}\right)-d_{k}}{\left(z_{k}^{2}-\sigma_{k}^{2}\right)-z_{k}^{1}} \\ \bar{\mu}_{R}\left(d_{k}\right)=\frac{d_{k}-\left(z_{k}^{1}-\sigma_{k}^{1}\right)}{z_{k}^{2}-\left(z_{k}^{1}-\sigma_{k}^{1}\right)}, \underline{\mu}_{L}\left(d_{k}\right)=\frac{d_{k}-\left(z_{k}^{1}+\sigma_{k}^{1}\right)}{z_{k}^{2}-\left(z_{k}^{1}+\sigma_{k}^{1}\right)} \end{array} $$

여기서 $\mu_{L}$은 입력 데이터가 첫 번째(그림 2에서 왼쪽의 퍼지집합) 퍼지집합을 만족하는 소속 정도를 의미하고 $\mu_{R}$은 두 번째 퍼지집합(그림 2에서 오른쪽의 퍼지집합)을 만족하는 소속 정도를 의미한다. 또한, $\bar{\mu}$는 상한소속 값, $\underline\mu$은 하한 소속값을 의미한다.

3.2.2 파라미터 식별

식(11)의 IT2TSK 퍼지규칙의 후건부에서 추정되어야 할 모수 $p^{r}$(3입력 회귀모형이므로 $p^{r}=[p_{0}^{r},\: p_{1}^{r},\:p_{2}^{r},\: p_{3}^{r}]$)는 그림 2의 FOU가 0이면 정확히 T1 퍼지집합과 일치하므로 T1TSK(Type-1 TSK) 퍼지논리시스템의 파라미터 추정에 빈번히 사용되는 LSM(least square method)로 쉽게 추정할 수 있다. 따라서 $r$번째 퍼지규칙을 만족하는 입력데이터쌍의 개수가 $q$개라면 T1TSK 모델의 후건부 회귀모형은 다음처럼 표현할 수 있으며

(16)
\begin{align*} y^{r}(1)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(1)+p_{2}^{r}d_{2}^{r}(1)+p_{3}^{r}d_{3}^{r}(1)\\ \vdots\vdots\vdots\vdots\vdots \\ y^{r}(i)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(i)+p_{2}^{r}d_{2}^{r}(i)+p_{3}^{r}d_{3}^{r}(i)\\ \vdots\vdots\vdots\vdots\vdots \\ y^{r}(q)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(q)+p_{2}^{r}d_{2}^{r}(q)+p_{3}^{r}d_{3}^{r}(q) \end{align*}

여기서 $y^{r}$은 식(12)의 출력 열벡터 값 중에 입력데이터쌍에 상응하는 값들로 정의되며, 식(16)의 행렬식은

(17)
\begin{align*} \left[\begin{aligned}\begin{aligned}\begin{aligned}\begin{aligned}y^{r}(1)\\\vdots\end{aligned}\\y^{r}(i)\end{aligned}\\\vdots\end{aligned}\\y^{r}(q)\end{aligned}\right]=\left[\begin{aligned}\begin{aligned}\begin{aligned}\begin{aligned}1 d_{1}^{r}(1)d_{2}^{r}(1)d_{3}^{r}(1)\\\vdots\vdots\vdots\end{aligned}\\1 d_{1}^{r}(i)d_{2}^{r}(i)d_{3}^{r}(i)\end{aligned}\\\vdots\vdots\vdots\end{aligned}\\1 d_{1}^{r}(q)d_{2}^{r}(q)d_{3}^{r}(q)\end{aligned}\right]\left[\begin{aligned}p_{0}^{r}\\\begin{aligned}p_{1}^{r}\\\begin{aligned}p_{2}^{r}\\p_{3}^{r}\end{aligned}\end{aligned}\end{aligned}\right] \end{align*}

(18)
$Y^{r}=D^{r}P^{r}$

와 같이 표현될 수 있다. 따라서 파라미터 $P^{r}$은 다음과 같이 LSM에 의해 추정할 수 있으며

(19)
$\hat P^{r}=[" "D^{r}" "^{T}D^{r}]^{-1}D^{r}Y^{r}$

이 추정된 파라미터들은 식(20)을 최소화하게 된다.

(20)
$E^{r}=(Y^{r}-D^{r}\hat P^{r})^{T}(Y^{r}-D^{r}\hat P^{r})$

4. 시스템 출력

제안된 시스템의 최종 출력을 얻기 위해선 먼저 IT2TSK 퍼지모델의 출력을 얻어야 하고 이를 다시 추세차분에 상응하는 역변환을 수행해야 한다. 마지막으로 선형보간에 의해 늘어난 데이터에서 원형의 데이터에 상응하는 예측데이터를 추출해야 한다.

4.1 Type-Reduction

식(19)에 의해 추정된 파라미터 $\hat p^{r}$을 이용하여 식(16)에 대입하게 되면 국부 출력 $\hat y^{r}$는 T1TSK 퍼지모델의 국부출력 값을 의미한다. 이러한 파라미터는 앞서 기술되었듯이 FOU를 0으로 하여 T1TSK 형태로 추정한 결과이다. 따라서 FOU를 반영한 추론 결과를 얻기 위해선 규칙기반의 전건부 UMF와 LMF를 이용한 추론 처리가 요구되며 그림 3은 이를 보여준다.

그림. 3. T1과 IT2 퍼지집합의 추론 과정

Fig. 3. Comparison of fuzzy inference process between T1 and IT2 fuzzy sets

../../Resources/kiee/KIEE.2020.69.8.1237/fig3.png

그림에서 T-norm은 퍼지추론 연산자로 본 논문에서는 minimum 연산자를 이용하였으며, 그림에서 보이듯 IT2 퍼지집합의 추론 과정을 거치게 되면, $r$번째 규칙의 국부 출력 $\hat Y_{TSK,\:2}^{r}($d$)$는 식(21), (22)와 같이 하한 국부출력 $\hat Y_{TSK,\:1}^{r(L)}$와 상한 국부출력 $\hat Y_{TSK,\:1}^{r(U)}$으로 정의되는 구간집합(interval set)으로 표현된다. (11).

(21)
$$\hat{Y}_{T S K, 1}^{r(L)}=\sum_{k=0}^{3} \hat{p}_{k}^{r} d_{k}^{r}-\sum_{k=0}^{3}\left|d_{k}^{r}\right| s_{k}^{r} \text { where } d_{0}^{r}=1$$

(22)
$\hat Y_{TSK,\:1}^{r(U)}=\sum_{k=0}^{3}\hat p_{k}^{r}d_{k}^{r}+\sum_{k=0}^{3}\left | d_{k}^{r}\right | s_{k}^{r}\text { where }d_{0}^{r}=1$

만약 입력데이터가 $M$개의 퍼지 규칙을 만족하였다면 이러한 구간집합 또한 $M$개로 나타날 것이다. 그림 4식(21)(22)의 구간집합에 대한 개념과 IT2TSK 퍼지추론의 최종 결과를 얻는 과정을 보여준다.

그림 4에서의 상한 국부 출력과 하한 국부 출력에 대한 추론 과정을 수식적으로 표현하면 다음과 같이 표현할 수 있으며

(23)
\begin{align*} \hat Y_{TSK,\:1}^{(l)}=\dfrac{\sum_{r=1}^{M}\underline f^{r}y^{r}}{\sum_{r=1}^{M}\underline f^{r}}=\dfrac{\sum_{r=1}^{M}\underline f^{r}(\hat p_{0}^{r}+\hat p_{1}^{r}d_{1}+\hat p_{2}^{r}d_{2}+\hat p_{3}^{r}d_{3})}{\sum_{r=1}^{M}\underline f^{r}}\\ \text { where }\underline f^{r}=\min[\underline\mu^{r}(d_{1})\underline\mu^{r}(d_{2})\underline\mu^{r}(d_{3})] \end{align*}

(24)
\begin{align*} \hat Y_{TSK,\:1}^{(u)}=\dfrac{\sum_{r=1}^{M}\bar{f}^{r}y^{r}}{\sum_{r=1}^{M}\bar{f}^{r}}=\dfrac{\sum_{r=1}^{M}\bar{f}^{r}(\hat p_{0}^{r}+\hat p_{1}^{r}d_{1}+\hat p_{2}^{r}d_{2}+\hat p_{3}^{r}d_{3})}{\sum_{r=1}^{M}\bar{f}^{r}}\\ where\bar{f}^{r}=\min[\bar{\mu}^{r}(d_{1})\bar{\mu}^{r}(d_{2})\bar{\mu}^{r}(d_{3})] \end{align*}

여기서 $\hat Y_{TSK,\:1}^{(l)}$은 LMF에 의해서 연산되는 하한 출력값을 의미하고, $\hat Y_{TSK,\:1}^{(u)}$은 UMF에 의해서 연산되는 상한 출력값을 의미한다. 또한, $M$은 하나의 입력데이터쌍이 만족하는 퍼지규칙 수를 의미한다.

그림. 4. 구간 집합 추론 개념

Fig. 4. Inference concept for the interval set

../../Resources/kiee/KIEE.2020.69.8.1237/fig4.png

그림 4에서 보이듯 IT2TSK 퍼지추론의 최종결과는 상한 국부 출력과 하한 국부 출력으로 정의되는 구간집합들의 최소 가중무게 평균과 최대 가중무게 평균을 구함으로써 얻을 수 있으며 식(25)(26)은 각각 최소 가중무게평균과 최대 가중무게 평균을 얻는 방법을 나타낸다.

(25)
$\hat Y_{TSK,\:1}^{L}=\dfrac{\sum_{r=1}^{L}\hat Y_{TSK,\:1}^{r(u)}+\sum_{r=L+1}^{M}\hat Y_{TSK,\:1}^{r(l)}}{\sum_{r=1}^{L}\bar{f}^{r}+\sum_{r=L+1}^{M}\underline f^{r}}$

(26)
$\hat Y_{TSK,\:1}^{U}=\dfrac{\sum_{r=1}^{U}\hat Y_{TSK,\:1}^{r(l)}+\sum_{r=U+1}^{M}\hat Y_{TSK,\:1}^{r(u)}}{\sum_{r=1}^{U}\underline f^{r}+\sum_{r=U+1}^{M}\bar{f}^{r}}$

여기서 $L$과 $U$는 그림 4에서 보이듯 무게 중심의 변동점(switch point)으로, Karnik-Mendel 알고리즘(11,15)을 이용하여 쉽게 유도될 수 있다.

마지막으로 IT2TSK 퍼지모델의 전체 출력은 두 무게중심을 이용하여 다음과 같이 얻을 수 있다.

(27)
$\hat Y_{TSK,\:2}($d$)=(\hat Y_{TSK,\:1}^{L}+\hat Y_{TSK,\:1}^{U})/2$

여기서 $\hat Y_{TSK,\:2}($d$)$는 하나의 입력데이터쌍이 만족한 $M$개의 규칙을 추론한 입력쌍에 상응하는 IT2TSK 퍼지모델의 예측 출력을 의미한다.

4.2 데이터의 역변환 및 복원

위와 같이 IT2TSK 퍼지모델의 출력을 얻게 되면, 이 출력값은 그림 1에서 첫 번째 절차를 거친 데이터이므로 상응하는 4의 변환절차가 필요하게 된다. 다시 말해 원형의 선형보간데이터는 식(6)의 $Xl$을 의미하고 현재의 출력값은 식(10)의 $TX$에 상응하는 예측값들을 의미하므로 역변환 과정이 요구된다. 따라서 역변환 과정은 1,2 차 추세선을 이용하여 다음과 같이 표현될 수 있으며

(28)
$\hat X l=\hat T X+TL_{1}+TL_{2}$

식(28)에 의해 역변환 데이터는 선형 보간형 데이터이므로 원형의 전력부하 데이터에 상응하는 예측결과, 즉 시스템의 최종 예측결과를 얻기 위해선 다음과 같이 예측된 데이터를 원형의 시점으로 사상시키는 것이 필요하다.

(29)
$\hat x_{t}=\hat x l_{(\dfrac{tt-1}{4}+1)}where tt=[1:3(N-1)+N]$

여기서 $tt$는 식(6)의 추출과정 이전의 데이터 길이 이고, $\hat x_{t}$는 원형의 시점에 해당하는 전력부하의 예측값을 의미한다.

5. 시뮬레이션

제안된 시스템의 성능을 검증하기 위해 2개의 전력부하 데이터를 사용하였으며, 데이터의 분할(학습데이터, 검증데이터)길이는 다른 연구 논문들에서 분할한 방법과 동일한 크기로 분할하여 시스템을 설계하고 검증하였다.

Case 1) AQEPL(Australian quarterly electric power load)

첫 번째 시뮬레이션 데이터는 호주의 분기별 전력부하 데이터(1956. 3~1994.9)(13)로 총 155개의 데이터로 구성되어 있으며, 이 중 시스템 학습(설계)을 위해 70개의 데이터를 사용하고 나머지를 검증(예측)데이터로 사용하였다. 그림 5는 선형보간처리가 된 호주의 분기별 전력부하데이터와 1차($TL_{1}$) 및 2차($TL_{2}$) 추세선의 모양, 그리고 각 추세차분이 이루어진 전력부하 데이터의 모양을 보여준다.

그림 5에서 검은색은 원형의 선형보간 전력부하데이터를 나타내고 붉은색 점선은 1차 추세선, 붉은색 실선은 1차 추세차분선과 원형의 선형보간 전력부하데이터에 의해 생성된 1차 추세 차분데이터를 나타낸다. 원형의 전력부하데이터에 비해 추세성이 완화된 것을 볼 수 있다. 또한, 파란색 점선은 1차 추세차분 데이터에 대한 2차 추세선을 나타내며, 파란색 실선은 2차 추세차분 데이터로 원형에 비해 추세성이 상당히 경감되었음을 알 수 있다. 이러한 추세성의 제거는 퍼지 규칙기반의 편중 현상을 억제할 수 있으므로 퍼지 추론과정에서 규칙 활용의 효율성을 높여 좋은 예측성능을 이끌어 낼 수 있게 된다. 그림 6은 호주 전력부하 데이터에 대한 K-평균 군집화 모양과 이 중심을 이용한 첫 번째 입력공간(식(12)의 1열 데이터) 데이터에 대한 IT2 퍼지집합의 모양을 보여준다.

그림. 5. AQEPL 데이터의 추세 차분 모양

Fig. 5. Trend difference forms of AQEPL data

../../Resources/kiee/KIEE.2020.69.8.1237/fig5.png

그림. 6. K-평균 군집화 및 IT2 퍼지집합 생성 결과

Fig. 6. Forms of IT2 fuzzy set and K-means clustering algorithm

../../Resources/kiee/KIEE.2020.69.8.1237/fig6.png

세 개의 입력공간 데이터를 이용하여 K-평균 군집화를 수행한 결과 8회 반복 수행 후 수렴하였으며, 그림 6의 좌측은 두 개의 군집에 포함된 데이터의 모양을 보여준다. 또한, K-평균 군집화 과정으로 탐색된 군집의 중심을 이용하여 첫 번째 입력공간 데이터를 위한 IT2 퍼지집합을 생성한 결과 우측의 형태로 구현되었으며, 역시 8회의 동조 과정을 거침을 보여준다. 그림 7은 제안된 IT2TSK 퍼지 예측시스템의 예측결과들을 보여준다. 그림 7의 좌측은 2차 추세 차분데이터에 대한 예측 결과이며 우측의 그림은 제안된 시스템의 최종 예측결과를 보여준다. 또한, 각 그림에서 붉은색은 원형의 데이터를 의미하고, 파란색은 예측결과, 검은 점선은 학습과 예측의 경계를 나타낸다. 먼저 그림 7의 좌·우 결과를 비교해 보면 우측의 데이터 변화량은 대략 0.3에서 4.5(단위 생략) 정도의 변화량을 보이지만 좌측의 2차 추세 차분데이터의 경우는 –0.1에서 1.2 정도의 변화량으로 추세성이 상당히 완화되었음을 알 수 있다. 이는 그림 5에서도 명확히 드러나는 결과이다. 또한, 두 그림 모두에서 붉은색 선과 파란색 선이 거의 중복되어 있으므로 제안된 예측시스템이 학습구간이나 검증구간 모두에서 원형의 전력부하 데이터를 우수하게 예측하고 있음을 알 수 있다. 제안된 예측시스템의 보다 명확한 성능분석을 위해 성능지표 MAPE(Mean absolute percentage error)를 이용하여 표 1에 비교하였다(9,14).

그림. 7. 추세차분데이터와 원형의 전력부하데이터에 대한 예측결과

Fig. 7. Prediction results for AQELP data and its trend difference data

../../Resources/kiee/KIEE.2020.69.8.1237/fig7.png

표 1. 제안된 예측시스템과 다른 예측시스템들의 성능 비교

Table 1. Performance comparison between the proposed prediction system with other systems

system

index

Fuzzy AR

Multi-Fuzzy

Model

GA-RS

Model

T1TSK

Difference

Fuzzy Model

MAPE(%)

3.125

2.1725

1.8100

1.7077

system

index

IT2TSK

Difference

Fuzzy Model

Normalized

Fuzzy Model

Proposed Model

T1TSK

Fuzzy Model

IT2TSK

Fuzzy Model

MAPE(%)

1.6585

0.6317

0.5190

0.5148

표 1의 기존의 연구 결과들을 살펴보면 유전알고리즘(GA: Genetic algorithm)과 러프셋(RS: Rough sets)을 이용한 시스템이 1.81%의 MAPE로 비교적 양호한 예측 결과를 보여주고 있다. 이후 시차에 따른 최적 차분데이터들을 이용한 다중모델 시스템에서는 IT2TSK 퍼지모델을 적용한 시스템이 T1TSK 퍼지모델을 적용한 경우보다 성능이 우수하였으며, 최근의 정규화 퍼지예측시스템의 경우는 제안된 시스템과 유사하게 보간데이터와 1차 추세 차분데이터를 이용함으로써 가장 좋은 예측성능을 보여준다. 마지막으로 제안된 시스템의 성능을 살펴보면 보간데이터와 2차 추세차분데이터를 이용함으로써 T1TSK 퍼지모델(FOU를 0으로 하였을 경우)이나 IT2TSK 퍼지모델을 이용한 경우 모두에서 기존 연구보다 우수한 예측성능을 보여주고 있으며, 특히 IT2TSK 퍼지모델을 적용한 예측결과가 T1TSK 퍼지모델을 적용한 결과보다 우수하게 나타났다. 따라서 이러한 결과들은 제안된 예측시스템의 설계 방법이 효과적임을 보여주는 결과라 할 수 있다.

Case 2) 대만 총 전력부하 데이터 (EPL data in Taiwan)

두 번째 시뮬레이션 전력부하 데이터는 대만의 총 전력부하 데이터(1945~2003)(16)로 수집된 59개의 데이터 중 50번째 데이터까지를 시스템 학습용으로 나머지를 검증용으로 적용하였다. 그림 8은 대만 전력부하 데이터와 1차($TL_{1}$) 및 2차($TL_{2}$) 추세선의 모양, 그리고 각 추세차분이 이루어진 전력부하 데이터의 모양을 보여준다.

그림. 8. 대만의 전력부하 데이터의 추세 차분 모양

Fig. 8. Trend difference forms of EPL data in Taiwan

../../Resources/kiee/KIEE.2020.69.8.1237/fig8.png

그림 8을 보면 대만의 전력부하 데이터(검은색 실선)는 후기로 갈수록 급격히 증가하는 특성을 보인다. 이러한 급격한 증가 추세는 퍼지 규칙의 편중 현상을 초래해 규칙기반 활용 효율을 저하해 예측의 정확성이 떨어지는 요인이 된다. 반면 2차 추세차분 데이터(파란색 실선)의 경우는 증가 추세성이 제거됐으며 또한 검증구간의 데이터 변화량 범위가 학습구간 변화량에 완전히 포함되는 결과를 보여주고 있다. 그림 9는 대만 전력부하 데이터에 대한 K-평균 군집화 결과와 이를 중심으로 IT2 퍼지집합을 생성한 결과를 보여준다.

그림. 9. K-평균 군집화 및 IT2 퍼지집합 생성 결과

Fig. 9. Forms of IT2 fuzzy set and K-means clustering algorithm

../../Resources/kiee/KIEE.2020.69.8.1237/fig9.png

그림. 10. 추세차분데이터와 원형의 전력부하데이터에 대한 예측결과

Fig. 10. Prediction results for ELP data in Taiwan and its trend difference data

../../Resources/kiee/KIEE.2020.69.8.1237/fig10.png

대만 전력부하 데이터에 대한 K-평균 군집화는 6회 반복 수행 후 수렴하였으며, IT2 퍼지집합의 생성과정도 6회의 반복 수행 후 수렴하였음을 알 수 있다. 그림 10은 대만 전력부하 데이터에 대한 제안된 IT2TSK 퍼지 예측시스템의 예측결과들을 보여준다. 그림 10의 좌측 그림은 추세차분데이터에 대한 예측결과를 의미하고 우측의 그림은 원형의 대만 전력부하 데이터에 대한 제안된 예측시스템의 최종 예측결과를 보여준다. 그림 10의 좌측 그림을 살펴보면 2차 추세차분과정을 통한 예측 구간 데이터의 변화량이 학습구간 데이터의 변화량에 완전히 포함되어 있음을 알 수 있으며, 이는 결국 시스템의 예측 정확성을 높이는 요소가 될 수 있다. 또한, 두 그림 모두에서 제안된 시스템의 예측결과(파란색 o)가 원형의 데이터(붉은색 *)를 매우 정확하게 예측함을 알 수 있다. 아래의 표 2는 제안된 예측시스템의 성능과 다른 예측시스템들(9,16)의 성능을 비교한 결과로 case1에서처럼 성능지표로 MAPE를 사용하였다.

표 2. 제안된 예측시스템과 다른 예측시스템들의 성능 비교

Table 2. Performance comparison between the proposed prediction system with other systems

system

index

ARIMA(2,2,1)

GRNN

SVMSA

T1TSK

Difference

Fuzzy Model

MAPE(%)

10.31

5.18

1.76

1.7092

system

index

IT2TSK

Difference

Fuzzy Model

Normalized

Fuzzy Model

Proposed Model

T1TSK

Fuzzy Model

IT2TSK

Fuzzy Model

MAPE(%)

1.5953

1.095

0.3218

0.2852

표 2의 ARIMA, GRNN 및 SVMSA 모델은 ANN을 기반으로 구현된 예측시스템으로 그 중 SVM을 적용한 경우 가장 좋은 예측성능을 보여줬다. 하지만 ANN의 경우에도 원형의 대만 전력부하 데이터가 가지는 후반기 급증하는 추세성으로 성능개선의 어려움을 가진다. 반면 퍼지모델을 적용한 나머지 시스템들의 경우에는 모델의 구현에 있어 시차에 따른 차분데이터나 추세성에 따른 차분데이터를 사용함으로써 학습범위를 초과하는 데이터를 적절히 취급 가능하게 하여 예측성능을 개선하였으며, 특히 제안된 예측시스템의 경우 2차 추세차분을 통해 급격한 증가 추세성의 완전한 제거를 통해 학습구간에서 생성된 퍼지규칙이나 추정된 파라미터가 실제 예측구간의 범위를 충분히 포용할 수 있어 기존의 연구들에 비해 매우 우수한 예측성능을 얻었음을 알 수 있다.

6. 결 론

본 논문은 지속적 또는 급격히 증가하는 전력부하 데이터를 보다 정확히 예측할 수 있는 예측시스템의 설계법을 다루었다. 예측시스템 설계를 위한 최적의 입력데이터를 생성하기 위해 데이터 전처리 과정에서 선형보간법과 2차 추세 차분법을 적용하였다. 이는 퍼지 예측시스템의 규칙기반 생성과정에서 시스템 학습에 요구되는 충분한 정보량을 제공함과 동시에 급격한 추세성에 따른 규칙 운영의 편중 현상을 완화하여 예측의 정확성을 높일 수 있도록 하기 위함이다. 또한, 시스템의 기본 모델로는 IT2TSK 퍼지 모델을 적용함으로써 데이터 변동에 따른 불확실성을 취급할 수 있도록 함과 동시에 T2TSK 퍼지 추론 과정의 복잡성을 완화할 수 있도록 하였다. 시뮬레이션 결과에서 비교적 선형 증가 추세에 피크 변화를 거듭하는 호주의 전력데이터의 경우 MAPE가 0.5148로 상당히 개선된 예측결과를 얻을 수 있었으며, 피크 변화는 거의 없지만 후기로 갈수록 급격히 증가하는 추세를 보이는 대만의 전력부하 데이터의 경우는 추세성이 거의 제거됨에 따라 MAPE가 0.2852로 타 시스템들에 비해 매우 우수한 예측결과를 얻었다. 결국, 이러한 결과들은 본 논문에서 제시된 시스템 설계 방법들이 지속적 증가 추세를 취급하는 퍼지 예측시스템의 성능개선에 매우 적합하게 동작할 수 있음을 보여준 결과로 간주할 수 있다. 또한, 제안된 전처리를 이용한 데이터 변환과정이 유사한 특성의 시계열 데이터에도 적용된다면 성능개선의 효과를 볼 수 있을 것으로 생각되지만, 시장 변동성이 포함된 시계열의 경우에는 적용 가능성에 대한 연구가 더 필요할 것으로 판단된다. 마지막으로 유전알고리즘과 같은 최적화 알고리즘을 이용하여 퍼지집합의 최적 개수를 결정할 수 있다면 제안된 시스템의 성능은 더욱 개선될 수 있을 것이며, 이러한 부분에 대한 추가 연구가 더 필요할 것으로 판단된다.

References

1 
J. F. Chen, W. M. Wang, C. M. Huang, 1995, Analysis of and adaptive time-series autoregressive moving-average (ARMA) model for short-term load forecasting, Electric Power Systems Research, Vol. 34, pp. 187-196DOI
2 
D. Ali, M. Yohanna, M. I, Puwu, B. M. Garkida, 2016, Long-term load forecast modelling using a fuzzy logic approach, Pacific Science Review A: Natural Science and Engineering, Vol. 18, pp. 123-127DOI
3 
J. H. Puiar, 2010, Fuzzy Ideology based Long Term Load Fore- casting, World Academy of Science, Engineering and Technology, Vol. 40, pp. 640-645Google Search
4 
M. Hayati, Y. Shirvany, 2007, Artificial Neural Network Approach for Short Term Load Forecasting for Illam Region, IJECSE, Vol. 1, No. no 2, pp. 121-125Google Search
5 
P. Mandal, T. Senjyu, T. Funabashi, 2006, Neural networks approach to forecast several hour ahead electricity prices and loads in deregulated market, Energy Conversion and Management, Vol. 47, No. 15-16, pp. 2128-2142DOI
6 
M. Tamimi, R. Egbert, 2000, Short term electric load fore- casting via fuzzy neural collaboration, Electric Power Systems Research, Vol. 56, pp. 234-248DOI
7 
B. J. Chen, M. W. Chang, C. J. Lin, 2004, Load forecasting using support vector machines: a study on EUNITE competition 2001, IEEE Trans. on Power Systems, Vol. 19, pp. 1821-1830DOI
8 
Y. R. Gahrooei, R. A. Hooshmand, 2019, Short Term Electricity Price Forecasting by Hybrid Mutual Information ANFIS-POS Approach, Computational Intelligence in Electrical Engineering, Vol. 10, pp. 63-72Google Search
9 
Y. K .Bang, C. H. Lee, H. Y. Park, 2018, Electricity Load Forecasting by using a Normalized Fuzzy System, JKIIS, Vol. 28, No. 1, pp. 57-64Google Search
10 
M. Jafari, H. Molaei, 2014, Spherical Linear Interpolation and Bezier Curves, General Scientific Researchs, Vol. 2, pp. 13-17Google Search
11 
J. M. Mendel, 2001, Uncertain Rule-based Fuzzy Logic System: Introduction and New Directions, Prentice-Hall, Upper Saddle River, Nj 07458DOI
12 
J. M. Mendel, 2004, Computing derivatives in interval type-2 fuzzy logic system, IEEE Trans. Fuzzy Syst., Vol. 23, pp. 84-98DOI
13 
Australian Bureau of Statistics. Cat. 8301.0.55.001.Google Search
14 
Y. K. Bang, C. H. Lee, 2011, Fuzzy Time Series Prediction using Hierarchical Clustering Algorithms, Expert Systems with Applications, Vol. 38, pp. 4312-4325DOI
15 
N. N. Karnik, J. M. Mendel, 2001, Centroid of a type-2 fuzzy set, Information Sciences., Vol. 132, pp. 195-220DOI
16 
P. F. Pai, W. C. Hong, 2005, Support vector machines with simulated annealing algorithms in electricity load fore- casting, Energy Conversion and Management, Vol. 46, pp. 2669-2688DOI

저자소개

방영근 (Young-Keun Bang)
../../Resources/kiee/KIEE.2020.69.8.1237/au1.png

2003년 강원대(삼척) 전기공학과 졸업(석사).

2010년 강원대(춘천) 전기전자공학과 졸업(박사)

E-mail : b2y2c1@hanmail.net

이철희 (Chul-Heui Lee)
../../Resources/kiee/KIEE.2020.69.8.1237/au2.png

1985년 서울대학교 전기공학과 졸업(석사).

1989년 서울대학교 전기공학과 졸업(박사).

현재 강원대학교 전기전자공학과 교수

E-mail : chlee@kangwon.ac.kr