• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Department of Electronics Engineering, Seokyeong University, Korea.)



Easterly wind, Deep neural network, Convolution neural network, Long short-term memory, Deep learning

1. 서 론

기압대의 영향과 지역적 특성에 의해 다양한 방향의 바람이 존재하나, 지구 자전의 영향으로 대부분의 바람은 서쪽에서 동쪽으로 부는 편서풍 계열이다. 그러나 한국 동해안 지역은 태백산맥과 동해상의 발달된 저기압 및 백두산 부근의 고기압 등의 영향으로 인해 동풍이 종종 발생한다 (1,2). 이러한 동풍 사례는 서풍에 비해 비교적 적은 빈도로 발생하지만, 경우에 따라 폭우, 호설 및 고온 현상을 발생시킨다 (3). 이것은 자연 재해와 밀접한 이상 현상으로 매우 중요한 문제이나, 동풍을 예측하는 것은 매우 어려운 일이다.

아직까지는 대부분의 연구가 동풍의 예측보다는 사후 분석에 중점을 두고 있으며, 이를 통해 얻어진 지식을 예측에 부분적으로 활용하려는 시도가 대부분이다 (1-3). 직접적인 예측에 사용되는 수치모델에 의한 접근법은 아직까지 정확도가 높지 않은 실정이다. 본 논문에서는 수치모델의 단점을 보완하기 위한 대체적인 연구로서, 데이터 기반의 딥러닝 기법을 사용하여 동풍 예측 모델을 구성하고 한반도 및 동해안 지역의 동퐁 유무를 판별한다. 딥러닝 기법으로는 DNN(Deep neural network)(4)과 CNN(Convolutional neural network)(5,6) 그리고 LSTM(Long Short-term Memory)(7,8)을 고려한다. DNN 기법은 수치 및 이미지 데이터 모두에 적용할 수 있는 보편적 방식이다. CNN은 이미지 데이터에 많이 사용되지만, 컨볼루션 연산을 2차원의 수치 데이터에 대해서 유사한 형식으로 적용할 수 있다. LSTM은 순차적인 일련의 데이터들의 관계를 학습하는데 강인한 특성을 가지고 있다.

수집한 동풍 데이터는 단순 지표면 외에도 상공에 위치한 다수의 연직층으로 구성되어있기 때문에, 각 층 내에서의 기상 인자의 구성 분포 뿐 아니라, 상하 각 층 간의 관계를 파악하는 것이 중요하다. 따라서 본 논문은 이러한 동풍 데이터 특성을 잘 반영할 수 있는 딥러닝 기법들을 검토한다. 구체적으로 사전 연구 (9,10)를 확장하여, DNN, CNN, LSTM 기법을 사용한 딥러닝 기반 모델 간의 동풍 예측 성능을 비교하고 평가한다. 한반도를 포함한 동해안 지역에 대해서 2013년과 2014년의 ERA5 데이터를 사용하여 실험한다.

2. 동풍과 데이터 전처리

2.1 동풍 현상

동풍 발생시 나타나는 현상은 같은 지점이라도 연직층의 수직 높이에 따라 풍향과 풍속이 다르다. 그림 1은 2004년 5월 1일 강릉 지역의 동풍 발생 사례이다. 지도 우측의 연직층 그래프에서 지상 부근은 동남풍이 우세함을 나타낸다. 13시와 14시 사이에 약 1.5 km 이하 고도에서 풍향의 반전을 보여준다. 고도 1.7 km이상에서는 바다쪽 또는 육지쪽에서 불어오는 해륙풍의 영향을 받지 않고 있다 (1).

그림 1 강릉 지역의 동풍 발생시 연직층의 풍향 현상

Fig. 1 Wind profile of easterly wind at Gangneung site

../../Resources/kiee/KIEE.2019.68.12.1607/fig1.png

2.2 실험 데이터

동풍 예측 모델 구성을 위해서 사용하는 데이터는 ECMWF (European Centre for Medium-Range Weather Forecasts)에서 제공하는 ERA5로서, 30km 간격의 격자점과, 137Km(1650hPa) ~ 80km(0.01hPa) 사이의 연직층 대기압 데이터로 구성된다. 연직층은 다수의 기압대(pressure level)와 지표면(surface level)으로 구분된다.

기압대별 연직층이 수십개 존재하며, 각 기압대 층마다 수십개의 인자가 포함된다. 전체 연직층 데이터는 방대한 규모의 인자수를 가지고 있기 때문에 예측 모델의 구성에 큰 어려움이 있다. 따라서 본 연구에서는 37개의 연직층 중에서 7개 층을 기상학적 중요도에 따라 선별한다. 즉, 지표면에 가까운 층부터 동풍에 영향을 미치는 고도까지를 선택하였는데, 그 이상의 고도에서는 동풍에 미치는 영향이 미미하기 때문이다.

그림 2 2차원 데이터 구조

Fig. 2 2 dimensional data structure

../../Resources/kiee/KIEE.2019.68.12.1607/fig2.png

층 당 인자들도 마찬가지로 기상학적 측면에서 동풍에 영관이 많다고 생각되는 주요 인자를 중심으로 10개로 축소하여 사용한다. 다만 지표면(surface level)은 다른 기압대보다 몇 배 많은 인자를 가지고 있기 때문에 40개를 선정하여 사용한다. 동풍 예측에는 기압대 연직층과 인자들의 관계가 동시에 고려되어야 한다. 이를 위하여 대상 데이터를 2차원 구조로 재구성한다.

그림 2는 한 격자점의 시점 데이터를 표현하기 위한 10 x 10 형태의 데이터 구조이다. 표의 각 행은 기압대(Pressure level) 층을 나타내며, 1000hPa, 925hPa, 850hPa, 700hPa, 500hPa, 300hPa와 지표면(surface level)으로 구분된다. 상위 기압대는 10개, 지표면은 40개의 인자로 구성되며, 각 인자들은 온도, 습도, 풍속, 풍향등을 나타낸다.

3. 딥러닝 기반 동풍 예측 기법

3.1 DNN(Deep Neural Network)

DNN(4)은 심층 신경망으로 입력층(input ayer)과 출력층(Output Layer) 사이에 여러개의 은닉층(hidden layer)으로 이루어진 인공신경망이다. DNN의 수많은 은닉층은 복잡한 비선형 관계들을 모델링하는데 용이하다. 그림 3은 DNN의 구조를 나타낸 것으로, 인자 데이터를 입력 받아 구성된 DNN 모델을 통해 동풍의 유무를 예측한다. DNN 기법은 수치 및 이미지 데이터 모두에 적용할 수 있는 보편적 특성이 있으나, 일반적으로 분류 성능면에서는 특화된 장점을 보이지 못하고 있다.

그림 3 DNN 구조

Fig. 3 Structure of DNN

../../Resources/kiee/KIEE.2019.68.12.1607/fig3.png

3.2 CNN(Convolutional Neural Network)

CNN(5)은 1989년 LeCun이 발표한 기법으로, 영상인식에 주로 사용되는 객체 분류 알고리즘이다. 기존의 전통적 물체 분류 알고리즘보다 10%이상 좋은 성능을 보이면서 ILSVRC- 2012 (6)부터 주류 알고리즘으로 사용되고 있다. CNN은 컨볼루션 층(convolution layer)와 다운 샘플링 층(pooling Layer)이 교대로 반복되는 구조를 이루며 이미지를 입력받아 특징을 자동으로 추출한다. 이를 통해 특징 맵을 만들고, 출력 노드에 완전연결(fully connected)시켜 이미지를 분류한다. 그림 4와 같이 2차원 수치 데이터도 하나의 이미지처럼 처리할 수 있다.

3.3 LSTM(Long short-term memory)

LSTM은 순환신경망인 RNN(Recurrent Neural Network) (4)을 개선한 기법이다. RNN은 입력의 길이가 길어지면 앞의 데이터를 잊어버리는 단점이 있는데 비해, LSTM은 RNN의 은닉 상태 외에도 Cell state 를 추가하여 기억력을 증가 시킨다.

그림 4 CNN 구조

Fig. 4 Structure of CNN

../../Resources/kiee/KIEE.2019.68.12.1607/fig4.png

또한 Forget gate, Input gate, Output gate를 통해 기억과 망각 및 입출력 양을 조절할 수 있다. LSTM은 CNN과 달리 순차적인 정보를 처리하는데 용이하다. 즉, LSTM은 출력 결과가 이전의 계산 결과에 영향을 받는다.

그림 5 LSTM 구조

Fig. 5 Structure of LSTM

../../Resources/kiee/KIEE.2019.68.12.1607/fig5.png

그림 5는 LSTM의 순차적인 처리과정과 다수의 게이트로 구성된 셀의 내부를 나타낸다. 여기서, Input gate는 현재의 정보를 Cell state에 반영하는 노드이고, Forget gate는 과거의 정보에 대하여 현재에 반영을 할지를 결정하는 노드이다. Output gate는 새로 갱신된 Cell state 정보의 양을 출력으로 결정하는 노드이다. 즉, 각각의 Gate를 통해 지난 정보와 현재의 입력 데이터가 LSTM Cell을 거쳐 결과물로 출력된다.

3.4 동풍 예측 모델 구성

동풍 예측 모델 구성을 위해서 DNN, CNN, LSTM 기반의 딥러닝 기법을 사용한다. 대상 데이터가 수치형 데이터라 DNN 기법의 적용이 일반적이나, 데이터의 정방형 구조를 고려하면 CNN 기법의 적용도 가능하다. 특히, 데이터의 기압대별 특성을 고려하면 시계열 데이터에 강인한 LSTM 기법도 적합하다. DNN의 적용에서는 기압대별 데이터를 일렬로 연결하여 DNN의 입력으로 사용한다(그림 6 상단). CNN 기법의 적용에서는 기압대별 데이터를 2차원으로 구성하여 컨볼루션 연산의 수행이 가능하도록 한다(그림 6 중단). LSTM 기법의 적용에서는 정방형 데이터의 각 행을 순차적인 입력으로 처리한다(그림 6 하단).

그림 6 동풍 예측 모델 구성도

Fig. 6 Model construction of easterly wind prediction

../../Resources/kiee/KIEE.2019.68.12.1607/fig6.png

4. 실험 환경 및 결과

4.1 실험 데이터 및 전처리

동풍 분류를 위한 실험 대상은 그림 7과 같이 한반도 주변지역이며, 해당 영역내의 격자점 수는 2501(41x61)개이다. 각 격자점에 대해서 2013~2014년(2년치)의 데이터를 그림 2의 입력데이터 형태로 변환한 후 실험에 사용한다. 모든 7개 층의 데이터를 입력으로 넣고 각 기압대별 동품 분류 모델을 학습한다. 본 논문에서는 우선순위가 높은 두 기압대 1000hPa, 850hPa 층에 대해서만 먼저 실험을 수행한다.

그림 7 대상 데이터 범위

Fig. 7 Range of target area

../../Resources/kiee/KIEE.2019.68.12.1607/fig7.png

표 1은 학습과 평가에 사용된 데이터 수로서, 각각 4:1 비율로 구성하고, 동풍과 비동풍 비율은 1:2로 구성한다. 각 격자점 별 및 각 층별 동풍의 유무가 다르므로 표와 같이 각 층별 데이터의 수가 다르다. 또한 데이터를 구성하는 각 인자 간 스케일을 맞춰주기 위해, 이상치를 제외한 값들을 정규화하여 사용한다.

표 1 동풍 예측 모델에 사용된 데이터 수

Table 1 Number of data used for the easterly wind prediction

1000hPa

850hPa

학습

평가

학습

평가

동풍

비동풍

동풍

비동풍

동풍

비동풍

동풍

비동풍

1,183,894

2,367,788

296,002

592,469

746,110

1,492,220

186,637

373,468

4.2 모델 학습 파라미터

실험에 사용된 각 딥러닝 기법의 학습 파리미터는 표 2와 같다. 1000hPa, 850hPa 기압대 층에 대해서 배치크기(Batch size)를 제외하고는 모든 파라미터가 동일한 조건에서 실험을 수행하였다. 여기서, LSTM의 Depth는 LSTM Cell의 갯수를 의미한다.

4.3 실험 결과

1000hPa, 850hPa 두 기압대에 대해서 DNN, CNN, LSTM 학습을 통해 생성된 모델을 평가한 성능 수치가 표 4에 나와 있다. 정확도에서 LSTM 기법이 97~98%로 가장 우수하며, DNN과 CNN 기법은 68~73%대에 머물고 있다.

표 2 딥러닝 기법별 파라미터

Table 2 Parameters for deep learning technique

Learning rate

Depth

Epoch

Batch

size

Mini

batch

DNN

0.001

5

20

5000

(1000hPa)

700

3197

(850hPa)

CNN

0.001

5 (Con:3 Pool:2)

20

5000

700

3197

LSTM

0.001

10 (LSTM Cell)

20

5000

700

3197

재현율에 있어서도 LSTM 기법이 93~97%대로 가장 우수하며, DNN과 CNN 기법은 51~55%대로 현격히 저한된 성능을 보인다. 다만, 데이터의 특성상 정밀도의 정의 TP/(TP+FP)에서, FP의 수치가 낮게 나와서 3 가지 기법의 성능 차이가 거의 없었다. 부연하면 동풍보다 비동풍의 구성 비율이 크기 때문에 나온 현상이다.

기압대 별로는 1000hPa의 정확도가 850hPa 보다 DNN은 4.3%, CNN은 4.4%, 그리고 LSTM은 1.3% 높게 나왔다. 마찬가지로, 기법별 정밀도, 재현율 역시 1000hPa 기압대의 성능이 850hPa 보다 약간 높다.

표 3 3 가지 기법의 수치 성능 결과

Table 3 Numerical performance results for three methods

1000hPA

850hPA

DNN

CNN

LSTM

DNN

CNN

LSTM

정확도

73.5%

73.1%

98.5%

69.2%

68.9%

97.2%

정밀도

99.7%

99.1%

97.8%

99.7%

99.1%

98.6%

재현율

55.6%

55.3%

97.9%

52.0%

51.7%

93.5%

표 3의 수치를 막대 그래프로 비교한 결과가 그림 8그림 9에 나와 있다. LSTM 기법이 정확도, 정밀도, 재현율의 지표 모두 고르게 우수함을 확인할 수 있다.

그림 8 1000hPa의 성능 비교 막대 그래프

Fig. 8 Comparison results of 1000hPa by bar chart

../../Resources/kiee/KIEE.2019.68.12.1607/fig8.png

그림 9 850hPa의 성능 비교 막대 그래프

Fig. 9 Comparison results of 850hPa by bar chart

../../Resources/kiee/KIEE.2019.68.12.1607/fig9.png

DNN과 CNN 기법은 이미지에 대한 학습에서는 성능의 차이가 나는 경우가 많으나, 본 연구에서 사용된 수치데이터에 대해서는 별 차이를 보이지 않았다. 더욱이 기대했던 컨볼루션 연산이 인접층간의 관계성을 추출하는데 미흡했던 것으로 생각된다. 이에 비해 LSTM 모델은 기압대별의 상하 관계를 순차적으로 처리하여, 기압대별 인자간의 연관 특성을 보다 잘 반영한 것으로 분석된다.

5. 결 론

본 논문에서는 3가지 딥러닝 기법들을 기압대별 다수의 기상 인자를 가진 동풍 분류 문제에 적용하였다. 동풍에 대한 기본 데이터를 10x10 정방향 데이터로 재구성하고, 이를 DNN과 CNN, 그리고 LSTM 기법에 맞게 변형하여 사용하였다. 한반도와 동해를 포함한 지역을 대상으로 2013~2014년 2년치의 데이터를 사용하여 동풍 분류 모델을 학습하고 평가하였다. 실험 결과 DNN과 CNN에 비해 LSTM을 적용한 방식이 우수한 성능 결과를 보였다. LSTM 기법은 순차적인 처리 방식으로 기압대별의 인접 관계 및 인자간의 연관 특성을 보다 잘 반영한 것으로 사료된다.

향후, 입력 데이터의 기압대 층 수나 인자 수를 변화시켜 이에 대한 영향을 분석하는 것과 실험대상 기간을 늘려 결과의 신뢰성을 보완하는 것이 필요하다.

Acknowledgements

본 연구는 2017학년도 서경대학교 교내연구비 지원에 의하여 이루어졌음.

본 연구는 기상청 및 기상산업기술원 기상 See-At 기술 개발사업(KMI2018-06710)에 의해 수행되었음.

References

1 
Sun-Gi Lee, et al., 2005, A Case Study on the Easterly Wind Characteristics around Gangneung City, Journal of Atmosphere, Vol. 15, No. 4, pp. 191-202DOI
2 
J. G. Lee, J. S. Lee, 200, A Numerical Study of Yeongdong Heavy Snowfall Events Associated with Easterly, Asia-Pacific Journal of Atmospheric Sciences, Vol. 39, No. 4, pp. 475-490Google Search
3 
Ziqi Cao, et al., 2015, Interannual increase of regional haze-fog in North China Plain in summer by intensified easterly winds and orographic forcing, Atmospheric Environment, Vol. 122, pp. 154-162DOI
4 
Y. LeCun, Y. Bengio, G. Hinton, 2015, Deep learning, Nature, Vol. 521, pp. 436-444DOI
5 
Y. LeCun, et al., 1998, Gradient based learning applied to document recognition, in Proceedings of the IEEE, pp. 2278-2324DOI
6 
A. Krizhevsky, I. Sutskever, G. Hinton, 2012, ImageNet classification with deep convolutional neural networks, in NIPSDOI
7 
S. Hochreiter, J. Schmidhuber, 1997, Long short-term memory, Neural Computation, Vol. 9, No. 8, pp. 1735-1780DOI
8 
F. Gers, J. Schmidhuber, 2001, LSTM Recurrent Networks Learn Simple Context Free and Context Sensitive Languages, IEEE Transactions on Neural Networks., Vol. 12, No. 6, pp. 1333-1340DOI
9 
K. Kim, K. Seo, 2018, Deep Learning Based Prediction for Easterly Wind, in Proceedings of Information and Control Symposium CICS’2018, pp. 55-56Google Search
10 
K. Kim, K. Seo, 2019, Long Short-Term Memory Based Prediction for Easterly Wind, in Proceedings of Information and Control Symposium ICS’2019, pp. 21-22Google Search

저자소개

김경태 (Kyoungtae Kim)
../../Resources/kiee/KIEE.2019.68.12.1607/au1.png

2016년 서경대학교 전자공학과 졸업(학사).

2020년 서경대학교 대학원 전자컴퓨터공학과 졸업예정(석사).

관심분야는 진화연산, 머신비전, 딥러닝.

서기성 (Kisung Seo)
../../Resources/kiee/KIEE.2019.68.12.1607/au2.png

1986년 연세대학교 전기공학과 졸업(공학사).

1988년 연세대학교 대학원 전기공학과 졸업(석사).

1993년 연세대학교 대학원 전기공학과 졸업(박사).

1999~2003년 Michigan State University, Genetic Algorithms Research and Applications Group, Research Associate,

2002~ 2003년 Michigan State University, Electrical & Computer Engineer- ing, Visiting Assistant Professor,

2011~2012년 Michigan State University, BEACON (Bio/ comput- ational Evolution in Action CONsortium) Center, Visiting Scholar,

1993년~현재 서경대학교 전자공학과 교수.

관심분야는 진화연산, 딥러닝, 머신비전, 기상예측, 지능로봇