권오극
(Ogeuk Kwon)
1
최수현
(Soohyun Choi)
1iD
조현식
(Hyunsik Jo)
1
차한주
(Hanju Cha)
†iD
-
(Dept. of Global Planning & Engineering, K-water, Korea.)
Copyright © The Korean Institute of Electrical Engineers(KIEE)
Key words
Recurrent Neural Network, Power Generation Prediction, Floating Photovoltaic, LSTM, AI
1. 서 론
지구온난화로 인한 기후변화로 북극의 빙하 감소와 이상 고온 현상으로 전 세계적으로 심각성을 인식하여 2015년 파리협약을 통해 선진국과 개발도상국
모두 탄소 감축을 위해 NDC (Nationally Determined Contribution)를 발표하며 각국은 신재생에너지 비중을 높이고 있다.
해외 신재생에너지 정책목표는 ’50년 기준 47%(BNEF, Bloomberg New Energy Finance)~ 62%(EIA, Energy Information
Administration) 수준으로 전망하고 있으며, 주요국의 신재생에너지 목표는 일본 22~24%(’30년), 중국 35%(’30년), 프랑스
40%(’30년), 독일 40~45%(’25년)이다. 한국은 제9차 전력수급기본계획을 통해 2034년 기준 77.8GW(발전량 26.1%) 신재생에너지
보급계획을 가지고 있으며, 2050 탄소중립 등 신재생에너지 보급목표를 확대하려고 하고 있다.
따라서 신재생에너지 보급률은 굉장히 빠르게 높아질 것으로 예측된다. 하지만, 순간적으로 높은 수요가 신재생 에너지원으로 공급되는 경우 신재생에너지원의
급변하는 출력과 함께 전력의 변동성이 심해질 것이고 그에 따라 전력계통의 불안정성이 야기될 수 있다. 신재생에너지 변동성과 간헐성으로 인한 계통운영의
불안정성을 감소시키기 위한 방법으로 가상발전소와 같이 여러 지역에 분산된 신재생에너지원을 하나의 발전소와 같이 입찰하는 방식이 도입되었다. 따라서
기존 취득된 기상청의 일사량, 주변온도, 습도, 일조시간 등의 정보를 이용하여 태양광의 발전량을 예측하여야 한다. 태양광 발전량을 예측 방법으로 통계적인
접근과 기계적인 접근 방식이 있다. 통계적인 접근 방식인 시계열 데이터의 예측은 단일 값들은 이용한 자기회귀(Auto regressive) 모형,
이동평균(Moving average) 모형이 사용되고 두 가지를 결합하여 이용하는 회귀이동평균(ARIMA) 모형이 사용된다. Input값이 다중일
경우 예측을 위해 머신러닝 기반의 모델을 많이 사용한다. 머신러닝의 모델의 예시로는 인공신경망(Artificial Neural Network), 합성곱신경망(Convolution
Neural Network), 순환신경망(RNN, Recurrent Neural Network)등이 있으며, 이러한 머신러닝 모델을 사용할 경우 고전적인
시계열모델 보다 보다 정확한 예측이 가능하게 된다. 순환신경망 LSTM 모형은 전반적으로 ARIMA 모형보다 시계열 예측 성능이 우수하다고 알려져
있다. 기계학습 연구에서는 순환신경망(RNN) 구조인 LSTM(long short term memory)과 GRU(Gated Recurrent Unit)가
적합하다고 알려져 있다. 육상태양광의 경우 순환신경망을 이용하여 발전량을 예측한 연구가 진행 되었고, 최근에는 ANN(Artificial Neural
Network)을 활용하여 발전량을 예측하고 있다(4). 본 논문에서는 수상태양광에 대해서 순환신경망을 이용한 발전량 예측을 수행하였다.
2. Title
2.1 태양광발전소의 종류
일반적으로 태양광발전은 설치장소에 따라 5개로 구분하고 있다. 땅 위에 설치하는 육상태양광(Ground mounted)과 건축물의 옥상이나 지붕 위에
설치하는 옥상태양광(Roof Top)과 농수로 위 설치하는 농수로태양광(Canal Top)과 해안가 앞바다에 설치하는 해상태양광(Offshore)과
내륙의 댐 또는 저수지 등 수면 위에 설치하는 수상태양광 (Floating)이 있다.
수상태양광은 육상태양광과 비교하여 태양광 모듈 후면의 온도가 낮아서 발전효율이 증가한다고 언급되고 있고 또한 패널 청소할 물의 이용이 용이하며 증발면적을
감소시켜 물의 증발을 억제하는 효과가 있다.
2.2 태양광 발전량 예측 필요성
재생에너지는 기존 화석연료를 대체하여 온실가스 감축과 미세먼지 저감 등 환경적 측면에서 이점이 있다. 앞으로 신재생에너지 보급률은 굉장히 빠르게 높아짐으로
인하여, 순간적으로 높은 신재생 에너지원의 전력이 공급되는 경우 신재생 에너지원의 급변하는 출력과 함께 전력의 변동성이 심해질 것이고 그에 따라 전력계통의
불안정성이 야기될 수 있다(2). 전력의 공급과 수요를 일치시켜야 하는 부분에서는 재생에너지가 가지는 변동성과 불확실성으로 전력망을 안정하게 운영하는데 위험요소로 작용하고 전력계통의
안정성을 저해하는 요소로 작용한다. 우리나라 전력계통 운영은 규정주파수인 60Hz를 상시 유지하기 위해 실시간으로 발전 공급량을 조정하여 수요와 공급을
일치시키고 있다. 수상태양광의 경우 일사량에 기반하여 발전량이 변하는 특성상 발전량의 변동성이 크므로 전력계통을 안전하게 유지하기 위해서는 발전량
예측이 필요하다.
2.3 순환신경망을 이용한 발전량 예측
태양광 발전량 예측 방법은 대표적으로 통계적 방법과 기계학습 방법으로 분류된다. 통계적인 방법으로는 회귀분석을 통한 발전량을 예측하는 모델이 있고
태양광 발전량에 중요한 영향을 미치는 모듈온도를 예측하는 모델이 있다. 모두 회귀분석 기법(Regression)을 이용한 예측모델로 모듈온도와 풍속
등 주변 조건과의 선형관계를 기반으로 모델링 하였으며 일사량이나 모듈의 높이 등 분석 조건을 조금씩 달리하면서 좀 더 정확한 예측모델을 연구하였다.
통계적 방법은 이동평균, 자기상관 분석 등과 같은 통계적 기법을 통해 데이터의 특징을 분석한 후 발전량을 예측하는 방법이 있다. 하지만, 이러한 방법들은
비정상성 및 비선형성 데이터를 적용할 경우 잘못된 예측 결과를 도출할 수 있다. 반면에 기계학습 방법은 수집된 데이터를 기반으로 발전량을 예측하는
방법으로 선형뿐만 아니라 비선형성, 비정상성을 갖는 데이터를 처리할 수 있다. 최근에는 하드웨어 기술의 발전으로 인해 데이터의 연산능력이 향상됨에
따라 순환신경망(RNN, Recurrent Neural Network)의 LSTM(Long Short-Term Memory), GRU(Gated Recurrent
Units)와 같은 방법이 발전량 예측에 적용되고 있다.
3. 발전량 예측
3.1 예측 대상 발전소
발전량 예측에 이용한 수상태양광은 2012년에 합천댐 수면에 설치된 500㎾ 수상태양광이다. 설비의 사양은 표 1과 같고 설치 전경은 그림 1과 같다. 분석에 사용된 데이터는 2019년도 1월 1일부터 2021년도 8월 30일까지 데이터를 이용하였다. 태양광의 출력, 일사량, 온도, 강수량,
바람, 습도, 등 27개의 일간의 데이터를 활용하였다. 2019년 1월 1일부터 2021년 7월30일까지 예측을 위한 Train으로 이용하였고 2021년
8월 01일부터 2021년 8월30일까지 Test 데이터로 발전량 예측을 검증하였다.
표 1. 합천수상태양광 특성
Table 1. FPV(Floating Photovoltaic) Specifications
구 분
|
정 격
|
구조체
|
알루미늄 프로파일(AL-PROFILE)
|
부력체
|
F.R.P
|
태양광 모듈
|
300W(15.5%)
|
용량
|
500㎾
|
준공년도
|
2012
|
그림. 1. 500㎾ 수상태양광 전경
Fig. 1. Photo of 500㎾ FPV
3.2 변수간 상관관계
발전량 예측의 대상지는 합천에 설치되어있기 때문에 발전량 예측을 위해 사용한 데이터는 기상청 자료 외 합천댐에서 운영 기록하는 데이터를 이용하였다.
발전량 예측에 이용한 데이터는 표 2와 같다. 저수지에 설치되는 수상태양광의 경우 안개의 영향이 있을 것으로 판단되나 계측된 데이터가 없어 분석에 포함되지 않았다.
표 2. 예측에 사용된 데이터
Table 2. Data Used for Prediction
구 분
|
상세 사용데이터
|
온 도
|
평균기온, 최저기온, 최고기온
|
강우량
|
기상청 강우량, 통합운영 강우량
|
풍 속
|
최대순간풍속, 최대풍속, 평균풍속
|
습 도
|
최소상대습도, 평균상대습도
|
기 압
|
기압관련 7개 기상청데이터
|
일사량
|
가조시간, 합계일조시간
|
운 량
|
평균 전운량, 평균중하층운량
|
수 위
|
K-water 운영통합 수위
|
수 온
|
K-water 수질통합 수온
|
총 27개 데이터 변수 간의 상관관계 분석을 실시하였다. 상관관계 분석의 결과는 그림 2와 같으며, 상관관계가 높을수록 적색으로 표현되고 상관관계가 반대일수록 청색으로 표현되어 있다. 발전량(output)은 일사량(sun)과 비례적인
상관관계와 운량(cloud)과는 반비례적인 상관관계가 있는 것을 확인할 수 있다.
그림. 2. 사용된 데이터의 상관관계
Fig. 2. Correlation Among Used Data
회귀모형에서 독립변수들 간의 강한 상관관계를 가지고 있을 때 다중공선성(Multicollinearity)이 존재한다. 다중공선성이 존재하는 데이터를
활용하여 모델링을 수행한다면 효율적이지 못할 뿐만 아니라 통계적으로 유의미하지 않는 결과가 도출될 가능성이 존재한다. 회귀분석에서 변수들 간 강한
상관관계가 나타나는 다중공선성 문제 해결이 필요하다. 독립변수의 일치에 가까울 정도의 관련성이 있는 것을 확인하여 제거하기 위해 분산팽창계수(VIF,
Variation Inflation Factor)를 분석하고 높은 상관관계가 보이는 변수를 배제하여 12개 데이터를 이용하여 분석하였다. 12개 데이터의
분산팽창계수의 값은 표 3과 같고 일반적으로 VIF가 10 이하이면 문제가 없다고 판단된다.
표 3. 사용된 12개 데이터와 VIF 값
Table 3. Utilized 12 Data and their VIF Values
항 목
|
VIF
|
비 고
|
temp3
|
3.7
|
최고기온
|
rain1
|
6.1
|
기상청 강우량
|
rain2
|
6.4
|
합천댐 운영강우량
|
wind1
|
3.0
|
최대순간풍속
|
wind3
|
3.5
|
평균풍속
|
hum3
|
2.4
|
습도
|
hpa3
|
1.1
|
기압데이터
|
sun1
|
4.0
|
가조시간
|
sun2
|
2.0
|
합계일조시간
|
cloud1
|
2.4
|
평균 전운량
|
cloud2
|
1.9
|
평균중하층운량
|
EL
|
1.2
|
합천댐 수위
|
3.3 예측값과 실제값의 오차 비교
예측값과 실제값의 오차는 MAE(mean average error)와 MSE(mean square error), MAPE(mean average percentage
error)로 표현할 수 있다. 여기서 MAE는 식 (1), MSE는 식 (2), MAPE는 식 (3)과 같다.
$y_{i}$ : 실측값, $x_{i}$ : 예측값, $e_{i}$ : 에러값
$Y_{i}$ : 실측값, $\hat Y$ : 예측값
$A_{t}$ : 실제값, $F_{t}$ : 예측값
MAE와 MSE는 비교 대상이 없으며 에러의 정도를 판단하기 쉽지 않다. MAPE는 상대적으로 비교에 익숙한 백분율 표시방법이며, 모집단 예측의 정확성을
평가하는데 가장 자주 사용되는 요약 측정법이다. MAPE의 특징을 간략히 정의하면 평균 절대 백분율 오차(MAPE)는 정확도를 오차의 백분율로 표시하는
방법이다. MAPE는 퍼센티지(percentage)로 표현되어 이해가 쉽다는 장점이 있지만, 차이가 클 경우 실제값($A_{t}$)과 예측값($F_{t}$)이
100%를 넘는 오차율이 나오는 단점이 있다. 또한, 실제값이 0을 포함하는 데이터는 비교 대상에 포함할 수 없다는 단점을 가진다.
3.4 결측값 처리와 데이터 스케일링
태양광의 유지보수 활동이 있거나 통신 이상이 발생할 경우 분석에 필요한 발전량 데이터가 그림 3과 같이 적색으로 표시된 부분과 같이 결측되는 경우가 존재한다.
그림. 3. 일간의 수상태양광 발전 데이터
Fig. 3. Daily FPV Generation Data
따라서 결측값을 어떠한 방법으로 처리하는 방식에 따라 수집된 데이터의 활용도를 높일 수 있다. 결측값 처리는 직전값으로 대치하는 Pad 방식, 결측값을
삭제하는 Drop 방식, 전체 데이터의 중간값으로 대체하는 중간값 방식이 있다. 3가지 방식을 비교한 결과를 표 4에 정리하여 나타내었고, 결측값을 중간값으로 대체하는 방식이 MAE(평균에러)가 가장 적어 본 논문에서는 결측값 처리 방식을 중간값 방식으로 채택하여
사용하였다.
표 4. 결측값에 대한 오차 비교
Table 4. Comparison of Errors for Unknown Values
구분
|
학습그래프
|
MAPE
|
Pad
|
|
7.2
|
Drop
|
|
7.6
|
중간값
|
|
3.3
|
다른 단위의 변수(발전량, 일사량, 풍속)를 비교하기 위해 변수의 범위와 분포를 같게 하여 변수간 상대비교를 위해 MinMaxScaler, StandardScaler,
RobustScaler 3가지 스케일 방식을 사용하였다. MinMaxScaler의 방식은 데이터의 최소값을 0, 최대값을 1로 변환하는 방식이고 StandardScaler
방식은 각 데이터의 평균을 0, 분산을 1로 변경하여 모든 특성이 같은 크기를 가지게 하는 것이며, RobustScaler 방식은 데이터가 같은 스케일을
갖게 되지만 평균 대신 중앙값을 사용하는 것이다. 3가지 스케일 기법을 적용하여 Test 데이터와 실제 데이터간 오차를 비교하면 MAPE의 결과값은
다중공선성을 적용하지 않았을 경우, 즉 모든 데이터를 사용할 경우의 결과를 표 5에 나타내었고, 다중공선성을 제거하였을 때 결과 값을 표 6에 나타내었다.
표 5. 다중공선성을 제거하지 않은 경우의 3가지 방법의 MAPE
Table 5. Three Methods MAPEs without Removing Multicollinearity
|
MinMax
Scaler
|
Standard
Scaler
|
Robust
Scaler
|
MAPE
|
Train
|
8.58
|
3.99
|
3.88
|
Test
|
11.6
|
4.62
|
3.33
|
다중공선성을 적용하여, 즉 중복되는 데이터를 제거하면 표 6과 같이 오차율은 높아지지만 더 신뢰성있는 결과를 얻을 수 있다. 최종적으로 Train과 Test 부분에서 오차가 적은 RobustScaler 사용하였다.
표 6. 다중공선성을 제거한 경우의 3가지 방법의 MAPE
Table 6. Three Methods MAPEs with Removing Multicollinearity
|
MinMax
Scaler
|
Standard
Scaler
|
Robust
Scaler
|
MAPE
|
Train
|
5.75
|
4.55
|
4.46
|
Test
|
7.32
|
5.59
|
6.30
|
3.5 학습모델 선정
태양광 발전량을 예측하기 위한 시계열의 데이터의 형태는 표 7과 같이 발전예측일 이전 3일간(1월1일~1월3일)의 입력데이터(일사량, 온도, 풍속, 강우)를 이용하여 발전예측(1월 3일)을 한다.
표 7. 예측을 위하여 사용된 시간 연속성
Table 7. Utilized Time Series Data for Prediction
|
$x_{1}$
(일사량)
|
$x_{2}$
(온도)
|
$x_{3}$
(풍속)
|
$x_{4}$
(강우)
|
$y_{1}$
(발전량)
|
2019-01-01
|
9.8
|
4.6
|
7.9
|
0.0
|
1277
|
2019-01-02
|
9.8
|
6.4
|
6.1
|
0.0
|
2050
|
2019-01-03
|
9.8
|
7.2
|
5.3
|
0.0
|
2023
|
2019-01-04
|
9.8
|
6.7
|
2.7
|
0.0
|
1144
|
2019-01-05
|
9.9
|
8.9
|
5.6
|
0.0
|
1730
|
2019-01-06
|
9.9
|
8.6
|
4.7
|
0.0
|
1197
|
발전량 예측을 위해 3일간의 연속 입력데이터를 사용한 이유는 다음과 같다. 예측 모델을 만들 때 예측발전량의 정확도를 높이기 위해 예측일 당일 입력데이터를
이용할 것인지 아니면 최대 몇 일전 자료까지 이용하는 것에 대한 결정이 필요하다. 예를 들어 1월 3일의 발전량을 예측하는 방법으로 1월 3일의 입력
데이터(일사량, 온도, 풍속, 강우)를 가지고 예측이 가능하다. 날씨는 급변하지 않는 특성이 있어 예측일(1월 3일) 전날(1월 2일)의 입력데이터도
예측일 발전량에 영향을 미칠 수 있으나 기간이 많이 지난 연속 입력데이터는 의미가 없을 것이다. 따라서 발전량 예측일을 기준으로 하여 몇 일전 데이터까지
이용하는 것이 발전량을 예측을 정확한지를 분석하였다.
표 8은 발전량을 예측하기 위해서 1일, 2일, 3일, 4일, 5일전 까지의 연속데이터를 이용하였을 때 오차를 나타내었다. Train(예측 모델)의 경우
연속 입력데이터가 많을수록, 즉 5일간 데이터를 이용한 것이 가장 작은 오차율(4.07)을 보였다, 즉 결정된 값을 가지고 분석할 경우 많은 데이터,
즉 5일치 연속데이터를 이용할수록 정확도가 높았다. Train으로 만들어진 모델로 Test(예측)한 결과의 정확도가 높아야 잘 만들어진 모델이라 할
수 있다. Test(예측)의 결과를 보면 연속 입력데이터 일수가 3일까지 증가할수록 오차가 낮아져 정확도가 높았지만 더 많은 일수의 데이터(4, 5일
데이터)를 사용할 경우 다시 오차율이 증가하는 것을 알 수 있다. 많은 일수의 입력데이터를 활용하는 것보다 정확한 발전예측을 위해 이용하는 입력데이터의
선정이 오차를 줄일 수 있다. 따라서 몇 일전 까지의 입력 데이터가 발전량 예측에 유효한 가에 대한 분석 결과로 당일을 포함한 3일간 기상 데이터를
이용하는 방법이 Test(예측)에 가장 적절한 방법이라고 판단된다.
표 8. 연속 일자를 기준한 오차 비교
Table 8. Error Comparison Based on Sequence Days
|
1일
데이터
|
2일간
데이터
|
3일간 데이터
|
4일간데이터
|
5일간데이터
|
MAPE
|
Train
|
11.89
|
4.91
|
5.32
|
4.22
|
4.07
|
|
Test
|
19.21
|
7.88
|
5.63
|
6.57
|
6.93
|
데이터를 예측하기 방식을 RNN의 데이터 시점이 멀어질수록 학습능력이 저하되는 단점을 보완한 LSTM으로 학습을 진행하였다. 학습을 여러 번 반복하는
과정에서 LSTM의 단점인 연산시간이 오래 걸린다는 점으로 인해 LSTM과 정확도 차이가 거의 없으면서 연산속도가 빠른 GRU를 사용하여 분석하였다.
LSTM과 GRU의 구조는 표 9와 같이 LSTM은 Forget(ft), Input(it), Output(ot) 총 3개가 있으며, GRU는 Reset gate(rt), Update
gate(zt) 2개의 Gate만을 사용한다. LSTM은 Cell state(ct), Hidden state(ht)가 있지만 GRU는 하나의 Hidden
state(ht)로 표현하고 있다.
표 9. LSTM과 GRU의 구조
Table 9. Structure of LSTM & GRU
GRU는 LSTM보다 작은 파라미터를 활용하므로 적은 메모리를 사용하고 실행이 신속하여 빠른 동작의 프로젝트에 적합하다. LSTM은 데이터 셋의 시퀀스가
길수록 더욱 정확하여 시퀀스가 크며 정확도가 중요한 문제에 적합하다(7). LSTM과 GRU 두 가지 방법을 이용하여 분석을 실시한다.
3.6 분석결과
RNN 방식의 LSTM과 GRU를 이용하여 2019년 1월 1일부터 2010년 7월 30일까지 데이터를 이용하여 예측모델을 만들기 위한 훈련(Train)을
진행한 후 2020년 8월 1일부터 30일 까지 일사량을 예측(Test)하였다. LSTM과 GRU의 각각의 실제값과의 오차는 표 10와 같다.
표 10. LSTM & GRU의 실행 에러의 비교
Table 10. Performance Error Comparison of LSTM & GRU
구 분
|
MAE
|
MSE
|
MAPE
|
LSTM
|
Train
|
52.84
|
46.99.40
|
4.71
|
Test
|
42.24
|
2795.45
|
5.03
|
GRU
|
Train
|
53.05
|
4374.58
|
5.44
|
Test
|
38.89
|
3117.9
|
6.54
|
LSTM 학습한 모델이 Train(훈련)에서 MAPE 4.71, Test(예측)에서는 MAPE 5.03의 오차로 GRU보다 더 정확도가 높은 것으로
나타났다. 그림 4와 그림 5는 LSTM과 GRU 방법으로 2019년 1월 1일부터 2010년 7월 30일까지 발전량 Train에서 실제값(Y_train)과 예측값(Y_train_prediction)을
그래프로 나타낸 것이다.
그림. 4. LSTM을 이용한 Y_train과 Y_train_prediction 비교
Fig. 4. Comparison Between Y_train and Y_train_prediction with LSTM
청색으로 표시된 실제값(Y_train)과 주황색으로 표시된 예측값(Y_train_prediction)이 비슷한 것으로 나타난다.
그림. 5. GRU을 이용한 Y_train과 Y_train_prediction 비교
Fig. 5. Comparison Between Y_train and Y_train_prediction with GRU
2020년 8월 1일부터 31일 까지의 일사량을 예측(Test)한 LSTM과 GRU 결과는 그림 6과 그림 7과 같이 나타내었다. 실제값(Y_test)와 예측값(Y_test_prediction)의 LSTM의 MAPE는 5.03이고 GRU의 MAPE는 6.54이다.
그림. 6. LSTM을 이용한 Y_test과 Y_test_prediction 비교
Fig. 6. Comparison Between Y_test and Y_test_prediction with LSTM
그림. 7. GRU을 이용한 Y_test과 Y_test_prediction 비교
Fig. 7. Comparison Between Y_test and Y_test_prediction with GRU
3.7 육상태양광의 발전량 예측과 비교
김한호(8)는 2015년 1월 1일부터 2017년 9월 19일까지 남부발전의 부산발전본부 내의 태양광 발전량을 이용한 태양광 발전량 예측 모델링 하였다. 발전량이
데이터는 결측치가 없었지만 기상 데이터는 48,217의 결측치가 존재하였다. 발전량과 기상 데이터는 모두 정규화(normalization)를 이용하여
스케일링을 진행하였다. 최적의 변수를 선택하는 방법으로는 각 독립 변수(기상 데이터)들이 종속 변수(태양광 발전량 데이터)에 어느 정도의 영향을 미치는지
분석하였다. 기온, 습도, 일사량, 일조시간 변수가 88%의 영향을 미치며 나머지 5개 변수는 약 0.5% 이내의 영향력을 미친다고 분석되었다. 따라서
예측모델에 입력된 변수는 발전량, 일조량, 기온, 습도 일조시간 5가지 입력데이터이다. 순환신경망(LSTM)을 이용한 예측에서는 MAPE는 7.29%로
나타났다. 표 11에 육상 태양광의 예측과 본 논문과의 차이점을 나타내었다. 수상태양광 발전량 예측에서는 수상환경의 특성을 반영하기 위하여 풍속과 강우량 데이터를 추가하였다.
표 11. 육상과 수상태양광 방법 비교
Table 11. Method Comparison Between Ground and Floating PV
항목
|
육상태양광(김한호(14))
|
수상태양광
|
데이터
|
발전량
일조량
기온
습도
일조시간
|
발전량, 합계일조시간,
최고기온, 습도, 가조시간, 최대순간풍속, 평균풍속, 평균 전운량, 강우량(기상청, 합천댐) 합천댐 수위, 기압데이터
|
분석단위
|
시간별
|
일별
|
예측기준
|
24시간 데이터로
미래 24시간 예측
|
2일치 데이터로 미래 1일 예측
|
순환신경망
|
LSTM
|
GRU
|
MAPE
|
7.29
|
3.3
|
3.8 수상태양과의 발전량과 풍속
육상태양광은 인근의 기상데이터가 존재하지 않아 주변 지역의 기상데이터를 거리에 따른 가중치를 주어서 분석하였다. 합천의 수상태양광은 합천댐 일조량
데이터를 이용할 수 있고, 강우량데이터를 추가로 이용할 수 있었으며, 수상태양광의 경우 개활지에 위치하여 바람이 잘 통하여 냉각 효과가 있다. 표 12는 풍속을 입력으로 추가한 경우와 그렇지 않은 경우의 MAPE를 LSTM을 이용하여 나타내었다. 풍속을 입력데이터로 활용한 경우 MAPE가 낮아지는
결과를 얻을 수 있었으며, 이것으로 풍속이 발전량 증가에 영향을 주는 것을 알 수 있다.
표 12. LSTM을 이용한 바람 데이터 활용여부에 대한 MAPE 비교
Table 12. MAPE Comparisons for with/without Wind Data with LSTM
구 분
|
MAE
|
MSE
|
MAPE
|
With wind data
|
Train
|
52.84
|
46.99.40
|
4.71
|
Test
|
42.24
|
2795.45
|
5.03
|
Without wind data
|
Train
|
46.38
|
3757.52
|
5.08
|
Test
|
51.23
|
5508.88
|
6.22
|
4. 결 론
육상태양광의 발전량을 예측한 것은 있으나 수상태양광의 발전량을 분석한 데이터를 확보하기 위해 합천댐 500㎾ 태양광의 1년 7개월의 데이터를 학습하여
1개월 발전량을 예측하여 보았다. 데이터의 전처리 측면에서는 결측치에 대한 것은 중간값으로 대체하고 데이터를 정규화는 RobustScaler 적용시
실제값과 가장 일치하는 결과를 얻었다. 발전량 예측을 위한 몇 일간의 입력데이터(일사량, 온도, 풍속, 강우)를 사용하는 것에 대해서는 Train(예측
모델)의 경우 연속 입력데이터가 클수록 오차율이 감소하여 많은 입력데이터가 정확한 예측을 할 수 있을 것으로 보였다. 그러나 실제 Test(예측)의
결과를 보면 연속 입력데이터 일수가 3일까지 증가할수록 오차가 낮아져 정확도가 높았지만 더 많은 일수의 데이터(4, 5일 데이터)를 사용할 경우 다시
오차율이 증가하는 것을 알 수 있다. 발전량을 예측하는데 이전의 데이터가 유의미하나 3일 이전의 데이터는 발전량 예측에 큰 영향을 주지 않는다. 3일간의
연속된 입력 데이터를 이용하는 것이 발전량 예측정확도가 높은 것을 확인하였다. GRU가 LSTM보다 연산속도가 신속하였으나 정확도에서는 LSTM 더
우수하였다. 또한 풍속데이터를 추가하여 예측하는 것이 풍속데이터를 사용하지 않은 것보다 MAPE가 낮고 예측 정확도가 높은 것을 알 수 있었다. 본
연구는 신재생에너지 확산에 따른 변동성이 심해지고 있어 수상태양광 발전량 예측을 통해 전력의 수요와 공급안정화에 기여할 수 있도록 수상태양광 발전량을
순환신경망을 통해 예측하였다. 순한신경망으로 수상태양광 발전량을 예측하는 경우 예측일 이전 3일간의 연속된 입력 데이터를 이용하고 GRU보다 LSTM을
활용하는 것이 더 정확한 결과를 얻었으며 풍속이 발전량에 영향을 미치는 것을 알 수 있었다. 향후 수상태양광 최적예측을 위한 이용하는 데이터에 따른
정확도를 분석해 보고, 저수지에 빈번히 발생되는 안개에 대해서도 수상태양광 발전량에 영향을 미치는지 분석해 보고자 한다. 또한 다른 지역의 수상태양광과
인근 육상태양광의 발전량을 예측해서 비교하며, 시간별로도 예측을 분석해 보고자 한다.
References
Hyun-Jin Kim, 2021.11, The Grid Connection Status of Renewable Energy and Accommodation
Plans(9th Long-term Grid Reinforcement Plan), Korea Society of Energy&Climate Change,
pp. 16
Heesung Moon, Yeuntae Yoo, Intae Kim, Seung-Min Jung, Gilsoo Jang, 201810, Simulation
and Performance of Large Scale Power System Considering Renewable Energy Variability,
The Korean Institute of Electrical Engineers, pp. 131-132(2 pages)
Hyesook Son, Seokyeon Kim, Yun Jang, 2020 10, LSTM-based 24-Hour Solar Power Forecasting
Model using Weather Forecast Data, KIISE Transactions on Computing Practices, Vol.
26, No. 10, pp. 435-441
Yongtaek Lee, Doohyung Kim, Wooseok Sin, Changki Kim, HyunGoo Kim, Sung Won Han, October
2021, A Comparison of Machine Learning Models in Photovoltaic Power Generation Forecasting,
Journal of the Korean Institute of Industrial Engineers vol. 47, Vol. 5, pp. 444-458
Yanzhao Wu, Ling Liu, January/February 2022, A Comparative Measurement Study of Deep
Learning as a Service Framework, IEEE Transactions on Services Computing, Vol. 15
HyukRok Kwon, 2022, A Study on the Power Metering Data Missing Correction Model Based
on Deep Learning, Ph.D. Thesis Chosun University Kwangju Korea
Fuyong Zhang, Xiangyu Gao, , Atmospheric Environment Data Generation Method Based
on Stacked LSTM-GRU, 2021 IEEE 15th International Conference on Electronic Measurement
& Instruments (ICEMI).
Hanho Kim, Haesung Tak, Hwan-gue Cho, 2019 6, Design of Photovoltaic Power Generation
Prediction Model with Recurrent Neural Network, Journal of KIISE, Vol. 46, No. 6,
pp. 506-514
Trapani Kim, 2013, Proposing offshore photovoltaic(PV) technology of the energy mix
of the Maltese islands, Energy Convers Management, Vol. 67, pp. 18-26
Y.-K Choi, Appl 2014, A Study on Power Generation Analysis of Floating PV System Considering
Environmental Impact, Int J Softw Eng Its, Vol. 8, pp. 75-84
Utpal Kumar Dasa, Kok Soon Tey, January 2018, Forecasting of photovoltaic power generation
and model optimization, Renewable and Sustainable Energy Reviews, Vol. volume 81,
pp. 912-928
Gyu Gwang Kim, Hyung-Keun Ahn, May 2019, Prediction Model for PV performance With
Correlation Analysis of Environmental Variables, IEEE journal of photovoltaics vol.
9, Vol. 9, No. 3
R.W Taylor, 1986, System and module rating : Advertised versus actual capability,
Sol. Cells, Vol. 18, pp. 335-344
Baekcheon Kim, Seunghwan Jung, February 2020, Solar Power Generation Forecasting
based on LSTM considering Weather Conditions, Journal of Korean Institute of Intelligent
Systems, Vol. 30, No. 1, pp. 7-12
In Sup Han, 2016, Study on a prediction model that takes into account the multicollinearity
of the independent variables, Department of Industrial and Management Engineering
Graduate School Kyonggi University.
Jeff Tayman, David A. Swanson, 1999, On the validity of MAPE as a measure of population
forecast accuracy, Population Research and Policy Review, Vol. 18, pp. 299-322
R.J. Hyndman, A.B. Koehler, 2006, Another look at measures of forecast accuracy, International
Journal of forecasting accuracy, Vol. 22, pp. 679-688
C. Tofallis, Aug 2015, A better measure of relative prediction accuracy for model
selection and model estimation, Journal of the Operational Research Society, Vol.
66, No. 8, pp. 1352-1362
Apeksha Shewalkar, Deepika Nyavanandi, Simone A. Ludwig, 2019, Performance evaluation
of deep neural networks applied to speech recognition : RNN, LSTM AND GRU, JAISCR,
Vol. 9, No. 4, pp. 235-245
저자소개
He received the B.S. degree in electrical engineering from Yeungnam University, Gyeongsan,
Korea, in 1998 and M.S. degree in electrical engineering from Arizona State University,
in 2011.
He is currently working toward the Ph.D. degree in Chungnam National University.
Currently, He serves as a General Manager of K-water.
He received the B.S. degree in electronic engineering from Yeungnam University, Gyeongsan,
Korea, in 2019.
Currently, he serves as a assistant manager of K-water.
He received the B.S, M.S and Ph.D degree in electrical engineering from Chungnam National
University, Daejeon, Korea, in 2011, 2013 and 2017.
Currently, he serves as a Senior Researcher for K-water Research Institute.
He received the B.S. degree from Seoul National University, Seoul, South Korea, in
1988 the M.S. degree from the Pohang Institute of Science and Technology, Pohang,
South Korea, in 1990 and the Ph.D. degree from Texas A&M University, College Station,
TX, USA, in 2004, all in electrical engineering.
From 1990 to 2001, he was at LG Industrial Systems, Anyang, South Korea, where he
was engaged in the development of power electronics and adjustable speed drives.
Since 2005, he has been with the Department of Electrical Engineering, Chungnam National
University, Daejeon, South Korea.
He was a Visiting Professor at the United Technology Research Center, Hartford, CT,
USA, in 2009.