Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers

The Transactions of the Korean Institute of Electrical Engineers

ISO Journal TitleTrans. Korean. Inst. Elect. Eng.

Main Menu

Journal Search

[

Research article

]

The Transactions of the Korean Institute of Electrical Engineers

KIEE Vol. 74, No. 11, p.1784-1790

ISSN (print) :

1975-8359

ISSN (online) :

2287-4364

Received : 26 Jun. 2025Revised : 14 Aug. 2025Accepted : 29 Sep. 2025

DOI :

https://doi.org/10.5370/KIEE.2025.74.11.1784

회귀분석을 이용한 태양광 발전 계측데이터 추정 기법 연구

A Study on the Measurement Data Estimation of Photovoltaic Power Generation Using Regression Analysis

김영일 (Young-Il Kim) ^†iD 노재구 (Jae-Koo Noh) ¹iD 이효철 (Hyo-Chul Lee) ¹iD 김예리 (Ye-Ri Kim) ¹iD 신진호 (Jin-Ho Shin) ¹iD

(Digital Solution Laboratory, KEPCO Research Institute, Republic of Korea.)

^†Corresponding Author : Digital Solution Laboratory, KEPCO Research Institute, Republic of Korea. E-mail: yi.kim@kepco.co.kr

License :

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0)which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Translated Abstract

As the proportion of renewable energy increases, the instability of the power system is growing due to volatility of photovoltaic and wind power caused by weather and environmental conditions. Accordingly, the necessity to monitor renewable energy generation in real-time and manage power supply and demand to secure grid stability is increasing. This paper introduces a renewable energy data integration platform that collects and manages real-time power generation data from renewable energy generators nationwide in 1-minute resolution, and presents research on a technique to generate 1-minute resolution measured data using 1-hour resolution metering data collected during missing periods, based on a regression analysis technique when real-time power generation data is missing due to communication errors, etc.

Key words

Regression, Analysis, Estimation, Photovoltaic Power Generation, Measurement, Metering

1. 서 론

정부의 제11차 전력수급기본계획에 따르면 2023년 기준 31.4GW의 신재생 발전설비는 2038년까지 125.9GW로 증가할 것을 전망하고 있다^[1]. 신재생 발전원이 증가함에 따라 태양광과 품력 등과 같은 발전원이 기상과 환경조건에 따른 발전량의 변동성이 커지고 있어 전력계통의 불안정성이 높아지고 있다. 신재생 발전원이 확대될 경우 전력수급의 불균형이 발생하여 주파수 변동, 전압 상승, 전력계통 관성력 약화 등과 같은 문제로 인해 전력계통 안정성에 영향을 끼치게 된다^[2,^3]. 특히 태양광과 풍력과 같은 IBR (Inverter Based Resource)의 경우 기존의 동기발전기와 달리 변동성이 크고, 매우 빠른 응답속도와 동특성을 갖고 있어 전력계통의 복잡성을 증가시키는 문제가 있어 계통 안정도에 주는 영향을 평가하기 위한 다양한 해석방법 및 대응방안에 대한 연구가 진행되고 있다^[4]. 전통적인 배전선로의 경우에는 변전소에서 수용가로 단방향 조류가 발생하였으나, 최근에는 신재생의 증가로 인해 양방향 조류가 발생하면서 전압상승, 전력품질 저하 등 다양한 문제가 발생하고 있다. 이를 해결하기 위해 전압조정장치인 SVR(Step Voltage Regulator)를 설치하고, 정밀한 전압제어를 위해 머신러닝이나 인공신경망 기법 등을 이용하여 SVR을 제어하는 연구를 진행하고 있다^[5]. 이러한 연구를 수행하기 위해서는 신재생 발전량에 대한 다양한 예측방법이 필요하여 인공지능을 기반으로 하는 다양한 예측 모델에 대한 논문과 특허가 지속적으로 발간되고 있다^[6].

본 논문에서는 신재생 에너지의 변동성 및 전력 품질 등의 연구를 수행하는데 필요한 발전량 데이터를 통합 관리하는 신재생 에너지 데이터 통합 플랫폼에 대한 개발내용을 소개하고, 통신이상 등으로 인해 누락된 계측데이터를 계량데이터를 이용한 회귀분석을 통해 추정하는 방법에 대해 소개하고자 한다.

2. 신재생 에너지 데이터 통합 플랫폼

2.1 신재생 에너지 데이터 관리현황

한전은 2025년 1월을 기준으로 표 1과 같이 총 1백만개, 38GW의 신재생 발전설비를 전력망에 연결하고 있으며, 계약 형태별로 살펴보면 전력거래소를 통해 전력을 판매하는 시장거래 용량이 43%, 한전과 신재생 에너지 판매 계약을 한 PPA 거래 용량이 48%, 자가 소비 후 남은 잉여전력을 전기요금에서 상계하는 상계거래 용량이 8%로 구성된다.

신재생 발전설비의 발전량은 신재생 발전사업자의 계약형태에 따라 데이터를 관리하는 주체가 달라져서 여러 시스템에서 별도로 관리되고 있다. 신재생 발전현황을 감시하기 위해 다양한 형식으로 관리하고 있으나, 이를 단순화하면 계측 및 계량데이터로 구분할 수 있다. 계측데이터는 신재생 발전량을 실시간으로 파악하기 위해 1분마다 계측 장치를 통해 발전량(kW)을 계측하여 획득하게 되며, 계량데이터는 신재생 발전량에 대한 비용 정산을 위해 15분 또는 1시간마다 계량 장치를 통해 발전량(kWh)을 계량하여 획득하게 된다. 시장거래의 경우에는 전력거래소에서 발전정산을 위해 모든 고객의 계량데이터를 수집하며, 한전은 전용선로를 사용하는 일부 고객에 한하여 계측데이터를 수집하고 있다. PPA 거래의 경우에는 한전에서 발전정산을 위해 모든 고객의 계량데이터를 수집하며, 일부 고객에 한하여 계측데이터를 수집하고 있다. 상계거래의 경우에는 역송량에 대한 계량데이터를 수집하고 있으나, 자가 소비 후에 남는 잉여전력에 한정되어 계량하기 때문에 신재생 발전량 데이터로써의 의미가 상대적으로 적은 데이터이다.

표 1 신재생 에너지 보급현황

Table 1 Status of renewable energy deployment

구 분		신재생 상업운전
구 분		용량(MW)	건수
송배전 전압별	154kV 이상 송전	7,351(19.2%)	608(0.1%)
	22.9kV 이하 송전	1,902(5.0%)	379(0.0%)
	22.9kV 이하 배전	28,955(75.8%)	1,011,883(99.9%)
계		38,208(100.0%)	1,012,870(100.0%)
계약 형태 별	시장거래	16,644(43.6%)	9,518(0.9%)
	PPA거래	18,323(48.0%)	171,096(16.9%)
	상계거래	3,241(8.5%)	832,256(82.2%)

2.2 통합 플랫폼 개요

본 연구에서 개발된 신재생 에너지 데이터 통합 플랫폼은 그림 1과 같이 기본적으로 38.2GW, 1백만 개의 신재생 설비에 대한 설비용량 정보를 관리하고 있다. 이 중에서 송전급 약 9.2GW의 발전설비에 대해 8.0GW의 설비는 전용선로에서 1분 단위로 계측정보를 수집하고, 나머지 1.2GW의 설비는 송전급 발전율을 이용하여 발전량을 추정하고 있다. 배전급 28.9GW의 발전설비에 대해 14.3GW의 설비는 한전의 차세대 배전망 관리시스템에서 계측 및 추정한 계측정보를 수집하고, 나머지 14.6GW의 설비는 배전급 발전율을 이용하여 발전량을 추정하고 있다.

그림 1. 신재생 에너지 데이터 통합 플랫폼 화면

Fig. 1. Screen of renewable energy data integration platform

신재생 발전량을 추정하는 과정은 그림 2와 같고 추정에 따른 발전량의 변화를 예를 들어 설명하면 표 2와 같다. 특정일 13시를 기준으로 송전급 8.0GW 설비용량에 대해 발전량으로 7.2GW를 계측하고, 배전급 14.3GW 설비용량에 대해 발전량으로 13.3GW를 계측한 경우, 누락이나 오검침된 설비의 발전량과 설비용량을 보정을 통해 제거하면, 송전급은 설비용량 7.6GW에 발전량 6.9GW로, 배전급은 설비용량 13.9GW에 발전량 12.1GW로 수정된 보정본을 얻게 된다. 보정된 데이터를 송전급 전체 설비용량 9.2GW에 맞추어 발전율인 91%를 적용하여 발전량을 8.4GW로, 배전급 전체 설비용량 28.9GW에 맞추어 발전율 86%를 적용하여 발전량을 24.9GW로 추정하게 된다.

그림 2. 신재생 발전량 보정 및 추정

Fig. 2. Correction and estimation of renewable generation

표 2 신재생 발전량 보정 및 추정 예시

Table 2 Example of correction and estimation of renewable generation

	송전급(MW)			배전급(MW)			합계(MW)
	발전량	설비 용량	발전율	발전량	설비 용량	발전율	발전량	설비 용량	발전율
원본	7,241	8,002	90%	13,394	14,381	93%	20,635	22,383	92%
보정본	6,937	7,605	91%	12,101	13,991	86%	19,038	21,596	88%
추정본	8,425	9,253	91%	24,925	28,955	86%	33,350	38,208	87%

3. 회귀분석을 이용한 계측데이터 추정

3.1 실험 개요

전력사에서 신재생 발전원으로 인한 계통안정성 영향 분석을 수행하기 위해서는 1분 단위의 발전량 계측데이터가 필요하다. 계측데이터의 경우 통신 이상이나 계측 오류 등으로 1시간 이상 누락되거나 비정상적인 데이터가 발생하는 경우가 있다. 또한 플랫폼에서는 계측데이터를 기반으로 1분 단위의 계측값을 합산하여 신재생 발전량을 표시하고 있다. 대용량 발전원의 계측데이터가 누락될 경우 전체 발전량 데이터가 불안정하게 표출되는 문제점이 발생한다. 본 연구에서는 계측데이터가 장시간 누락된 경우 회귀분석을 통해 계량데이터를 이용하여 계측데이터를 추정하는 기법을 연구하였으며, 실험에 사용된 하드웨어 스펙은 표 3과 같다.

표 3 회귀분석에 사용된 하드웨어 스펙

Table 3 Hardware specification used for regression analysis

구분	상세 내역
CPU	Intel Xeon ES-2680 v4 @ 2.4GHz(56 CPUs)
Memory	256GB
Disk	54TB
O/S	Linux 4.18.0
Framework	Python 3.13.0

3.2 실험 데이터

본 연구에서는 1분 단위 계측데이터와 1시간 단위 계량데이터가 모두 수집되는 10MW 이상 태양광 발전원 21곳의 데이터를 이용하였다.

실험에 사용된 발전원의 총 설비용량은 1.6GW이고, 평균 설비용량은 76MW, 최대 설비용량은 306MW, 최소 설비용량은 15MW로 구성된다. 태양광 발전원의 설비용량의 분포를 나타내는 히스토그램은 그림 3과 같다.

그림 3. 태양광 설비용량에 대한 히스토그램

Fig. 3. Histogram of photovoltaic generation capacity

3.3 전처리 및 정규화

본 연구에서는 정확한 실험을 진행하기 위해 수집된 데이터에서 비정상적인 데이터를 제거하기 위한 전처리 과정을 아래와 같이 수행하였다. 1분 단위로 수집되는 계측데이터는 감시시스템의 특성상 통신 장애나 계측 오류 등으로 인해 일시적으로 데이터가 누락되는 상황이 발생하게 된다. 본 실험에서는 1분 단위 계측데이터가 연속적으로 5개 이하로 누락되는 경우에는 전후의 계측값의 평균을 이용하여 보정하였으며, 5개 이상 누락되는 경우의 계측데이터는 실험에서 제외하였다. 1시간 단위 계량데이터의 경우에는 실험기간 동안에 계량데이터가 누락된 경우에는 해당 기간 동안에 계측 및 계량데이터를 모두 제외하였다. 전처리를 통해 1분 단위로 24시간 동안 계측한 1440개(60×24)의 데이터를 갖는 658건의 계측데이터를 만들어 실험에 사용하였다.

계측 및 계량데이터에 대한 정규화는 각 계측 및 계량값을 해당 태양광 발전원의 설비용량으로 나누어 0에서 1사이의 값을 갖도록 정규화를 수행하였다.

3.4 군집화를 통한 데이터 분석

실험데이터에 대한 분석을 위해 계측데이터를 기반으로 군집화를 수행하였다. 군집화 실험은 k-means 알고리즘을 이용하였으며, k 값을 결정하기 위해 k 값의 범위를 1부터 9까지 증가시키며 왜곡도(Distortion Score)를 계산하여 적정한 k 값을 찾는 Elbow 방법을 사용하였다^[7,^8].

군집화 결과로 각 군집들이 잘 분리되어 있는지 시각적으로 확인하기 위해 PCA(Principal Component Analysis)를 수행하였다. 1440개의 계측데이터 중에서 데이터의 분산을 가장 잘 설명하는 성분을 X축, 그 다음 설명하는 성분을 Y축으로 하여 k값이 3일 때부터 6일 때까지의 PCA 그래프를 나타내면 그림 4와 같다. PCA 그래프를 살펴보면 군집이 잘게 쪼개져 겹치거나 과도하게 분리되지 않고 고르게 분포되어 있어 실험에 사용한 데이터가 비교적 고르게 분포된 것을 알 수 있다.

그림 4. 군집화에 대한 PCA 그래프(k=3~6)

Fig. 4. PCA graph for k-means clustering(k=3~6)

표 4는 각 군집의 중심값에서 군집에 속한 노드들 간의 거리를 합하여 SSE(Sum of Squred Errors)를 계산한 것으로 SSE가 낮을수록 높은 군집화 성능을 보여주게 된다. 그림 5는 SSE를 이용하여 왜곡도를 나타낸 그래프로, 본 연구에서는 왜곡도의 기울기가 급격히 줄어들기 시작하는 지점인 k=5를 최적의 군집 개수로 선정하였다.

k-means 알고리즘을 통해 1440개의 계측데이터를 5개의 군집으로 나누었을 때 각 군집의 중심값을 나타내면 그림 6과 같다. X축은 1분 간격으로 일일 24시간을 나타내며, Y축은 발전량을 설비용량으로 나누어 정규화된 발전량(PG, Power Generation)을 나타낸다.

표 4 군집 수에 따른 SSE 값

Table 4 SSE based on the number of clusters

	군집 수(k)
	2	3	4	5	6	7	8	9
SSE	33519	24559	19953	16877	16142	15321	14537	13725

그림 5. 최적의 k 값 선정을 위한 Elbow 그래프

Fig. 5. Elbow graph for optimal k

그림 6. 군집별 평균 발전량 그래프

Fig. 6. Average power generation graph for clusters

각 군집별 평균 발전량을 살펴보면 군집 2는 가장 많은 일일 발전량 데이터를 갖고 있는 군집으로 201개의 발전량 데이터가 ESS가 연동되지 않는 일반적인 태양광 발전량 형태를 보인다. 군집 1과 4는 ESS가 연결된 태양광 발전량 중에서 ESS 용량이 태양광 설비에 비해 상대적으로 적은 경우로 10시부터 ESS를 충전하여 1시간 정도 충전한 후 16시에 방전하는 형태를 보인다. 군집 3과 5는 ESS 용량이 상대적으로 큰 경우로 10시부터 충전하여 15시까지 충전하고 16시에 방전하는 형태를 보이고 있다. 이러한 분석을 통해 실험에 사용되는 발전량 데이터가 다양한 패턴을 갖고 있으며 고르게 분포하고 있는 것을 알 수 있다.

3.5 회귀분석을 이용한 계측데이터 추정

본 연구에서는 위의 군집분석을 통해 알아본 바와 같이 다양한 발전량 형태를 갖는 태양광 발전원에 대해서 계측데이터가 1시간 이상 누락된 경우에 계량데이터를 이용하여 계측데이터를 추정하는 기업을 연구하였다. 본 연구에서는 1분 단위 계측값과 1시간 단위 계량값이 모두 수집되는 태양광 발전원의 데이터를 이용하여 6시간 단위로 이루어진 총 6035개의 실험데이터를 생성하여 실험하였다.

회귀분석을 위해 인공신경망 기반의 태양광 출력 추정에 많이 사용되는 MLP(Multi Layer Perceptron) 모델을 사용하였다^[9,^10].

그림 7. 계측데이터 추정을 위한 MLP 모델

Fig. 7. MLP model for measuring data estimation

그림 7을 살펴보면 입력층은 추정하고자 하는 계측데이터를 나타내는 1시간 단위의 시간 데이터 1개와 추정 시간 직전 6시간 동안의 1시간 단위 계량데이터 6개, 추정 시간 직전 1시간 동안의 1분 단위 계측데이터 60개로 구성된다. 출력층은 추정 시간 이후 1시간 동안의 1분 단위 계측데이터 60개로 구성된다. 실험데이터는 MLP 모델의 훈련용으로 70%를 사용하고 검증용으로 30%를 사용하도록 하였다. 실험을 위한 기본 반복횟수인 epoch는 100번으로 설정하고, 성능 평가를 위한 손실함수는 MAE(Mean Absolute Error)를 사용하였다. 인공 신경망의 성능에 중요한 영향을 미치는 활성화 함수 및 최적화 알고리즘에 대한 성능 비교를 위해 활성화 함수는 logistic과 tanh, relu를 사용하고 최적화 알고리즘은 lbfgs와 sgd, adam을 사용하였다.

$MAE =\dfrac{1}{n}\sum_{i=1}^{n}| y_{i}-\hat{y_{i}|}(y_{i}관측값,\: \hat{y_{i}}예측값)$

첫 번째 실험에서는 계측데이터 추정에 적합한 활성화 함수와 최적화 알고리즘을 선정하기 위해 단일 은닉층을 기반으로 노드수를 100개부터 1000개까지 100개씩 증가시키면서 성능을 평가하였고 그 결과는 그림 8과 같다. 은닉층에 입력된 데이터의 가중치를 이용하여 출력신호를 생성하는 활성화 함수는 출력의 비선형성을 위해 중요한 요인으로 –1에서 1의 범위를 갖는 tanh(Hyperbolic Tangentn)와 양수는 그대로 출력하고 음수인 경우에는 0을 출력하는 relu(Rectified Linear Unit)가 가장 성능이 좋은 것으로 나타났다. 노드의 가중치를 갱신하여 손실을 최소화하는 최적화 알고리즘의 경우에는 대량의 데이터에 적합한 adam(Adaptive Moment Estimation)의 성능이 좋은 것으로 나타났다.

그림 8. 단일 은닉층의 노드수에 따른 MAE

Fig. 8. MAE based on node count for single hidden layer

첫 번째 실험에 사용된 조합에 대한 연산시간은 그림 9와 같이 나타나며, 이를 분석하면 활성화 함수로 relu를 사용하고, 최적화 알고리즘으로 sgd와 adam을 사용하는 경우가 빠른 연산시간을 보이는 것을 알 수 있다. 따라서 가장 중요한 성능에 있어서 손실함수의 오차가 적고, 상대적으로 빠른 연산시간을 보이는 조합으로 relu와 adam을 사용하는 방법이 가장 효과적인 것을 알 수 있다.

그림 9. 단일 은닉층의 노드수에 따른 연산시간

Fig. 9. Computation time based on node count for single hidden layer

두 번째 실험에서는 활성화 함수로 relu를 사용하고, 최적화 알고리즘으로 adam을 사용하여 다중 은닉층에 대한 성능을 평가하기 위해 각 계층별로 노드수를 동일하게 하는 방법과 감소시키는 방법, 증가시키는 방법으로 비교실험을 진행하였고 실험에 사용된 각 방법에 따른 은닉층별 노드수는 표 5와 같다. 두 번째 실험은 은닉층을 단일 계층부터 4개의 은닉층을 갖는 경우로 나누어 실험하였고, 실험 결과로 얻은 MAE의 그래프는 그림 10과 같고, 연산시간은 그림 11과 같다.

표 5 다중 은닉층별 노드수

Table 5 Number of nodes per multi hidden layer

방법	1계층	2계층	3계층	4계층
동일#1	[1024]	[1024, 1024]	[1024, 1024, 1024]	[1024, 1024, 1024, 1024]
동일#2	[512]	[512, 512]	[512, 512, 512]	[512, 512, 512, 512]
동일#3	[256]	[256, 256]	[256, 256, 256]	[256, 256, 256, 256]
동일#4	[128]	[128, 128]	[128, 128, 128]	[128, 128, 128, 128]
감소#1	[2048]	[2048, 1024]	[2048, 1024, 512]	[2048, 1024, 512, 256]
감소#2	[1024]	[1024, 512]	[1024, 512, 256]	[1024, 512, 256, 128]
감소#3	[512]	[512, 256]	[512, 256, 128]	[512, 256, 128, 64]
증가#1	[64]	[64, 128]	[64, 128, 256]	[64, 128, 256, 512]
증가#2	[128]	[128, 256]	[128, 256, 512]	[128, 256, 512, 1024]
증가#3	[256]	[256, 512]	[256, 512, 1024]	[256, 512, 1024, 2048]

그림 10을 살펴보면 다중 은닉층의 노드수를 동일하게 하는 경우 3계층을 사용할 때 성능이 가장 우수하며, 128개 노드를 사용한 경우가 가장 낮고, 512개의 노드를 사용한 경우(동일#2)가 가장 높은 성능을 보이고 있다. 노드수를 감소시키는 경우를 살펴보면 2048, 1024, 512개 노드로 시작하여 하위 계층으로 갈수록 절반씩 줄이는 3가지 방식을 사용하였는데 [1024, 512]로 2계층만을 사용하는 경우(감소#2)가 좋은 성능을 보이고 있다. 노드수를 증가시키는 경우는 3계층을 사용할 때 성능이 우수하며, [128, 256, 512]를 사용하는 경우(증가#2)가 좋은 성능을 보이고 있다.

그림 10. 다중 은닉층의 노드수에 따른 MAE

Fig. 10. MAE based on node count for multi hidden layer

그림 11를 살펴보면 전체 노드수와 연산시간이 비례하는 것을 알 수 있는데, 동일#2 경우 중간 정도의 속도를 보이고 있으나 큰 문제가 되지 않아 성능평가에 있어서는 주요지표인 MAE를 위주로 판단하였다.

그림 11. 다중 은닉층의 노드수에 따른 연산시간

Fig. 11. Computation time based on node count for multi hidden layer

표 6은 동일, 감소, 증가 방법별로 높은 성능을 보이는 경우의 MAE 값을 나타낸다. 세가지 경우 모두 최하위 은닉층은 512개의 노드를 사용한 경우가 가장 좋으며, 3계층의 노드수를 동일하게 512개로 사용하는 동일#2 방법의 MAE가 0.0354로 가장 성능이 우수한 것으로 나타났다.

표 6 다중 은닉층의 실험 방법별 MAE

Table 6 MAE for each method with multi hidden layer

방법	계층 및 노드수	MAE
동일#2	[512, 515, 512]	0.0354
감소#2	[1024, 512]	0.0368
증가#2	[128, 256, 512]	0.0366

그림 12는 본 연구에서 최종 선정된 MLP 모델을 시각적으로 평가하기 위해 나타낸 산점도 그래프이다. X축은 관측된 실제값을 나타내며, Y축은 MLP 모델의 추정값을 나타내며, 붉은 점선은 이상적인 추정선을 나타낸다. 산점도를 살펴보면 점들이 촘촘하게 모여 우상향하는 대각선을 이루고 있어 관측값과 추정값이 강한 상관관계를 나타내고 있는 것을 알 수 있다.

그림 12. 최종 MLP 모델의 산점도

Fig. 12. Scatter graph for final MLP model

그림 13은 본 실험을 통해 얻은 실제 계측값과 추정 계측값에 대한 최소, 평균, 최대 오차의 사례를 보여준다. 회색선은 추정 시점 전후 1시간 동안의 실제 계측값을 나타내며, 검은 선은 추정시점 이후 1시간 동안의 추정 계측값을, 파란색은 추정시점 전후 1시간 단위 계량값을 나타낸다. 최소 오차 그래프는 일몰 시점인 18시에 태양광 발전량이 안정적으로 줄어드는 경우를 보여주고 있으며, 평균 오차 그래프는 12시경 55%였던 발전율이 80%까지 증가하는 경우를 보여주고 있다. 최대 오차는 ESS가 연계된 태양광 발전원으로 18시경 발전량이 거의 없다가 19시부터 약 40분간 ESS 방전이 일어난 특별한 상황인 것으로 판단된다.

그림 13. 추정된 계측데이터의 최소, 평균, 최대 MAE

Fig. 13. Minimum, average, and maximum MAE of estimated measuring data

ESS로 인해 발생하는 최대 오차를 줄이기 위해 향후에는 k-means 군집화를 통해 태양광만 있는 경우와 ESS가 연계된 태양광의 경우를 분리하고, 두 경우에 대한 회귀분석 모델을 따로 만들어서 계측값을 추정하는 방식에 대한 연구를 진행할 예정이다.

4. 결 론

본 연구에서는 1분 단위 계측데이터가 누락된 태양광 발전원에 대해 1시간 단위 계량데이터를 이용하여 1시간 동안의 계측데이터를 추정하는 방법을 연구하였다. 추정을 위해 인공신경망 기반의 MLP 모델을 사용하였고, 손실함수는 절대 오차 평균인 MAE를 사용하였다. 실험결과 활성화 함수로 relu를 사용하고, 최적화 알고리즘으로 adam을 사용하며, 다중 은닉층으로 [512, 512, 512]의 3계층에 동일한 노드수를 갖는 경우가 MAE 0.0354로 최적인 것으로 나타났다.

본 연구에서는 MLP 모델만을 사용하여 실험을 하였으나, 추가적으로 GRU(Gated Recurrent Unit)와 LSTM(Long Short-Term Memory) 등과 같은 다양한 인공지능 모델을 활용하여 추정 정확도를 높이는 실험을 계속해 나갈 계획이다. 또한 ESS가 연계된 태양광의 추정 성능이 낮은 것을 해결하기 위해 태양광만 있는 경우와 ESS가 있는 경우로 나누어 회귀분석을 수행하는 연구도 진행할 예정이다.

이러한 연구경험을 바탕으로 데이터 확보를 통해 태양광 발전원 뿐 아니라 풍력, 연료전지 등의 신재생 발전원에 대한 계측데이터를 추정하는 방식도 연구해 나갈 계획이다.

Acknowledgements

본 논문은 한전 자체과제로 2022년도부터 수행한 “신재생 에너지 실시간 데이터 플랫폼 및 유연접속 운영시스템 개발” 과제의 연구결과물입니다.

References

Ministry of Trade, Industry and Energy, “11th Basic Electricity Supply and Demand Plan(2024-2038),” 2025.

Hun-Tae Kim and Seong-Su Jhang, “Key Technologies for Stabilization of Power System for Successful Achievement of 3020 Renewable Energy Policy,” The Transactions of the Korean Institute of Electrical Engineers, vol. 67, no. 2, pp. 149-157, 2018. DOI:10.5370/KIEE.2018.67.2.149

Ik-Jae Kim, Jin-Young Choi and Yoon-Sung Cho, “Study On Power System Analysis for Net Zero Carbon Emission Scenario Analysis,” The Transactions of the Korean Institute of Electrical Engineers, vol. 73, no. 2, pp. 243-253, 2024. DOI:10.5370/KIEE.2024.73.2.243

Bohyun Park and Jihun Kim, “Review of Power System Instability Cases by IBR Increasing and Analysis of Response Factors,” The Transactions of the Korean Institute of Electrical Engineers, vol. 73, no. 5, pp. 912-922, 2024. DOI:10.5370/KIEE.2024.73.5.912

Byungchan Yoo, Wonna Choi and Seungmin Jong, “A Study on Prediction and Accuracy Improvement of SVR Voltage Control in Distribution System Based on Machine Learning,” The Transactions of the Korean Institute of Electrical Engineers, vol. 74, no. 1, pp. 7-14, 2025. DOI:10.5370/KIEE.2025.74.1.7

Moon-Jong Jang, Taehoon Kim and Eunsung Oh, “A Study on the Patent Trend of AI-based Renewable Power Generation Forecasting Technologies,” The Transactions of the Korean Institute of Electrical Engineers, vol. 72, no. 4, pp. 496-502, 2023. DOI:10.5370/KIEE.2023.72.4.496

Jing Ouyang, Lidong Chu, Xiaolei Chen, Yuhang Zhao, Xuanmian Zhu and Tao Liu, “A K-means cluster division of regional photovoltaic power stations considering the consistency of photovoltaic output,” Journal of Sustainable Energy, Grids and Networks, vol. 40, pp. 496-502, Dec. 2024. DOI:10.1016/j.segan.2024.101573

Hanis Nasuha binti Amer, Mohd Fuad Abdul Latip and Norliza Zaini, “Modeling Domestic Solar Generation Profiles Using Elbow and K-Means Clustering Techniques,” 12th International Conference on System Engineering and Technology (ICSET), pp. 77-82, Oct. 2022. DOI:10.1109/ICSET57543.2022.10011009

Weican Liu and Mei Gai, “PV-MLP: A lightweight patch-based multi-layer perceptron network with time–frequency domain fusion for accurate long-sequence photovoltaic power forecasting,” Journal of Renewable Energy, vol. 251, pp. 1-18, May, 2025. DOI:10.1016/j.renene.2025.123277

Rafiq Asghar, Francesco Riganti Fulginei, Michele Quercio and Assia Mahrouch, “Artificial Neural Networks for Photovoltaic Power Forecasting: A Review of Five Promising Models,” Journal of IEEE Access, vol. 12, pp. 90461-90485, 2024. DOI:10.1109/ACCESS.2024.3420693

저자소개

김영일(Young-Il Kim)

He received his Ph.D. degree in computer engineering from Chungnam National University, Daejeon, Korea in 2012.

He is currently Principle Researcher of Platform Intelligence Pjt at KEPCO Research Institute, Korea.

노재구(Jae-Koo Noh)

He received his M.S. degree in computer engineering from Chungnam National University, Daejeon, Korea in 2018.

He is currently Senior Researcher of Platform Intelligence Pjt at KEPCO Research Institute, Korea.

이효철(Hyo-Chul Lee)

He received his B.A degree in Electronic and Electrical Computer Engeering from Hanyang University, Seoul, Korea in 2010.

He is currently Reacher of Platform Intelligence Pjt at KEPCO Research Institute, Korea.

김예리(Ye-Ri Kim)

She received her M.S. degree in computer engineering from Chungnam National University, Daejeon, Korea in 2023.

She is currently Research Engineer of Platform Intelligence Team at KEPCO Research Institute, Korea.

신진호(Jin-Ho Shin)

He received his Ph.D. degree in computer science from Chungbuk National University, Cheongju, Korea in 2010.

He is currently Chief Researcher of Platform Intelligence Pjt at KEPCO Research Institute, Korea.

KIEEThe Transactions of
the Korean Institute of Electrical Engineers

The Transactions of the Korean Institute of Electrical Engineers

ISO Journal TitleTrans. Korean. Inst. Elect. Eng.

Journal Search

Journal XML

Journal Information

A Study on the Measurement Data Estimation of Photovoltaic Power Generation Using Regression Analysis

Translated Abstract

Key words

1. 서 론

2. 신재생 에너지 데이터 통합 플랫폼

2.1 신재생 에너지 데이터 관리현황

2.2 통합 플랫폼 개요

3. 회귀분석을 이용한 계측데이터 추정

3.1 실험 개요

3.2 실험 데이터

3.3 전처리 및 정규화

3.4 군집화를 통한 데이터 분석

3.5 회귀분석을 이용한 계측데이터 추정

4. 결 론

Acknowledgements

References

저자소개

김영일(Young-Il Kim)

노재구(Jae-Koo Noh)

이효철(Hyo-Chul Lee)

김예리(Ye-Ri Kim)

신진호(Jin-Ho Shin)

Article Information (continued)

Key words

KIEEThe Transactions ofthe Korean Institute of Electrical Engineers

The Transactions of the Korean Institute of Electrical Engineers

ISO Journal TitleTrans. Korean. Inst. Elect. Eng.

Journal Search

Journal XML

Journal Information

A Study on the Measurement Data Estimation of Photovoltaic Power Generation Using Regression Analysis

Translated Abstract

Key words

1. 서 론

2. 신재생 에너지 데이터 통합 플랫폼

2.1 신재생 에너지 데이터 관리현황

2.2 통합 플랫폼 개요

3. 회귀분석을 이용한 계측데이터 추정

3.1 실험 개요

3.2 실험 데이터

3.3 전처리 및 정규화

3.4 군집화를 통한 데이터 분석

3.5 회귀분석을 이용한 계측데이터 추정

4. 결 론

Acknowledgements

References

저자소개

김영일(Young-Il Kim)

노재구(Jae-Koo Noh)

이효철(Hyo-Chul Lee)

김예리(Ye-Ri Kim)

신진호(Jin-Ho Shin)

Article Information (continued)

Key words

KIEEThe Transactions of
the Korean Institute of Electrical Engineers