1. 서 론
국내 하·폐수처리장은 건설 비용과 처리 효율성을 고려하여 생물학적 처리 기법인 활성슬러지공정(Activated Sludge Process)을 주로
사용한다. 이 공정은 미생물 덩어리인 활성슬러지를 하·폐수와 혼합하고, 이 활성슬러지가 하·폐수 속의 유기물을 섭취 분해함으로써 하·폐수를 정화하는
방식이다. 따라서, 활성슬러지가 얼마나 효율적으로 유기물을 제거하는가가 하·폐수 정화의 핵심 요소이다. 활성슬러지가 하·폐수 속의 유기물을 잘 제거하기
위해서는 활성슬러지가 건강해야 하고 또 하·폐수 속에 적정한 양이 유지되어야 한다. 하·폐수 속에 활성슬러지가 건강하기 위해서는 활성슬러지가 먹고
사는 용존 산소가 하·폐수 속에 적정량이 존재해야 한다. 그리고 하·폐수 속에 활성슬러지 양을 적절하게 유지하기 위해서는 인위적으로 양을 조절해야
한다. 따라서, 하·폐수 속에 용존 산소를 제어하는 것과 활성슬러지 양을 조절하는 것이 하·폐수 정화의 주요 제어 요소이다(1).
하·폐수 속에 용존 산소를 제어하기 위해서는 하수에 송풍기를 통해 공기를 주입하는 형태로 제어한다. 그리고 하·폐수 속에 활성슬러지 양의 조절을 위해서는
MLSS(Mixed Liquid Suspended Sludge)를 주입하거나, 버리는 슬러지를 양을 조절하는 WSR(Waste Sludge Ratio)
제어, 또는 슬러지를 재 주입하는 RRSP(Return Sludge Set Point)를 제어하는 방식으로 조절한다. MLSS, WSR, RRSP
등을 이용하여 활성슬러지 양을 조절하는 방식은 하·폐수처리장 설계 시에 유입되는 하·폐수의 처리 용량별로 어느 정도 정해져 있고 하·폐수 처리의 양이
자주 변하는 것이 아니기 때문에 주로 일정하게 유지하는 형태로 운영된다. 따라서, 실질적인 효율적인 하·폐수의 정화는 용존 산소를 제어하는 것으로
실질적으로는 송풍기를 제어하는 것이다(2). 활성슬러지는 하·폐수의 용존 산소(Dissolved Oxygen)를 통해 호흡하고 번식하므로 건강해지는데 용존산소의 양이 과도하면 활성슬러지의
호흡량 대비 배설물이 과도하여 정화 능력이 감소한다. 따라서, 하폐수 최적의 정화를 위해서는 하·폐수의 수질에 따라 적절한 용존 산소의 공급이 중요하다(3).
기존의 용존 산소를 결정하는 방법은 운전자의 경험을 근거로 결정되어 진다. 다년간의 경험을 근거로 용존산소량을 결정하여야 하는데 일반적으로 용존 산소를
많이 주입하는 방식으로 운전한다. 따라서 필요 이상으로 용존 산소 주입을 위해 과도하게 송풍기를 운전하는 경우가 발생한다. 이러한 과도한 송풍기 운전은
하·폐수처리장 운영비의 증가를 가져온다. 실제로 하·폐수처리장 운영비의 약 21%가 전력 비용이고, 그 전력비 용중 약 54~60%가 송풍기 운영으로
인한 것이다(4).
이러한 문제를 해결하기 위해 주로 운전자의 경험을 인공지능형 기법을 이용해서 처리하는 방식이 주로 이용되어 왔다. 대표적으로 운전자의 경험을 지능화하여
제어하는 퍼지 제어(Fuzzy Control)를 이용하는 방식으로 운전자의 경험을 퍼지 규칙으로 만들어 제어하는 방식을 주로 이용되어 왔다. 그러나
이 방법의 핵심은 운전자의 명확한 운전 경험이 규칙의 형태로 존재해야 하고 그에 적절한 데이터가 존재해야 한다. 그러나, 대부분의 하·폐수처리장의
운영이 무조건 용존산소를 높이는 방식으로 운영되어 실질적으로 퍼지 제어 기법은 우수하나 실질적인 제어의 효과를 볼 수가 없었다(8).
또 다른 방식은 활성슬러지 공정을 모델링하고 이 모델로부터 하·폐수의 수질에 따라 배출수의 수질이 좋아지는 최적의 용존산소를 결정하는 방식이다. 이
방식은 기본적으로 모델링 성능이 우수하면 좋은 결과를 낼 수 있다. 모델링 성능이 우수하기 위해서는 기본적으로 모델링에 사용되는 데이터가 2년치 이상으로
충분해야 하고 또한 실질적인 제어를 위해서는 수질 센서값이 운전자가 신뢰할 수 있도록 정확해야 한다. 또한, 모델링에 사용되는 수질의 종류에 대해서도
명확해야 되나 하·폐수의 수질이 하·폐수처리장마다 다르기 때문에 일반적인 형태로 모델링에 사용되는 수질의 종류를 정의하기 어렵다(6).
기존의 두 가지 기법 모두가 실질적으로 효과적으로 적용되기 위해서는 기본적으로 수질 센서 데이터가 충분하고, 신뢰성이 있어야 하고, 하·폐수처리장마다
다른 수질의 영향력을 반영할 수 있어야 한다.
따라서, 본 논문에서는 수질 센서 데이터의 충분성을 보장하기 위해 실제 하·폐수처리장의 3년치 데이터를 이용하고, 수질 데이터의 신뢰성을 확보를 위해
실시간으로 환경관리공단 시스템으로 전송되며 기준값을 초과하는 경우 패널티를 부과하기 때문에 신뢰성이 높은 방류수의 의 4가지 항목인 COD(Chemical
Oxygen Demand), TN(Total Nitrogen), TP(Total Phosphorus), SS(Suspended Solid)를 이용한다.
또한 하·폐수처리장마다 다른 수질의 영향력을 반영하기 위해 운전자의 신뢰성이 높은 방류수 수질인 COD, TN, TP, SS 4가지 수질을 기반으로
방류수 수질에 영향을 미칠 가능성이 있는 수질 항목을 설명가능한 인공지능(XAI, eXplainable AI)을 이용하여 유입수 수질 센서 항목들을
결정하고, 이를 모델링에 적용하여 최적의 용존산소를 결정하고자 한다. 하·폐수처리에서 최적이라는 것은 방류수의 4가지 수질 항목의 값을 최소화 한다는
의미이다. 설명가능한 인공지능 기법은 뉴럴네트워크를 이용한 공정 모델링에서 모델의 추론 결과에 영향 미치는 입력 요소들을 찾는 것으로 이를 통해 하·폐수처리장마다
다른 수질의 영향력을 반영할 수 있다.
본 논문의 구성은 다음과 같다. 2절에서는 하·폐수처리시스템의 활성슬러지공정을 생물학적 특성과 공정 제어 기반으로 설명하고, 3절에서는 신뢰성 있는
데이터 기반 공정 모델링, 4절에서 설명가능한 인공지능(XAI, eXplainable AI)의 적용, 5절에서는 활성슬러지공정 신경회로망 DO 모델
구현, 6절에서는 시뮬레이션, 마지막으로 7절에서는 결과를 고찰하고자 한다.
2. 하수처리시스템의 활성슬러지 공정
그림1 은 하·폐수처리장의 활성슬러지공정을 보여준다. 유입되는 하·폐수는 일차적으로 일차침전지로 유입되고 여기서 침강성 고형물이 제거된다. 일차침전지(Primary
Clarifier)에서는 체류시간을 길게 하여 침강성 고형물질을 바닥으로 퇴적되게 하고, 다음으로 상등수를 분리하여 다음 공정인 협기조(Anaerobic
Tank)로 보낸다. 혐기조에서는 인(Phosphorus)을 방출시켜 포기조(Aeration tank)에서 미생물이 과잉 섭취 할 수 있도록 하며,
무산소조(Anoxic Tank)는 포기조의 내부 반송수의 질소를 탈질시키는 역할을 한다. 무산소조에서는 pH, ORP(Oxidation Reduction
Potential), 질산성 질소(NO3)가 측정된다(7).
그림. 1. 하수처리 활성슬러지공정 및 수질 측정 항목
Fig. 1. Activated Sludge Process and Sensors in Sewage Treatment System
포기조에서는 미생물 덩어리인 활성슬러지가 하·폐수 속의 유기물질을 섭취하며 저분자 물질로 분해한다. 여기서 분해 물질 중의 탄소 성분은 대부분 CO2(이산화탄소)가
되거나 세포에 잔류하게 되며, 질소(N)와 인(P)이 일부 소비된다. 이 반응은 자연계에서의 자정 작용과 같은 것으로 인위적으로 공기를 물속에 주입하여
활성슬러지를 만들고, 이 활성슬러지가 용존산소를 이용해서 유기물을 분해한다. 즉, 공기를 주입하여 하·폐수 속의 용존 산소를 제어한다. 포기조에서는
DO(Dissolved Oxygen), NH4, pH, MLSS(Mixed Liquid Suspended Solid)이 측정된다. 유입수 수질과 포기조의
수질 항목들에 따라 배출수의 수질 4가지 COD, TN, TP, SS를 최소화 할 수 있도록 용존산소를 결정하는 것이 활성슬러지공정 모델링 및 제어의
핵심이다.
3. 신뢰성 있는 데이터 기반 공정 모델링
그림 2는 활성오니공정 모델링 절차를 보여준다. 활성슬러지 공정의 모델링은 하·폐수처리장마다 다른 수질의 영향력을 반영할 수 있도록 배출수의 수질인 COD,
TN, TP, SS를 최소화 할 수 있도록 용존산소를 결정하는 것이다. 따라서, 유입수의 수질과 배출수의 수질과의 상관 관계를 찾아내는 것이 모델링
구조 동정에 중요하다. 활성슬러지공정과 같은 생물학적 공정은 비선형성이 매우 강하고 또한 생물학적 공정의 특성으로 반응 시간이 유입량에 따라 달라
일반적인 통계 기법이나 선형 회귀 같은 방식의 적용은 한계가 있다. 그래서 본 논문에서는 이런 문제 해결을 위해 뉴럴네트워크 모델을 이용한다.
그림. 2. 제안한 하수처리 활성슬러지공정 모델링 절차
Fig. 2. Proposed Modeling Method of Activated Sludge Process
일반적으로 하·폐수가 유입으로부터 배출되기까지 일반적으로 약 12시간 정도의 반응시간이 소요된다고 알려져 있다. 따라서, 일차침전지부터 이차침전지에
이르기까지의 모든 수질 데이터를 가지고 공정을 모델링 하는 것은 적절하지 않다. 따라서, 실제적으로 반응의 영향력이 큰 포기조와 이차침전지의 수질
항목만으로 공정을 모델링 하는 것이 이러한 반응시간의 문제를 해결하는 방법이 될 수 있다. 이 경우, 포기조의 NH4, DO, pH, MLSS와 이차침전지
배출수의 COD, TN, TP, SS, pH가 모델링에 필요한 수질 항목이 될 수 있다. pH의 경우 변화가 적고 제어의 결과로서 모델링에서 제외하는
것이 적절하다. 여기에서, 가장 정확한 데이터는 이차침전지 배출수의 COD, TN, TP, SS이다. 이 4가지 데이터는 실시간으로 환경관리공단 시스템으로
송신되어 기준치 초과시 패널티를 부과하기 때문에 데이터가 정확하여 신뢰할 수 있다.
포기조의 용존 산소의 경우 실제적으로 송풍기를 가동하여 포기조의 용존 산소를 제어한다. 따라서 용존 산소를 높이기 위해서는 송풍기 가동 시간을 증가시켜야
하고, 이 경우 송풍기의 가동에 따른 사용 전력이 증가한다. 실제적으로 송풍기 가동 시간에 따른 전력비가 하수처리장 운영비의 약 50% 내외를 차지하는
경우가 많다. 따라서 송풍기의 가동을 최소화 하면서 이차침전지 방류수의 4가지 SS, COD, TN, TP를 기준치 이하로 유지하는 것이 운영 측면에서
중요하다.
따라서, 모델의 입력 항목으로 포기조의 NH4, MLSS, pH 3개 수질 입력 항목과 이차침전지 배출수의 COD, TN, TP, SS 4개 수질
입력항목으로, 출력으로는 포기조의 용존산소 DO로 하고 이로부터 서로의 관계를 뉴럴네트워크 모델링하고, 이 모델로부터 최적의 용존산소 DO를 결정하고자
한다.
실제적 적용에서 모델링의 입력 수질 변수가 많은 경우, 하나라도 입력 수질 변수가 오류가 있거나 문제가 있으면, 실제적 활용이 불가능하므로 입력 수질
변수의 수를 최소화하는 것이 필요하다. 따라서, 본 논문에서는 설명가능한 인공지능을 이용하여 출력변수인 용존산소 DO에 영향 미치는 입력 수질변수의
수를 최소화 하고자 한다.
일반적으로 활성슬러지공정 모델의 성능은 수질 센서 데이터의 유효 허용 범위가 일반적으로 기준치로 ±3%이고, 실제적으로 현장에서 적용 운영이 가능한
모델의 최대 학습오차를 ±5%로 가정하면 활성슬러지공정 모델의 최대오차는 ±8% 이내가 정도 되어야 실제적 활용이 가능하다.
4. 설명가능한 인공지능(XAI, eXplainable AI)의 적용
설명가능한 인공지능(XAI, eXplainable AI)은 뉴럴네트워크 모델에서 예측 또는 추론된 결과의 원인을 찾아내는 기법이다. 뉴럴네트워크 모델에서
예측 또는 추론에 영향을 미치는 요소를 찾아 결과를 이해할 수 있게 하는 것으로, 모델 자체를 해석하는 Interpreting Model과 원인에
대해 데이터로 설명하는 Explaining Decision으로 구분된다. 여기에서는 모델 자체를 해석하는 Interpreting Model을 중 연결강도를
이용하는 Layer-wise Relevance Propagation을 이용한다(5).
그림. 3. 하수처리 활성슬러지공정에 XAI 적용 방법
Fig. 3. Activated Sludge Process Modeling based XAI
설명가능한 인공지능의 활성슬러지공정 모델링에 적용은 그림 3과 같다. 먼저 공정 운전 전문가 또는 일반적인 운전 데이터로 부터 활성슬러지공정에서 배출수의 수질에 영향을 미치는 수질 항목들을 찾아 정의해야 한다.
다음으로는 이것을 이용하여 뉴럴네트워크 모델을 만들고, 학습을 수행한다. 본 연구에서는 역전파 알고리즘(Backpropagation Algorithm)을
사용한다. 모델이 목표 성능을 갖도록 구현되면 이로부터 어떤 입력변수가 출력 변수에 영향을 많이 미치는 가를 찾아내야 한다. 입력을 찾아낸다. 입력변수가
결정되면 이 입력 변수들을 모델의 입력으로 하여 다시 뉴럴네트워크 모델을 만들어 학습한다.
Interpreting Model을 이용하는 설명가능한 인공지능에는 입력값의 작은 변화에 따른 예측 값의 변화에 대한 변수 중요도 평가하는 방법,
모델 생성 후 새로운 입력 데이터에 대한 예측 결과 영향도를 분석하는 방법, 뉴련의 연결강도를 이용하는 방법으로 등이 있다. 활성오니공정의 모델링에서는
입력 수질 값의 작은 변화를 정의하기 어렵고, 새로운 입력 수질 값에 대한 정의와 민감도의 산출이 보편성을 갖기 어려워, 본 논문의 활성슬러지공정
모델링에는 적합하지 않아 딥러닝에 특화된 뉴련의 연결강도를 이용하는 방법 적용하고자 한다. 그림 4는 누럴네트워크 모델에서 연결강도를 이용한 설명가능한 인공지능 적용의 과정을 보여준다.
그림. 4. 적용된 설명가능한 뉴럴네트워크 구조
Fig. 4. Applied eXplainable Neural Network
출력변수에 영향을 미치는 입력변수를 찾기 위해 뉴럴네트워크 레이어별로 연결강도의 절대값을 이용한다. 연결강도가 양 또는 음의 값으로 가질 수 있어
서로 상쇄되는 문제가 있다. 연결노드의 함수가 시그모이드 함수로 좌우 대치이므로 절대값을 이용하는 것은 논리적으로 타당하다. 본 논문에서는 모델의
학습에 역전파(Backpropagation) 알고리즘을 이용한다. 학습 이 진행되어 목표 성능인 95% 이상의 성능이 나오면 학습을 종료하고, 연결강도를
양수와 음수로 구분하고 GAN(Generative Adversarial Networks)과 같이 양수는 양수끼리 음수는 음수끼리 경쟁하게 한다. 즉,
양수 중 제일 큰 값의 연결노드를 택하고, 음수는 음수 중 제일 작은 값의 연결노드를 선택한다. 다음 레이어에 대해서도 동일한 방식으로 진행한다.
전체적인 절차는 다음과 같다. 또한, 연결강도 절대값의 순위 1위와 2위의 편차가 매우 작은 경우(보통의 경우 연결강도 표준편차) 연결강도 크기가
1,2 모두를 선택한다. Step 1-5은 기존 연구의 내용과 동일하고 Step 6이 본 연구에서 추가적으로 보완된 부분이다(4).
Step 1 : if $W_{j}$>0, A={$W_{j}$}, else B={$W_{j}$}, j=1...n
여기서, n은 중간노드 수
Step 2 : $J_{k}$ = max A, $J_{m}$=min B
여기서, $J_{k}$, $J_{m}$은 k, m번째 중간노드이다.
Step 3 : if $W_{ik}$>0, A={$W_{ik}$}, else B={$W_{ik}$}, i=1...m
Step 4 : if $W_{im}$>0, C={$W_{im}$}, else D={$W_{im}$}, i=1...m
Step 5 : $I_{s}$ = max A, $I_{t}$=min B,
$I_{p}$ = max C, $I_{r}$=min D,
여기서, $I_{s}$, $I_{t}$, $I_{p}$, $I_{r}$은 s, t, p, r번째 입력노드이다.
Step 6 : if Gab(연결강도 절대값 순위 1위 2위 편차) < α
연결강도 크기가 1,2 모두를 선택
여기서, α는 연결강도 표준편차
s, t, p, r번째 입력 변수가 출력 변수에 영향 미치는 정도가 큰 입력변수로 결정된다. 이와 같은 방식으로 처음에 선택된 $W_{j}$ 2개(양수와
음수)를 제외하고 계속해서 반복하면 그 다음으로 출력에 미치는 영향이 큰 입력 변수가 선택된다. 선택된 노드가 중복되지 않으면 출력노드에 미치는 영향이
큰 입력변수는 2의 제곱승으로 증가하게 된다. 이와 같은 식으로 입력노드 변수가 출력변수 노드에 미치는 영향 정도의 순서를 정할 수 있다.
5. 활성슬러지공정 신경회로망 DO 모델
활성슬러지공정 용존산소 뉴럴네트워크 모델은 포기조의 NH4, MLSS, 2개 수질 항목과 이차침전지 배출수의 COD, TN, TP, SS 4개 수질
항목을 입력 변수로 하고, 출력 변수는 포기조의 용존산소로 한다. 기존 연구에서는 포기조의 pH를 포함하였으나 실제 데이터에서 pH의 변화가 미비하여
제외히였다(4). 활성슬러지공정 용존산소 뉴럴네트워크 모델은 그림 5와 같다.
그림. 5. 하수처리 활성슬러지공정 용존산소 뉴럴네트워크 모델
Fig. 5. DO Neural Network Model of Activated Sludge Process
여기서, 그림 5와 같은 뉴럴네트워크 모델 학습은 역전파 알고리즘을 이용한다. 뉴럴네트워크 입력과 출력은 데이터 값을 정규화하여, 식 (1)과 같이 데이터 $X_{t}=\left\{x_{1}(t),\:x_{2}(t),\:\cdots ,\:x_{n}(t)\right\}$에 대하여 정규화하여
입력변수의 출력변수에 대한 영향력을 균등화 하였다.
$\dot x_{i}(t)=\dfrac{\left(x_{i}(t)-(x_{i,\:\min}+x_{i,\:\max})/2.0\right)}{(x_{i,\:\max}-x_{i,\:\min})/2.0}$
(1)
여기서, $x_{i}(t)$는 $i$번째 입력변수의 $t$번째 데이터를 의미하고 $x_{i,\:\min},\:x_{i,\:\max}$는 각각 $i$번째
입력변수의 최대값과 최소값을 의미한다.$\dot x_{i}(t)$는 폐구간 [-1.0, 1.0]으로 정규화된 $i$번째 입력변수의 시간 $t$에서의
데이터를 의미한다. 모델의 학습은 전통적인 역전파 알고리즘을 사용하였다.
출력변수인 용존산소 DO에 변화에 크게 영향 미치는 입력변수를 찾기 위해 모델의 오차가 5%되는 시점 또는 오차의 변화가 거의 없는 시점을 학습 종료
시점으로 판단하고, 이때부터 4절의 알고리즘 step 1-6을 적용하여 각각의 입력변수에 대해 순위를 정하여 순위가 높은 것이 용존산소 DO에 미치는
영향이 큰 것으로 판단한다. 모델 학습 종료 시점을 최소자승오차(RMS error : Root Mean Square Error)를 설정한 것은 활성슬러지공정에
있어서 10% 이내의 오차는 실제적 제어에서 허용 가능한 것으로 알려져 있기 때문이다.
6. 성능평가
본 논문에서 제안한 알고리즘의 성능평가를 위해서 수도권 하수처리장의 3년치 실제 데이터를 사용하였다. 활성슬러지공정의 특성상 충분한 데이터가 실제적
검증에 필수적이다. 사용된 데이터는 시간별 데이터로 매 시각 정각에 측정되는 값이다. 전체 수질 항목별 데이터 개수는 26,280(3×365×24)개이다.
그림 6과 같이 활성오니공정 용존산소 뉴럴네트워크 모델을 구성하고 역전파 알고리즘을 통해 학습을 수행하였다. 사용된 데이터는 전체 데이터 26,280개 중,
비정상 데이터를 제외하고격일로 데이터를 학습용과 평가용으로 구분하여 각각 13,140개로 하였다. 비정상 데이터의 판단은 동일시간대 3일치 평균의
20%을 벗어나는 데이터로 설정하였다. 보통의 경우, 데이터 평균의 20%를 벗어나는 데이터는 수질 센서 오류이거나 센서 정비상태로 정상적인 데이터로
볼 수 없다. 또한 일별, 시간별 수질의 변화를 고려하여 똥일 시간대의 평균을 사용하여 비정상 데이터를 판단하였다. 평가는 비정상 데이터를 포함하는
경우와 포함하지 않은 경우를 구분해서 수행하였다.
학습의 종료는 모델의 최소자승오차가 10%되는 시점이거나 오차의 변화가 거의 없어 수렴하는 시점을 모델링 학습 완료 시점으로 하였다. 최종 모델링
최소자승오차는 아래 표 1과 같은 결과를 보였다. 비정상 데이터를 포함하는 경우와 포함하지 않은 경우의 오차는 0.02 정도로 미비하였으나 이는 비정상 데이터가 많은 경우
더 클 것으로 판단된다.
표 1. 모델 오차 비교
Table 1. Comparison of LMS Error
Including Abnormal Data
|
|
Learning Model
|
Estimating Model
|
RMS Error
|
0.15
|
0.21
|
Excluding Abnormal Data
|
|
Learning Model
|
Estimating Model
|
RMS Error
|
0.13
|
0.19
|
다음으로는 학습된 모델로부터 4절에서 제시한 알고리즘 Step 1-6을 적용하여 출력변수인 용존산소 DO에 미치는 각 입력변수의 영향 정도를 순위로
평가하였다. 연결강도를 양과 음으로 구분하여 절대값을 사용하여 제안된 알고리즘으로 수행한 결과는 표 2와 같다. 표 2에서 4절의 Step 6의 적용에서 순위가 2인 MLSS와 순위가 3인 TN의 편차가 기준치 이하로 되어 TN도 입력에 포함하였다.
표 2. 출력에 미치는 입력의 영향도 순위
Table 2. Inputs Impact Ranking on Output
|
Positive Weight
|
Negative Weight
|
Step 6: Gab
|
NH4
|
2
|
-
|
> α
|
MLSS
|
-
|
2
|
< α
|
COD
|
1
|
-
|
> α
|
SS
|
|
1
|
> α
|
TN
|
-
|
3
|
> α
|
TP
|
-
|
4
|
> α
|
표 2에서 최종적으로 활성오니공정 용존산소 뉴럴네트워크 모델에서 양수의 연결강도에서는 COD와 NH4 가 결정되고, 음의수의 연결강도에서 MLSS,
SS, TN이 선택되었다. 양수와 음수의 연결강도에서 각각 영향도 순위 1와 2위만을 선택하였다. 연결강도 순위 3위 이후도 선택은 가능하나 이 경우
입력 변수의 수가 많아저 모델링 효율과 실제적 적용에서 문제가 될 수 있다. 그러나 편차가 기준치 이하인 경우는 포함하였다. 최종적으로 활성오니공정
용존산소 뉴럴네트워크 모델의 구조는 그림 6과 같다.
그림. 6. 제안된 알고리즘으로 결정된 뉴럴네트워크 모델
Fig. 6. DO Neural Network Model using XAI
NH4, MLSS, COD, SS, TN 5개가 용존산소 DO에 미치는 입력변수로 하여 뉴럴네트워크 모델을 구성하고 역전파 알고리즘을 이용하여 학습을
수행하였다. 사용된 데이터는 전체 데이터 26,280개로 격일로 데이터를 학습용과 평가용으로 구분하여 각각 13,140개로 하였다. 학습의 종료는
최소자승오차의 변화가 거의 없는 시점을 모델링 학습 완료 시점으로 하였다. 최종 모델링 최소자승오차는 아래 표3과 같다. 비정상 데이터를 포함하는 경우와 포함하지 않은 경우도 이전과 동일하게 오차는 0.02 정도로 미비하였으나 이는 비정상 데이터가 많은 경우
더 클 것으로 판단된다.
표 3. DO 제안된 뉴럴네트워크 모델의 최소자승오차
Table 3. LMS Error of Proposed DO Neural Network Model
Including Abnormal Data
|
|
Learning Model
|
Estimating Model
|
RMS Error
|
0.17
|
0.23
|
Excluding Abnormal Data
|
|
Learning Model
|
Estimating Model
|
RMS Error
|
0.13
|
0.20
|
입력변수가 6개인 그림 5의 모델보다 입력변수가 1개가 줄어든 제안된 모델의 최소자승오차는 동일하였고, 평가용 모델은 최소자승오차가 0.01 증가하였다.이 정도는 입력변수의
수가 줄어든 것과 비교할 때 유익이 더 크다고 판단된다. 또한 용존 산소 제어의 실제적인 측면을 고려할 때, 차이는 거의 의미가 없는 정도이므로 입력변수를
6개에서 5개로 줄인 것과 비교하면 제안된 기법이 훨씬 더 효율적임을 알 수 있다. 즉, 제안된 기법을 통해 출력변수에 영향 미치는 입력변수를 줄이는
것으로 모델의 오차가 줄면 최선의 결과이나, 모델의 오차가 조금 증가한다 해도 응용 분야에 따라 그 증가된 오차가 큰 의미가 없다고 한다면 제안된
기법을 통해 입력변수를 줄이는 것이 실제 현장 적용에서는 더 큰 실효성이 있다고 판단된다.
5. 결 론
본 논문에서는 하·폐수처리 활성슬러지공정에서 데이터 신뢰성으로 인한 모델 베이스 제어의 문제점 해결을 위해 신뢰성이 높은 배출수 수질 4가지 항목을
기반으로 배출수 수질에 영향을 미칠 수 있는 수질 센서 항목을 설명가능한 인공지능(XAI, eXplainable AI)을 적용하여 유입수 수질 항목을
결정하고, 이를 활성슬러지공정 용존산소 뉴럴네트워크 모델링에 적용하여 최적의 용존산소를 결정하였다. 또한, 설명가능한 인공지능 기법중 연결강도를 이용하는
기법에서는 GAN의 개념을 이용하여 양수와 음수로 구분하여 서로 경쟁하는 방식을 적용하였다. 그 결과 활성슬러지공정 DO 뉴럴네트워크 모델의 입력
변수 6개(포기조의 NH4, MLSS 2개, 이차침전지 방류수의 COD, TN, TP, SS 4개) 중에서 COD, NH4, MLSS, SS, TN
5개를 선택하였다. 최종적으로 선택된 5개의 입력변수로 용존산소 뉴럴네트워크 모델로 재구성하여 역전파 알고리즘을 이용하여 모델을 학습하였다. 3년치
시간데이터 26,280개를 사용하엿고, 이중에서 격일로 데이터를 학습용과 평가용으로 구분하여 각각 13,140개로 하였다. 학습의 종료는 오차의
변화가 거의 없는 시점을 모델링 학습 완료 시점으로 하였다. 최종 모델의 학습 최소좌승 오차와 평가용 최소자승오차는 각각 0.13과 0.20 이었다.
학습모델의 경우, 입력변수가 6개인 기존의 방식보다 오차가 평가용 모델에서 조금 증가 하였지만 용존산소의 실제적인 값의 운영 범위로 볼 때, 이 정도의
차이는 거의 의미가 없는 정도이므로 입력변수의 수를 6개에서 5개로 줄인 것과 비교하면 제안된 기법이 훨씬 더 효과적임을 알 수 있었다. 입력 변수를
줄일 수 있는 것은 실제에서 매우 중요하다. 하나의 센서가 장애가 나면 기존의 연구에서는 활용이 불가능하기 때문에 장애가 난 센서를 입력에서 제외하면
실제적 적용이 가능하기 때문이다. 또한, 응용 분야에 따라 오차의 미미한 증가가 큰 의미가 없다고 한다면 제안된 기법을 통해 입력변수 수를 줄이는
것이 실제 현장 적용에서는 더 큰 실제성이 있다고 판단된다.
향후, 연구에서는 단순히 연결강도에 크기 순위 뿐만 아니라 연결강도의 음수 절대값과 양수 절대값의 상호 연결도 반영되어야 할 것으로 본다.