2.1 심음 발생의 선형 모델링
심음은 심실이 수축할 때 방실판막이 닫히며 생기는 낮고 둔한 제 1심음(first heart sound), 대동맥판과 폐동맥판이 닫힐 때 들리는 생기는
음으로 높고, 소리의 지속이 짧은 제 2심음(second heart sound) 2개의 큰 심음이 있으며, 이들은 비교적 고주파수에 해당하고, 제
3심음, 제 4심음은 저주파이며, 잘 들리지 않는다(2).
선천성 심장병중 심실중격 결손증(Ventricular Septal Defect, VSD)은 우심실과 좌심실 사이의 벽(칸막이)에 구멍이 생겨서 이를
통해 혈류가 지나가는 선천성 심장 질환으로, 전체 선천성 심장 기형 중 약 20~30%를 차지하여, 선천성 심장 기형 중 가장 흔한 질환에 해당한다.
심방 중격 결손증(Atrial Septal Defect : ASD)은 우심방과 좌심방 사이의 벽(심방 중격)의 결손(구멍)을 통해 혈류가 새는 기형을
의미한다(3).
음향 신호의 코딩과 인식 분야에서 신호 분석의 주목적은 신호를 복원하거나 인식하기 위해 충분한 파라미터들을 포함한 신호의 정보를 효과적으로 표현하는
것이다. 신호의 분석에서는 신호의 특성을 정확하고 간단히 나타낼 수 있는 주요 파라미터들을 정확히 추출하는 것이 중요하다.
음성 신호의 경우 음향적인 특성을 가장 성공적으로 나타낸 모델 중의 하나는 Fant에 의해 개발된 선형 음성 발생 모델(linear speech production
model)이며, 이를 토대로 개발된 선형 예측 기법은 음성 분석, 합성, 인식 등 음성 연구의 여러 분야에서 이용되고 있다(4). 선형 예측 기법은 기본적인 음성 파라미터들인 피치(pitch), 형성음(formant), 스펙트럼 등을 추정하고, 낮은 비트율 전송이나 저장을
위해 음성을 표현하기 위한 기법이다.
음성 발생 과정은 음원의 발생(source generation), 조음(articulation), 방사(radiation)의 세 과정으로 이루어진다.
이를 심음의 경우로 대체해 보면 심음원 발생, 전달(transfer), 방사의 세 과정으로 대체할 수 있을 것으로 보이며, 각각의 발생 모델의 시스템
함수는 식 (1)과 같이 표현될 수 있을 것이다.
여기서, $C(z)$는 심장에서 심음 발생의 전달 함수, $T(z)$는 공진(resonance)과 반공진(antiresonance)을 일으키며 심장에서
흉곽 표면까지 심음이 전파되는 전달 함수, 그리고 $R(z)$는 방사(radiation)와 청진기 간의 전달 함수로 가정한다.
선형 예측 모델은 음성 발생 모델의 파라미터들이 선형 수학을 사용하여 쉽게 구해진다는 중요한 특성 때문에 음성 발생 모델과 관계가 있다. 식 (1)의 전체 시스템의 입력은 $e(t)$로 가정하여 심음 주기 $P$를 갖는 임펄스 열(impulse train)이라 볼 수 있고, 심음 전달 함수 $T(z)$는
2-극점 공진기 몇 개가 직렬로 구성된 전-극점(all-pole) 모델이다. 각각의 공진은 대응되는 중심 주파수와 대역폭을 갖는 형성음(formant)으로
정의된다. 이와 같이 정의된 선형 심음 발생 모델은 다음과 같이 나타낼 수 있다.
여기서, 여기 모델(excitation model) $E(z)$와 위의 모델들과의 직렬 접속에 의해 심음 $S(z)$가 나타나게 된다.
이산 모델을 더 단순화하는 방법은 식 (3)을 정의함으로써 식 (4)의 전-극점 합성 모델(all-pole synthesis model)을 만들 수 있다.
필터 $A(z)$는 전-영점 필터(all-zero filter)이고, 식 (1)의 역 필터(inverse filter)이다. 필터 $1/A(z)$은 일정한 범위 내에서 음성 모델의 완만한 스펙트럼 형태를 나타내는 전-극점 필터이다.
$E(z)$가 전-극점 필터 $1/A(z)$에 인가되면, 출력이 심음 신호 모델의 $z$-변환 $S(z)$이므로, 식 (4)는 합성 모델로 간주된다. $A(z)$를 식 (4)의 양변에 곱해 주면, 그 결과는 식 (5)와 같다.
심음 발생이나 합성 모델을 정의하는 파라미터는 $A(z)$의 계수 $a_{i}$, 그리고 $E(z)$의 파라미터, 피치 주기 $P$, 그리고 이득
$\sigma$ 등이 있다.
2.2 선형 예측 분석
선형 예측은 최소-제곱 최소화 기준(least-squares minimization criterion)에 기초한다.
샘플 $s(n)$의 선형 예측은 단지 이전 샘플 $s(n-1)$에 기초를 두고 만들어진다. 그러면 $e(n)=s(n)-as(n-1)$은 예측 오차(prediction
error)로 생각할 수 있다. 최소화 기준은 최소-제곱 평균(least-square mean) 의미에서 예측 오차를 최소화하는 것이다(17).
샘플링된 데이터 영역에서 식 (5)는 식 (7)과 같이 등가적으로 표현될 수 있다.
샘플 $s(n)$의 $M$번째 선형 예측에는 이전의 $M$개 샘플들의 선형 결합이 필요하다. $\hat s(n)$을 예측된 샘플이라 하면,
여기서,
이다. $e(n)$은 실제 데이터 샘플 $s(n)$과 예측된 샘플 $\hat s(n)$ 사이의 예측 오차로 해석될 수 있다. $-a_{i}$ 항은
구해진 예측기 계수(predictor coefficients)로 정의된다. 음의 부호는 오차가 두 변수의 차에 기초한다는 것을 나타낸다.
각각의 샘플 인덱스 $n$에서, $s(n)$은 이전의 $M$개의 샘플들의 선형 결합에 의하여 예측된다. 식 (9)의 $z$-변환은
이며, 식 (11)은 선형 예측기 필터(linear predictor filter)를 나타낸다. 식 (7)과 (8)로부터, $z$-변환 영역에서 선형 예측 모델은 식 (12)와 같이 나타낸다(1).
이고,
이 된다. 선형 예측 기법에는 자기 상관 방법, 공분산 방법, 그리고 격자 방법 등이 있다(4). 표 1은 이들 세 가지 선형 예측 기법들을 비교한 것이다. 본 연구에서는 선형 예측기로 윈도우의 적용 없이도 필터의 안정성이 보장되는 격자(lattice)
방법 중 하나인 Burg 알고리즘을 사용하였다.
표 1 세 가지 선형 예측 방법들의 특성 비교
Table 1 Comparison between different property of three linear prediction methods
($p$ : 차수, $N$ : 샘플수)
특 성
|
Autocorrelation
|
Covariance
|
Lattice
|
윈도우
|
필요
|
없음
|
필요 없음
|
안정성
|
보장됨
|
보장되지 않음
|
보장될 수 있음
|
연산안정성
|
보장되지 않음
|
보장되지 않음
|
보장될 수 있음
|
연산효율성
|
효율적
|
효율적
|
비효율적
|
연산량
|
$p N+p^{2}$
|
$p N+\dfrac{1}{6}p^{3}+\dfrac{3}{2}p^{2}$
|
$5p N$
|
2.3 Burg 알고리즘
MEM(maximum entropy method)이라 알려진 Burg 방법은 격자 구조를 이용하여 전향 예측 오차(forward prediction
error)와 후향 예측 오차(backward prediction error) 제곱의 합을 최소화하는 것이다(4).
여기서, $e$는 전체 오차, $e_{p}^{+}(n)$, $e_{p}^{-}(n)$는 각각 전/후향 예측 오차이며, 물리적 진행 방향은 다음 그림과
같다.
그림 1 전/후향 예측 오차
Fig. 1 Forward/backward prediction error
최소화가 선형 예측 계수에 대하여 수행되면, 결과로 나온 예측 오차 필터는 최소 위상이 되지는 않는다. 그 대신에, Burg는 반복 과정을 제시하였다.
$p-1$ 차수의 예측 오차 필터 $\left\{1,\: a_{p-1,\:1},\: a_{p-1,\:2},\:\ldots ,\: a_{p-1,\:p-1}\right\}$가
이미 결정되어 있다고 가정하면, 반사계수 $\gamma_{p}$를 구하고 Levinson 방법을 적용하여 $p$차의 예측 오차 필터의 계수를 결정할
수 있다(4).
예측 오차 필터의 차수가 $p\le n\le N-1$의 경우에 본 연구에서 사용하는 격자 필터(lattice filter)에서 격자 관계는 다음과
같다.
여기서, $\gamma_{p}$는 1보다 작은 크기를 갖게 된다.
그림 2는 식 (15)의 격자 관계를 나타낸 역필터 구조이다.
그림 2 격자 역필터 $A(z)$의 구조
Fig. 2 Structure of the Lattice inverse filter $A(z)$
2.4 실험 및 결과 고찰
2.4.1 실험
대학병원 소아과 진료실에서 1~4회 내방한 40여명의 소아를 대상으로 심음 데이터를 수집하였고, 이중에서 질환 치료를 통해 정상이 되었거나, 잡음이
심한 경우 등의 데이터를 제외하고, 본 연구의 연령별, 질환별 관찰을 위한 15인의 소아를 대상으로 분석 실험을 진행하였고, 이는 표 2에 나타내었다.
심음 데이터 수집 시스템은 필터 및 심음 증폭기가 내장된 전자청진기를 제작하여 사용하였고, 노트북 컴퓨터로 구성되어 있다(6). 수집된 소아 심음은 증폭 및 필터링되고 사운드 카드의 A/D 변환기를 통해서 8[kHz]의 샘플링 주파수와 16비트 모노의 해상도로 웨이브 파일로
디지털 변환되어 저장된다. 청진음 데이터에서 음성, 기계음, 피부마찰음 등 아티팩트(artifact)는 잘라내고, 약 2 주기의 심박이 포함되는 1초를
분석 윈도우(window) 크기로 설정하였다.
표 2. 피검자 정보
Table 2 Subject information
피검자
|
나이
|
성별
|
진단
|
JDK
|
0.41
|
M
|
small VSD
|
BJW
|
0.83
|
M
|
functional murmur
|
SKJ
|
0.91
|
M
|
VSD
|
KMJ
|
1.00
|
F
|
VSD
|
KTS
|
1.50
|
M
|
ASD
|
KSM
|
1.50
|
M
|
small ASD
|
JES
|
2.00
|
F
|
정상(functional murmur)
|
LDM
|
2.00
|
M
|
VSD
|
PDJ
|
2.33
|
M
|
정상
|
CHH
|
2.83
|
M
|
정상
|
YHS
|
3.00
|
M
|
정상
|
LHJ
|
3.16
|
M
|
VSD
|
PHS
|
3.75
|
F
|
정상
|
SSH
|
4.00
|
M
|
정상
|
LSJ
|
4.00
|
F
|
functional murmur
|
심음의 선형 예측 분석을 통해 구한 특징 파라미터의 성능을 분석하기 위하여 심음의 AR 스펙트럼을 구하고, 특징 파라미터로는 심음 발생 모델의 전달함수
극점에 해당하는 형성음 주파수를 추출하였다. 이를 위한 실험 절차는 다음 그림과 같다.
그림 3 형성음 검출 실험 절차
Fig. 3 Procedure for formant detection
디지털화된 심음은 격자 필터 구조의 10차 Burg 알고리즘 으로 선형 예측 분석이 이루어지고, AR 모델의 스펙트럼 추정법에 의해 스펙트럼을 추출한다.
스펙트럼 파형의 1차 도함수를 이용해 기울기가 양에서 음으로 변하는 지점을 검출하여 1단계의 형성음 주파수를 구한다. 추출된 스팩트럼을 이동 평균과
2차 도함수를 이용하여 0교차를 검출하여 2단계로 형성음을 구하여 결과를 취합하여 형성음 주파수를 결정한다.
2.4.2 결과 고찰
그림 4~7은 정상 소아의 스펙트럼 파형의 예를 1세부터 4세까지 나타낸 것이고, 그림 8~10은 세 질환 소아의 파형을 나타낸 것이다. 그림에서 파형과 수평선 사이에 저주파수 쪽에서부터 검출된 형성음 주파수를 수직선으로 나타내었다.
그림 4 1세 피검자(VSD)의 스펙트럼의 예 : 피검자 KMJ
Fig. 4 Example of the spectra for 1-year old child(VSD) : subject KMJ
그림 5 2세 피검자(정상)의 스펙트럼의 예 : 피검자 JES
Fig. 5 Example of the spectra for 2-year old child(normal) : subject JES
그림 6 3세 피검자(정상)의 스펙트럼의 예 : 피검자 YHS
Fig. 6 Example of the spectra for 3-year old child(normal) : subject YHS
그림 7 4세 피검자(정상)의 스펙트럼의 예 : 피검자 SSH
Fig. 7 Example of the spectra for 4-year old child(normal) : subject SSH
형성음 주파수는 극점에 해당하는 위치이지만, 영점의 영향 등으로 검출이 되지 않는 경우도 빈번히 있으며, 제1, 2 형성음 주파수(F1, F2)는
저주파 부근에서 비교적 일정하게 검출되나, 제3~5 형성음 주파수(F3~F5)는 선형 예측 분석의 특성상 위치가 변동이 심하거나, 경우에 따라 검출되지
않기도 한다.
그림 8 VSD 질환자의 스펙트럼의 예 : 피검자 LDM
Fig. 8 Example of the spectra for VSD patient : subject LDM
그림 9 ASD 질환자의 스펙트럼의 예 : 피검자 KTS
Fig. 9 Example of the spectra for ASD patient : subject KTS
그림에서 질환별 스펙트럼마다 유사해 보이지만 약간씩 차이가 있다는 것을 알 수 있다. VSD 질환 스펙트럼의 경우 F1 주변 경사가 급하고, 이후에도
굴곡(F2, F3등)이 있다. 그리고 정상보다는 F1-F2 간격이 좁은 것을 알 수 있다. ASD 질병 스펙트럼의 경우에는 F1 주변이 정상과 비슷하게
주변에서 완만하고, 전체적으로도 파형이 완만함을 볼 수 있으며, F1-F2 간격은 VSD 질병처럼 간격이 좁은 것을 알 수가 있다. 기능성 심잡음
질환 어린이의 경우에는 스펙트럼의 형태가 정상과 거의 비슷한데 특정 프레임에서 F3 이후의 고주파 형성음이 크고 뚜렷하게 나타나는 경우가 나타난다.
그림 10 기능성심잡음 질환자의 스펙트럼의 예 : 피검자 BJW
Fig. 10 Example of the spectra for functional murmur patient : subject BJW
표 3은 소아의 5개 프레임에서 추출된 형성음주파수 평균값을 연령별로 나타낸 것이고, 표 4는 같은 방법으로 질병별로 결과를 나타낸 것이며, 단위는 Hz이다. F1, F2,...는 각각 제1 형성음주파수, 제2 형성음주파수, ...를 의미한다.
표 3. 소아 연령별 형성음 주파수
Table 3 Formant frequencies for child age
(단위: Hz)
subj.
|
age
|
F1
|
F2
|
F3
|
F4
|
F5
|
JDK
|
0.41
|
274.8
|
720.6
|
1610.2
|
2753.3
|
3487.5
|
BJW
|
0.83
|
237.4
|
824.2
|
1732.3
|
2668.5
|
3293.5
|
SKJ
|
0.91
|
342.4
|
746.0
|
1479.8
|
2308.0
|
3293.0
|
KMJ
|
1.00
|
249.4
|
849.0
|
1360.8
|
2660.0
|
3513.6
|
average
|
276.0
|
785.0
|
1545.8
|
2597.5
|
3396.9
|
KTS
|
1.50
|
229.4
|
604.0
|
1567.7
|
2525.8
|
3423.3
|
KSM
|
1.50
|
233.0
|
734.3
|
1637.6
|
2714.8
|
3699.5
|
JES
|
2.00
|
243.2
|
795.2
|
1671.3
|
2353.4
|
3521.8
|
LDM
|
2.00
|
307.4
|
658.8
|
×
|
2517.2
|
3670.0
|
average
|
253.3
|
698.1
|
1625.5
|
2527.8
|
3578.7
|
PDJ
|
2.33
|
207.6
|
577.0
|
1341.8
|
2337.5
|
3284.8
|
CHH
|
2.83
|
204.2
|
602.7
|
1669.8
|
2569.5
|
3404.6
|
YHS
|
3.00
|
239.8
|
748.0
|
1683.0
|
2470.4
|
3609.5
|
average
|
217.2
|
642.6
|
1564.9
|
2459.1
|
3433.0
|
LHJ
|
3.16
|
246.0
|
650.5
|
1745.0
|
2650.0
|
3409.3
|
PHS
|
3.75
|
188.0
|
757.4
|
1787.6
|
2677.4
|
3529.3
|
SSH
|
4.00
|
331.0
|
944.8
|
1768.0
|
2617.3
|
3468.6
|
LSJ
|
4.00
|
199.0
|
798.5
|
1787.3
|
2622.0
|
3425.7
|
average
|
241.0
|
787.8
|
1772.0
|
2641.7
|
3458.2
|
AR 모델링의 스펙트럼 특성상 형성음 주파수 위치의 바이어스가 나타나며, 고주파로 갈수록 위치의 편차가 크다. 따라서 F1, F2가 F3 이후의 것들보다
중요한 파라미터로 볼 수 있을 것이다. 표 3에서 보면 연령이 높아짐에 따라 F1, F2 등의 평균 주파수 값이 낮아지는 것을 볼 수 있다. 이는 성장하면서 체격이 커짐에 따라 심박도 느려지고,
따라서 형성음 주파수도 값이 낮아지는 것으로 추정된다. 그러나 피검자 SKJ, LDM, SSH 등은 F1이 심하게 높아서 상대적으로 성장이 느려 체격이
작았을 것으로 예측할 수 있다. 표 4의 질환별 형성음 주파수 평균치를 살펴 보면, F3 이후의 주파수 값은 특별한 차이를 나타내지 않지만, 위에서 언급한 특별히 편차가 있는 어린이를
제외하면 F1이 VSD 질환 어린이의 주파수 평균값이 높은 경향을 나타내는 것을 알 수 있다. ASD와 심잡음 어린이의 경우는 정상 소아와 큰 차이가
없는 것으로 나타남을 알 수 있다. 심잡음의 경우 정상 소아의 경우에도 빈번히 나타나고, 성장하면서 사라지기도 한다.
또한 정상 어린이의 형성음 주파수 평균값의 경우 F1과 F2의 간격이 482Hz이며, VSD와 ASD보다 약 42Hz 넓고, 기능성심잡음보다 약 80Hz
작게 나타난 것을 알 수가 있다. VSD 질환의 평균값의 경우 평균적으로 다른 질병보다 F1이 284Hz로 높은 주파수를 갖으나, F3은 상대적으로
낮은 주파수를 갖음을 알 수가 있다. ASD 질환의 평균값의 경우 F1은 정상과 거의 비슷한 주파수 분포를 갖으며, F1-F2 간격은 VSD 질환과
유사하게 나타났다.
표 4 소아 심장 질환별 형성음 주파수
Table 4 Formant frequencies for child heart disease
(단위: Hz)
class
|
subj.
|
age
|
F1
|
F2
|
F3
|
F4
|
F5
|
Nor-mal
|
JES
|
2.00
|
243.2
|
795.2
|
1,671.3
|
2,353.4
|
3,521.8
|
PDJ
|
2.33
|
207.6
|
577.0
|
1,341.8
|
2,337.5
|
3,284.8
|
CHH
|
2.83
|
204.2
|
602.7
|
1,669.8
|
2,569.5
|
3,404.6
|
YHS
|
3.00
|
239.8
|
748.0
|
1,683.0
|
2,470.4
|
3,609.5
|
PHS
|
3.75
|
188.0
|
757.4
|
1,787.6
|
2,677.4
|
3,529.3
|
SSH
|
4.00
|
331.0
|
944.8
|
1,768.0
|
2,617.3
|
3,468.6
|
average
|
235.6
|
737.5
|
1653.6
|
2504.3
|
3469.8
|
VSD
|
JDK
|
0.41
|
274.8
|
720.6
|
1,610.2
|
2,753.3
|
3,487.5
|
SKJ
|
0.91
|
342.4
|
746.0
|
1,479.8
|
2,308.0
|
3,293.0
|
KMJ
|
1.00
|
249.4
|
849.0
|
1,360.8
|
2,660.0
|
3,513.6
|
LDM
|
2.00
|
307.4
|
658.8
|
×
|
2,517.2
|
3,670.0
|
LHJ
|
3.16
|
246.0
|
650.5
|
1,745
|
2,650.0
|
3,409.3
|
average
|
284.0
|
725.0
|
1549.0
|
2577.7
|
3474.7
|
ASD
|
KTS
|
1.50
|
229.4
|
604.0
|
1,567.7
|
2,525.8
|
3,423.3
|
KSM
|
1.50
|
233.0
|
734.3
|
1,637.6
|
2,714.8
|
3,699.5
|
average
|
231.2
|
669.2
|
1602.7
|
2620.3
|
3561.4
|
Func. mur.
|
BJW
|
0.83
|
237.4
|
824.2
|
1,732.3
|
2,668.5
|
3,293.5
|
LSJ
|
4.00
|
199.0
|
798.5
|
1,787.3
|
2,622.0
|
3,425.7
|
average
|
218.2
|
811.4
|
1759.8
|
2645.3
|
3359.6
|