• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of AI Convergence Engineering(BK21), Gyeongsang National University, Korea.)
  2. (Information & Communication Engineering, Gyeongsang National University, Korea. )
  3. (Dept. of Intelligence and Communication Engineering, Gyeongsang National University, Korea.)
  4. (PAIST (ProxiHealthcare Advanced Institute for Science and Technology), Seoul 04513, S.Korea)



Machine learning, 6-axis IMU sensor, Classification, Data analysis, Quaternion

1. 서 론

최근 호흡기 관련 질환들이 유행하고 있어서 개인의 구강 관리에 관한 관심이 높아지고 있다. 구강 관리의 소홀은 구강 위생과 밀접한 연관이 있으며 개인 구강 위생이 좋지 않다면 자연스럽게 바이러스에 노출되기 쉬운 환경이 조성된다. 음식 섭취 후 이를 내버려 둔다면 구강 내 미생물들이 번식하며 미생물막(이하 치태)과 같은 얇은 생물막이 형성되며 이때 바이러스들이 생존 및 번식에 유리한 환경을 조성해준다. 또한, 이러한 치태를 제거하지 않고 내버려 둔다면 호흡기 질환뿐만 아니라 여러 구강 질환들을 일으킬 수 있다. 치은염 및 치주 질환이 치태 때문에 발생하는 대표적인 질환이다[1]. 해당 질환들은 치태 때문에 생성된 박테리아가 방출한 독소 및 분비물 때문에 야기되는 질환이며 점진적으로 구강 내 조직들을 파괴하며 진행된다. 이러한 치주 질환에 지속해서 노출된다면 호흡기 질환을 유발할 수 있다는 연구 결과가 존재한다. [2]에 여러 데이터(환자 차트 데이터 등과 같은 환자 정보) 분석을 통해 만성 폐쇄성 질환(이하 COPD)이 치주 건강 악화와 치태에 의해 폐 감염균 성장의 상관관계가 존재한다는 것을 증명했다. 최근 여러 웨어러블 디바이스들을 사용하는 양은 증가하고 있다. Statista의 통계에 따르면 전 세계 웨어러블 디바이스 사용자 수는 2016년에 325,000,000명에서 2022년 1,105,000,000명으로 세 배 이상 증가한 것을 확인할 수 있다. 이러한 웨어러블 디바이스 사용자의 증가로 인해 이를 활용한 건강 모니터링 관련 연구도 증가하는 추세이다[3]. 이러한 웨어러블 디바이스에서 수집되는 ECG, 심박수, 센서 데이터 등과 인공지능을 활용해 파킨슨병과 같은 퇴행성 질병에 대해 예측을 하거나 스마트 워치 센서에서 출력되는 데이터를 기반으로 사람의 움직임이나 걸음걸이를 통해 뇌 신경 질환 또는 여러 근육 퇴행성 질환을 예측하는 연구가 존재한다[4][5]. 웨어러블 디바이스 기반 인공지능 연구를 토대로 본 논문에서는 센서 부착 칫솔과 기계학습을 활용하여 치아 건강 모니터링을 위한 양치구역 추정 및 양치 습관을 분석하고 사람들을 올바른 양치로 이끌도록 하는 것이 목표이다. 더 나아가 양치와 구강 질환의 상관관계에 대해 파악하여 구강 질환 들을 예측할 수 있는 인공지능 모델을 개발하려 한다.

본 논문에서는 비교적 저렴한 6축 IMU 센서에 출력되는 6축의 가속도 센서와 각속도 센서 데이터를 활용하여 구강 내 13군데의 양치구역를 추정하는 기계학습 기반의 접근을 제안한다. 본 연구팀의 이전 연구에서는 6축 가속도 센서만을 가지고 3차원 가상 공간 내의 일정 크기의 벡터 축의 회전을 통해서 일곱 군데의 양치구역을 추정하는 결과를 도출하였다. 본 연구에서는 이에 더해서 가속도 센서값을 추가하여 구강 내 13군데의 양치구역을 89%의 정확도로 추정하며, 이를 통해서 더 정교하고 정확한 양치 위치 추정 기술을 개발한다.

본 연구는 저비용의 단일 센서만을 활용하여 양치구역을 추정하는 새로운 접근법을 제시하며, 이를 통해 더 넓은 범위의 사람들이 올바른 양치 습관을 형성에 도움이 될 수 있도록 한다.

본 논문은 다음과 같이 구성된다. 2장에서는 칫솔의 회전을 표현하기 위해 쿼터니언을 활용한 3차원 공간에서의 각속도 데이터 전처리 과정과 가속도 데이터 패턴에 관해 설명한다. 3장에서는 데이터 수집 환경 및 학습 데이터에 대한 설명과 기계학습 모델을 통한 양치구역 추정 성능 비교 및 결과 분석을 수행한다. 마지막으로, 4장에서는 본 논문의 결론과 향후 연구 방향에 대해 논의한다.

2. 관련 연구

양치 습관 분석 연구에는 크게 양치 패턴 기반 연구와 양치구역 추정 연구로 나눌 수 있다. 양치 패턴과 위치를 추정하기 위해서 칫솔 내의 내장 IMU(Inertial Measurement Unit) 센서를 사용한 연구가 주종을 이룬다. 최근에는 스마트 워치의 다양한 센서와 칫솔 내의 센서 데이터를 융합하여 양치구역과 패턴에 대한 보다 심층적인 분석이 이루어지고 있다[6][7]. 양치 패턴 연구는 양치 방법에 대해 분석하는 것으로, 구강 내 회전 양치, 수평 반복 양치, 수직 반복 양치에 대한 변위와 강도 평가가 그 분석 대상이 된다. 대표적인 연구로 [8], [9], [10], [11], [12]등이 있다.

본 연구는 주로 구강 내의 양치구역을 그 분석 대상으로 하고 있으며, 이를 기반으로 각 위치에 대한 양치 패턴 분석을 진행하고자 한다. 양치구역 추정 연구는 여러 센서 데이터를 기반으로 양치 시 구강 내에 칫솔의 위치를 추정한다. 위치를 추정할 때 IMU 센서와 같은 센서의 움직임을 통해서 구강 내의 양치구역을 추정하게 되는데 다양한 제어이론을 도입한 전통적인 제어이론 기반의 알고리즘을 통해 위치 추정과 IMU 센서 데이터를 활용한 기계학습 기반의 연구가 대부분을 이룬다. 관련 연구와 그 비교는 표 1과 같다.

[13]은 3축 가속도계와 AMR(Anisotropic Magneto Resistive) 기반 자기 센서를 활용해 칫솔 회전 시에 발생하는 Roll, Pitch, 헤딩 각도를 측정했다. 이를 바탕으로 구강 내 15개 영역을 부위별 임곗값을 찾고 이를 기반으로 한 양치구역 추정 알고리즘을 제안한다. 피실험자 15명을 대상으로 이 알고리즘을 테스트했으며 15개 부위의 평균 정확도는 97.1%이다.

[14]은 9개의 양치 영역에 대해 분류를 진행한다. 3축의 가속도, 3축의 각속도, 3축의 지자기 센서를 활용하여 추정을 진행한다. 입력 데이터에 별도의 전처리 과정 없이 잡음만 제거한 뒤 SVM 모델을 학습시킨다. SVM 모델에서 커널을 각각 Linear, RBF, Poly, Sigmoid를 활용하여 성능을 비교했으며 각각 80%, 82%, 77%, 80%였다.

[15]은 9축 IMU 센서를 활용하여 Bass 양치법만 진행하여 실시간으로 수집된 16개의 양치구역 탐지 모델을 개발한다. 9축 IMU 센서의 Roll, Pitch, Yaw 값을 사용하였다. 추정 모델은 Random forest 기반의 분류 모델을 활용하였으며, 학습 데이터의 개수는 5,683개, 검증 데이터 개수는 1,895개로 총 7,578개의 데이터를 사용했다. 16개의 양치구역에 대한 분류 정확도는 평균 74%였다.

[16]은 9축 IMU 센서를 활용해 양치구역을 추정한다. 순환 확률 신경망(RPNN)을 활용하여, IMU 센서에서 얻은 가속도 데이터를 Roll, Pitch로 변환한 값과 NED(North-East-Down) 좌표계, 고정 좌표계인 Carrier 좌표계를 통해 물체가 이동할 때의 좌표계로 사용하여 구강 내 16군데의 양치구역을 추정하였다. 총 150,000개의 데이터를 학습에 사용했으며 5명의 실험 참가자에 1,000개의 데이터를 테스트로 사용했다. RPNN의 추정 정확도는 99.08%였다.

본 연구와 비교하여 [13], [14], [15], [16]은 9축 이상의 IMU 혹은 AMR 센서를 사용하여 그 정확도를 높였다. 하지만 본 논문에서는 비교적 저렴한 6축의 센서로 양치구역 추정을 진행하며 비용적인 측면에서 장점이 있다.

본 논문과 가장 유사하게 [17]은 3축의 가속도 센서와 3축의 각속도 센서를 활용하여 16개의 양치구역을 추정하였다. 데이터 수집을 할 때 양치 방법을 회전 양치만으로 진행하였다. 양치구역을 추정할 때 RNN 모델을 사용하였으며, 양치구역의 추정 정확도는 88%로서 본 연구의 결과보다 미세하게 낮다.

표 1 관련 연구 비교

Table 1 Related Work and Comparison

관련

연구

적용 센서

접근법

특징 및 성능

[13]

3축가속도센서,

AMR 센서

제어이론

15 군데 양치구역 추적,

정확도: 97.1%

[14]

9축IMU센서

기계학습

9 군데 양치구역 추적,

SVM(정확도: 82%)

데이터 전처리 없이 사용

[15]

9축IMU센서

기계학습

16 군데 양치구역 추적,

Bass 양치법만 진행, Random Forest

(정확도: 74%)

[16]

9축IMU센서

딥러닝

16 군데 양치구역 추적,

RPNN(순환확률신경망) (정확도: 99.09%)

[17]

3축 가속도센서,

3축 각속도센서

딥러닝

16 군데 양치구역 추적,

RNN(Recurrent Neural Network)(정확도: 88%)

3. 자세 기반 양치구역 추정을 위한 접근 방법

본 논문은 그림 1과 같은 6축의 IMU 센서에서 얻은 가속도와 각속도 데이터를 활용하여 양치구역 분류 방법을 제안한다. 이때 이 6축은 센서에서 출력되는 6개의 운동 방향이며 (X, Y, Z)의 3축에 대해 그림 1에서처럼 직선 화살표의 가속도, 회전하는 화살표의 각속도 방향으로 물체가 움직이는 것을 의미한다. 센서에서 출력되는 값 중 가속도 데이터가 의미하는 것은 물체가 움직일 때 발생하는 속도의 변화량이고 각속도는 물체가 회전할 때 측정되는 각도의 변화량이다. 본 논문에서는 양치 데이터를 얻기 위해 칫솔에 6축 IMU 센서를 부착하여 실제 양치 동작 중에 발생하는 행동 데이터를 실시간으로 수집한다. 이렇게 수집된 데이터 중 각속도 데이터는 여러 전처리 과정을 거쳐 칫솔모 방향을 추정하는 데에 활용하고 가속도 데이터는 양치 시 칫솔의 위치와 칫솔 움직임에 대한 패턴을 추정한다. 이러한 센서 데이터를 바탕으로 여러 기계학습 모델을 학습하여 그림 2와 같이 양치 시 출력되는 구강 내 치아 13구역을 추정한다.

그림 1. 6축 IMU 센서 (가속도 및 각속도 센서)

Fig. 1. 6-axis IMU sensor (acceleration and angular velocity sensors)

../../Resources/kiee/KIEE.2024.73.2.358/fig1.png

표 2 구강 내의 양치구역 구별(괄호의 번호는 그림 2 숫자)

Table 2 Differentiate between brushing positions in the mouth (as shown in Figure 2)

레이블

구강 내 치아 영역

IO (1)

앞니 바깥면

LMO (2)

왼쪽 어금니 바깥면

RMO (3)

오른쪽 어금니 바깥면

LUMC (4)

왼쪽 위 어금니 씹는면

LWMC (5)

왼쪽 아래 어금니 씹는면

RUMC (6)

오른쪽 위 어금니 씹는면

RWMC (7)

오른쪽 아래 어금니 씹는면

IUS (8)

앞니 위 안쪽면

IWS (9)

앞니 아래 안쪽면

LUMS (10)

왼쪽 위 어금니 안쪽면

LWMS (11)

왼쪽 아래 어금니 안쪽면

RUMS (12)

오른쪽 위 어금니 안쪽면

RWMS (13)

오른쪽 아래 어금니 안쪽면

3.1 구강 내 양치구역

본 논문에서는 그림 2와 같이 양치 시 구강 구조에 따른 칫솔모의 위치를 13개의 구역으로 나눈다. 양치구역을 표시하기 위해 본 논문에서는 다음과 같은 표기를 사용한다: Incisor: 앞니, Molar: 어금니, Left: 왼쪽, Right: 오른쪽, Outside: 바깥면, InSide: 안쪽면, LoWer: 아래쪽, Upper: 위쪽, Chewing: 씹는면. IO(앞니 바깥면)는 앞니 위, 아래 바깥면을 가리키고 LMO(왼쪽 어금니 바깥면)는 왼쪽 위, 아래 바깥면을 가리키며, RMO(오른쪽 어금니 바깥면)는 오른쪽 위, 아래 바깥면을 가리킨다.

그림 2. 구강 내 치아 영역

Fig. 2. Tooth areas in the oral cavity

../../Resources/kiee/KIEE.2024.73.2.358/fig2.png

3.2 각속도 센서 데이터 변환

본 논문에서 6축 IMU 센서를 활용하여 가속도(m/s2) 및 각속도 데이터(deg/s)를 수집한다. 각도를 구하기 위해 본 논문에서는 각속도 센서에서 출력되는 각속도 데이터를 활용한다. 각속도 데이터를 식 (1)과 같은 사다리꼴 수치 적분을 통해 센서로부터 수집된 각속도 데이터를 각도(deg)로 변환해 준다. 식 (1)에서 θt는 수치 적분을 통해 구해야 하는 각도이며 θt−1은 이미 수집된 각도이며 초깃값은 0이다. wt는 센서에서 수집되고 있는 현재 각속도 데이터값이고 wt−1은 이미 수집되었던 직전 각속도 데이터값이다. 수치 적분으로 구한 각도와 실제 각도와 비교한 오차는 평균 0.00005°이다. 이때 이 오차는 본 논문에서 활용한 IMU 센서에서 출력해주는 각도와 각속도 센서 데이터를 적분하여 얻은 각도를 비교해서 얻은 오차이며 1분가량 회전시켜 실험을 진행한 결과이다. IMU 센서에서 출력해주는 각도는 X, Z 축으로는 ±180°, Y 축으로는 ±90°만 표현 가능하므로 양치 시 주로 출력되는 Y축의 각도를 전부 표현할 수 없어 각속도 센서의 데이터를 활용한다. 각속도 센서의 각속도 데이터는 각 축 (X, Y, Z)에 대하여, 각 속도 (x, y, z)로 구성되며 이러한 각각의 축에 대하여 식 (1)을 적용한다.

(1)
θt = θt−1 + $\dfrac{1}{2}$(wt + wt−1)(tt − tt−1)

3.3 쿼터니언 변환

본 논문에서 그림 3과 같은 3차원 공간에서 고정된 축에 칫솔모 기준으로 (α = (x, y, z)), (β = (x, y, z)), (γ = (x, y, z)) 세 벡터를 정의한다. 이 세 벡터는 6축 IMU 센서의 (X, Y, Z) 축에 대해서, 고정된 위치에 칫솔모의 3축 회전을 표현하기 위해, 센서의 X, Y, Z 축 각각을 칫솔 손잡이 방향 축(α = (x, y, z)), 칫솔모 측면의 직각 축(β = (x, y, z)), 칫솔모 방향 축(γ = (x, y, z))과 대응시키고, 이 칫솔모의 각축에 대해 임의의 길이의 벡터를 정의한다. 따라서 칫솔 자세의 특징은 세 개의 각 축의 끝점에 대한 3차원 공간의 좌표인 (α, β, γ) = ((xα, yα, zα), (xβ , yβ , zβ ), (xγ , yγ , zγ )) 로 표현된다. 이를 기반으로 양치 시 측정되는 회전을 3차원 공간에서의 회전으로 표현하기 위해 쿼터니언 회전을 활용한다.[18]. 쿼터니언은 네 개의 실수로 구성된 복소수이며 3차원 회전을 표현할 때 네 개의 차원으로 표현할 수 있다. 이를 통해 자유로운 회전 표현이 가능하며 실제 물체의 회전을 구현할 때 주로 사용되는 기법이다. 쿼터니언 회전을 활용하여 구한 값을 기반으로 3차원 공간에서 정의한 벡터의 끝점 좌표를 회전시킨다. 이때 이 벡터들은 임의로 정한 크기에 의해 최대, 최솟값을 가지며 본 논문에서는 임의로 길이를 300으로 정의한다. 파란색 축은 칫솔 손잡이 방향 축(α = (x, y, z))이며 빨간색 축 은 칫솔모 측면의 직각 축(β = (x, y, z)), 초록색 축은 칫솔모 방향 축(γ = (x, y, z))으로 정의한다.

그림 3. 고정된 3축에서의 칫솔 축 정의

Fig. 3. Define the toothbrush axis along three fixed axes

../../Resources/kiee/KIEE.2024.73.2.358/fig3.png

그림 4. 3차원 공간 내 벡터 표현

Fig. 4. Represent vectors in three-dimensional space

../../Resources/kiee/KIEE.2024.73.2.358/fig4.png

3.4 가속도 센서 데이터

본 논문에서 가속도 센서 데이터를 활용하여 칫솔의 위치(displacement)에 따른 데이터 패턴을 분석한다. 가속도 센서는 물체 움직임과 그에 따른 속도의 변화량을 측정하는 센서로, 가속도 센서 데이터를 통해 칫솔의 움직임 및 방향 변화 정보를 수집할 수 있다. 가속도 센서에서 수집되는 데이터는 (X, Y, Z) 3축에 대한 각각의 가속도가 출력되며 각 축에 대해서 대응되는 변수는 (Accx, Accy, Accz)로 정의한다. 이러한 가속도 데이터를 통해 여러 양치 시 확인할 수 있는 데이터 패턴이 존재하는데, 먼저 양치 시 구강 내에서 칫솔이 앞뒤 반복 운동을 주로 하게 되는데 이 움직임은 가속도 센서에서 Y축에 대한 가속도가 발생하게 되며, 이것은 칫솔이 구강 안쪽과 바깥쪽으로 움직일 때 서로 다른 방향으로 나타난다. 그림 5(a)와 같이, 양치 시 칫솔이 안쪽으로 움직일 때는 빨간색 네모 박스의 데이터이며 이 방향은 양(데이터의 +)의 가속도 방향으로 출력된다. 반대로 칫솔이 바깥쪽으로 움직일 때는 파란색 네모 박스이며 음(데이터의 −)의 가속도 방향으로 출력된다. 또한, 가속도 센서에서 항상 중력 가속도가 측정되기 때문에 이를 활용하여 중력 가속도의 방향에 따라 칫솔모의 방향을 추정할 수 있다. 칫솔모가 지면을 기준으로 하늘 방향으로 향하고 있다면(칫솔모가 위쪽 어금니 씹는 면을 닦을 때), 그림 5(b)와 같이 Z축에 양의 방향으로 중력 가속도 값이 나타난다. 반대로 칫솔모가 아래로 향하고 있다면(칫솔모가 아래쪽 어금니 씹는면을 닦을 때) Z축에 음의 방향으로 중력 가속도 값이 나타난다. 칫솔모의 위치가 어금니 바깥쪽일 경우, 그림 5(c)와 같이 X축에 중력 가속도가 출력되고 이때 구강 내 왼쪽 어금니 안쪽면 위, 아래, 오른쪽 어금니 바깥일 때는 음의 방향, 오른쪽 어금니 안쪽면 위, 아래, 왼쪽 어금니 바깥면일 때는 양의 방향이 출력된다. 이렇게 가속도 센서 데이터만으로도 양치구역을 추정할 수 있으며 벡터 끝점 좌표와 함께 활용한다면 다양한 정보를 통해 더욱 정확성 높게 양치구역을 추정할 수 있다.

그림 5. 가속도 센서 데이터 패턴 분석

Fig. 5. Accelerometer data pattern analysis

../../Resources/kiee/KIEE.2024.73.2.358/fig5.png

3.5 데이터 수집

본 논문에서는 데이터의 일관성을 위해서, 양치하는 사람의 행동을 일부 제한한다. 양치 데이터 수집은 다음과 같이 이루어졌다. 본 논문에서의 데이터 수집은 참가자 10명에게 센서 부착 칫솔을 나눠주고 이를 활용해 양치를 진행한다. 양치 진행 전 평평한 공간에 칫솔을 둔 상태로 데이터 수집 버튼을 누르고 2초 지난 후 칫솔을 들고 양치를 진행한다. 양치는 정면을 바라보고 오른손 양치를 진행하며 이때 고개는 좌우 움직임이 없어야 한다. 칫솔의 각도는 아래로 기울어지지 않게 지면과 수평하게 잡은 뒤 정면 거울을 보며 양치를 진행한다. 그림 2와 같은 13구역에 대해 각각 양치를 진행하며 한 구역별로 약 10에서 15 초씩 5회 양치를 진행한다. 다시 한번 말하지만, 본 데이터에는 왼손잡이의 양치가 포함되어 있지 않다. 총 수집한 데이터의 개수는 약 1,090,000이다. 이후 데이터의 존재하는 이상치 값들을 제거하기 위해 사분위수를 활용하여 제거한다. 사분위수는 데이터 75% 지점 + 1.5 IQR보다 큰 값, 데이터 25% 지점 - 1.5 IQR 보다 작은 값을 이상치라 하며 이 값이 포함된 행을 제거한다. 이때 IQR은 데이터 75% 지점에서 데이터 25% 지점을 뺀 값을 의미한다.

3.6 기계학습 모델

본 논문에서 활용한 기계학습 모델은 Support Vector Machine(SVM), Navie Bayes(NB), Decision Tree(DT), Logistic Regression(LR), Bagging, Histogram Gradient Boosting(HGB), Random Forest(RF), Catregorical Boost(CB)로 총 8가지의 모델을 학습하고 성능 비교를 진행한다.

SVM[19]은 데이터 분류를 위한 경계를 결정 경계라 하는데 이 결정 경계를 통해 데이터를 분류하는 과정을 진행한다. SVM은 결정 경계와 Support Vector 사이의 거리를 마진이라 하는데 이 마진을 최대화하기 위한 결정 경계를 찾아 데이터 특성을 분류하는 알고리즘이다.

NB[20]는 데이터 특성들이 상호 독립적이라 가정하고 베이즈 정리를 통해 주어진 입력의 조건부 확률을 계산하여 확률이 가장 높은 클래스에 입력 데이터를 할당해 주는 알고리즘이다.

DT[21]는 데이터를 분류하기 위해 의사 결정 규칙을 조합하는 알고리즘이다. 독립 변수(입력 변수)와 타겟 변수(출력 변수)를 사용하여 의사 결정을 진행하며 독립 변수와 타겟 변수를 조합하여 데이터의 불순도가 가장 낮게 만들 수 있는 독립 변수를 선택해 불순도를 최소화하기 위한 트리 구조를 생성하여 데이터를 분류하는 알고리즘이다.

LR[22]은 회귀를 사용해서 입력 데이터가 어떤 범주(레이블)에 속할 확률을 0에서 1 사이의 값으로 변환해 준다. 이렇게 변환된 값을 임곗값(일반적으로 0.5 활용)을 기준으로 더 높은 확률의 클래스로 분류하는 알고리즘이다.

BG[23]는 앙상블 모델로 데이터 샘플을 여러 번 뽑아 서로 다른 모델을 학습시키고 이 결과를 집계하는 방식으로 클래스를 분류하는 알고리즘이다. 집계 방식은 두 가지가 있는데 첫 번째는 각 모델의 결과 중 가장 많이 나온 결과를 선택하는 방식이고, 두 번째는 각 모델 결과의 평균을 내는 방식이다.

HGB, CB 모두 부스팅 기반 앙상블 기법 알고리즘이다. 이때 부스팅[24]이란 여러 개의 분류 알고리즘을 순차적으로 학습하며 이전에 학습한 알고리즘에서 예측이 틀렸던 데이터에 가중치를 부여하여 다음 모델을 재학습하는 과정을 반복한 기법이다.

HGB[25]는 부스팅 기반 알고리즘으로 데이터를 여러 개의 구간으로 나누어 이 구간에 속하는 데이터 포인트의 개수를 기록하는 방식으로 데이터를 히스토그램으로 변환한다. 그 후 이렇게 변환된 히스토그램 형식의 입력에 그레디언트 부스팅 기법을 적용한 알고리즘이다. 그레디언트 부스팅 기법은 다음 모델을 학습할 때 경사 하강법을 사용해 가중치를 업데이트한 부스팅 기법이다.

CB[26]는 학습을 할 때 모든 데이터를 한 번에 학습하여 부스팅 과정을 거친 것이 아닌 일부 데이터만 가지고 부스팅 기법을 적용해 이를 반복하여 데이터의 가중치를 부여하는 알고리즘이다. 히스토그램으로 변환하는 과정처럼 여러 개의 데이터 구간으로 나누고 이 데이터 구간별로 모델을 학습시켜 가중치를 업데이트하는 부스팅 기법이다.

RF[27]는 여러 개의 DT를 구성하고 각 트리에 데이터를 랜덤하게 샘플링해 학습한다. RF는 BG 알고리즘의 한 형태이기 때문에 각 트리의 예측 결과를 BG 방식처럼 집계하여 클래스를 분류해주는 알고리즘이다.

4. 양치구역 추정 모델 성능 평가

본 논문에서는 데이터의 정확성과 신뢰성을 높이기 위해 같은 조건에서 양치를 진행하도록 한다. 이때 수집된 가속도 센서 데이터와 각속도 센서에서 얻은 각속도 데이터의 전처리 과정을 통해 얻은 벡터 끝점 좌표를 학습 데이터로 기계학습 모델을 학습하고 여러 성능 평가 지표와 K-fold 검증을 통해 모델의 신뢰성을 높인다. 또한 혼돈 행렬과 ROC AUC 곡선을 활용하여 상대적으로 정확도가 낮은 클래스를 파악해 추가 연구 진행하여 모델 또는 데이터의 문제를 파악할 수 있다. 학습 시 활용한 클래스는 양치구역이며 그림 2와 같이 13구역이다. 모델 학습 시 같은 학습 환경에서 서로 다른 하이퍼 파라미터를 바탕으로 기계학습 모델을 학습한다.

4.1 검증 데이터셋 구성

양치 데이터의 구성은 가속도 센서 데이터 (Accx, Accy, Accz) 와 3차원 공간의 벡터 회전을 통해 얻은 끝점 좌표 α, β, γ로 총 12개의 데이터로 구성된다. 수집된 데이터셋은 학습과 검증(또는 테스트)의 목적으로 사용되며, 이때 학습 데이터셋과 검증 데이터셋은 10명의 참가자에 대한 양치 데이터 중 임의로 8명을 뽑아 기계학습 모델의 학습 데이터로 활용하고 남은 2명의 데이터를 모델 검증에 사용하였다.

본 논문에서는 표 3와 같이 8개의 기계학습 모델을 선택하여, 양치 데이터셋을 기반으로 각 모델의 학습을 진행하였다. 하이퍼 파라미터 튜닝은 Python의 Scikit-learn 라이브러리 내 GridsearchCV를 활용하여 수행하였다. GridsearchCV를 활용하면 사용자가 지정한 여러 하이퍼 파라미터값을 자동으로 조합하여 가장 최적의 결과를 도출하는 값을 찾아낼 수 있다. 모델들 간의 성능 비교를 위해 성능 평가 지표로 정확도, 정밀도, 재현율, F1-score를 활용한다. 정확도란 전체 데이터 샘플 개수 중에서 학습된 모델이 정확하게 예측한 데이터 샘플의 비율로서, 서로 다른 기계학습 알고리즘이나 설정값들 사이에서 성능 차이를 가장 직관적으로 이해할 수 있는 지표 중 하나이다. 정밀도란 모델이 예측한 클래스 중 실제 해당 클래스로 레이블 된 클래스일 확률이고 재현율이란 실제 레이블 한 클래스에서 모델이 예측한 클래스가 서로 일치한 확률이다. F1-Score는 정밀도와 재현율의 조화 평균을 계산한 것이다. 또한 K-fold 검증을 통해 데이터셋에 대한 과적합을 방지하고 모델의 신뢰성을 높일 수 있다. 이때 K-fold 검증이란 학습 데이터셋과 테스트 데이터셋을 서로 교차 변경하며 학습을 하여 성능을 평가하는 검증 방법이다. 이 실험에서 활용한 K 값은 5이다.

표 3 기계학습 학습 모델 성능 비교

Table 3 Compare the performance of machine learning training models

기계학습모델

정확도

정밀도

재현율

F1 - score

RF

89%

92

89

89

SVM

89%

92

89

88

HGB

87%

89

87

88

CB

87%

89

86

86

LR

86%

88

86

87

DT

85%

88

86

86

BG

84%

87

84

84

NB

79%

86

79

79

평균

85.8%

88.9

85.8

85.9

표준편차

3.24

2.16

3.2

3.19

4.2 양치구역 추정 모델 성능 분석

표 3은 K-fold 검증을 통해 얻은 각 성능 평가 지표들의 평균값이다. 표 3을 통해서, 대부분 기계학습 모델이 주어진 특징을 통해 구강 내 양치구역을 잘 추정하는 것을 볼 수 있다. 전체 기계학습 모델의 정확도 평균은 85.8%(표준편차 3.24)로 대부분 비교적 높은 정확도를 보여준다. 또한, 기계학습 모델의 예측에 대한 정밀도, 재현율 및 F1-score은 13구역 양치 시 88.9, 85.8, 85.9로서 비교적 높은 성능을 보여주고 있다. 이는 본 논문이 제시하는 특징이 양치의 자세 기반으로 구강 내의 양치구역을 비교적 잘 구분한다고 할 수 있다.

4.3 클래스별 성능 분석

표 3을 통해서 상위 4개의 모델들(SVM, HGB, RF, CB)에 대한 모델의 클래스별 정확도를 확인하여 모델의 신뢰성을 높이기 위해 학습 결과에 대한 혼돈 행렬과 ROC AUC 그래프를 분석한다. 혼돈 행렬은 실제값과 예측값에 대해 각 클래스를 나열하고, 그 교차점에 예측값의 성능을 기입하여 만든 행렬이다. 대각선 위치의 값들은 올바르게 분류된(모델이 예측한 클래스와 실제 클래스가 일치) 데이터의 비율을 의미하며 그 외 위치한 값들은 잘못 분류된 데이터의 비율을 의미한다. 따라서 혼돈 행렬을 통해 클래스별로 얼마나 많은 데이터가 올바르게 분류되었는지, 원래 해당 클래스가 아닌데 해당 클래스로 잘못 예측된경우를 확인할 수 있다. 그림 6은 SVM, HGB, RF, CB 모델이 예측한 클래스와 실제 클래스에 대한 혼돈 행렬을 보여준다. 그림 6(a)의 SVM 모델의 경우, 클래스 LWMC, IUS의 정확도가 낮은 것을 확인할 수 있으며 실제 LWMC 데이터 중 모델이 IWS 클래스로 분류된 경우가 많이 존재한다는 것을 알 수 있다. 나머지 모델인 그림 6(b), 6 (c), 6 (d)의 경우 그림 6(a)와 마찬가지로 LWMC, IUS의 정확도가 낮은 것을 확인할 수 있으며 실제 LWMC 데이터 중 모델이 IWS라 예측한 경우가 많은 것을 알 수 있다. 이는 LWMC와 IWS의 데이터가 유사하여 기계학습 알고리즘의 오분류가 일어났다고 판단할 수 있다. 그림 8(a)과 8 (b)는 혼동되는 두 양치 행위(LWMC와 IWS)를 볼 수 있다. 그림 8에서와같이 칫솔모의 방향이 같고 비슷한 위치를 양치하고 있다. 반면 RWMC는 비교적 결과가 좋은데 이는 오른손 양치 때문으로 판단된다. IUS의 경우 여러 클래스로 오분류 됐으며 이는 데이터 수집 시 해당 클래스에 노이즈가 많이 존재하여 발생한 문제라 추측하고 있다. 그림 9는 이들의 양치 행위를 볼 수 있다. 이들 간의 유사성은 칫솔모가 위쪽으로 향한다는 것이지만 SVM이나 RF의 경우 RMO로 판단되는 경우가 다분하여 칫솔모가 위쪽으로 향한다는 특징은 유효하지 않다고 본다. 향후 이를 개선하기 위한 노력이 필요하다.

ROC AUC 곡선은 ROC 곡선 아래의 면적을 측정한 것이며 이때 ROC 곡선은 민감도와 특이도를 나타내는 곡선이다. 민감도는 실제 클래스값이 양성일 때 예측 클래스값이 양성이라고 출력이 되는 비율이며 특이도는 실제 클래스값이 음성인데 음성이라고 예측하는 비율이다. 이때 양성은 특정 조건(실제 클래스와 같은 경우)을 만족한 값이고 음성은 특정 조건을 만족하지 못하고 오분류를 한 값이다. ROC AUC 값의 범위는 0과 1 사이의 값을 가지며 1에 가까울수록 모델 분류 성능이 높은, 0.5에 가까울수록 모델 분류 성능이 낮다는 것을 나타낸다. 그림 7의 결과를 확인해 보면 혼돈 행렬의 결과와 마찬가지로 클래스 LWMC(하늘색), IWS(연두색)의 ROC AUC 값이 낮으며 이는 혼돈 행렬의 결과와 일관된 해석을 보여주고 있다.

그림 6. 상위 4개 분류기의 혼돈 행렬

Fig. 6. Confusion matrix of the top-4 classifiers

../../Resources/kiee/KIEE.2024.73.2.358/fig6.png

그림 7. 상위 4개 분류기의 ROC AUC 그래프

Fig. 7. ROC AUC graph of the top-4 classifiers

../../Resources/kiee/KIEE.2024.73.2.358/fig7.png

그림 8. 양치구역 구별이 쉽지 않은 구강 내 양치 자세 case 1

Fig. 8. Intraoral brushing position with difficulty distinguishing oral cavity CASE 1

../../Resources/kiee/KIEE.2024.73.2.358/fig8.png

그림 9. 양치구역 구별이 쉽지 않은 구강 내 양치 자세 case 2

Fig. 9. Intraoral brushing position with difficulty distinguishing oral cavity CASE 2

../../Resources/kiee/KIEE.2024.73.2.358/fig9.png

5. 결 론

최근 호흡기 질환들의 유행으로 인해 개인 구강 관리가 관심받고 있다. 호흡기 질환들은 구강 위생이 저하되면 발병 확률이 높아지기 때문이다. 본 논문은 개인 구강 관리의 기본이 되는 올바른 양치로 이끌기 위해 비교적 저비용의 6축 IMU 센서를 활용한 기계학습 기반 양치 위치 분류 방법을 제안하였다. 6축 IMU 센서를 활용하여 3차원 공간의 쿼터니언 회전을 통해 칫솔 사용자의 양치 부위를 추정하고 이를 통해 도출된 벡터 끝점 좌표 데이터와 양치 시 가속도 데이터를 학습 데이터로 활용, 해당 데이터로 기계학습 모델을 학습 및 여러 성능 평가 지표를 바탕으로 모델 검증을 진행했으며 정확도 89%의 모델을 개발했다. 해당 모델을 활용해 매 양치 시 현재 양치 중인 구역을 추정 가능하며 이를 바탕으로 양치 습관 분석 및 개선을 할 수 있다. 하지만 현재 오른손잡이에 대한 양치 데이터 수집만 진행되었기 때문에 양치 분류에 대한 한계점이 존재한다. 또한, 두 클래스에서 상대적으로 낮은 정확도를 보이기 때문에 이를 해결해야만 모델의 신뢰성이 높아질 것이다. 향후 연구에서 양치 데이터를 클래스별로 체계화하여 데이터 수집을 진행하여 클래스별 정확도 불균형 문제를 해결할 예정이다. 본 논문에서 개발한 모델은 본 연구의 참여 기업인 (주)프록시헬스케어에서 개발한 미세 전류 칫솔에 해당 모델을 적용할 예정이다[28].

Acknowledgements

This paper is the outcome of a mid-sized project (NRF-2023 R1A2C1006639) funded by the National Research Foundation of Korea in 2023, and is also part of the research conducted in the third phase of the industry-academia-research cooperation leading university development project (LINC 3.0), which is supported by funding from the Ministry of Education and the National Research Foundation of Korea.

References

1 
J.-Y. Lee, “Microbiological understanding of oral diseases,” The Journal of the Korean dental association, vol. 32, no. 9, pp. 630–637, 1994.URL
2 
N. Kelly, L. Winning, C. Irwin, F. T. Lundy, D. Linden, L. McGarvey, G. J. Linden, and I. A. El Karim, “Periodontal status and chronic obstructive pulmonary disease (copd) ex- acerbations: a systematic review,” BMC oral health, vol. 21, pp. 1–11, 2021.DOI
3 
L. Lu, J. Zhang, Y. Xie, F. Gao, S. Xu, X. Wu, and Z. Ye, et al., “Wearable health devices in health care: narrative system- atic review,” JMIR mHealth and uHealth, vol. 8, no. 11, p. e18907, 2020.URL
4 
L. Sigcha, L. Borz`ı, F. Amato, I. Rechichi, C. Ramos- Romero, A. Ca´rdenas, L. Gasco´, and G. Olmo, “Deep learn- ing and wearable sensors for the diagnosis and monitoring of parkinson’s disease: A systematic review,” Expert Systems with Applications, p. 120541, 2023.DOI
5 
D. J. Cook, M. Strickland, and M. Schmitter-Edgecombe, “Detecting smartwatch-based behavior change in response to a multi-domain brain health intervention,” ACM Transactions on Computing for Healthcare (HEALTH), vol. 3, no. 3, pp. 1– 18, 2022.DOI
6 
C. Luo, X. Feng, J. Chen, J. Li, W. Xu, W. Li, L. Zhang, Z. Tari, and A. Y. Zomaya, “Brush like a dentist: Accu- rate monitoring of toothbrushing via wrist-worn gesture sens- ing,” in IEEE INFOCOM 2019-IEEE Conference on Com- puter Communications, pp. 1234–1242, IEEE, 2019.DOI
7 
Yumi Ko, JeongGyu Kim, HanKyul Kim, and Ahyoung Choi, “AI smart brushing application with IOT and big data analysis,” Proceedings of the Korean Information Science Society Conference, pp. 1695–1697, 2022.URL
8 
K.-H. Lee, J.-W. Lee, K.-S. Kim, D.-J. Kim, K. Kim, H.-K. Yang, K. Jeong, and B. Lee, “Tooth brushing pattern clas- sification using three-axis accelerometer and magnetic sen- sor for smart toothbrush,” in 2007 29th Annual International Conference of the IEEE Engineering in Medicine and Biol- ogy Society, pp. 4211–4214, IEEE, 2007.DOI
9 
K.-S. Kim, T.-H. Yoon, J.-W. Lee, and D.-J. Kim, “Interactive toothbrushing education by a smart toothbrush system via 3d visualization,” Computer methods and programs in biomedicine, vol. 96, no. 2, pp. 125–132, 2009.DOI
10 
M. Marcon, A. Sarti, and S. Tubaro, “Toothbrush motion analysis to help children learn proper tooth brushing,” Com- puter Vision and Image Understanding, vol. 148, pp. 34–45, 2016.DOI
11 
Z. Hussain, D. Waterworth, A. Mahmood, Q. Z. Sheng, and W. E. Zhang, “Dataset for toothbrushing activity using brush-attached and wearable sensors,” Data in Brief, vol. 37, p. 107248, 2021.DOI
12 
S. Akther, N. Saleheen, M. Saha, V. Shetty, and S. Kumar, “mteeth: Identifying brushing teeth surfaces using wrist- worn inertial sensors,” Proceedings of the ACM on interac- tive, mobile, wearable and ubiquitous technologies, vol. 5, no. 2, pp. 1–25, 2021.DOI
13 
Y.-J. Lee, P.-J. Lee, K.-S. Kim, W. Park, K.-D. Kim, D. Hwang, and J.-W. Lee, “Toothbrushing region detection using three-axis accelerometer and magnetic sensor,” IEEE Transactions on Biomedical Engineering, vol. 59, no. 3, pp. 872–881, 2011.DOI
14 
Hyeok-Jae Lee, Kyung-Jin Min, Jin-Woo Song, Sang-Yeop Lee, Dong-Jun Kim, and Jeong-Whan Lee, “A Study on Machine Learning-Based Toothbrushing Pattern Classification for Quality Evaluation of Brushing,” Proceedings of the KIEE conference, pp. 1984–1985, 2020.URL
15 
H. Li, L. Jing, and F. Liu, “A real-time lightweight method to detect the sixteen brushing regions based on a 9-axis in- ertial sensor and random forest classifier,” in Proceedings of the 2021 9th International Conference on Information Tech- nology: IoT and Smart City, pp. 24–29, 2021.DOI
16 
C.-H. Chen, C.-C. Wang, and Y.-Z. Chen, “Intelligent brush- ing monitoring using a smart toothbrush with recurrent prob- abilistic neural network,” Sensors, vol. 21, no. 4, p. 1238, 2021.DOI
17 
Hee Jun Lim, Jung Han Ha, Ye Gi Lee, Hyunkook Jang and Hee-Youn Lee, “Smart toothbrush model using Machine Learning,” Proceedings of the Korean Information Science Society Conference, pp. 1504–1506, 2018.URL
18 
Y.-B. Jia, “Quaternions and rotations,” Com S, vol. 477, no. 577, p. 15, 2008.URL
19 
W. S. Noble, “What is a support vector machine?,” Nature biotechnology, vol. 24, no. 12, pp. 1565–1567, 2006.DOI
20 
K. P. Murphy et al., “Naive bayes classifiers,” University of British Columbia, vol. 18, no. 60, pp. 1–8, 2006.URL
21 
Y.-Y. Song and L. Ying, “Decision tree methods: applications for classification and prediction,” Shanghai archives of psy- chiatry, vol. 27, no. 2, p. 130, 2015.DOI
22 
S. Dreiseitl and L. Ohno-Machado, “Logistic regression and artificial neural network classification models: a method- ology review,” Journal of biomedical informatics, vol. 35, no. 5-6, pp. 352–359, 2002.DOI
23 
L. Breiman, “Bagging predictors,” Machine learning, vol. 24, pp. 123–140, 1996.DOI
24 
A. J. Ferreira and M. A. Figueiredo, “Boosting algorithms: A review of methods, theory, and applications,” Ensemble ma- chine learning: Methods and applications, pp. 35–85, 2012.DOI
25 
A. Guryanov, “Histogram-based algorithm for building gra- dient boosting ensembles of piecewise linear decision trees,” in Analysis of Images, Social Networks and Texts: 8th Inter- national Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers 8, pp. 39–50, Springer, 2019.DOI
26 
A. V. Dorogush, V. Ershov, and A. Gulin, “Catboost: gradient boosting with categorical features support,” arXiv preprint arXiv:1810.11363, 2018.DOI
27 
M. Pal, “Random forest classifier for remote sensing clas- sification,” International journal of remote sensing, vol. 26, no. 1, pp. 217–222, 2005.DOI
28 
Y. W. Kim, S. Subramanian, K. Gerasopoulos, H. Ben-Yoav, H.-C. Wu, D. Quan, K. Carter, M. T. Meyer, W. E. Bentley, and R. Ghodssi, “Effect of electrical energy on the efficacy of biofilm treatment using the bioelectric effect,” npj Biofilms and Microbiomes, vol. 1, no. 1, pp. 1–8, 2015.DOI

저자소개

권민욱 (MinWook Kwon)
../../Resources/kiee/KIEE.2024.73.2.358/au1.png

MinWook Kwon received the B.S degree at the Information & Communication Engineering, Gyeongsang National University in 2022. Currently, he is course a master’s course at the Dept of AI Convergence Engineering(BK21), Gyeongsang National University in 2023. His research interests includes Machine Learning, Computer vision, Data analysis and Medical AI.

임대연 (DaeYeon Lim)
../../Resources/kiee/KIEE.2024.73.2.358/au2.png

DaeYeon Lim is doing B.S course at the Information & Communication Engineering, Gyeongsang National University in 2023. His research interests includes Sensor-based data processing, Machine Learning, Data analysis and Deep learning

김도윤 (DoYoon Kim)
../../Resources/kiee/KIEE.2024.73.2.358/au3.png

DoYoon Kim is doing B.S course at the Dept. of Intelligence and Communication Engineering, Gyeongsang National University in 2023. His research interests includes Machine learning, Deep learning, Sensor-based processing technology, Wearable devices

류승재 (Seungjae Ryu)
../../Resources/kiee/KIEE.2024.73.2.358/au4.png

Seungjae Ryu received the B.S degree at the Information & Communication Engineering, Gyeongsang National University in 2022. Her research interests includes Machine learning, Deep learning, Data mining, Computer vision, Biomedical engineering

조은아 (Eunah Jo)
../../Resources/kiee/KIEE.2024.73.2.358/au5.png

Eunah Jo received the B.S degree at the Information & Communication Engineering, Gyeongsang National University in 2022. Her research interests includes Machine learning, Deep learning, Computer vision, Computer graphics, Data science, Biomedical engineering

김영욱 (Young Wook Kim)
../../Resources/kiee/KIEE.2024.73.2.358/au6.png

Young Wook Kim received the B.S degree from College of Medicine, Ulsan National University, Ulsan, South Korea, in 2001 and from Department of Electrical Engineering, Seoul National University, Seoul, South Korea, in 2008. He received the M.s and Ph.D from Electrical and Computer Engineering, University of Maryland, College Park, MD, USA. His research interests includes Biomedical Engineering

김진현 (Jin Hyun Kim)
../../Resources/kiee/KIEE.2024.73.2.358/au7.png

Jin Hyun Kim received the Ph.D. degree from the Department of Computer Science and Engineering, Korea University, Seoul, South Korea, in 2011. He was a Post-Doctoral Fellow with the KAIST, Daejeon, South Korea, and Aalborg University, Denmark. He was a Researcher with INRIA/IRISA, Rennes, France. From 2014 to 2019, he was a Post-Doctoral Fellow with the University of Pennsylvania, Philadelphia, PA, USA. Since 2019, he has been an assistant professor in Department of Information and Communication Engineering, Gyeongsang University, South Korea. His current research interests include cyber physical systems, real-time systems, model checking, machine learning for medical and vehicular autonomy systems.