01. Introduction
- 현재 지문, 얼굴, 음성등이 생체 인식을 위한 방법으로 널리 사용되고 있다.
- 하지만 이러한 정보들은 복제되거나 위조될 가능성이 있다.
- 따라서 더욱 안전하게 개인을 식별할 수 있는 방법이 필요하다
- 심전도(ECG) 신호는 진폭, 피크 및 기타 특성들이 개인 특이적이며, 위조하기 어렵고 부정맥과 같은 다양한 심혈관 질환(CVD)의 기초 역할을 한다.
- 따라서 ECG를 활용한 생체 인증이 새롭게 떠오르고 있다.
- 현재 건강한 사람의 심전도 데이터를 기반으로 한 생체 인식은 95%의 정확도를 보이지만, CVD 환자의 경우 이에 대해 훨씬 낮은 정확도를 보인다.
- 따라서 본 연구에서는 건강하든 심혈관계 질환이 있든 관계없이 ECG 신호를 잘 변환하기 위한 새로운 normalization & interpolation 알고리즘(TEC : Template ECG cycle)을 제안하여 예측 성능을 향상하고자 한다.
- TEC알고리즘은 건강한/심혈관계 질환이 있는 사람들 중, 같은 집단(ex.건강한 집단)끼리는 높은 유사성을 보이고, 다른 집단(건강한 집단 vs 심혈관계 질환이 있는 집단) 간에는 낮은 유사성을 보이는 것이 특징이다.
*interpolation(보간법) : 주어진 데이터 포인트들의 사이에 위치한 값을 추정하는 기술이다. 주어진 데이터가 이산적인(discrete) 데이터인 경우, 보간법을 사용하여 두 개 이상의 데이터 포인트 사이에 위치한 값을 예측할 수 있다. (예를 들어, 1시간마다 기온을 측정한 데이터가 있다고 가정하고, 만약 1시와 5시의 기온을 알고 있는 상태에서 3시의 기온을 추정하고 싶을 때 보간법을 사용할 수 있다.) 보간법은 주로 데이터의 부족한 부분을 채우거나 부드러운 곡선을 만들기 위해 활용된다.
02. Materials and Methods
- 건강한 사람들의 심전도 데이터 : 52명, PhysioNet PTB 데이터 베이스
- 비정상적인(심혈관계 질환을 가진 사람들) 심전도 데이터 : 105명(건강한 14명, CVD환자 91명) QT 데이터 베이스 *
* QT 데이터 베이스는 주로 부정맥을 포함한 다양한 QT간격, ST간격을 가진 ECG 신호로 구성되어 있다.
- ECG 신호는 0.5~45Hz 버터워스 밴드 패스 필터(BBP:Butterworth Band-Pass filter)를 사용하여 신호제거 됨
*Butterworth Band-Pass filter는 신호처리에서 사용되는 주파수를 조절하기 위한 필터로, 특정 주파수 대역을 강조하거나 감소시키는데 사용된다. 특히 버터워스 필터는 주파수 대역에서 부드럽게 변화하면서 감쇠되는 특징을 가지고 있다.
- ECG 신호 E를 감안할 때, So-chan [13]을 사용하여 R파를 감지
- E를 두개의 이웃 R파 사이에서 ECG주기로 나눈다.
- 일부 연구에서는 R파의 고정 길이 측면 영역으로 ECG주기를 생성했지만, 다양한 심박수(즉, 건강하거나 심혈관계 질환이 있는 사람들을 모두 포함하게 때문에) 여러 개의 R파가 포함될 수 있다. 따라서 높은 정확도로 R파를 감지하기 위해 두 개의 R피크 사이의 영역을 하나의 ECG 주기로 간주한다.
2-1) ECG cycle interpolation (ECI)algorithm
두 개의 정규화된 ECG 주기를 비교하기 어려운 경우는 다음과 같다.
첫째. 두 사이클이 서로 다른 샘플링 주파수를 사용하여 감지된경우(may be detected using different sampling frequencies)
둘째. 동일한 샘플링 주파수 또는 하나의 ECG이지만, 달리기 또는 부정맥과 같은 다양한 이유로 두 사이클의 길이가 다른 경우
- 따라서 본 연구에서는 스플라인 보간법(Spline interpolation)을 사용하여 ECG주기를 보간한다.스플라인 보간법은 주어진 데이터 포인트들을 연결하는 부드러운 곡선을 생성하는 보간법의 한 종류로, 다항식을 사용하여 각 구간마다 부드러운 곡선을 만들어내는 것이 특징이다.
-또한 두 심전도 주기의 차이는 유클리디안 거리로 측정된다(Notmalized & interpolated vectors의 Euclidean Distance). 이때 두 개의 ECG주기 사이의 유클리디안 거리가 작을수록 두 개의 ECG 주기는 서로 비슷한 것으로 간주된다.
2-2) ECG cycle normalization (ECN) algorithm
( sampling time을 0에서 1 사이의 값으로 맞추는 작업 )
2-3) ECG cycle normalization and interpolation algorithm(ECOIL)
Input : an ECG signal E
output : an ECG signal M with its data points sampled at [0: 0.01 : 1] and the curve within [0,1] * [0,1]
위의 절차에 따라 ECG 신호에서 TEC(Template ECG cycle)를 도출한다.
* [0 : 0.01 : 1] = 0부터 1까지 0.01 간격으로 이루어진 것
03. Results and Discussion
3-1) self similarity of the processed ECG cycles
본 연구에서는 PTC와 QT에서 추출한 샘플 s0306le & sel100m에 ECN 및 ECI알고리즘을 적용했을 때 전후 비교를 했다.
Figure1의 (a)는 건강한 사람들의 ECG 주기이다.(Original curve) -> (b)는 ECN, ECI를 적용하였을 때 (상단) 대표로 10개만 training set에서 뽑았을 때 모양이 거의 일치한다. (하단)test set에서도 10개만 뽑았을때 모양이 거의 일치함 또한 training set과 test set 간에도 모양이 거의 일치한다.
또한 CVD환자의 ECG의 경우(c)에서 QRS파동의 전압은 샘플링 시간에 따라 다르지만, (d)에서와 같이 ECN와 ECI알고리즘에 의해 처리된 ECG에서는 일관성을 관찰할 수 있다.
3-2) ECG-based biometric authentication of healthy persons
건강한 사람의 ECG .(a)는 두 TEC사이에서의 유클리디안 거리를 나타낸다. 이를 조금 더 명확하게 보기위해 (a)에서 가장 작은 값을 0으로 변경하고, 그 외의 값은 1로 바꾸어 그림(b)와 같이 이진 히트맵으로 변경하였다. 즉, 건강한 사람들의 심전도로 생체 인식을 진행했을때 해당 사람을 100% 식별할 수 있다는것을 나타낸다.
3-3) ECG-based biometric authentication of CVD patients
반면, CVD환자의 심전도로 생체 인증을 한경우, 정확도가 약90%정도이다. 다른 알고리즘보다 본 연구에서 제안한 알고리즘을 적용했을때 최소 10%이상의 성능향상을 낼 수 있을것이다. 또한 일부 샘플에 대한 잘못된 예측은 ECG의 주기 사이의 P파와 T파의 상당한 shifting때문일 수도 있다.
3-4) Combined performance of both healthy persons and CVD patients
PTB 데이터 베이스에서 수집된 52명의 건강한 사람의 데이터와 QT데이서 베이스에서 수집된 14명의 건강한 사람 + 91명의 CVD환자의 ECG를 모두 합쳐 하나의 데이터 셋으로 생성하였다. 그 다음 총157명의 생체 인증에 대한 정확성을 평가했을때 94.27%의 정확도를 보였다.
3-5)Longer signal duration increases authentication accuracy
추가적으로, ECG singal의 길이의 변화에 따른 정확도를 분석해보았을때, ECG signal이 5초, 10초 20초 인경우 각각 정확도가 94%, 96%, 98%를 보였다. 따라서 ECG 기반 생체 인식의 경우, ECG signal이 더 길수록 더 잘 인식한다는것을 의미한다.
🖇논문
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0071523