🤖딥러닝

[논문 리뷰] Prediction of white-coat hypertension and white-coat uncontrolled hypertension using machine learning algorithm

빅데희터 2023. 6. 3. 17:47
반응형

01. Introduction

White-coat hypertension(WCH)은 의료진이 혈압을 측정하는 동안에만 과도하게 높은 혈압(Blood pressure)이 나타나는 현상을 의미하며 (즉, 일상적인 환경에서는 혈압이 정상범위에 있지만, 병원 등 낯설고 긴장되는 환경에서 혈압을 잴 때일시적으로 혈압이 과도하게 높게 나타나는 현상), 높은 Blood Pressure로 병원에 내원하는 환자들 중, 10~30%가 White-coat hypertension이 나타난다. 이러한 현상은 주로 의사나 간호사 등 의료진과의 상호작용, 긴장, 불안등으로 인해 혈압이 일시적으로 상승하는 것인데, 일반적으로는 White-coat hypertension이 나타나더라도 특별히 문제가 있는 것은 아니다. 하지만 일부 사람들에게는 실제로 고혈압이나 혈압 관련 질환의 조기 징후일 수 있기 때문에 의료진은 환자의 혈압을 정확하게 측정하는 것이 필요하다.

 

참고로, white-coat hypertension(WCH) 고혈압관련 치료를 받고 있지 않은 사람들에게서 이러한 현상이 나타나는 것이며, white-coat uncontrolled hypertension(WUCH) 고혈압관련 치료를 받고 있는 사람들에게서 이러한 현상이 나타나는 것이다.

 

본 연구에서는 WCH와 WUCH를 다양한 방식으로 정의했을 때도 연구 결과가 일관성을 가지는지 평가하기 위해 크게 2가지 형태로 WCH와 WUCH를 정의했다.

*WCH/WUCH(정의A) : 항고혈압제 치료를 받지 않는/ 치료받는 환자의 office BP가 >=140/90mmHg이거나, daytime ambulatory BP <135/85mmHg인 경우.

*WCH/WUCH(정의B) : 항고혈압제 치료를 받지 않는/ 치료받는 환자의 office BP >=140/90mmHg, 24시간 동안 측정한 평균 혈압이 <130/80mmHg, Daytime ambulatory BP <135/85mmHg, Night-time ambulatory BP <120/70mmHg인 경우.

 

- Office BP : 일반적으로 의료기관, 진료실과 같은 장소에서 측정된 혈압. 주로 대동맥 혈압을 의미하며, 수축기 혈압(Systolic Blood Pressure)과 이완기 혈압(Diastolic Blood Pressure)을 포함한다.

- Daytime ambulatory BP : 주간 동안 측정된 이동식 혈압으로, 이동식 혈압 측정은 일상적인 활동이나 환경에서 연속적으로 혈압을 모니터링하는 방법이다. 24시간 동안 혈압을 측정하며, 일반적으로 팔이나 손목에 혈압 모니터를 착용한다. 보통 24시간 동안 측정된 혈압 값 중에서 일정한 시간대(일반적으로는 오전부터 오후까지)에 해당되는 값으로, 일상생활에서 활동적인 상황에서의 혈압을 반영하므로, office BP보다 정확한 혈압 판단이 가능하다.

- Night-time ambulatory BP : 밤 동안 측정된 이동식 혈압을 의미하며 이는 일상생활의 수면 중 혈압을 모니터링하는 것을 의미한다. (기본적으로 ambulatory BP는 24시간 동안 연속적으로 혈압을 측정하는 것을 의미하는데 Daytime에 측정된 것인지 Night-time에 측정된 것인지가 달라지는 것)

 

 

현재 WCH/WUCH를 감지하기 위한 방법으로 ABPM가 사용된다. ABPM는 측정 오류가 적고, 밤 시간 동안에도 혈압을 지속적으로 측정할 수 있기 때문에 WCH를 screening 하는데 적합하다고 여겨진다. 하지만 ABPM은 시간과 비용이 많이 드는 방법이다. 따라서 본 연구에서는 WCH/WUCH를 조기 식별하기 위한 새로운 방법으로 ML모델을 제안한다.

 

*ABPM(Ambulatory Blood Pressure Monitoring): 의료 환경에서 24시간 동안 혈압을 지속적으로 측정하는 비침습적 방법. 휴대용 혈압 모니터를 사용하여 정확한 혈압 측정을 가능하게 한다. ABPM으로 평소 일상 활동 및 수면 중 혈압 변동을 실시간으로 모니터링하여 정확한 혈압 패턴을 파악할 수 있으며, white-coat hypertension을 판별하는 데 사용될 수 있다.

 

*HBPM(Home Blood Pressure Monitoring) : 휴대용 혈압 모니터를 사용하여 환자가 집에서 혈압을 측정하고 기록하는 방법. HBPM은 의료 환경이 아닌 일상 환경에서 혈압을 측정하므로, 환자의 실제 혈압 상태와 일상적인 활동 및 스트레스 상황에서의 혈압 변화를 더 잘 반영할 수 있다.

 

 

 


02. Methods

0) Graphical Abstract

 

 

1) Data & participants

- 두 개의 코호트 집단

 

코호트 1 : 예측 모델을 개발하고 내부 검증 하기 위해 사용됨

코호트 2: external validation 목적으로 사용됨

 

*코호트 : 특정 시간 동안 동일한 경험을 고유하는 그룹이나 집단. 특정 시점에서 비슷한 특성이나 노출 여부를 가진 개체들을 추적하고, 향후 시간 동안 발생하는 이벤트나 결과를 관찰하여 통계분석을 수행한다. 이를 통해 특정 요인과 결과 간의 관련성이나 원인-결과 관계를 파악하고 질병 발생, 생존율, 치료 효과 등을 연구할 수 있다.

 

* Test set vs External validation

- Test set  : Test set은 모델 개발 단계에서 사용되며, 모델을 훈련하고 최적화한 후 최종적으로 모델의 성능을 평가하기 위해 사용되며, 모델의 일반화 능력을 측정한다.(일반적으로 데이터셋은 훈련세트(Training set), 검증세트(Validation set), 테스트세트(Test set)로 나누어짐). 테스트 세트는 모델 개발 과정에서 사용된 데이터와 독립적이어야 함.

- External validation : External validation은 모델의 일반화 능력과 신뢰성을 확인하기 위해 개발된 데이터 셋과는 독립적인 외부 데이터셋을 사용하여 모델을 평가하는 과정이다.(ex. A국가로 검증한 것을 B국가로도 검증할 수 있을지 확인하기 위함)

 

- 논문에서 사용된 변수 

WCH/WUCH와 관련 있을 것으로 예상되는 임상적 지표 총 26개를 선정하여, 모델의 학습 및 예측에 사용하였다.

(ex. Age, Sex, BMI, office SBP, office DBP 등)

 

 

2) Model development

 

 

본 연구에서는 input data가 들어왔을 때, 해당 환자가 WCH/WUCH에 해당되는지(1) 아닌지(0)를 분류하기 위한 목적으로, 총 4가지 분류기(Classification Model)들을 사용하였으며, 구체적인 모델은 다음과 같다.

 

- Logistic Regression

- Random Forest

- XG boost

- Artificial Neural Network(ANN)

 

 

 

 

 

3) Subgroup analysis

subgroup analysis는 '해당 연구 결과를 특정 조건의 집단에게도 동일하게 적용될 수 있을까?'를 알아보기 위해 시행한다. 예를 들어 나이, 인종, 기저 질환 유무 등과 같은 특성에 따라 모델의 예측 정확도가 다를 수 있다 따라서 이를 파악하여 특정 그룹에 맞춤형 모델을 개발하거나 특정 그룹에 대한 개별적인 관리 전략을 수립할 수 있다. 또한 subgroup analysis는 예측 모델이 특정 그룹에 편향되어 있는지를 평가하는데 도움을 준다. 예를 들어, 모델이 특정 인구 그룹에 대해 예측 정확도가 낮을 수 있는데, 이는 데이터의 불균형, 표본의 크기 부족, 변수의 중요성 등과 관련될 수 있다. 따라서 subgroup analysis를 통해 편향이 있는지 확인하고 이를 조정할 수 있다.

 

해당 연구에서 시행한 subgroup analysis는 다음과 같다

- 조건 B 적용

- 50세 이상/ 이하

- BMI >=27kg/m2 (즉, 과체중 이상인 사람들) 혹은 Fasting glucose level(공복혈당 수준) >=100mg/dl

 

 

 


03. Results

1) Baseline characteristics of participants

2) Model performance - internal validation (Definition A)

(A) : Internal validation을 위한 ROC, AUROC curve / RF에서 가장 큰 값을 보임

(C) : Internal validation을 위한 PR curve & AP

 

 

 

 

3) Model performance - external validation (Definition A)

(B) : External validation을 위한 ROC & AUROC curve / RF에서 가장 높은 값을 보임

(D) : External validation을 위한 PR curve & AP 

 

 

 

 

4) Model explanation

 

모델이 예측한 값에 가장 크게 영향을 미친 feature를 알아보기 위해 RF의 SHAP summary plot을 수행했다. 위의 그래프를 봤을때, RF model이 내놓은 예측값에 가장 영향을 많이 미친 feature는 office DBP이며, 이는 office DBP값이 클수록 WCH/WUCH일 확률이 증가한다는 의미로 해석할 수 있다.

반응형