0. 코호트 연구 vs 환자-대조군 연구
* 코호트 연구 (Cohort Study)
- 특정 노출 요인(exposure)에 따라 연구 대상을 두 그룹 (intervention group과 control group)으로 나누고, 시간 경과에 따라 결과 변수(Outcome)가 발생하는지 관찰하는 연구 설계
- 노출이 고정된 상태에서, Outcome발생이 시간 경과에 따라 발생 (랜덤)
- 로지스틱 모형, 포아송 모형, 콕스비례위험 모형 적용
* 환자-대조군 연구(Case-Control Study)
- 특정 결과 변수(Outcome)가 이미 발생한 집단(Case)과 발생하지 않은 집단(Control)을 비교하여, 과거에 어떤 노출 요인(exposure)이 있었는지 후향적으로 조사하는 연구 설계
- 로지스틱 회귀 모형 적용
- 희귀 질환이나 드물게 나타나는 결과 변수를 연구하기에 적합
- 회상 편향 (Recall Bias) : 연구 대상자가 과거 노출에 대해 정확하게 기억하지 못할 수도 있음
* Self-Controlled Case Series (SCCS) / Case-only design의 필요성
-> 기존 관찰 연구 (코호트 & Case-Contol study)의 한계
- 노출군과 비노출군 간의 차이로 인해 Selection Bias(선택 편향)가 발생할 수 있음.
- 대상자의 기저 특성 (연령, 성별, 인종 등)의 차이가 결과를 왜곡할 수 있음.
- 관찰 자료 기록이 있는 환자들만 파악할 수 있기 때문에 전체 환자 수를 정확하게 알 수 없음.
- 모든 환자 데이터를 수집하는것이 어렵거나 비용이 많이 들 수 있음.
- 측정되지 않은 다양한 교란 요인 (Unmeasured Confounder)가 존재.
1. Self-Controlled Design (SCCS) / Case-Only design
1-1) SCSS의 기본 특성
- 기존 관찰연구들의 한계점을 보완하기 위해 집단 간 비교가 아닌, 특정 event를 경험한 각 개인 내에서 비교하는 'Self-Controlled Designs (Case-Only Design)'이 제시됨
- Case-Only Design은 이미 Outcome이 발생한 환자(Case)들만 포함한 연구 설계
- 같은 환자 내에서 exposure(약물 사용 등)과 Outcome(부작용 등)간의 연관성을 분석하는 관찰 연구 설계
- 변형된 코호트 연구의 일종으로 연구 대상 자기 자신이 대조군으로 설정되는 연구 설계 (Case only design)
- 즉, 노출군과 비노출군을 비교하는것이 아니라, 결과가 동일하게 발생한 군만 모아서 각 개인의 노출 전후를 비교하는 연구 설계.
- 동일한 개인 내에서 노출 여부가 다른 시점 간의 비교를 하기 때문에 개인의 기저 특성에 따른 Bias를 통제하는 효과를 얻을 수 있음
- 연구 대상자 자신이 대조군의 역할을 하기 때문에, 따로 대조군을 모집할 필요 없음
- 각 환자를 시점에 따라 비교하는 방법
- 특정 약물(A)을 복용하고, 특정 부작용도 발생한 환자를 대상으로, 과연 (A) 약물이 진짜 해당 부작용을 trigger 하는 원인이 되는가?를 알고 싶은 것.
- 이를 알기 위해, '약물 복용 기간' & '약물을 복용하지 않은 기간'에서 발생률 및 상대 위험도 산출.
- 약물 노출률이 매우 높아 적절한 대조군을 선정하기 어려운 연구에 적용
- 예를 들어, 특정 백신의 부작용 발생률을 평가하고자 할 때, 특정 백신 접종률이 높은 국가에서는 대조군(백신 미접종자)을 찾기 어려움. 따라서 이러한 경우, 백신을 접종한 사람들만 대상으로 백신 접종 전, 후를 비교하여 분석하는 방법.
- 사전에 관찰 시작 시점과 관찰 종료 시점을 고정
- Acute Outcome과 Intermittent exposure 간의 연관성 분석에 가장 적합한 연구 설계
- 어느 집단에 생기느냐(Who)? 가 아닌, 언제 생기느냐(When)? 가 주된 연구 질문.
* Self Controlled Design (Case-Only Design) 예시
연구 가설 : 특정 약물 A가 부작용(두통)을 유발하는가?
- 대상자 : 두통이 발생한 환자들
- 분석 방법 : 각 개인의 약물 복용 시기 (약물에 노출된 기간)와 복용하지 않은 기간 (비 노출 기간) 동안 두통 발생률 비교
- 결론 : 동일 환자 내에서 약물 A를 복용했을 때, 두통 발생률이 더 높다면, 해당 약물이 두통을 유발했을 가능성이 있음
1-2) SCSS의 기본 가정
Self-Controlled Case Series(SCCS)는 Exposure와 Clinical Outcome 간의 시간적 연관성을 분석할 때 적용하는 연구 설계로, 이 설계가 제대로 작동하려면 아래의 몇 가지 가정이 충족되어야 한다.
1. 결과변수 (Outcome) 발생이 노출 변수(Exposure)에 영향을 미쳐서는 안 된다.
- 예시 : 특정 약물(A)을 복용했을 때 부작용(Outcome)이 발생하여, 해당 약물 복용을 중단하거나 다른 약물로 복용할 경우, 분석 결과가 왜곡될 수 있음
- 관심 약물 및 부작용이 기존에 잘 알려져 있지 않아야 함
- 해결 방법 : Outcome 발생 이전에 'Pre-exposure period(사전 노출 기간)'을 추가하여 분석
예시 1 ) 결과 변수가 발생한 환자에게 관심 약물 처방이 금기여서는 안 됨
* 심부전 - 피오글리타존
피오글리타존은 당뇨병 치료제이며, 심부전 환자에게는 사용 금기 약물임.
-> 따라서 만약 당뇨병 치료 중에 심부전(Clinical Outcome)을 겪은 환자에게, 의사가 피오글리타존을 처방하지 않을 것임
-> 이러한 경우, 심부전 발생 이후 피오글리타존 exposure가 줄어들기 때문에 노출과 결과 간의 연관성을 잘못해석할 수 있음
-> 결과적으로, 피오글리타존과 심부전 사이의 IRR(Incidence Rate Ratio)이 실제보다 높아지는 비뚤림(Bias)이 발생
-> 잘못된 해석 : 피오글리타존을 복용하면 심부전이 더 자주 발생하는구나!
-> 왜곡되는 이유 : 심부전 발생 이후, 해당 환자에게 피오글리타존이 처방되지 않기 때문에 결과적으로 '노출되지 않는 기간'동안 심부전 발생률이 낮게 보이고, 피오글리타존에 노출된 기간 동안 심부전 발생률이 상대적으로 높아 보이는 Bias가 발생하는 것.
예시 2) 결과 변수 발생으로 인해 관심 약물 노출이 증가해서는 안됨
* 폐렴 - 항생제
폐렴(Outcome)이 발생한 환자는 항생제(Exposure)를 처방할 가능성이 높음
-> 즉, 결과 변수(폐렴)가 노출 변수(항생제)에 영향을 미치는 것
- SCCS 설계에서는 노출 (항생제)가 결과(폐렴)를 유발하는 것으로 분석해야 하지만, 반대로 될 경우, 결과적으로는 IRR이 실제보다 낮게 나타남.
-> 잘못된 해석 : 행생제가 폐렴을 예방하지 못하는구나! 혹은 항생제를 먹으면 폐렴에 걸릴 위험이 높아지는구나!
-> 왜곡되는 이유: 폐렴 발생 시점에 항생제 사용이 급증하고, 항생제에 노출된 기간(복용기간) 동안 폐렴 발생률이 과소 평가됨, 반대로 항생제 비 노출기간에는 폐렴 발생률이 과대평가되는 Bias 발생
2. 결과변수들은 모두 독립적이어야 한다 (서로 관련이 있으면 안 됨).
- 만약, 결과변수가 재발하는 경우, 독립적이어야 하며, 재발하지 않는 경우 발생률이 10% 미만이어야 비뚤림이 존재하지 않음
- 결과 변수들 간에 서로 영향을 주거나, 재발할 경우 가정이 위반될 수 있음
- 예시 : 첫 번째 뇌졸중 발생이 두 번째 뇌졸중 발생 가능성을 높이는 경우
- 해결 방법 : 한 명의 환자에 대해 첫 번째 Outcome만 포함하거나, 일정 기간 내 재발 사건은 제외하고 분석
3. 연구 자료는 중도 절단 되면 안 된다.
- 즉, 결과 변수 발생이 이후의 관찰기간에 영향을 미쳐서는 안 됨
- 예시 : 관찰 기간 중, 환자의 사망으로 인한 중도 절단 (관찰 기간 내에 사망 기록이 있는 환자는 더 이상 추적 관찰 불가능)
- 이러한 경우, 예상할 수 없는 비뚤림(Unpredictable bias)이 발생
- 해결 방법 : 관찰 기간 중, 사망 환자는 처음부터 제외하고 분석
1-3) SCSS의 지표
-> Incidence Rate Ratio (IRR) or Relative Incidence (RI)
- 특정 노출 (exposure)이 결과(Outcome)에 미치는 영향을 상대적인 위험도로 평가하는 지표
- 두 집단 또는 조건의 사건 발생률을 비교하는 비율
*IRR = 노출된 기간의 사건 발생률 / 노출되지 않은 기간의 사건 발생률
* 사건 발생률 (Incidence Rate) = 사건 수 / 총 관찰 기간 (Person-years)
# IRR 해석
IRR > 1 : Exposure가 Clinical Outcome 발생 위험을 증가시킴
IRR = 1 : Exposure와 Clinical Outcome사이에 영향이 없음
IRR < 1 : Exposure가 Clinical Outcome 발생 위험을 감소 시킴
* IRR 직관적 이해
- 예를 들어, IRR =4라면, '해당 약물에 노출된 상태에서 Clinical Outcome(부작용 등)이 발생할 위험이, 약물에 노출되지 않았을 때보다 4배 더 높다'는 의미.
- 만약, IRR = 0.5라면, '해당 약물에 노출된 상태에서 Clinical Outcome(부작용 등)이 발생할 위험이 약물에 노출되지 않았을 때보타 50% 더 낮다'는 의미.
* IRR 산출 예시
연구 질문 : 특정 약물 (A)를 복용하면 두통 발생 가능성이 높아지는가?
- 대상자 : 두통이 발생한 환자들 10명
- 관찰 기간 : 10년
=> 이때의 person year = 100 (10명 * 10년)
- 10명의 노출 기간 (약물 A를 복용한 기간) 4년 동안 (person year 40) -> 부작용 8건 발생
- 10명의 비노출 기간 (약물 A를 복용하지 않은 기간) 6년 동안 (person year 60) -> 부작용 6건 발생
( 발생률 = Outcome 발생 수 / Person year )
- 약물 복용 기간의 발생률 : 8 / 40 = 0.2
- 약물 비복용 기간의 발생률 : 6 / 60 = 0.1
IRR = 약물 복용 기간의 발생률 / 약물 비복용기간의 발생률 = 0.2 /0.1 = 2배
-> 결론 : 특정 약물 (A)를 복용하는 기간 동안 부작용이 발생할 확률은 해당 약물을 복용하지 않은 기간에 비해 2배 높다.
1-4) SCCS의 장점
- case만 필요하기 때문에 데이터를 비교적 쉽고 저렴하게 수집할 수 있음
- 고정된 교란요인(fixed confounder)이 모두 통제됨
- 결과 발생률 (Outcome rate)의 시간적 변화를 명확하게 모델링할 수 있음
- 독립적인 반복 사건 (Independent recurrent events)도 동일한 분석 틀에서 처리 가능
- 노출 위험 기간 (exposure risk window)이 길거나 무제한일 경우에도, 노출되지 않은 기간이 있으면 분석 가능
-짧은 노출 기간에서도 높은 분석 능력을 가짐
1-5) SCCS의 단점
- 정확한 시간 정보 필요
- 노출 위험 기간의 길이와 타이밍을 신중하게 설정해야 함
- 시간적 교란 요인(Temporal Confounders)이 고려되지 않으면, 결과가 왜곡될 수 있음
- 개인 내 상대적 발생률(Relative Incidence)만 추정 가능하며, 절대적 위험 (Absolute Risk)은 추정되지 않음
Self-Controlled Case Series (SCCS) 요약
- SCCS는 Acute recurrent(급성 재발성) 또는 Non-recurrent (비재발성), 희귀 사건(rare events), 간헐적/일시적 노출 (intermittent or transient exposure), 정확한 시간 정보를 알 수 있는 경우에 적합한 연구 설계
- 개인 내 분석이 이루어지며, 별도로 대조군이 필요하지 않음
- 시간에 따라 불변하는 요인(Time invariant factors)은 분석에서 자동으로 제거됨 (ex. 인종, 성별 등)
- 결과 발생일(date of outcome occurrence)에도 추적 관찰이 중단되지 않음