Rucrazia's Blog

Epidemiology 6. 진단 시험(Diagnostic Testing) 본문

기술 - Review/Healthcare

Epidemiology 6. 진단 시험(Diagnostic Testing)

DoyoungJ 2018. 1. 9. 18:02

본 포스팅은 'Greenberg, R. S. (2005;2004;). Medical epidemiology (4th ed.). New York: Lange Medical Books/McGraw-Hill.'을 번역 및 요약한 내용입니다.

 

임상적 이유Clinic reasoning

 임상 의학은 과학을 예술적으로 응용하는 것입니다. 실제로 임상 추론의 과정은 매우 복잡 합니다. 두 사람의 얼굴이 같지 않으므로 두사람의 신체  비슷하지 않으므로 두 사람이 똑같은 질병의 양상에 따라 반응하고 행동하지 않습니다. 이것은 의사의 교육에있어서 근본적인 어려움입니다.

 확률은 삶의 지침입니다. 의사의 임상적 결정 과정은 확률에 근거합니다. 예를 들어 한 의사가 정상적인 유방 검사를 받은 54 세의 여성이 유방암에 걸릴 확률이 낮은 것으로 알고있었습니다 (~ 0.3 %). 반대로 비정상 선별 유방 X 선 사진은 유방암에 걸릴 확률을 13 %까지 높였습니다. 핵의학과 전문의는 특정 유방 조영술 결과에 근거하여 유방암 발생 확률을 약간 낮추거나 높게 예측할 수 있습니다. 양성 FNA 검사는 유방암 발병 가능성을 약 64 %까지 증가합니다. 다시 말하지만, 이 환자의 FNA 표본의 특성 (핵의 출현 또는 핵 / 세포질 비율)에 따라, 유방암이 나타날 확률이 약간 올리거나 내려갈 수 있습니다.
 
또한, 다른 병리학 자들은 동일한 현미경 표본을 해석 할 때 다른 결론에 도달 할 수 있습니다. 일부 병리학자는 암세포가 분명히 존재한다고 말하고 다른 표본은 암의 존재에 대해 의심 스럽다고 보고 할 수 있습니다.
 
질병이 존재할 확률이 0에 가까울 때 질병을 배제 할 수 있습니다. 추정 된 확률이 100 %에 가까울 때, 질병의 존재가 확인됩니다. 엑스레이나 생검과 같은 진단 절차는 종종 실험실 검사로 간주되지만 임상 정보를 수집하는 거의 모든 방법을 검사로 간주 할 수 있습니다.
 
질문에 대한 환자의 반응이나 신체 검사 결과의 유무에 따라 임상의가 특정 질병이 발생할 확률을 추정하는 데 영향을줍니다. 위의 환자는 환자의 여자 형제와 어머니가 이전에 유방암 진단을 받았다면 환자가 유방암에 걸릴 확률은 1 % 정도였습니다. 만성 유방 덩어리가 신체 검사 상에 존재했다면, 유방암 검사 이전에 환자가 암에 걸릴 확률은 20-40 %로 추정 될 수있었습니다.

 경험이 많은 진단 전문가는 일반적으로 환자와의 만남 초기에 가설을 세운 다음 상대적으로 적은 수의 질병의 예상 확률을 정교화하기 위해 검사를 지시합니다. 검사는 질병의 중증도를 평가하고 질병 결과를 예측하며 치료 반응을 모니터링 하는데 사용될 수 있습니다.

 검사의 목적에 관계없이 검사가 결과의 확률을 추정하는데 사용된다는 것을 기억하는 것이 중요합니다.

 

민감도과 특이도(SENSITIVITY AND SPECIFICITY)

 이상적인 의료 검사는 항상 정확합니다. 예를 들어, 여성은 유방암의 유무를 명확하게 판단 할 수 있는 진단 검사를 받을 수 있으며 검사에 의한 부작용이 없습니다. 검사 결과, 양성은 암이 존재한다는 것을 나타내며, 음성 검사 결과는 암이 없다는 것을 나타냅니다. 그러나 실제로는 모든 테스트에는 오류가 있습니다.

 양성 또는 음성 결과만 있는 검사를 고려하십시오. 검사가 수행 된 후 그림 6-2에서와 같이 네 가지 가능한 시나리오 중 하나가 발생합니다. "진정한"질병 상태는 "황금 표준"이라고 하는 가장 확실한 진단 방법에 의해 결정됩니다. 예를 들어, 유방암 진단을 위한 황금 표준은 환자 유방에서 얻은 조직의 표본에서 암을 병리학적 확인입니다. 그림 6-2의 a 셀에는 관심 있는 질병이 있고 결과는 양성인 것을 true-positive(진양성) 이라고 합니다. d 셀에서는 질병이 없고 결과는 음성인 것을 true-negative(진음성) 이라고 합니다. 이 두 세포에서 시험 결과는 질병의 실제 상태와 일치합니다. b 셀은 질병이 없는 사람으로 양성 검사 결과를 나타냅니다. 이 검사 결과는 질병이 존재한다고 잘못 제시하기 때문에 위양성으로 간주됩니다. c 셀의 개체는 이 질병에 걸리지만 음성 결과가 나옵니다. 이 결과는 질병이 없다고 잘못 제시하기 때문 위음성으로 지정됩니다.
 모든 진단 테스트는 이러한 방식으로 평가 될 수 있습니다. 검사 평가의 첫 번째 단계는 질병의 "진정한"상태를 결정하는 것입니다. 민감도과 특이도는 특정 검사 방법에 비해 다른 검사의 타당성을 설명하는데 사용되는 용어입니다. 검사의 민감도는 양성 검사 결과를 가진 관심이 있는 환자의 비율로 정의됩니다. 민감도는 다음과 같이 계산됩니다.

 민감도가 높은 검사는 임상 적으로 질병의 존재를 배제하는 데 유용합니다. 즉, 검사 결과가 음성인 환자가 관심 질병에 걸릴 가능성을 사실상 배제 할 수 있습니다.

 검사의 특이성은 음성 검사 결과가 있는 관심 질환이 없는 사람의 비율로 정의됩니다. 특이성은 다음과 같이 계산됩니다.

검사의 특이도가 높을수록 질병이 없는 사람은 질병을 갖고 있을 것 같은 환자군에서 제외될 가능성이 커집니다. 검사의 특이도가 높으면 검사 결과 양성이면 해당 질병의 존재를 강력하게 시사합니다.

 

 

긍정적 및 부정적 예측 가치(POSITIVE & NEGATIVE PREDICTIVE VALUE)
 민감도와 특이도는 테스트의 정확도를 설명하는 것입니다. 질병 유무의 확률 추정에 관한 두 가지는 양성 예측치 (PV+)와 음성 예측치 (PV-)입니다. PV+는 실제로 관심이 있는 질병이 있는 양성 검사 결과를 가진 사람의 비율로 정의됩니다. 따라서 PV+는 검사가 양성일 경우 관심 질병이 얼마나 있을지 예측할 수있게 해줍니다.  PV+는 질병이 있는 양성 검사 결과를 가진 사람의 비율입니다. PV +는 다음과 같이 계산됩니다.

 

 ex) FNA 테스트 이전에 이 샘플에서 유방암의 평균 확률은 총 114 명의 여성 중 15 명 (13 %)이 영향을 받았습니다. FNA 테스트 후, 양성인 검사 결과를 가진 여성의 유방암 확률은 64 %로 증가했습니다.

 PV-는 관심 질환이 없는 음성 검사 결과를 가진 사람들의 비율로 정의됩니다. PV-를 계산하기위한 공식은 다음과 같습니다.

 ex) FNA가 시행되기 전에 이 샘플에서 유방암을 갖지 않을 확률은 총 114 명 중 87 % 인 99 명이었습니다. FNA 결과가 부정적인 결과 유방암에 걸릴 확률은 99 %로 증가했습니다. 이제는 FNA 후 확률이 양성 또는 음성 결과로 계산되었으므로 FAP 테스트의 유용성이 고려 될 수 있습니다. 양성 반응 결과 유방암 확률은 13 %에서 64 %로 증가했습니다. 유방암의 확률이 13 % 또는 64 %인지 여부에 관계없이 추가 검사가 지시됩니다. 양성 FNA 결과 전후에 임상 의사는 유방암의 가능성이 너무 커서 수술 생검과 같은 검사를 포기할 수 없다고 결론을 내렸습니다.

 그러나 음성 테스트 결과 유방암이 1 % (PV- = 1 % 100 %)로 나타날 확률은 줄어 듭니다. 비정상 유방 X 선 사진은 있으나 비정상 유방암의 치료를 실수로 지연시키는 위험이 1 백분의 1에 달하는 것을 제외하고는 수술 생검을 연기하고 유방 X 선 촬영 및 육체 검사를 수 개월 내에 반복하도록 결정할 수 있습니다. 보다 적극적인 접근 방법은 비정상 유방 X 선 사진을 가진 모든 여성에게 수술 생검을 시행하는 것입니다. 비정상 유방 X 선 사진 촬영을하는 환자에게 FNA를 시행하는 이점은 대다수의 여성들이 외과적 생검과 관련된 이환율과 비용을 줄일 수 있다는 것입니다. 모든 검사가 잘못되었다는 것을 인식하는 것 외에도 임상 상황이 변함에 따라 검사의 유용성이 바뀌는 것을 알아야합니다. 구체적으로, 개인의 질병 유무에 대한 사전 검사 확률 또는 인구 집단의 질병 유병률은 예측 가치에 큰 영향을 미칩니다.

 

 위 두 그룹의 유방암 유병율은 질병 유무의 평균 예비 검사 확률과 같았으며 palpable masses(촉진 가능 덩어리)가 있는 여성 (38 %)이 palpable masses가 없는 여성 (13 %)보다 높았습니다. FNA 테스트는이 두 가지 임상 상황에서 동일한 특이성과 민감성을 나타냈지만, 테스트의 PV +는 palpable masses이 없는 여성의 경우 64 % 였지만 palpable masses이 있는 여성의 경우 88 %였다. PV +는 질병의 예비 검사 확률이 증가하면서 증가했습니다. 따라서 질병의 기저 확률이 높은 여성에게서 유방암의 존재를 확인하는 것이 더 쉬웠습니다. 만성 통증이 없는 여성에서 FNA를 사용했을 때 PV 값은 99 % 였지만, palpable masses가 있는 여성에서는 96 %로 감소했습니다. PV-는 질병의 존재에 대한 예비 검사 확률이 증가함에 따라 감소했습니다. 질병의 예비 검사가 감소함에 따라 질병을 배제하는 것이 쉬워지게 됩니다.

 

 

 

절사점(CUTOFF POINTS)

 

 이 장에서 FNA의 사용은 유방암을 진단하는 방법으로 분석되었으며, "암이 존재"또는 "암이 부재"를 나타낼 것이라고 가정했습니다. 양성 또는 음성 결과의 이분법 분류는 유용합니다. 이분법 결과의 예로는 유방에서의 통증의 양성 또는 음성 병력, 육체 검사에서 만져지는 유방 종괴의 유무, 정상 또는 비정상 알칼리성 인산가수분해 레벨(뼈 또는 간 질환의 혈청 표지) 등이 있습니다. 그러나 실제로는 검사 결과가 연속적으로 발생하는 경우가 많습니다. 유방 통증은 예를 들어 음성, 간헐적 또는 지속적 일 수 있습니다. 유방의 크기는 일반적으로 센티미터 단위로 측정됩니다. 혈청 알칼리성 인산 가수 분해 효소 수준은 연속적인 범위를 따라 분포 할 수 있습니다. 일반적으로 지속적인 검사 결과의 가치가 극단적일수록 결과에 실험실 오류 또는 환자의 이상이 반영 될 가능성이 커집니다.

 네 가지 가능한 결과가 각각 긍정적 또는 부정적 결과로 간주되는지 여부는 테스트 성능 평가에 영향을 미칩니다. 

1. 악성 세포의 존재 또는 부재를 적절하게 평가할 수있는 재료가 충분하지 않음
2. 양성 (악성 세포가 없음)
3. 의심이 되는 세포가 존재 (비정형 세포가 존재 하나 확실하게 악성이 아님)
4. 악성 세포 존재. 

 양성과 의심의 범주 사이에 컷오프 포인트가 설정되어 있으면 FNA 결과가 부정확하면 유방암의 가능성이 줄어들지만 유방암의 확률이 있으면 생검이 가능할 수 있습니다. FNA 결과가 양성이면 PV+만큼의 암 발병률을 보일 수 있지만 여전히 진단을 확신 할 수는 없습니다. 실제로 많은 임상의는 양성 FNA 검사 결과가 외과적 절제 생검의 필요성을 배제함으로써 환자에게 추가 절차를 줄이고 치료 비용을 절감 할 수 있다고 믿습니다.

 

 

우도 비(LIKELIHOOD RATIOS)
 우도 비(LR)는 진단 검사의 해석에 유용합니다. LR은 관심 질병이 없는 사람에 대한 특정 검사 결과의 확률로 해당 질병이 있는 사람에 대한 검사 결과의 확률을 나눈 값 입니다. 이분법 결과로 분류 될 수있는 FNA와 같은 검사의 경우, LR은 양성 또는 음성 검사 결과에 대해 정의됩니다. 양성 검사 결과 (LR +)에 대한 우도비는 질병이 없는 사람에 대한 양성 검사 결과 확률로 해당 질병이 있는 사람에 대한 양성 검사 결과 확률을 나눈 값 입니다. 수학적으로 LR+는 다음과 같이 계산됩니다.


LR+ = Sensitivity / (1–Specificity)


민감도와 특이도는 백분율이 아닌 비율로 표현됩니다. LR+의 가능한 가장 작은 값으로 분자가 최소화되면(민감도 = 0), LR +가 0이 됩니다. LR+의 최대 값은 분모가 최소화되면 (특이도 = 1, 1 - 특이도 = 0), 양의 무한대의 LR+이 됩니다. LR+ 은 양성 검사 결과의 확률이 영향을 받은 환자와 그렇지 않은 사람에게 똑같이 나타날 가능성이 있으므로 관심 있는 질병이 있거나 없는 환자를 분류하는데 가치가 없는 검사가 어떤건지 알려줍니다. LR+ 값이 1보다 큰 경우는 관심 질병에 걸린 사람이 질병에 걸리지 않는 사람보다 양성 검사 결과를 보이는 경우에 해당합니다. LR+의 값이 클수록 양성 반응 결과와 관심 질환의 관련성이 강해집니다. 음성 테스트 결과의 우도비(LR-)는 질병이 없는 사람에 대한 음성 테스트 결과의 확률을 해당 질병이 있는 사람에 대한 음성 테스트 결과 확률에 나눈 값 입니다. 수학적으로 LR-는 다음과 같이 계산됩니다.

 

LR– = (1–Sensitivity) / Specificity

민감도와 특이도는 백분율이 아닌 비율로 표시됩니다. LR-의 최소값은 분자가 최소화되면 (감도 = 1이므로 1-민감도 = 0), LR- 값이 0이 됩니다. LR-의 가장 큰 값은 분모가 최소화 될 때 발생하며 (특이도 = 0), 양의 무한대의 LR-을 만듭니다. LR +와 마찬가지로, 1의 값을 가진 LR-는 질병을 가진 사람과 질병에 안걸린 사람 사이에서 음성 검사 결과가 발생할 확률이 똑같이 높기 때문에 관심 있는 질병이 있거나 없는 사람을 분류하는데 가치가 없는 검사를 판별해냅니다. LR 값이 낮을수록, 음성 검사 결과와 관심 질병이  없는 것 사이의 관련성이 강해집니다.

 예측 값과 달리 우도비는 질병의 유병율에 따라 변하지 않습니다. 위에서 지적했듯이 두 우도 비의 크기는 검사 결과와 질병의 가능성 사이의 연결 강도를 나타냅니다. LR+ 값이 큰 진단 검사는 양성 결과가 있는 환자의 질병 의심을 증가시킵니다. LR+의 크기가 클수록 검사의 진단 가치가 높아집니다. 다소 임의적이지만, LR+ 값이 10 이상인 경우가 종종 높은 가치가 있는 진단 검사로 인식됩니다. 
 LR- 값이 작은 진단 검사는 음성 검사 결과가 있는 환자의 질병이 걸렸을 수 있다는 가능성을 줄입니다. LR-의 크기가 작을수록 검사의 진단 가치가 좋습니다. 다소 임의적인 근거에서, 0.1 이하의 LR-값은 종종 높은 진단 가치를 지닌 검사의 지표로 인식됩니다. 

 LR은 진단 검사의 결과에 의해 질병의 존재 가능성이 변경되는 정도를 직접적으로 측정하기 위해 사용될 수 있습니다. 검사가 수행되기 전에 환자가 특정 질병에 걸릴 확률을 고려하기 위해 질병의 예비 검사 확률이라고 하는 것을 하게 됩니다. 특정 환자의 경우, 질병에 대한 사전 검사 가능성은 환자에 대한 이용 가능한 임상 정보를 기반으로합니다. 

 

ROC 곡선 (ROC CURVES)

 절사점(cutoff point) 부분에서 언급했듯이, FNA는 가능한 결과의 개별 카테고리로 분류되는 진단 검사 결과의 한 예입니다. 여기에는 평가, 양성, 의심, 악성 표본이 포함됩니다. 양성 시험 결과와 음성 시험 결과 사이의 한계점은 양성 검사 결과의 제한적인 정의 (악성 세포 존재) 또는 양성 검사 결과의 보다 포괄적인 정의 (의심스러운 세포 또는 악성 세포 존재)로 설정 될 수 있습니다. 절사점의 변화는 FNA 테스트의 민감도, 특이도 및 예측값에 영향을 미침으로써 얻은 정보가 임상 결정에 영향을 미치는 것으로 나타났습니다. 혈청 효소 수준과 같은 다른 유형의 진단 검사는 지속적인 측정 척도를 따라 결과를 산출합니다.

 이러한 상황에서, 양성 검사 결과와 음성 검사 결과 사이에 절사점을 설정할 위치에 대한 더 많은 옵션이 있습니다. 측정의 연속 척도에 따라, 다른 절사점은 민감도 또는 특이도의 상이한 레벨을 초래할 것입니다. 일반적으로 절사점이 올라감에 따라 감도가 증가하여 특이도가 감소합니다. 이러한 관계에 대한 편리한 요약은 ROC 곡선으로 지칭되는 그래프로 도시 될 수 있습니다. 이 커브는 레이더 신호에서 노이즈와 정 신호를 구분할 수있는 분별 능력을 측정한 장치에서 이름을 따온 것입니다.

 진단 검사를 위해 그래프는 수직 축에 민감도 (때로는 진정한 양의 비율로 표시됨)와 수평 축에 1-특이도 (때로는 위양성 비율로 표시됨)으로 구성됩니다. 각 절사점(cutoff point)에서 민감도와 1-특이성이 계산됩니다. 이러한 결과는 ROC 곡선을 생성하는 모든 컷오프 포인트를 따라 그래프로 나타낼 수 있습니다. ROC 곡선의 예가 그림 6-6에 나와 있습니다. 이 그래프에서 진단 검사의 성능은 실선으로 표시됩니다. 점선으로 표시된 대각선은 진단 값이 없는 검사를 나타냅니다. 이 파선을 따르는 모든 지점에서 민감도는 1-특이도와 같습니다. 민감도가 1-특이도와 같을 때, LR+의 분자는 분모와 같습니다. 말하자면, 이 점선 대각선을 따라 모든 점에서 LR+는 1과 같고 양성인 검사 결과는 관심 있는 질병이 있거나 없는 사람들에게 똑같이 나타날 것입니다. 그러므로 임상적으로 유용한 진단 검사는 이 점선 대각선에서 멀리 떨어진 ROC 곡선을 갖게 됩니다. 진단 테스트의 ROC 곡선에 대한 또 다른 생각은 수직축 (민감도)을 "신호"로, 수평축 (1-특이도)을 "잡음"으로 간주하는 것입니다. 그림 6-6의 왼쪽 부분 감도 (신호)가 급격히 상승하고, 1-특이도 "잡음"이 약간 증가합니다.

 즉, 특이성을 현저히 낮추어 민감도를 크게 높일 수 있으며 이는 매우 유리한 절충안입니다. 그러나 그림 6-6의 오른쪽 부분을 보면 ROC의 기울기 곡선은 매우 평평하여 잡음의 상당한 증가에 대한 신호의 개선이 거의 없음을 나타냅니다. 이는 매우 바람직하지 않은 절충입니다. 전반적인 검사 성능의 요약 지수는 ROC 곡선 아래의 면적으로 계산할 수 있습니다. 면적이 클수록 검사 성능이 향상됩니다. ROC 곡선에서 가장 높은 값은 1이며 완벽한 검사일 때와 같습니다. 대조적으로 점선 대각선 아래의 영역은 관심 질환이 있는 사람과 없는 사람을 구별하지 못하는 검사에 해당하며 0.5입니다. 이러한 극단이 주어지면 ROC 곡선 아래의 면적이 0.5보다 1에 가까워지는 것이 분명합니다. 이 원칙은 또한 특정 질병에 대한 두 가지 진단 검사의 상대적인 가치를 비교하는데 사용될 수 있습니다. 이 점은 그림 6-7에 설명되어 있으며 두 개의 가상 진단 검사 A 및 B의 성능이 대조됩니다. ROC 곡선 아래의 면적은 검사 B보다 검사 A에서 더 컸다. 이는 우수한 진단 값을 의미한다.

 

선별 검사(SCREENING TESTS)

 환자에게 유방암에 대한 선별 검사로 유방 X 선 사진을 환자에게 추천했습니다. 유방 X 선 사진의 목적은 질병 초기에 유방암을 발견하는 것입니다. 선별 검사를 통해 질병의 존재를 일찍 감지하여 보다 효과적인 치료와 장기 생존을 가능하게합니다.
(1) 선별 검사는 질병의 존재가 일상적 진단 (예 : 증상이 발생할 때)에 의해 감지되기 ​​전에 질병이 있는 사람을 식별 할 수 있고,
(2) 선별 검사는 일상 진단 시간과는 달리 생존 가능성을 높입니다. 유방암은 진행성 질환의 원형 예입니다. 대부분의 암과 마찬가지로 유방암은 빠르게 성장하고 증식하는 종양을 형성하는 단일 악성 세포로 시작한다고 믿어진다. 시간이 지남에 따라 유방암 세포는 림프계를 통해 액와 림프절로 퍼지고 림프계, 혈관계 또는 둘 다를 통해 다른 신체 부위로 퍼집니다. 질병 초기에 유방암이 발견되면 암이 림프절 및 다른 부위로 전이 될 가능성이 줄어 듭니다. 유방암 진단 시점으로부터의 생존 기간은 종양의 크기와 인접한 원격지로 확산되는 정도와 관련이 있다는 사실이 오래 전부터 알려져 왔습니다. 유방 조영술이 처음 소개되었을 때, 유방의 암 병변 (유능한 임상의 조차도 느낄 수없는 암조차도)이 유방 X 선 사진으로 발견 될 수 있다는 것이 분명했습니다. 연구원은 유방 조영술을 받은 무증상 여성을 스크리닝함으로써 초기 단계에서 유방암을 발견 할 수 있었으며 따라서 여성의 경우 생존율이 증가함에 따라 여성에게 영향을 미친다고 전했다. 이 논리는 오류가 없지만, 스크리닝 프로그램을 평가할 때는 리드 타임(lead-time) 바이어스와 길이 바이어스 샘플링과 같은 두 가지 중요한 편향을 고려해야합니다. 그림 6-9에서 볼 수 있듯이, 리드 타임 (lead-time) 편향은 생존 기간을 연장하지 않고 질병을 발견하고 사망했을 때까지 측정 된 생존율의 증가입니다.

 길이 편향된 표본 추출은 선별 프로그램에서 발견 된 질병이 선별 검사 없이 발견 된 질병보다 덜 공격적 일 때 발생합니다. 평균적으로 스크리닝 프로그램에 의해 발견 된 유방암은 증상이 있을 때 진단되는 암보다 덜 공격적 일 수 있습니다. 이것은 덜 공격적인 암이 일반적으로 더 공격적인 악성 종양보다 느린 속도로 자라기 때문입니다. 이것은 덜 공격적인 암이 일반적으로 보다 공격적인 악성 종양보다 느리게 진행되기 때문에 발생하며, 따라서 암이 스크리닝에 의해 탐지 될 수있는 기간은 천천히 성장하는 암에서 더 길다. 생존 기간을 측정한 결과, 선별 검사를 통해 유방암을 진단 받은 사람은 더 오래 삽니다. 부분적으로는 이 환자들의 암이 일상적으로 진단받은 환자의 암보다 느리게 성장하기 때문이다. 리드 타임 편차와 길이 편향 표본 추출을 극복하고 따라서 선별 프로그램의 진정한 이점을 평가하기 위해서는 전체 개체군 내에서 질병 별 사망률을 측정하는 것이 유용합니다. 스크리닝 프로그램이나 스크리닝을 하지 않고 무작위로 배정받은 사람은 특정 질병으로 사망했는지 여부를 판단합니다. 이러한 연구는 뉴욕의 건강 보험 플랜 (HIP)에 의해 1960 년대에 수행되었습니다. HIP 연구에서 여성은 무작위로 일상적인 치료를 받도록 지정되었고 매년 유방 X 선 검사와 유방 검사로 구성된 선별 프로그램을 진행할 수 있습니다.

 

 

 선별 도구로서의 유방 촬영술의 유용성에 대한 연구 결과는 그림 6-10에 나와 있습니다. 모든 선별 검사의 평가에서 위음성 결과를 확인하는 것이 중요합니다. HIP 연구에서 선별 검사를 시행 한 그룹에서 무증상 여성의 생검 결과가 양성인 결과를 얻었습니다. 그 당시 유방암 촬영 후 건강한 여성들이 암을 놓쳤는지를 판단 할 수있는 FNA와 같은 확정적인 표준 검사는 없었습니다. 위음성 선별 검사 (47 회)의 근사치는 매년 선별 검사 사이에 발생하는 암의 수를 결정함으로써 도출되었습니다. 이 유방암은 "중간 암"으로 지정되었습니다. 유방암 검사 후 유방 X 선 검사를 시행 한 후 증상이 있는 암이 발견되면 첫 유방 X 선 사진이 부정적인 것으로 추정됩니다. 그림 6-10에서 mammography는 우수한 특이도 (98 %)를 가졌고 위양성 검사는 여전히 1~7 (PV + = 12 %) 이상으로 진양성보다 많았습니다. 즉, 확진 진단을 받기 위해 수술 생검을 받은 양성 유방 X 선 사진을 가진 여성들 중 발견 된 유방암 1 건당 7 건 이상의 생검 결과가 부정적 이었음을 의미합니다. 이 높은 위양성 비율은 일반 인구에서 단일 시점에서 유방암의 빈도가 낮은 것과 관련이 있습니다. 낮은 PV+ 값은 특정 시점에서 출생 인구의 소수 인원에만 영향을 미치는 질병의 존재를 탐지하도록 고안된 선별 검사에 상당히 일반적입니다. 따라서 선별 검사가 일반인에게 도입 될 때 잘못된 결과와 관련된 불안, 비용 및 이환 가능성을 고려하는 것이 중요합니다.

 HIP 연구의 목적은 유방 X 선 사진을 반복적으로 사용하면 유방암 사망률을 줄일 수 있는지 판단하는데 있었습니다. 동시 대조군을 사용하여 유방암으로 인한 유방 촬영 검사와 사망률 간의 관계를 조사자가 평가할 수 있었습니다. 선별 검사나 정기적인 치료에 대한 여성의 무작위 배정은 후속 유방암 사망률에 영향을 줄 수있는 요인들에 대해 선별 검사군과 비선별 검사군의 균형을 맞추는 이유에 있었습니다 (7 장의 무작위 화에 대한 논의 참조). 생존 기간보다는 연령별 유방암 사망률 평가가 리드 타임 편차의 가능한 왜곡 효과를 감소시켰습니다. HIP 연구원은 유방 조영술이 일상적인 치료를 받는 대조군 그룹과 비교했을 때 유방암 사망률을 선별 검사 대상 환자에서 30 % 줄였다고 결론 지었다. 이 획기적인 연구의 결과와 다른 나라에서 비슷한 디자인을 연구한 결과와 함께 유방 조영술을 이용한 선별 검사의 효과가 입증되었습니다.

 

출처

- Greenberg, R. S. (2005;2004;). Medical epidemiology (4th ed.). New York: Lange Medical Books/McGraw-Hill.