Rucrazia's Blog

Epidemiology 7. 임상 시험(Clinical Trials) 본문

기술 - Review/Healthcare

Epidemiology 7. 임상 시험(Clinical Trials)

DoyoungJ 2018. 1. 28. 23:13

본 포스팅은 'Greenberg, R. S. (2005;2004;). Medical epidemiology (4th ed.). New York: Lange Medical Books/McGraw-Hill.'을 번역 및 요약한 내용입니다.

 

 미국에서는 당뇨병의 유병률은 인구의 2%에서 4% 사이인 것으로 추산됩니다. 당뇨병의 두 가지 기본 유형은 제 1형 당뇨병과 제 2형 당뇨병이 있습니다. 제 1형 당뇨병은 췌장 베타 세포의 자가 면역 파괴로 인해 인슐린의 생산이 현저히 감소되거나 결핍되는 것을 특징으로 합니다. 포도당이 세포로 들어가는 것을 촉진하는 인슐린이 없으면 혈장 포도당 수치가 상승합니다. 혈장 내 포도당 레벨이 신장에 의해 재흡수 될 수있는 양 (약 180 mg / dL)을 초과하면, 생성된 글루코스테리아가 삼투성 이뇨를 유발합니다. 그렇기 때문에 소변으로 포도당을 내보내기 위해 물을 내보내는 것이 필요로 합니다. 결과적으로 물과 칼로리가 손실되면서 당뇨병의 주요 징후인 체중 감소와 탈수증이 동반되는 배뇨 증가, 식욕 부진으로 이어집니다.

 인슐린을 발견하기 전에는 제 1형 당뇨병으로 진단받은 환자들은 몇 주 안에 질병으로 사망했습니다. 그 이후, 동물에서 인슐린을 정제를 할 수 있게 되어서, 인슐린의 피하 주사는 제 1형 당뇨병 환자의 생존에 도움이 되었습니다.

 인슐린 발견과 포도당 수치 모니터링 기술의 개발로 인해 인슐린 결핍으로 인한 급사가 사실상 사라지긴했지만, 제 1형 당뇨병 환자는 계속해서 질병의 조기 합병증을 앓고있었습니다. 1980년대에는 이러한 장기적인 합병증의 원인이 의학계 내에서 논의되었습니다. 한 그룹은 혈당 수치가 더 엄격하게 관리된다면 당뇨병의 장기적인 합병증을 감소시킬 수 있다고 주장했습니다. 다른 그룹들은 당뇨병과 관련된 다른 생리학적 이상이 장기적인 혈관 합병증의 원인이된다고 가정했습니다.

 인슐린을 하루 2 회 이상 주사하면 매우 높은 혈당 레벨과 합병증을 피할 수 있을 정도로 혈당을 충분히 조절할 수 있습니다. 그러나 하루에 4 회의 인슐린 주입과 혈당치를 보다 자주 모니터링하는 집중 치료는 정상 췌장에서 인슐린 분비를 보다 이상적으로하게 하고 이론적으로는 장기적인 혈관 합병증의 위험을 줄일 수 있습니다. 동시에 집중 치료를 하면 혈당치가 낮아져 (저혈당증) 드문 경우이지만 혼수 상태가 될 수 있습니다.

 의사가 환자의 정상 혈당 수준을 유지하기를 원하는 이론적인 이유가 있지만 위에서 설명한 집중 치료와 관련된 위험 요소도 있습니다. 새로운 치료법의 안전성과 효능을 결정하기 위해 연구자는 임상 시험을 수행해야합니다. 무작위, 통제 임상 시험은 하나의 치료가 다른 치료와 직접 비교되어 두 치료법 중 어느 것이 가장 큰 효과가 있는지를 결정하는 연구 설계입니다.

 

 

임상 시험에 대한 소개(INTRODUCTION TO CLINICAL TRIALS)
 임상의가 당뇨병 환자의 혈당치를 조절하기 위해 사용할 수있는 처방을 선택할 때 고민 해야 하는 것이 있습니다. 히포크라테스의 공리 - "우선, 해를 끼치 지마"- 의학적 중재를 심사숙고하는 임상의에게 하는 시간을 초월한 경고입니다. 히포크라테스는 "설득력 있는 이론을 우선적으로 다루는 것이 아니라 의료 행위에 참여해야한다"면서 "그러나 이성과 결합 된 경험을 이용 해야한다"고 말했습니다. 다시 말해, 치료 계획은 이론적으로 합리적인 것이어야하며 경험적으로 시험되어야 합니다. 히포크라테스는 2000년 전 치료의 효과를 판단하는 것이 환자에 대한 치료의 효과에 근거해야한다고 지적했습니다. 현대 의학에서도 치료법에 대한 무작위적이고 통제 된 임상 시험은 치료의 유용성을 결정하는 기준이 됩니다.

 현대 의학에서 적절한 치료법을 선택하려면 임상 시험의 설계 및 수행을 이해해야합니다. 치료를 평가하는 이 중요한 방법은 히포크라테스가 암시하는 두 가지 유형의 지식, 즉 이성과 경험을 활용합니다. "합리적인"치료는 기본적인 생체 의학 지식에 의해 제안된 치료입니다. 당뇨병의 병태 생리학 및 이 질병의 장기적인 합병증에 대한 지식은 혈당 수준의 엄격한 관리와 당뇨병의 합병증 회피에 대한 필요성을 나타냅니다. 그러나 히포크라테스가 말했듯이 임상의는 이론만으로 치료 결정을 내릴 수는 없습니다. 이성의 지시는 경험적 시험을 통해서 되어야 합니다. 임상의는 자신의 개인적인 경험과 동료의 서면 또는 구두로 전달된 경험 등 치료 처방을 평가하는데 두 가지 유형의 경험을 사용합니다. 서면 경험은 단일 사례, 일련의 사례 또는 하나의 치료와 다른 치료의 비교의 형태로 나타날 수 있습니다. 인간 집단에서 두 가지 이상의 치료 방법을 직접 비교하는 것을 임상 시험이라고합니다. 임상 시험의 개발은 현대 의학적 방법을 임상 의학에 응용한 결과입니다. 임상 시험의 목적은 적시에 적절하고 효과적인 치료법을 선택하고 사용하는데 도움이 되는 정보를 제공하는 것입니다.

 

 

증거 중심 의학(EVIDENCE-BASED MEDICINE)

 임상적 전문 지식, 병리학적 지식 및 의사 결정을 위한 환자 선호도와 현재 최고의 증거를 통합하는 것을 증거 기반 의학이라고 합니다. 증거 중심 의학의 실천은 질병 관리와 관련된 관심사의 문제를 정확하게 정의 할 수있는 능력으로 시작하는 몇 가지 기술을 필요로합니다. 증거 중심 실무자는 의학 문헌에서 관련 정보를 찾아 비판적으로 평가할 수 있어야합니다. 마지막으로, 얻은 증거는 질병 관리에 대한 결정에 통합되어야합니다.

 근거 기반 의학의 사용은 여러 가지 이유로 권장됩니다.
1. 의학 문학에 접근하고 체계적으로 해석 할 수 있는 효율적인 프레임 워크를 제공 할 수 있습니다.
2. 질병 관리를 위한 전략을 선택하기 위한 객관적인 기반을 제공함으로써 임상 결과를 향상시킬 수 있습니다.
3. 임상의에 의한 질병 관리 방법을 수정하기 위한 합리적 근거로 사용될 수있다.
4. 종합 진료 팀이 치료를 받으면 질병 관리를 위한 계획을 조정할 수 있습니다.
5. 현재 지식의 갭을 식별하여 더 많은 조사를 위해 우선 순위를 제시 할 수 있습니다.
6. 특정 접근법을 뒷받침하는 증거가 부족할 때, 타당한 분야를 제시 할 수있습니다.
7. 질병 관리 프로세스 평가를 용이하게하여 품질 및 효율성 향상 기회를 제안 할 수 있습니다.

 증거 중심 의학의 실천은 몇 가지 주요 가정에 근거합니다. 첫째, 임상 시험을 통해 공식 임상 시험을 받을 수 없는 임상 의학의 여러 측면을 인정합니다 따라서 임상의의 개인적인 경험은 의학 문헌에서 수집 한 정보에 유용하고 필요한 동반자입니다. 둘째, 근본적인 병리학에 대한 지식이 진단 및 치료 계획 수립에 중요하지만, 그러한 지식만으로는 충분하지 않으며 질병 관리의 비효율적인 전략으로 이어질 수 있습니다. 셋째, 임상 시험의 설계, 수집 및 분석에 사용되는 방법에 대한 비판적 평가가 필요합니다. 넷째, 일상적인 임상 정보 수집 및 해석에 대한 체계적인 접근 방식은 보다 일관되고 객관적인 임상 결정을 용이하게합니다. 증거 기반 의학의 실행에는 여러 가지 장벽이 있습니다. 많은 임상의는 연구 조사의 공식 평가에 대한 훈련이 제한적입니다. 임상의가 필요한 기술을 갖추고 있다고 해도 문헌을 검색하고 평가할 시간이 거의 없습니다. 시간이 있다고 해도, 평가할 수 있는 증거가 부족한 질병에는 많은 중요한 문제가 있습니다.
 
 이러한 장애물을 고려해 볼 때 최근 몇 년 동안 근거 중심의 의학이 급속도로 발전한 것은 놀라운 일입니다. 부분적으로는 조직의 변화, 재정 지원 및 의료 서비스 제공이 임상 결과에 중점을두고 다른 관리 전략의 비용 효율성을 고무했습니다. 또한, 전자 데이터베이스의 자동 검색을 통해 관련 의학 문헌에 보다 쉽고 빠르게 액세스 할 수 있습니다. 또한 인터넷은 비판적 평가로부터 결과의 신속하고 광범위한 공유를 촉진했습니다.
 보편적으로 채택된 것에서 멀리 떨어져 있지만 증거 중심 의학은 질병 관리 개선을 약속합니다. 증거 중심 의학의 실행을위한 전제 조건은 임상 연구를 비판적으로 평가할 수있는 능력입니다.

 

연구 문제에 관한 진술(STATEMENT OF THE RESEARCH QUESTIONS)
 실험실 실험과 마찬가지로 임상 시험을 수행하는 첫 번째 단계는 주요 연구 문제를 공식화하는 것입니다. 일반적으로 가설로 불리는 이 질문은 중요한 연구 매개 변수, 예를 들어 비교 대상 치료 유형, 평가 대상 결과의 성격, 각 치료 그룹의 대상 수, 환자의 수혜 자격 등을 결정하기 위해 결정됩니다. 임상 시험의 가설에 대한 해답을 제공 할 수있는 측정 매개 변수 선택이 기본 목표입니다.

 일차적인 평가 기준을 결정할 때 임상 연구자는 다음 질문을 고려해야합니다.
1. 어떤 종료점이 임상적으로 가장 중요한가?
2. 합리적으로 편향이 안생기게 측정 할 수있는 종료점은 무엇입니까?
3. 인구 규모, 연구의 재원 및 장기적으로 환자를 추적 할 수있는 능력과 같은 실용적인 제약은 무엇인가?

 미국과 캐나다의 연구원은 다음과 같은 질문에 답하기 위해 임상 시험을 계획했습니다: "인슐린 주사를 자주하고 빈혈 모니터를 자주하는 등 집중 치료가 당뇨병의 표준 요법보다 우수한가?"
 
치료 효능을 평가하기 위해 하나 이상의 종료점을 측정 할 수 있습니다. 종료점의 유형에는 삶의 질 측정, 생존 기간, 생존 환자 비율, 합병증 비율 및 생존이나 삶의 질을 예측할 수있는 중간 종료점이 포함됩니다.

 당뇨병 치료에 대한 "우수성"을 평가할 때 가능한 결과 측정에는 다음이 포함됩니다.
1. 치료 개시 후 지정된 시간에 생존한 환자의 비율
2. 적극적인 라이프 스타일을 유지하는 환자의 능력
3. 치료로 인한 주요 합병증의 위험
4. 당뇨병과 관련된 혈관 관련 질병 중 하나를 경험할 위험
5. 장기 혈당 수치의 지표인 헤모글로빈 A1-C (HgbA1C)의 측정
6. 특정 시점에서의 혈당 수치.
 다음 두 가지 질문의 예는 가설에 따라 상징적으로 다시 나타납니다.

 


여기에서 H0는 귀무 가설이라고 불리며, π0과 π1은 연구에 참여한 후 5 년 동안 당뇨성 망막증을 앓는 표준 치료군 또는 집중 치료군의 사람들의 비율입니다.

 


 여기에서 μ0와 μ1은 각각 표준 치료군 또는 집중 치료군의 시험 대상자 입원 후 1 년 후의 평균 HgbA1C 수치입니다.
 이러한 가설은 Null 형식으로 명시되어 있습니다. 지정된 종료점에 대한 치료 그룹간에 차이는 없습니다. 임상 시험의 목적은 관찰된 결과가 이러한 귀무 가설과 일치하는지 여부를 테스트하는 것입니다. 관측된 자료가 귀무 가설과 일치하지 않는 경우 귀무 가설 (H0)은 다음과 같은 대립 가설 (HA)을 위해 기각됩니다.

 


 여기서 π0와 π1은 다시 표준 치료군과 집중 치료군에서 연구에 참여한 후 5 년 동안 당뇨성 망막증을 앓고 있는 사람의 비율입니다. 이 대립 가설은 당뇨병성 망막증의 발생과 관련하여 두 가지 치료법이 다를 것이라고 말합니다. 유사하게, HgbA1C 결과에 대한 또 다른 가설은 다음과 같이 기술 될 수있습니다 :


여기서 μ0와 μ1은 다시 표준 치료군과 집중 치료군의 평균 HgbA1c 수준입니다. 다시 말해,이 대립 가설은 두 치료법이 치료 후 환자에서 달성 된 평균 HgbA1c 수준과 다르다는 것을 의미합니다.
 잠재적으로 치명적인 질병에 대한 치료법의 가장 중요한 최종 목표는 생존 또는 삶의 질을 설명하는 생존 일 것입니다.

 그러나 이 당뇨병 치료법의 연구자들은 여러 가지 이유로 당뇨성 망막증을 연구의 주요 목표로 선택했습니다.
1. 당뇨병으로 인한 사망은 질병의 발병 후 수십 년 간 발생합니다. 사망이 주요 종료점이라면 판별을 적시에 완료할 수 없었을 것입니다.
2. 망막병증은 당뇨병의 심각한 합병증입니다. 한 기관의 혈관 손상은 다른 신체 부위의 혈관 손상과 관련이 있습니다. 혈관 질환은 질병으로 인한 이환율과 사망률을 초래하는 주요 생리학적 과정이기 때문에 연구자는 이것이 일차 평가 기준으로 합리적 선택이라고 생각했습니다.
3. 눈은 혈관계의 손상을 비 침습적으로 시각화 할 수있는 독특한 연결 통로를 제공합니다. 또한, 망막병증 진행의 측정은 표준화되고 여러 시점에서 각 환자의 망막 사진을 찍어 평가할 수 있습니다. 또한 연구자들은 각 환자가 무작위로 분류된 치료 그룹에 대한 지식 없이 사진에 기록된 망막 손상의 양을 평가할 수있었습니다.
4. 중간 종말점인 망막병증은 생존과 삶의 질이라는 두 가지 중요한 최종 목표를 예측하는 것으로 생각됩니다.

 

표본 크기의 결정(DETERMINATION OF SAMPLE SIZE)
 임상 시험에 등록해야하는 피험자 수 (표본 크기)는 1 차 연구 종료점과 관련하여 결정되어야합니다. 실험이 끝나면 데이터가 분석되고 귀무 가설을 기각하거나 채택하기 위한 통계적 결정이 내려집니다. 이 결정은 확률을 기반으로하며 불행히도 정확하거나 부정확 할 수 있습니다. 당뇨병 치료 임상 시험의 가능한 결과와 "진실"의 관계는 그림 7-1에 나와 있습니다. 이 토론의 목적을 위해, "진실"은 연구중인 임상 상태의 환자 전체에게 정확하게 적용되면 개입의 결과로 생각할 수 있습니다. 임상 시험은 "진실"의 표본으로 간주 될 수 있습니다. 인구 표본을 사용하여 전체 인구에 대한 올바른 추론을하는 것이 좋지만 표본 만 평가할 수 있기 때문에 부정확 한 결론의 위험이 존재합니다.
그림 7-1의 셀 A와 D에서 연구 결과는 "사실"과 일치합니다. 그러나 셀 B와 셀 C에서 연구 결과는 "사실"과 일치하지 않습니다(오류). 이 두 가지 유형의 오류는 출처와 의미가 다릅니다.


 연구에서 치료법의 차이가 발견되면 실제로 차이가 없는 경우 (셀 B), 유형 I 오류가 있습니다. 이 상황에서 연구 결과는 잘못된 것입니다. 당뇨병 치료 임상 시험에서 I 형 오류는 망막증이 발생한 환자의 비율에서 치료법간에 차이가 있다고 결론을 내렸을 때 발생했습니다. "사실"은 두 비율의 차이는 없다 였습니다. 실제적으로 차이가 있을 때 연구에서 치료법의 차이를 발견하지 못하면(셀 C) 유형 II 오류가 발생했다고합니다. 이 상황에서 연구 결과는 부정적인 것입니다. 당뇨병 치료 임상 시험에서 진행형 망막병증이 있는 것으로 판명된 피험자의 비율에서 치료간에 차이가 없다고 결론을 내린 경우, 실제로 치료법 중 하나가 위험 감소와 관련이있을 때 유형 II 오류가 발생했을 것입니다.
잘못된 방법론, 우발적인 사건 또는 둘 다로 인해 잘못된 연구가 발생할 수 있습니다. 방법론적인 오류는 연구 설계에 세심한 주의를 기울임으로써 최소화 될 수 있지만 우연에 의한 오류는 완전히 제거 될 수 없습니다. 그러나 이러한 오류를 추정 할 수 있습니다. 오류에 관련된 표기법은 유형 I 오류 가능성을 나타냅니다. 즉, 그룹간에 관찰 된 차이가 진정한 차이는 아니지만 우연히 발생하는 것으로 나타나는 것은 알파 레벨입니다. 반대로 유형 II 오류 가능성을 나타 내기 위해 사용 된 표기법 (실제로 연구 결과가 하나가 되었을 때 차이를 찾지 못함) 베타 레벨입니다. 연구자는 연구 계획시 알파 및 베타 레벨을 지정합니다. 알파 레벨은 일반적으로 0.05로 지정됩니다.  이는 조사자가 유형 I 오류를 저지르는 위험을 5 % 허용한다는 것을 의미합니다. 즉, 실제로는 그렇지 않을 때 그 그룹들이 다르다는 그릇된 결론을 내리는 것을 5% 허용한다는 것입니다. 연구자는 또한 베타 레벨 또는 유형 II 오류를 저지를 위험이 있음을 사전에 지정해야합니다. 종종 0.20의 베타 수준이 적당하다고 간주됩니다. 즉, 그룹 간의 진정한 차이를 놓칠 수있는 5 분의 1이 허용됩니다.
 통계적 힘(statistical power), 또는 그룹의 진정한 차이를 발견하는 연구 능력은 (1-β)입니다. 베타 레벨의 0.20 인 연구의 통계력은 0.80 또는 80 %입니다. 그러한 연구는 치료 그룹 간의 결과에서 특정 차이를 발견 할 확률이 80 %입니다. 알파 및 베타 레벨이 지정되면 연구 팀은 표본 크기를 결정하기 전에 또 다른 매우 중요한 연구 매개 변수를 지정해야합니다. 표본 크기는 연구가 탐지하도록 설계 될 치료 그룹 간의 결과 차이의 크기입니다. 비교중인 치료법 간의 이러한 차이는 매우 중요하며 임상 정보를 토대로 선택해야합니다. 조사에 합당한 결과 차이의 수준을 결정할 때 조사관은 다음 질문 중 하나 이상을 고려할 수 있습니다.
1. 이 유형의 환자를 치료하는 임상의와의 결과의 차이점은 무엇입니까?
2. 질병의 결과로 고통받을 수있는 환자에게는 어떤 차이가 있습니까?
3. 결과에서 어떤 차이가 더 큰 비용이나 더 큰 부작용에도 불구하고 더 효과적인 치료의 사용을 정당화 할 수 있습니까? 

 방금 언급 한 세 가지 요소 (유형 I 및 유형 II 오류의 수용 가능한 수준과 그룹 간의 결과 차이 예상 크기)는 반비례라고 여기기에 충분합니다. 필요한 표본 크기와 관련이 있습니다. 즉, 일반적으로 허용되는 5 %보다 1 % 만 유형 I 오류를 허용 할 수있는 경우 표본 크기를 늘려야합니다. 유사하게, 제 2 형 오류의 수용 가능한 수준의 감소 (강화된 통계적 힘)는 더 많은 대상을 연구 할 필요가 있습니다. 예상 결과의 차이 (예 : 망막 병증을 앓고 있는 환자의 비율)가 치료 그룹의 수가 감소함에 따라 차이를 감지하기 위해 더 큰 표본 크기가 필요하기 때문입니다. 대조적으로 결과의 다양성 (예 : HgbA1c 수준의 표준 편차)이 감소함에 따라 그룹간에 결과 차이를 입증해야하는 피험자가 줄어 듭니다.

 

랜덤화(RANDOMIZATION)
 임상 시험에서 가장 고려해야 하는 것은 치료에 대한 반응이나 주요 결과 측정에 영향을 줄 수있는 배경 특성이 두 그룹이 유사 할 확률을 최대화하는 방법으로 환자를 각 그룹에 배정해야한다는 것입니다.
 현대 임상 시험의 경우, 그룹에 대한 할당은 랜덤화에 의해 수행됩니다. 무작위 배정으로, 그룹 배정은 의사 결정이나 환자의 선호도에 영향을 받지 않으며, 확률만으로 결정됩니다.
 각 환자에 대한 치료 그룹의 지정은 다른 모든 환자의 그룹 지정과 무관합니다 (영향을 받지 않음). 당뇨병 임상 시험에서와 같이 동일한 표본 크기를 가진 두 가지 가능한 치료 방법이 있는 경우 각 환자는 어느 치료법에 배정 될 확률이 50%입니다. 
 50년 전에는 새로운 치료법의 이점을 평가하는 주요 방법은 몇명의 환자를 새로운 방법으로 치료 한 후, 과거 표준 요법을 받은 환자군에 대한 결과와 비교하는 것 이었습니다. 표준 방법으로 치료를 받은 환자를 비동시적nonconcurrent 또는 과거historical 대조군 이라고 합니다. 연구자가 집중 치료(실험적인 치료 방법) 대 표준 치료(또는 대조 치료)의 임상 효능에 관한 가설을 테스트하기를 원한다면 환자 그룹에 집중적인 치료법을 이용하고, 특정 기간에 망막증이 발병한 환자의 비율 표준 인슐린 요법으로 초기에 치료받은 환자군 중 망막 병증이 발생한 환자의 비율과 비교 될 것입니다.
 
이 접근 방식에는 몇 가지 고유한 문제점이 있습니다.
1. 망막병증의 진행에 대한 진단 기준은 시간이 지나면 변할 수 있습니다.
2. 망막병증을 측정하는데 사용되는 기술은 연구 기간 동안 변경 될 수 있습니다.
3. 식이 조절에 관한 지식의 발전과 같은 추가적인 치료 방식은 시간이 지남에 따라 이용 가능해질 수 있으며, 윤리적인 이유로 연구의 두 번째 부분으로서 환자에게 적용되어야 할 것입니다.
4. 가장 중요한 것은 환자가 표준 인슐린 요법으로 치료받는 동안 당뇨병을 앓았던 환자는 집중 치료 기간 동안 환자의 예후 특성(성별, 연령, 사회 경제적 지위)이 유사하지 않았을 수 있습니다.

 의사나 환자는 주어진 치료 방법을 선택할 수 있습니다. 그러나 이 방법은 심각하게 결함이 있습니다. 보건 의료 제공자가 객관적인 의사 결정자가 되기 위해 노력하지만 환자의 요구에 감정적이며 종종 임상 시험 결과에 앞서 치료의 효능에 대한 의견을 제시합니다. 물론 치료 결과에 개인적인 관심이 있는 환자는 자신의 평가 또는 치료 효과에 대한 기대에 따라 치료를 선택할 가능성이 높습니다. 따라서 환자와 의사의 이러한 선호로 인한 불공정한 비교를 피하기 위해 치료 그룹에 할당하는 것이 억제되어야 합니다.
 무작위 배정의 목적은 치료 그룹의 기본 특성의 "평등성"을 달성하여 치료법의 비교가 공정하다고 간주하는 것입니다. 치료 그룹의 평등성을 평가하기 위해 인구통계학적 및 예후적 요인을 그룹간에 비교할 수 있습니다. 환자가 무작위로 배정된 경우, 집단이 인구통계학적 및 예후적 특징이 유사 할 것으로 예상됩니다.
 두 가지 치료법에서 같은 성별의 4개의 환자 그룹에 할당된 순서는 임의적 일 수 있습니다. 처음 4 명의 남성 환자는 표준 치료군 또는 집중 치료군에 배정되고 다음 4 명의 남성은 다른 집단에 배정됩니다. 여성도 같은 방식으로 배정 될 것입니다. 연구가 끝나면 각 치료 그룹에 남성과 여성 환자가 동등하게됩니다. 이러한 방식으로 환자를 배정하는 것을 블록 무작위 화 (block randomization)라고합니다. 환자 블록에서 무작위 추출 하는 것의 목적은 예후적으로 중요한 환자 하위 집단에 대한 불균형된 할당 ("무승부의 행운"으로 인한)이 되는 것을 막는 것입니다.

 

 

플라시보 효과와 맹검(THE PLACEBO EFFECT AND BLINDING)
 1801 년 Haygarth는 위약으로 치료가 수행된 최초의 임상 시험 결과를 발표했습니다. 당시 많은 질병에 대한 보편적인 치료법은 Perkins tractor로 알려진 금속 막대의 전자기 영향을 통해 증상을 완화시키는 것이 었습니다. Haygarth는 모방 목제 tractor로 5 명의 환자를 치료했고 4 명이 완화되었다는 것을 발견했습니다. 다음날 그는 동일한 5 명의 환자에게 금속 트랙터를 사용하여 5 명의 환자 중 4 명과 동일한 결과를 얻었습니다.

 임상 시험을 계획 할 때 어떤 종류의 치료가 환자의 질병에 대한 인식에 미치는 영향을 생각 안할 수 없습니다. 이 개념은 결과 측정이 주관적 일 때 가장 중요합니다. 환자의 욕구는 임상 시험에서 초기 무작위 배정에 이어 의사가 내리는 결정에도 영향을 줄 수 있습니다. 임상 시험 중 그룹의 차별적 치료로 이어질 수있는 추가 요인은 임상 시험 중에 임상의의 의사 결정 프로세스입니다. 예를 들어, 치료 효능에 관한 확실한 신념을 가진 임상의는 다른 요법에 비해 효과가 없다고 여겨지는 치료를 중단 할 가능성이 있을까?
 위약 효과를 설명하고 환자와 임상의의 개념으로 인한 편향의 도입을 줄이기 위해, 연구는 맹목적으로 수행 될 수있습니다. "맹검"은 본인이 받고 있는 치료가 정확히 어떤것인가 알려지지 않았음을 의미합니다.
 단일 맹검 연구에서 치료 할당은 환자가 모르게 하는 것입니다. 이중 맹검 연구에서 치료 할당은 환자와 치료 의사 모두에게 모르게 하는 것 입니다. 이중 맹검 연구에서 심각하거나 예상하지 못한 부작용이 있거나 연구가 완료된 경우에만 치료 방벙이 환자와 의사에게 공개됩니다.

 

 


임상 시험과 관련된 윤리적 문제(EVALUATION OF CLINICAL TRIAL)
 환자를 무작위 임상 시험에 참여시키려는 조사관은 몇 가지 윤리적 딜레마에 직면해있다. 첫째, 무작위 임상 시험 방법이 윤리적으로 수용 가능한가? 의학에서 가장 중요한 윤리적 교리 중 하나는 환자의 복지가 주요 고려 사항이며, 의료인은 환자에게 최적의 처방을 처방해야한다는 것입니다. 

 임상 시험 방법이 적절하게 수락되면 가능한 한 윤리적으로 임상 시험을 수행하는 방법에 관한 결정을 내려야합니다. 다음은 임상 시험을 수행중인 의료 전문가를 위한 지침 목록입니다.

    1. 무작위 시험에 포함 된 치료 옵션은 이전의 무작위 연구에 근거한 다른 치료 옵션보다 못한 것으로 알려져 있지 않으며, 표준 치료법이 존재한다면 대조군으로 사용해야합니다.
    2. 임상 시험은 임상적으로 중요한 질문을 다루어야하고, 미래 환자에게 유용 할 수있는 방법으로 해야합니다.
    3. 환자는 임상 실험의 일부이며 모든 치료 옵션, 참여의 위험 및 이점, 무작위화의 성격에 대해 이해할 수있는 언어로 알려야 합니다. 참여에 동의한 환자는 정보에 입각한 동의를 얻었으며 환자가 자유롭게 재판에 참여할 것을 선택함을 의미합니다.
 4. 조사관은 필요한 표본 크기를 충족시키는데 필요한 환자 수를 적시에 모집 할 수 있어야합니다.

 

결과 분석(Analysis of Results)
 추적 관찰에 대한 일부 환자의 취소는 모든 임상 시험에서 발생할 가능성이 있습니다. 취소한 환자의 수가 많을수록, 환자에 대한 정보가 적을수록 시험 결과에 신뢰도가 낮아집니다. 임상 시험의 결과 분석에서 환자는 원래 치료 요법이 실패한 후에 다른 치료법 중 하나를 받았더라도 원래 연구 (치료 의도)에 의해 할당된 치료군에 남겨 두어야합니다.


 무작위 추출 된 모든 참가자는 임상 시험 분석에 포함되어야합니다. 결과 비교에서 피험자를 선택적으로 제거하면 잘못된 결론이 도출 될 수 있습니다. 이 피험자들은 예정된 치료법을 받지 못했기 때문에 분석에 남겨 두는 것이 비논리적인 것처럼 보일 수 있습니다. 그러나 비치료자는 처방 지정과 상관없이 처방약보다 더 나쁜 결과를 나타내는 경향이 있음이 나타났습니다. 치료 과제가 준수 수준에 영향을 미치는 경우 분석에서 불이행을 제외하면 오도된 결과가 발생할 수 있습니다.
 분석에서 비치료자를 제거하면 임상 연구 결과를 일반화 할 수있는 능력이 제한 될 수 있습니다. 특정 환자에 대한 치료를 권고 할 때, 의사는 치료가 의도 한대로 완료되지 않을 가능성을 고려해야합니다. 임상 시험의 본질적인 질문은 치료가 특정 시점에서 제공되어야하는지 여부입니다. 그러므로 치료 혜택에 관한 관련 정보는 치료를받은 사람들뿐 아니라 치료를 받은 모든 환자들 사이의 결과입니다.

 잘보고 된 임상 시험은 분석가가 (1) 치료 그룹 간의 주요 결과치를 비교하고 (2) 변동 사항을 제외시키는 것이 합리적인지를 결정하기위한 기본 통계 검사를 수행 할 수있게하는 충분한 기본 데이터를 포함해야합니다. 
 임상 시험의 많은 결과는 '예/아니오' 결과 (예 : 사망 또는 생존, 치료 또는 치료법 없음, 재발 또는 재발하지 않음)이므로 간단한 표 형식으로 표시 할 수 있습니다.

 


메타 분석(Meta-analysis)
 여러 연구의 결과를 고려하는 방법을 메타 분석이라고합니다. 메타 분석이라는 용어는 여러 독립적인 임상 시험의 결과를 결합하거나 통합하는 통계 분석을 의미합니다. 메타 분석은 체계적 검토 유형으로 생각할 수 있습니다. 체계적 검토는 오류를 최소화하기 위한 전략을 사용하여 작성된 주제에 대한 증거 통합 유형입니다. 메타 분석은 두 개 이상의 연구 결과가 통계적으로 결합 된 체계적 검토입니다.
잘 수행된 메타 분석은 다른 유형의 검토 방법보다 몇 가지 이점을 제공합니다. 첫째, 메타 분석을 통해 요약 결론이 만들어진 데이터를 직접 제시 할 수 있습니다. 따라서 메타 분석의 결과는 다른 유형의 검토보다 데이터 중심적이고 객관적입니다. 둘째, 메타 분석에서의 통계적 합계는 정량적 결과 측정을 만들어 정확한 효과 추정치가 될 수 있습니다. 셋째, 연구 결과가 다를 떄는 결과의 변화 패턴에 대한 설명을 만들어서 임상 질문에 대한 더 깊은 통찰을 얻을 수 있습니다.

 본질적으로 메타 분석은 다른 연구에 대한 연구입니다. 다른 유형의 조사와 마찬가지로 메타 분석을 미리 계획해야하며 연구 프로토콜을 따라야합니다. 연구 계획에는 가설, 샘플링 전략, 포함 기준, 수집 할 데이터 및 정보 분석 방법을 명시해야합니다. 이러한 각 단계에서 최종 산물에 영향을 줄 수있는 전략적 결정을 내려야합니다.
 예를 들어, 당뇨병에 대한 집중 치료에 대한 임상 시험에 관심이 있다면 당뇨병에 관한 출판 된 문헌을 검색하는 것이 논리적인 표본 추출 전략 인 것으로 보일 것 입니다. 모든 연구가 출판 된 것은 아니기 때문에, 출판된 문헌은 주제에 관한 모든 이용 가능한 정보를 공정하게 표현하지 못할 수도 있습니다. 통계적으로 유의미한 연구 결과는 그렇지 않은 연구보다 더 많이 게재 될 가능성이 높은 것으로 나타났습니다. 또한 정부나 비영리 단체가 후원하는 연구가 민간 부문이 후원하는 연구 (아마도 독점적 정보를 보호하려는 욕구 때문에)보다 출판 될 가능성이 더 큽니다. 추가적인 표본 추출 왜곡은 특정 영향력 는 저널에 발표 된 논문이 인용 될 가능성이 높으므로 다른 곳에서 출판 된 저서보다 식별하기 쉽다는 사실에서 기인합니다. 또한 일부 연구 결과는 여러 발행물로 이어 지므로 를 쉽게 발견 할 수 있습니다. 경우에 따라 메타 분석가가 동일한 출처의 임상 시험 인구에서 나온 두 개의 별도 발행 된 논문을 결정할 수도 없습니다. 실용적인 이유로 메타 분석은 더 널리 읽히는 저널을 선택하고 긍정적인 결과를 가진 결과로 인한 과장을 초래할 수 있는 간행물에만 국한 될 수 있습니다.
 따라서 주제에 관한 출판된 문헌은 궁극적인 결론에 영향을 줄 수 있는 정보를 선택적으로 배제 할 수 있습니다. 이 잠재적인 오류 원인을 간행물 바이어스이라고도 합니다. 게시 되지 않은 연구를 확인하고 메타 분석에 포함시키려는 시도를 할 수는 있지만 이러한 정보를 찾아 넣는 것은 명백한 어려움이 있습니다. 미발표 연구를 찾는 한 가지 접근법은 임상 시험 등록에서 관련 조사를 검색하는 것입니다. 연구가 완료되기 전에 등록되기 때문에 연구 결과가 긍정적인지 여부에 영향을받지 않을 것입니다. 출판 된 연구와 출판되지 않은 연구가 모두 포함되어 있다면, 결과를 개별적으로 분석하는 것이 가능합니다. 출판 된 연구와 출판되지 않은 연구 사이의 명백한 차이는 출판 편견의 가능성을 시사합니다.
 주제에 대한 임상 시험이 확인되면 메타 분석가는 연구에 포함 할 특정 연구를 결정해야합니다. 이 과정은 임상 시험에서 환자를 등록하기 위한 자격 기준을 설정해야하는 필요성과 유사합니다. 메타 분석의 경우 특정 연구를 포함 시킬지 여부에 대한 결정은 일반적으로 (1) 품질 평가와 (2) 각 환자 집단, 치료 요법 및 결과를 기반으로 다른 연구와 결합 할 수있는가에 기반합니다. 심사 품질은 주관적인 과정 일 수 있으므로, 잘 설계된 임상 시험의 기본 특성에 포함 기준을 제한하는 것이 좋습니다.

그러한 포함 기준의 예로는
1. 치료 과제의 적절한 무작위 배정
2. 결과에 대한 맹검 평가
3. intention-to-treat 원칙에 기초한 분석.

 적격한 출처에서 나온 연구가 선택되면 표준 요약 양식을 사용하여 주요 정보를 추출해야합니다. 두 명의 검사자가 정보를 독립적으로 추상화하는 것은 데이터 수집 오류를 줄이는데 유용합니다.
 결과는 여러 연구에서 비슷한 방식으로 측정되어야합니다. 이분법 결과 (예 : 망막병증의 발생 여부)의 경우 비율이나 상대 위험도 일 수 있습니다. 지속적인 결과 (예 : 혈당 수준)의 경우, 실험군과 대조군의 평균 차이가 적용될 수 있습니다. 그러나 평균 차이의 크기는 기본 인구의 분포에 영향을 받는다는 점에 유의해야합니다. 예를 들어, 실험 대상과 대조군 간 혈당치의 평균 차이는 초기 혈당치가 낮은 당뇨병 환자의 연구 집단보다 초기 혈당치가 높은 당뇨병 환자의 연구 집단에서 더 클 것으로 예상됩니다. 따라서 표준 편차 단위로 차이가 제시되기 때문에 기본 값 분포를 조정합니다.

 메타 분석의 핵심은 개별 임상 시험의 결과를 통계적으로 조합 한 것입니다. 이 조합에 대한 가장 간단한 접근법은 개별 결과의 산술 평균 (평균)을 계산하는 것입니다. 개별 결과의 단순 평균은 각 연구에 동일한 가중치를 부여합니다. 작은 표본 크기의 연구는 큰 표본 크기의 연구보다 기회 변동의 영향을 받기 쉽기 때문에 작은 연구에 영향을 덜 주도록하는 것이 바람직합니다. 단순 또는 비가중 평균과 대조적으로 가중 평균을 계산함으로써 가장 통계적으로 정확한 개별 시험 결과에 중점을 둘 수 있습니다.
 결과를 결합하는데 사용한 통계 모델은 크게 두 가지 범주로 나뉩니다. 이른바 고정 효과 모델은 개별 연구에 대한 결과의 차이가 전적으로 무작위적인 변화에 기인한다고 가정합니다. 대조적으로, 무작위 효과 모델은 문제의 기본 관계가 무작위 변동의 영향 외에도 연구마다 다르다고 가정합니다. 요약 된 개별 임상 시험의 결과가 비슷할 때, 고정 효과 모델과 무작위 효과 모델 간의 최소 차이점이 얻어 질 것입니다. 그러나, 일반적으로, 랜덤 효과 모델은보다 넓은 신뢰 구간에 반영되는 바와 같이 다소 덜 정확한 요약 추정치를 유도 할 것이다. 기본 임상 시험의 결과가 크게 다를 경우 이질적이라고합니다. 이질성의 조건 하에서, 고정 및 무작위 효과 모델을 통해 얻은 요약 추정치는 상당 부분 다를 수 있습니다. 따라서 개별 임상 시험의 결과가 이질적인지 여부를 결정할 수 있어야합니다.
개별 연구 결과에 대한 편차가 무작위 적 변이에 의한 것인지 여부에 대한 문제를 해결하기위한 한 가지 접근법은 이질성에 대한 통계적 테스트를 수행하는 것입니다. 이질성의 테스트에 대한 통계적으로 유의미한 결과는 무작위 적 변이에만 기인하는 것보다 연구를 통한 변이가 더 크다는 것을 의미합니다. 그러므로 그러한 경우에는 무작위 효과 모델이 데이터를 요약하는 데 선호되는 방법이 될 것이다. 반면에, 이질성 테스트가 통계적으로 중요하지 않다면, 개별 연구 결과에 걸쳐 관찰 된 변동 수준은 무작위 변화로 설명 할 수 있습니다. 이러한 상황에서, 고정 효과 모델은 데이터를 요약하기위한 수용 가능한 접근 방법이 될 것이다.
결과의 이질성 문제가 단지 통계적 유의성의 테스트에 의해서만 다루어 져야하는지, 심지어는 주로 1 차적으로 다루어 져야하는지는 몇 가지 논쟁 거리이다. 이질성 테스트는 통계력이 제한되어 있기 때문에 유형 II 오류가 발생하기 쉽습니다. 즉, 기본 데이터에서 이질성의 존재에 대해 가양 성 결론을 이끌어 낼 수 있습니다. 통계적으로 중요하지 않은 결과는 메타 분석가 (및 독자)에게 기본 데이터에 이질성의 증거가 없음을 거짓으로 확신시킬 수 있습니다. 그러므로 메타 분석 과정에서 연구 결과의 이질성에 대한 문제를 더 깊이 탐구하는 것이 바람직하다.
여러 연구에서 발견 된 결과의 이질성은 무작위적인 다양성 외에도 여러 가지 이유로 발생할 수 있습니다. 개별 환자 집단의 특성은 관찰 된 효과의 차이에 중요한 기여를 할 수 있습니다. 이전에 언급했듯이, 특정 임상 시험에 대한 자격 및 제외 기준은 연령, 성별, 인종, 일반적인 건강 상태 및 기타 특성을 기준으로 한 대상 선택에 제한을 부과 할 수 있습니다. 자격 요건이 연구마다 다양하기 때문에 조사 대상자는 조사중인 치료에 대한 반응의 가능성에 영향을주는 근본적인 방식이 다를 수 있습니다.
예를 들어 눈을 뜨게되었는지 여부, 치료 준수율, 추적 기간 및 추적 관찰의 완전성과 같은 임상 시험 디자인 측면에서 얻은 결과에 영향을 줄 수 있습니다. intention-to-treat 원칙을 고수하는 것과 같은 개별 학습 결과 분석 방법 또한 결과에 영향을 줄 수 있습니다.
임상 시험이 조기에 중단되는지 여부는 결과와 관련이있을 수 있습니다. 일반적으로 임상 시험은 예기치 않게 커지지 않으면 조기에 중단되지 않습니다.
 결과의 차이는 실험군과 대조군간에 관찰됩니다. 이러한 차이는 실험군의 치료가 대조군 치료 (위약 또는 표준 요법)보다 훨씬 효과적이기 때문에 발생할 수 있습니다. 또는 치료의 합병증이나 부작용이 한 치료군에서 다른 치료군보다 더 클 수있어 연구자가 임상 시험을 조기에 종결시킬 수 있습니다. 두 경우 모두 조기에 결론을 내린 임상 시험의 결과는 원래 의도 한 결론에 도달한 임상 시험과 다를 가능성이 있습니다.

 잠재적인 이원성의 출처를 감안할 때, 선택된 연구에 대한 결과의 변이가 메타 분석에서 흔히 발생한다는 것은 놀랄 일이 아닙니다. 독립적인 조사자, 연구 집단 및 환경에서 결과를 재현하는 능력은 실험적 치료의 효과에 관한 추론에 대한 신뢰를 증가시킵니다. 결과의 이질성, 특히 설명 할 수없는 경우 메타 분석에서 끌어낼 수있는 추론의 불확실성이 높아집니다.
 이질성 탐구에 대한 중요한 접근법을 민감도 분석이라고합니다. 이러한 맥락에서 민감도 분석은 검토중인 연구의 하위 집합 내에서 요약 결과를 탐색하는 것입니다. 일관된 결과를 산출하고 다른 하위 그룹의 결과와 다른 결과를 산출하는 연구의 하위 그룹을 식별 할 수 있다면 이질성의 전반적인 출처에 대한 통찰력을 얻을 수 있습니다. 예를 들어, 메타 분석에 발표되거나 발표되지 않은 임상 시험이 모두 포함되는 경우 게시되지 않은 연구 결과와 별도로 게시 된 연구 결과를 요약하는 것이 유용 할 수 있습니다. 출판 된 연구에서 더 큰 치료 효과는 간행물 바이어스의 혐의를 지지 할 것입니다. 임상 시험의 샘플 크기에 따른 결과 분석은 또한 출판 편견의 증거를 제공 할 수 있습니다. 대규모 연구는 소규모 연구에 비해 통계력이 크기 때문에 작은 치료 효과를 더 잘 감지 할 수 있습니다. 통계적으로 유의미한 결과를 보이는 연구가 다른 연구보다 많이 발표되기 때문에 소규모 임상 시험에 비해 대규모 임상 시험에서 치료 효과가 약할 경우 간행물 바이어스가 나타날 수 있습니다. 말하자면, 약한 영향을 미치는 소규모 연구는 출간 될 가능성이 적었고 따라서 메타 분석에 활용하기가 어렵습니다. 유사하게 하위 집단 분석은 조기에 중단되었던 임상 시험 중 더 강력한 치료 효과를 나타낼 수 있습니다. 이러한 유형의 하위 집단 분석을 통해 연구 결과의 변형의 비랜덤 패턴이 감지되고 설명 될 수 있습니다. 이러한 의미에서 민감도 분석은 일관된 결과를 갖는 연구 하위 그룹을 보여줌으로써 연구중인 치료의 진정한 효과에 대한 더 깊은 통찰력을 제공합니다. 그러나 관찰 된 패턴이 우연히 발생할 수도 있으므로 민감도 분석을 신중하게 해석해야합니다. 하위 집단 분석의 과잉 해석은 잘못된 결론을 초래할 수 있습니다.
 또한 메타 분석이 바람직하지 않은 상황을 인식하는 것도 중요합니다. 임상적 관심에 대한 몇 가지 질문에 대한 결론을 내릴 수있는 시도가 불충분 할 수 있습니다. 주제에 대한 많은 시도가있을 때도 연구 집단, 설계 및 결과 측정의 근본적인 차이로 인해 결과를 결합하려고 시도하는 것이 현명하지 않을 수 있습니다. 또한 민감도 분석으로는 설명 할 수없는 여러 연구에서 치료 효과의 이질성이 상당 할 경우 개별 연구 결과의 가중 평균을 계산하는 것이 현명하지 않을 수 있습니다.
 요약하면, 메타 분석은 특정 치료의 효과에 대한 누적 증거를 평가하는데 도움이 되는 강력한 도구입니다. 연구를 통해 정보를 결합함으로써 통계적으로 정확하고 객관적인이자 효과 추정을 유도 할 수 있으며, 연구를 통한 결과의 일관성을 고려할 수 있습니다. 반면 메타 분석가가 통제 할 수없는 원래 임상 시험의 설계 및 데이터의 품질은 메타 분석의 품질에 영향을 미칩니다. 메타 분석가가 내린 의사 결정 (예 : 포함할 임상 시험 및 요약 분석 수행 방법)은 메타 분석의 품질에도 영향을 미칩니다. 궁극적으로 메타 분석의 가치는 정보에 입각한 치료 결정을 내릴 수있는 능력에 달려 있습니다.

 

출처

- Greenberg, R. S. (2005;2004;). Medical epidemiology (4th ed.). New York: Lange Medical Books/McGraw-Hill.