คำถามยอดนิยม
ไทมไลน์
แชท
มุมมอง
การทดลองแบบสุ่มและมีกลุ่มควบคุม
จากวิกิพีเดีย สารานุกรมเสรี
Remove ads
การทดลองแบบสุ่มและมีกลุ่มควบคุม[2] (อังกฤษ: randomized controlled trial; randomised control trial[3] ตัวย่อ RCT) เป็นการทดลองทางวิทยาศาสตร์แบบหนึ่ง ที่ใช้เป็นมาตรฐานทอง (gold standard) ของการทดลองทางคลินิก มักจะใช้เพื่อตรวจสอบประสิทธิผลและประสิทธิภาพของบริการสุขภาพ (เช่นการแพทย์หรือการพยาบาล) หรือเทคโนโลยีสุขภาพ (เช่นยา อุปกรณ์ทางการแพทย์ หรือวิธีการผ่าตัด) โดยทำในกลุ่มคนไข้ที่เป็นตัวแทนประชากรทางสถิติ (statistical population) และใช้เพื่อรวบรวมข้อมูลอื่น ๆ ที่มีประโยชน์เกี่ยวกับผลลบของการรักษาพยาบาล เช่นปฏิกิริยาเชิงลบต่อยา (adverse drug reactions)

ลักษณะเฉพาะของ RCT ที่ทำทั่ว ๆ ไปก็คือ หลังจากที่มีการประเมินคุณสมบัติการรับเลือกของผู้ร่วมการทดลองแต่ก่อนที่จะเริ่มการรักษาพยาบาล (หรือเงื่อนไขอื่น ๆ ถ้าไม่ใช่การทดลองทางการแพทย์) จะมีการจัดผู้ร่วมการทดลองให้อยู่ในกลุ่มสองกลุ่มโดยสุ่ม กลุ่มหนึ่งจะได้รับการรักษาพยาบาล (หรือเงื่อนไข) ที่เป็นประเด็นการศึกษา อีกกลุ่มหนึ่งจะได้รับการรักษาพยาบาล (หรือเงื่อนไข) อีกอย่างหนึ่งที่เป็นตัวควบคุมหรือเป็นตัวเปรียบเทียบ การจัดกลุ่มโดยสุ่มในการทดลองจริง ๆ นั้นซับซ้อน แต่ว่าถ้าคิดอย่างง่าย ๆ จะเป็นกระบวนการเหมือนกับโยนเหรียญที่สมดุล หลังจากการจัดกลุ่มโดยสุ่ม จะมีการปฏิบัติต่อผู้ร่วมการทดลองทั้งสองกลุ่มเหมือน ๆ กันทุกอย่าง ยกเว้นการรักษาพยาบาลที่เป็นประเด็นศึกษา เช่นวิธีการรักษา การตรวจสอบ การรักษาโดยเป็นผู้ป่วยนอก และ/หรือการติดตามผล ข้อดีที่สำคัญที่สุดของการสุ่มที่ทำถูกต้องก็คือ ช่วยลดระดับ allocation bias คือสร้างความสมดุลขององค์พยากรณ์โรค (prognostic factor) ที่มีในคนไข้ ทั้งที่รู้และไม่รู้ ระหว่างกลุ่มต่าง ๆ ที่รับการรักษา[4] กล่าวโดยสาระก็คือ คำว่า "สุ่ม" แสดงถึงกระบวนการจัดผู้ร่วมการทดลองให้อยู่ในกลุ่มการทดลองหรือกลุ่มควบคุมโดยเสี่ยงโชค เพื่อที่จะลดระดับความเอนเอียง
แม้ว่าคำว่า "RCT" และ การทดลองแบบสุ่ม (randomized trial) บางครั้งจะใช้เป็นไวพจน์ซึ่งกันและกัน แต่ระเบียบวิธีที่ดีกว่าก็จะใช้คำว่า "RCT" สำหรับการทดลองที่มีกลุ่มควบคุม (control) ที่ไม่ได้รับการรักษาที่เป็นประเด็นศึกษา (placebo-controlled study) หรือรับการรักษาที่มีการทดสอบมาก่อนแล้ว (positive-control study) เท่านั้น ดังนั้น คำว่า การทดลองแบบสุ่ม (randomized trial) ควรใช้เรียกงานศึกษาเปรียบเทียบกลุ่มการทดลองต่าง ๆ โดยที่ไม่มีกลุ่มควบคุม[5] และเช่นกัน แม้ว่าตัวย่อว่า "RCT" จะสามารถขยายเป็น randomized clinical trial (การทดลองทางคลินิกแบบสุ่ม) หรือ randomized comparative trial (การทดลองเปรียบเทียบแบบสุ่ม) แต่ว่า เพื่อที่จะเลี่ยงความคลุมเครือในสิ่งตีพิมพ์ทางวิทยาศาสตร์ จะเป็นระเบียบวิธีที่ดีกว่าถ้าจะใช้ตัวย่อ "RCT" สำหรับการทดลองที่มีกลุ่มควบคุมเท่านั้น และเพราะว่า การทดลองทางคลินิกแบบสุ่มไม่จำเป็นจะต้องมีกลุ่มควบคุม (และงานบางงานไม่สามารถจะมีได้ เพราะว่าเป็นเรื่องที่ทำได้ยากหรือว่าไม่ถูกจริยธรรม) ดังนั้น คำว่า randomized controlled clinical trials (การทดลองทางคลินิกแบบสุ่มและมีกลุ่มควบคุม) ก็จะเป็นชื่อที่ดีสำหรับงาน RCT ที่เป็นการทดลองทางคลินิก[6][7][8]
ให้สังเกตว่า มีการใช้ RCT ในงานวิจัยสาขาอื่น ๆ อีกด้วย รวมทั้งในสาขาต่าง ๆ ของสังคมศาสตร์ เช่นนิติศาสตร์ การศึกษา และการพัฒนาระหว่างประเทศ (ดูหัวข้อ "ในสังคมศาสตร์")
Remove ads
ประวัติ
การทดลองแบบสุ่ม (Randomized experiment) เกิดใช้เป็นครั้งแรกในปี ค.ศ. 1885 ในสาขาจิตวิทยาเชิงทดลองโดยบิดาของปรัชญาปฏิบัตินิยม (pragmatism) ชาวอเมริกัน ชาลส์ แซนเดอร์ส เพียร์ซ[9] และในสาขาการศึกษา[10][11][12] ต่อมาในปี ค.ศ. 1923 การทดลองแบบสุ่มก็เริ่มปรากฏในสาขาเกษตรกรรม ทำโดยนักสถิติชาวโปแลนด์-อเมริกัน Jerzy Neyman[13] และนักสถิติชาวอังกฤษเซอร์โรนัลด์ ฟิชเช่อร์ และเป็นงานวิจัยเชิงทดลองและบทความอื่น ๆ ของฟิชเช่อร์นั่นเอง ที่ได้เริ่มสร้างความนิยมให้กับการทดลองแบบสุ่ม[14]
ส่วน RCT ที่ตีพิมพ์เป็นบทความแรกในปี ค.ศ. 1948 เป็นงานชื่อว่า "Streptomycin treatment of pulmonary tuberculosis (การรักษาวัณโรคปอดด้วยสเตรปโตมัยซิน)" พิมพ์ในประเทศอังกฤษ[15][16][17] ซึ่งผู้เขียนท่านหนึ่งก็คือออสติน แบร็ดฟอร์ด ฮิลล์ ผู้ได้รับเครดิตว่า เป็นคนแรกที่ได้ค้นคิด RCT แบบที่ใช้ในปัจจุบัน[18]
โดยปลายคริสต์ศตวรรษที่ 20 ก็มีการยอมรับแล้วว่า RCT เป็นระเบียบวิธีมาตรฐานสำหรับ "การบำบัดโรคที่สมเหตุผล" (rational therapeutics) ในแพทยศาสตร์[19] โดยปี ค.ศ. 2004 มีผลงาน RCT กว่า 150,000 ชิ้นในระบบ Cochrane Library ขององค์กรความร่วมมือคอเครน[18] เพื่อจะเพิ่มคุณภาพของการรายงาน RCT ในสิ่งตีพิมพ์ทางการแพทย์ นักวิทยาศาสตร์และบรรณาธิการนานาชาติกลุ่มหนึ่งได้พิมพ์บทความแถลงชื่อว่า "Consolidated Standards of Reporting Trials (มาตรฐานรวมในการรายงานการทดลอง)" (CONSORT) ในปี ค.ศ. 1996 2001 และ 2010 ซึ่งได้กลายมาเป็นระเบียบที่ยอมรับกันอย่างกว้างขวาง[1][4]
Remove ads
จริยธรรม
มีหลักจริยธรรมที่เรียกว่า "clinical equipoise (ความเสมอภาคทางคลินิก)" ซึ่งก็คือจะเริ่มทำการทดลองได้ก็ต่อเมื่อ "มีความไม่ชัดเจนจริง ๆ ในกลุ่มผู้เชี่ยวชาญทางการแพทย์... เกี่ยวกับการรักษาที่ดีกว่า" เป็นหลักจริยธรรมที่ใช้โดยสามัญในการทดลองทางคลินิก (กล่าวอีกอย่างหนึ่งก็คือจะเริ่มการทดลองได้ก็ต่อเมื่อไม่ปรากฏมติของผู้เชี่ยวชาญว่า การรักษาที่เป็นประเด็นจะดีกว่าสิ่งที่เปรียบเทียบหรือไม่)[20] และแม้ว่าจะเป็นหลักที่มีการนำมาใช้ด้วยใน RCT แต่ว่า จริยธรรมเกี่ยวกับ RCT มีเรื่องที่ต้องพิจารณาเป็นพิเศษ
อย่างแรกก็คือ มีการเสนอว่า ความเสมอภาค (คือไม่รู้ว่าจะมีผลดีกว่าหรือไม่) ไม่เป็นเหตุเพียงพอที่จะเริ่มทำการทดลองแบบ RCT[21] อีกอย่างหนึ่งก็คือ "ความเสมอภาคที่เป็นมติของกลุ่ม" (collective equipoise) อาจจะไม่ตรงกับ "ความเสมอภาคที่เป็นมติของตน" คือ ผู้ทำงานวิจัยเองอาจจะเชื่อว่า การรักษาที่เป็นประเด็นมีผลดีกว่า[22] และอย่างสุดท้ายก็คือ มีการใช้ "Zelen's design" ในการออกแบบ RCT ซึ่งสุ่มจัดผู้ร่วมการทดลองเข้ากลุ่ม ก่อนที่ผู้ร่วมการทดลองจะยินยอมรับเงื่อนไขที่เป็นประเด็นการศึกษา ดังนั้น ผู้ที่อยู่ในกลุ่มควบคุมอาจจะไม่รู้ว่าตนเป็นส่วนของการศึกษา และไม่จำเป็นที่จะต้องให้การยินยอมเพื่อจะรับการปฏิบัติรักษาที่เป็นมาตรฐาน (ที่ใช้เปรียบเทียบกับกลุ่มทดลอง) การสุ่มโดยที่ไม่มีการยินยอมเช่นนี้อาจจะถูกจริยธรรมสำหรับ RCT เกี่ยวกับการตรวจคัดโรค (screening) และการรักษาบางอย่าง แต่อาจจะไม่ถูกจริยธรรม "สำหรับการทดลองวิธีการรักษาพยาบาลโดยมาก"[23][24]
Remove ads
การลงทะเบียนการทดลอง
ในปี ค.ศ. 2004 International Committee of Medical Journal Editors (คณะกรรมการบรรณาธิการวารสารแพทย์นานาชาติ; ตัวย่อ ICMJE ; เว็บไซต์) ได้ประกาศว่า การทดลองทั้งหมดที่เริ่มการขึ้นทะเบียน (enrollment) หลังวันที่ 1 กรกฎาคม ค.ศ. 2005 ต้องลงทะเบียนเพื่อที่จะมีสิทธิการตีพิมพ์ในวารสารชั้นนำที่เป็นสมาชิก 12 วารสารซึ่งรวมทั้ง BMJ, JAMA, NEJM และ The Lancet[25] ถึงกระนั้น โดยปี ค.ศ. 2009 และ 2011 ก็ยังมีการทดลองที่ลงทะเบียนช้า หรือไม่ได้ลงทะเบียนเลย[26][27]
ประเภท
สรุป
มุมมอง
โดยแบบ
การจัดประเภทอย่างหนึ่งก็คือโดยแบบงานศึกษา โดยเรียงลำดับจากแบบที่มีใช้มากที่สุดไปยังที่ใช้น้อยที่สุดในสิ่งตีพิมพ์เกี่ยวกับสุขภาพพยาบาล แบบหลัก ๆ ของ RCT มีดังต่อไปนี้[28]
- Parallel study - มีการจัดผู้ร่วมการทดลองแต่ละคนให้อยู่ในกลุ่มโดยสุ่ม ผู้ร่วมการทดลองทั้งหมดในกลุ่มจะได้รับ (หรือไม่ได้รับ) การรักษาพยาบาลที่เป็นประเด็นศึกษา
- Crossover study (การศึกษาข้ามกลุ่ม) - ในช่วงการศึกษา ผู้ร่วมการทดลองแต่ละคนจะได้รับ (หรือไม่ได้รับ) การรักษาพยาบาลที่เป็นประเด็นการศึกษาตามลำดับสุ่ม[29][30]
- Cluster randomised controlled trial - มีการจัดชุมชนทั้งกลุ่ม (เช่นทั้งหมู่บ้าน หรือทั้งโรงเรียน) โดยสุ่มให้รับการรักษาพยาบาลที่เป็นประเด็นศึกษาหรือไม่ได้รับ
- Factorial experiment - มีการจัดผู้ร่วมการทดลองโดยสุ่มให้อยู่ในกลุ่มที่จะได้รับการรักษาพยาบาลหรือไม่ได้รับ โดยเป็นแบบผสม (เช่น กลุ่ม 1 รับวิตามิน X และวิตามิน Y; กลุ่ม 2 รับวิตามิน X และยาหลอก Y; กลุ่ม 3 รับยาหลอก X และวิตามิน Y; และกลุ่ม 4 รับยาหลอก X และยาหลอก Y)
ในงานวิเคราะห์ RCT 616 งานที่มีการสร้างดัชนีใน PubMed ช่วงเดือนธันวาคม ปี ค.ศ. 2006 พบว่า 78% เป็นแบบ parallel; 16% เป็นแบบ crossover; 2% เป็นแบบ split-body; 2% เป็นแบบ cluster; และ 2% เป็นแบบ factorial[28]
โดยประสิทธิศักย์และประสิทธิผล
RCT สามารถจัดให้เป็นประเภท "explanatory" (สำหรับอธิบาย) หรือ "pragmatic" (สำหรับปฏิบัติ)[31] คือ RCT สำหรับอธิบายจะตรวจสอบประสิทธิศักย์ (efficacy) ภายใต้สิ่งแวดล้อมสถานการณ์ที่มีในงานวิจัยและที่มีระดับการควบคุมสูง โดยมีผู้ร่วมการทดลองที่มีการคัดเลือกในระดับสูง[31] ส่วน RCT สำหรับปฏิบัติจะตรวจสอบประสิทธิผล (effectiveness) ในข้อปฏิบัติที่ใช้ในการรักษาพยาบาลตามปกติประจำวัน โดยมีผู้ร่วมการทดลองที่ไม่ได้ทำการคัดเลือก ภายใต้สถานการณ์สิ่งแวดล้อมจริง ๆ ที่ยืดหยุ่นได้ ดังนั้น RCT สำหรับปฏิบัติจะให้ความรู้เพื่อการตัดสินใจในการปฏิบัติจริง ๆ[31]
โดยสมมุติฐานว่าเหนือกว่า ไม่แย่กว่า และเสมอกัน
วิธีการจัดประเภทของ RCT อีกประเภทหนึ่งจัดเป็น "superiority trials" (การทดสอบความเหนือกว่า) "noninferiority trials" (การทดสอบความไม่แย่กว่า) และ "equivalence trials" (การทดสอบความเสมอกัน) ซึ่งมีความแตกต่างกันโดยทั้งระเบียบวิธีและโดยการรายงาน[32] RCT โดยมากเป็นการทดสอบความเหนือกว่า ซึ่งมีสมมุติฐานว่า การรักษาพยาบาลที่เป็นประเด็นจะเหนือกว่าการปฏิบัติวิธีอื่นอย่างมีนัยสำคัญทางสถิติ[32] RCT บางส่วนเป็นการทดสอบความไม่แย่กว่า "เพื่อจะกำหนดว่า การรักษาพยาบาลใหม่นั้นไม่แย่กว่าการรักษาพยาบาลที่เป็นตัวเปรียบเทียบ"[32] ส่วน RCT ที่เหลือเป็นการทดสอบความเสมอกัน ที่มีสมมุติฐานว่า ผลของการรักษาพยาบาลทั้งสองไม่สามารถแยกแยะความแตกต่างกันได้[32]
Remove ads
การสุ่ม
สรุป
มุมมอง
ข้อดีของการสุ่มที่ถูกต้องใน RCT รวมทั้ง[33]
- "กำจัดความเอนเอียงในการจัด (คนไข้)ให้ได้รับการรักษาพยาบาล (treatment assignment)" โดยเฉพาะก็คือกำจัดความเอนเอียงประเภทความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounding)
- "ช่วยอำพรางวิธีการรักษาพยาบาลจากผู้ทำการตรวจสอบ จากผู้ร่วมการทดลอง และจากผู้ประเมินผล"
- "เปิดโอกาสให้ใช้ทฤษฎีความน่าจะเป็นที่จะแสดงค่าความเป็นไปได้ว่า ความแตกต่างของผลที่ได้ในระหว่างกลุ่มการรักษาเป็นเพียงเรื่องบังเอิญ (chance)"
มีขั้นตอนสองขั้นในการจัดกลุ่มคนไข้โดยสุ่ม ขั้นแรกเป็นการเลือกวิธีการสุ่ม (randomization procedure) ที่สร้างลำดับการจัดกลุ่มที่พยากรณ์ไม่ได้ นี่อาจจะเป็นการสุ่มแบบง่าย ๆ โดยจัดให้คนไข้อยู่ในกลุ่มต่าง ๆ โดยมีความน่าจะเป็นเท่า ๆ กัน หรืออาจจะเป็นแบบ "restricted" (จำกัด) หรืออาจะเป็นแบบ "adaptive" (ปรับได้) ขั้นที่สองซึ่งเป็นเรื่องของการปฏิบัติโดยตรงก็คือ การปิดบังการจัดสรร (allocation concealment) ซึ่งหมายถึงการป้องกันอย่างเข้มงวดเพื่อจะให้แน่ใจได้ว่า การจัดกลุ่มคนไข้จะไม่มีการเปิดเผยก่อนขั้นตอนที่จะจัดคนไข้ให้เข้ากลุ่มจริง ๆ (เช่นหลังจากที่คนไข้ได้ยินยอมตกลงเข้าร่วมการทดลองแล้ว) ยกตัวอย่างเช่น วิธีการจัดกลุ่มอย่างเป็นระบบที่ไม่ใช่เป็นการสุ่ม เช่นการสลับให้คนไข้หนึ่งอยู่ในกลุ่มหนึ่ง และคนไข้ต่อไปอยู่ในอีกกลุ่มหนึ่ง อาจทำให้เกิด "โอกาสเกิดความมัวหมองโดยหาประมาณไม่ได้" และเป็นการทำลายการปิดบังการจัดสรร[33]
การเลือกการสุ่ม
การสุ่มที่สมบูรณ์จะทำให้สำเร็จจุดมุ่งหมายดังต่อไปนี้คือ[34]
- เพิ่มกำลังทางสถิติ (statistical power) ให้สูงสุด โดยเฉพาะเมื่อมีการวิเคราะห์หารูปแบบในกลุ่มย่อย (Subgroup analysis) คือ โดยทั่ว ๆ ไปแล้ว การมีกลุ่มเท่า ๆ กันจะทำให้มีกำลังทางสถิติในระดับสูงสุด แต่ว่า ในการวิเคราะห์บางชนิด การมีกลุ่มไม่เท่ากันอาจจะมีอานุภาพยิ่งกว่า (เช่น การใช้ Dunnett’s procedure เพื่อเปรียบเทียบการใช้ยาหลอกเทียบกับการใช้ยาทดลองหลาย ๆ ขนาด[35]) และอาจจะจำเป็นเพื่อเหตุผลที่ไม่เกี่ยวกับการวิเคราะห์ (เช่น คนไข้อาจจะสนใจที่จะเข้าร่วมการทดลองมากกว่า ถ้ามีโอกาสสูงกว่าที่จะได้รับการรักษาพยาบาลที่เป็นประเด็น หรือเช่น องค์กรที่มีหน้าที่ควบคุมทางกฎหมายอาจจะมีกฎบังคับให้มีคนไข้อย่างน้อยที่สุดในกลุ่มทดลองที่เป็นประเด็นการศึกษา)[36]
- ลดระดับความเอนเอียงโดยการคัดเลือก (selection bias) ให้ต่ำที่สุด คือ ความเอนเอียงอาจจะเกิดขึ้นถ้าผู้ทำการทดลองเลือกคนไข้เข้ากลุ่มโดยมีความเอนเอียง โดยจะตั้งใจก็ดีหรือโดยเกิดขึ้นใต้จิตสำนึกก็ดี กระบวนการสุ่มที่ดีจะพยากรณ์ไม่ได้ ดังนั้น ผู้ทำการทดลองจะไม่สามารถเดาว่าคนไข้จะจัดเข้ากลุ่มไหนโดยอาศัยการจัดกลุ่มที่เกิดขึ้นครั้งสุดท้าย ความเสี่ยงต่อ selection bias จะมีระดับสูงสุดถ้าผู้ทำการทดลองรู้การจัดการรักษาพยาบาลครั้งสุดท้ายของคนไข้ (เช่นการทดลองที่ไม่ได้อำพราง) หรือสามารถเดาได้ (อาจจะเป็นเพราะยามีผลข้างเคียงที่ไม่เหมือนใคร)
- ลดระดับ allocation bias ให้ต่ำที่สุด (หรือ confounding) คือ ความเอนเอียงนี้อาจเกิดขึ้นได้เมื่อ covariate (ตัวแปรปรวนร่วมเกี่ยว) ที่มีอิทธิพลต่อผล ไม่มีการกระจายตัวอย่างสม่ำเสมอระหว่างกลุ่มต่าง ๆ ดังนั้นผลของการรักษาพยาบาล จึงเกิดความสับสนกับผลของตัวแปรปรวนร่วมเกี่ยว (คือเกิด accidental bias[33][37]) ถ้าการสุ่มทำให้เกิดความไม่สมดุลของตัวแปรปรวนร่วมเกี่ยว ที่มีความสัมพันธ์กับผลที่ได้ในระหว่างกลุ่มการทดลอง ค่าประเมินของผลที่ได้อาจจะมีความเอนเอียงถ้าไม่ได้ปรับผลที่ได้จากตัวแปรปรวนร่วมเกี่ยว (ซึ่งอาจจะเป็นค่าที่ไม่ได้วัดและดังนั้นจึงปรับไม่ได้)
อย่างไรก็ดี ไม่มีวิธีการสุ่มอย่างใดอย่างหนึ่งที่สามารถให้ถึงจุดมุ่งหมายเหล่านี้ได้ในทุก ๆ สถานการณ์ ดังนั้น นักวิจัยจะต้องเลือกวิธีใดวิธีหนึ่งสำหรับงานศึกษา อาศัยการเปรียบเทียบข้อดีและข้อเสียของวิธีการสุ่ม
การสุ่มแบบง่าย ๆ
การสุ่มแบบง่าย ๆ (simple randomization) นี้เป็นวิธีที่ใช้โดยสามัญที่สุดและเข้าใจได้ง่ายที่สุด คล้ายกับ การโยนเหรียญที่สมดุลซ้ำ ๆ[33] โดยมีชื่ออื่นว่า การสุ่มสมบูรณ์ (complete randomization) หรือ การสุ่มไม่จำกัด (unrestricted randomization) เป็นการสุ่มที่ทนทานต่อทั้งความเอนเอียงโดยการคัดเลือก (selection bias) และทั้ง accidental bias แต่ว่า จุดอ่อนของวิธีนี้ก็คืออาจจะทำให้กลุ่มต่าง ๆ มีขนาดไม่เท่ากันใน RCT ที่มีขนาดตัวอย่างน้อย ดังนั้น จึงมีการแนะนำให้ใช้สำหรับ RCT ที่มีผู้ร่วมการทดลองมากกว่า 200 คนเท่านั้น[38]
การสุ่มแบบจำกัด
เพื่อให้ขนาดกลุ่มต่าง ๆ เท่ากันใน RCT ที่มีตัวอย่างน้อย จึงมีการแนะนำการใช้การสุ่มแบบจำกัด (restricted randomization) วิธีใดวิธีหนึ่ง[38] การสุ่มแบบจำกัดประเภทหลัก ๆ ที่ใช้ใน RCT รวมทั้ง
- Randomized block design หรือ blocked randomization (การสุ่มแบบบล็อก) ที่มีการกำหนด "block size" (ขนาดบล็อก) และ "allocation ratio" (อัตราส่วนการจัดกลุ่ม) โดยที่ผู้ร่วมการทดลองของแต่ละบล็อกจะมีการจัดกลุ่มโดยสุ่ม[33] ยกตัวอย่างเช่น ถ้ามีขนาดบล็อกเท่ากับ 6 และอัตราส่วนการจัดกลุ่มเป็น 2:1 ก็จะมีการจัดกลุ่มโดยสุ่มเป็นคน 4 คนในกลุ่มหนึ่ง และ 2 คนในอีกกลุ่มหนึ่ง การสุ่มประเภทนี้สามารถผสมกับ "stratified randomization" (การสุ่มแบบแบ่งชั้น) เช่นในการทดลองแบบหลายศูนย์ (multicenter trial) แต่ละศูนย์จะมีการสุ่มในกลุ่มของตนเอง "เพื่อจะให้มีความสมดุลของลักษณะผู้ร่วมการทดลองต่าง ๆ ในแต่ละกลุ่ม"[4] กรณีพิเศษของการสุ่มแบบบล็อกก็คือ (random allocation) ที่ตัวอย่างทั้งหมดจะรวมอยู่ในบล็อกเดียว[33] ข้อเสียสำคัญอย่างหนึ่งของการสุ่มโดยวิธีนี้ก็คือ แม้ว่าขนาดของบล็อกจะใหญ่และคนในบล็อกจะมีความต่าง ๆ กันโดยสุ่ม การใช้วิธีนี้ก็ยังอาจจะนำไปสู่ความเอนเอียงโดยการคัดเลือก (selection bias)[34] ข้อเสียอีกอย่างหนึ่งก็คือ การวิเคราะห์ที่สมบูรณ์จะต้องมีการแบ่งส่วนวิเคราะห์โดยบล็อก[38]
- Adaptive biased-coin randomization (การสุ่มแบบมีเหรียญเอนเอียงและปรับได้ โดยมี urn randomization เป็นที่รู้จักกันดีที่สุด) โดยวิธีการสุ่มที่ไม่ค่อยสามัญเช่นนี้ ความน่าจะเป็นที่จะจัดเข้าในกลุ่มหนึ่งจะลดลงถ้ากลุ่มนั้นมีคนมากเกินไป และจะเพิ่มขึ้นถ้ากลุ่มนั้นมีคนน้อยเกินไป[33] วิธีการเช่นนี้เชื่อกันว่า เสี่ยงต่อ ความเอนเอียงโดยการคัดเลือก (selection bias) น้อยกว่าการสุ่มแบบบล็อก[38]
การสุ่มแบบปรับได้
มีวิธีการสุ่มแบบปรับได้ (adaptive randomization) สองอย่างที่ใช้ใน RCT แต่ใช้ไม่บ่อยเท่าการสุ่มแบบง่าย ๆ หรือการสุ่มแบบจำกัด คือ
- Covariate-adaptive randomization (การสุ่มแบบปรับตามตัวแปรปรวนร่วมเกี่ยว) ซึ่งวิธีหนึ่งที่ใช้ก็คือ minimization คือความน่าจะเป็นในการจัดเข้ากลุ่มจะมีค่าต่าง ๆ กันเพื่อลดความไม่สมดุลของตัวแปรปรวนร่วมเกี่ยว (covariate) ให้น้อยที่สุด[38] เป็นวิธีที่มีทั้งผู้สนับสนุนและผู้ไม่เห็นด้วย[33] เพราะว่า การจัดกลุ่มของบุคคลแรกในกลุ่มเท่านั้นที่เป็นการสุ่มจริง ๆ ดังนั้น วิธีนี้อาจจะไม่สามารถกำจัดความเอนเอียงขององค์ประกอบ (หรือตัวแปรปรวนร่วมเกี่ยว) ที่ซ่อนเร้นต่าง ๆ[4]
- Response-adaptive randomization (การสุ่มแบบปรับตามผลที่ได้) หรือรู้จักกันว่า outcome-adaptive randomization คือ ความน่าจะเป็นในการจัดเข้ากลุ่มหนึ่ง ๆ จะสูงขึ้น ถ้าคนไข้ก่อน ๆ ในกลุ่มมีการตอบสนองที่เป็นผลบวก[38] แม้ว่าจะมีการอ้างว่า วิธีนี้ถูกจริยธรรมดีกว่าการสุ่มแบบอื่น ๆ ถ้าความน่าจะเป็นของประสิทธิผล ของการรักษาพยาบาลหนึ่ง ๆ มีค่าเพิ่มขึ้นในช่วงการทดลอง แต่ว่า ถึงโดยปี ค.ศ. 1993 นักวิชาการด้านจริยธรรมก็ยังไม่ได้ศึกษาวิเคราะห์วิธีนี้โดยละเอียด[39]
การปิดบังการจัดสรร
"Allocation concealment" (การปิดบังการจัดสรร) มีนิยามว่า "วิธีการที่ป้องกันรักษากระบวนการสุ่มเพื่อไม่ให้รู้การรักษาพยาบาลที่จะจัดให้ ก่อนที่คนไข้จะเข้าสู่กระบวนการศึกษา" เป็นเรื่องที่สำคัญใน RCT[40] คือโดยทางปฏิบัติแล้ว เพราะเหตุผลต่าง ๆ เป็นต้นว่าอาจจะมีความเห็นส่วนตัวที่เป็นไปทางใดทางหนึ่งเกี่ยวกับการรักษาพยาบาลที่เป็นประเด็นการศึกษา นักวิจัยทางคลินิกใน RCT อาจจะไม่สามารถรักษาความเป็นกลาง มีเรื่องที่เปิดเผยแบบนิรนามว่า มีนักวิจัยส่องไฟดูซองจดหมายที่ปิดผนึกไว้ หรือว่าเข้าค้นห้องสำนักงานเป็นต้น เพื่อที่จะหาข้อมูลการจัดกลุ่ม เพื่อจะได้มีโอกาสกำหนดการจัดกลุ่มของคนไข้คนต่อไปของตน[41] การกระทำเช่นนี้ทำให้เกิดความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounders) ซึ่งจะมีน้อยที่สุดถ้ามีวิธีการปิดบังการจัดสรรที่ได้ผล เป็นการกระทำที่ในที่สุดจะบิดเบือนผลของงานศึกษา[33] วิธีการปิดบังการจัดสรรควรจะซ่อนการจัดกลุ่มจากทั้งคนไข้และทั้งนักวิจัย ไม่ให้สามารถรู้ได้จนกระทั่งถึงเวลาจัดคนไข้เข้ากลุ่มทดลองจริง ๆ เช่นหลังจากคนไข้ได้รับสมัคร และให้คำยินยอมเพื่อการรักษาที่ตนก็ยังไม่รู้คือยอมรับว่าตนอาจจะได้การรักษาของกลุ่มใดกลุ่มหนึ่งก็ได้[33]
ระเบียบวิธีมาตรฐานเพื่อให้มั่นใจว่ามีการปิดบังการจัดสรรที่ได้ผล รวมทั้งการใช้ซองเอกสารที่มีเลขตามลำดับที่ปิดทึบ (SNOSE), การใช้กล่องบรรจุยาที่มีเลขตามลำดับมีขนาดมีน้ำหนักมีป้ายและลักษณะอื่นคล้าย ๆ กัน, มีการจัดสรรที่ควบคุมโดยเภสัช, และมีการจัดสรรที่ทำโดยส่วนกลาง[33] มีการแนะนำว่า วิธีการปิดบังการจัดสรรควรจะรวมอยู่ในเกณฑ์วิธีการทดลองทางคลินิก (clinical trial protocol) และควรจะมีการรายงานอย่างละเอียดในสิ่งตีพิมพ์ที่แสดงผลของ RCT แต่ว่า งานศึกษาในปี ค.ศ. 2005 พบว่า RCT ส่วนมากมีเกณฑ์วิธีที่มีการปิดบังการจัดสรรที่ไม่ชัดเจน หรือไม่กล่าวถึงอย่างชัดเจนในงานที่ตีพิมพ์ หรือทั้งสองอย่าง[42] อย่างไรก็ดี ก็ยังมีงานศึกษาในปี ค.ศ. 2008 ของงาน meta-analysis 146 งานซึ่งสรุปว่า RCT ที่มีการปิดบังการจัดสรร (allocation concealment) ไม่เพียงพอหรือไม่ชัดเจนมักจะมีความเอนเอียงไปทางผลบวกต่อเมื่อผลของ RCT เป็นการวัดผลที่เป็นอัตวิสัย (subjective) แต่จะไม่มีเมื่อเป็นการวัดผลที่เป็นปรวิสัย[43]
ให้สังเกตว่า ในประเด็นการปกปิดการจัดสรร (allocation concealment) มักมีความสับสนในเรื่องหลัก ๆ คือ
- การปกปิดการจัดสรรไม่เหมือนกับการอำพรางการรักษา เพราะการปกปิดการจัดสรรเป็นการปิดไม่ให้รู้กลุ่มหรือการรักษาที่จะสุ่มจัดให้คนไข้ก่อนจะจัดจริง ๆ เท่านั้น เพื่อกันความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounders) อื่น ๆ[33]: 614 ส่วนการทดลองแบบอำพรางจะปิดการรักษาแม้ในช่วงการทดลองเพื่อกันความเอนเอียงอื่น ๆ[40]
- การปกปิดการจัดสรรอาจจะหมายถึงการปกปิดการจัดกลุ่มรักษา หรือการปกปิดการรักษาที่ทำไปตามลำดับ
- การสร้างลำดับสุ่มและการปกปิดการจัดสรรเป็นคนละขั้นตอนกัน การสุ่มจัดการรักษาให้คนไข้จะต้องมีทั้งการสร้างลำดับสุ่มที่พยากรณ์ไม่ได้ และทั้งระเบียบวิธีการปกปิดการจัดสรรที่สามารถกันไม่ให้รู้การจัดกลุ่มหรือการจัดการรักษา (treatment assignment)[33]
ขนาดตัวอย่าง
จำนวนของผู้ที่รับการรักษาพยาบาล (จะนับโดยจำนวนคนหรือจำนวนกลุ่มก็ดี) ในกลุ่มควบคุมและกลุ่มทดลองจะมีผลต่อความแม่นยำของ RCT ถ้าผลการรักษาพยาบาลนั้นเล็กน้อย จำนวนผู้ที่รับการรักษาในกลุ่มทั้งสองอาจจะไม่เพียงพอที่จะปฏิเสธผลว่าง (null hypothesis) เมื่อทำการตรวจสอบโดยสถิติ และความล้มเหลวในการปฏิเสธผลว่างก็จะหมายความว่า การรักษาพยาบาลนั้นไม่มีผลที่มีนัยสำคัญทางสถิติ "ในการทดลองนั้น ๆ" แต่ว่าถ้ามีขนาดตัวอย่างที่เพิ่มขึ้น RCT เช่นเดียวกันอาจจะสามารถแสดงผลของการรักษาพยาบาลที่มีนัยสำคัญทางสถิติ แม้ว่าจะมีผลเพียงเล็กน้อย[44]
Remove ads
การอำพราง
RCT อาจจะเป็นการทดลองแบบอำพราง (blind experiment) คือมี "วิธีการที่ป้องกันผู้ร่วมการทดลอง ผู้ให้ความดูแล หรือผู้ประเมินผล ไม่ให้รู้ว่าผู้ป่วยได้รับการรักษาพยาบาลแบบไหน"[43] โดยที่ไม่เหมือนกับการปิดบังการจัดสรร การอำพรางบางครั้งอาจไม่สมควรหรือว่าเป็นไปไม่ได้ที่จะทำใน RCT ยกตัวอย่างเช่น RCT เกี่ยวกับการรักษาพยาบาลที่ต้องอาศัยความร่วมมือเป็นการร่วมกระทำของคนไข้ (เช่น กายภาพบำบัด) ก็จะไม่สามารถอำพรางการรักษาพยาบาลจากคนไข้ได้
ที่สืบ ๆ กันมา RCT แบบอำพรางมักจะจัดประเภทเป็น "อำพรางฝ่ายเดียว" (single-blind) "อำพรางสองฝ่าย" (double-blind) หรือ "อำพรางสามฝ่าย" (triple-blind) แต่ว่า งานศึกษาในปี ค.ศ. 2001 และ 2006 พบว่า ชื่อเหล่านี้มีความหมายต่างกันสำหรับบุคคลต่าง ๆ[45][46] ดังนั้น คำแถลงความ Consolidated Standards of Reporting Trials (CONSORT) ออกเมื่อปี ค.ศ. 2010 จึงกำหนดว่า นักวิจัยและบรรณาธิการไม่ควรใช้คำว่า อำพรางฝ่ายเดียว อำพรางสองฝ่าย หรืออำพรางสามฝ่าย แต่ให้อธิบาย "ถ้ามีการทำ (การอำพราง) ได้ทำต่อใครหลังจากการจัดให้ได้รับการรักษาพยาบาล (เช่น อำพรางผู้ร่วมการทดลอง อำพรางผู้ที่ดูแลรักษา และ/หรืออำพรางผู้ที่ประเมินผล) และทำอย่างไร"[4]
RCT ที่ไม่มีการอำพรางควรเรียกว่า "ไม่อำพราง" (unblinded)[47] หรือว่า "เปิด" (open)[48] หรือถ้าเป็นการให้ยา "open-label"[49] ในปี ค.ศ. 2008 งานวิจัยหนึ่งสรุปว่า ผลการทดลอง RCT ที่ไม่มีการอำพรางมักจะมีความเอนเอียงไปทางผลบวกถ้าผลนั้นวัดโดยวิธีที่เป็นอัตวิสัย (subjective) ไม่ใช่เป็นการวัดที่เป็นปรวิสัย (objective)[43] ยกตัวอย่างเช่น ใน RCT ที่ตรวจสอบการรักษาโรคปลอกประสาทเสื่อมแข็ง (multiple sclerosis) ประสาทแพทย์ที่ไม่ได้รับการอำพรางมีความรู้สึกว่า การรักษาได้ผล แต่ว่า แพทย์ที่มีการอำพรางไม่คิดว่าได้ผล[50] ใน RCT สำหรับปฏิบัติ (pragmatic) แม้ว่าบ่อยครั้งจะไม่ได้อำพรางผู้ร่วมการทดลองและผู้ให้การดูแลรักษา แต่ว่า "ทั้งน่าปรารถนาด้วยและบ่อยครั้งเป็นไปได้ด้วยที่จะอำพรางผู้ประเมิน (ผล) หรือเก็บหาข้อมูลที่เป็นปรวิสัยเพื่อการประเมินผล"[31]
Remove ads
การวิเคราะห์ข้อมูล
สรุป
มุมมอง
วิธีการทางสถิติที่ใช้ใน RCT ขึ้นอยู่กับลักษณะข้อมูล รวมทั้ง
- สำหรับข้อมูลที่ให้ผลเป็นทวิวิภาค คือแบ่งเป็นสองอย่าง สามารถใช้ logistic regression และวิธีอื่น ๆ (ยกตัวอย่างเช่น ใน RCT ที่กำหนดการตอบสนองแบบดำรงอยู่ได้ ของยา peginterferon alfa-2a ต่อไวรัสตับอักเสบชนิดซี[51])
- สำหรับข้อมูลที่ให้ผลแบบต่อเนื่อง analysis of covariance สามารถใช้ตรวจสอบผลของตัวแปรทำนาย (predictor variable) (เช่น เพื่อตรวจความเปลี่ยนแปลงของไขมันในเลือดหลังจากได้ยาอะโทวาสแตติน ภายหลังจากการเกิดกลุ่มภาวะกล้ามเนื้อหัวใจขาดเลือดเฉียบพลัน[52])
- สำหรับข้อมูลที่แสดง time-to-event outcome ที่การวัดข้อมูลอาจไม่สมบูรณ์ (เพราะเหตุ Censoring) การวิเคราะห์โดย survival analysis อาจจะสมควร (เช่นการใช้ Kaplan-Meier estimator และ Cox proportional hazards model ในการวิเคราะห์ช่วงเวลาที่จะเกิดโรคหลอดเลือดหัวใจหลังจากได้รับการบำบัดด้วยการทดแทนฮอร์โมน [hormone replacement therapy] หลังจากหมดระดูแล้ว[53])
ไม่ว่าจะใช้วิธีการทางสถิติใด ๆ เรื่องสำคัญที่ควรพิจารณาเกี่ยวกับการวิเคราะห์ข้อมูลของ RCT รวมทั้ง
- ควรจะหยุดการทดลองก่อนจะเสร็จเพราะข้อมูลที่ได้แล้วหรือไม่ ยกตัวอย่างเช่น อาจควรที่จะหยุด RCT ก่อนเสร็จเพราะว่าการรักษา "ได้ผลดีหรือมีผลเสียเกินกว่าที่คาด" หรือว่า "ผู้ทำการทดลองพบหลักฐานว่าไม่มีผลแตกต่างที่สำคัญระหว่างวิธีการรักษาของกลุ่มทดลองกับของกลุ่มควบคุม"[4]
- ระดับที่กลุ่มการทดลองสามารถวิเคราะห์ได้ตามที่สุ่ม คือถ้าสามารถใช้ intention-to-treat analysis (การวิเคราะห์การรักษาตามที่ตั้งใจ) ได้หรือไม่ เพราะว่า การวิเคราะห์การรักษาตามที่ตั้งใจที่สมบูรณ์ "จะเป็นไปได้ก็ต่อเมื่อได้ข้อมูลผลที่สมบูรณ์" จากผู้ร่วมการทดลองทั้งหมดตามที่สุ่มเท่านั้น[54] แต่ถ้าข้อมูลผลบางอย่างยังขาดเหลืออยู่ อาจจะทำการวิเคราะห์กรณีที่มีข้อมูลสมบูรณ์และข้อมูลที่เติมให้เต็มโดยเทคนิคทางสถิติแบบ Imputation ได้[4] อย่างไรก็ดี ยิ่งมีผู้ร่วมการทดลองในกลุ่มที่จัดโดยสุ่มดั้งเดิมมากเท่าไร โอกาสที่จะเกิดความเอนเอียงก็จะน้อยลงเท่านั้น[4]
- ควรจะใช้เทคนิควิเคราะห์แบบ subgroup analysis (การวิเคราะห์เป็นกลุ่มย่อย) หรือไม่ ซึ่งเป็นวิธีที่ "มักจะแนะนำไม่ให้ทำ" เพราะว่า สามารถเกิดปัญหาทางสถิติที่เรียกว่า multiple comparisons problem ที่แสดงผลบวกที่ไม่จริง (false positive) ทำให้ผลที่พบไม่สามารถจะทำซ้ำได้[4]
Remove ads
การรายงานผลของ RCT
บทความแถลง "Consolidated Standards of Reporting Trials (มาตรฐานรวมในการรายงานการทดลอง)" (CONSORT) สำหรับปี ค.ศ. 2010 เป็น "รายการคำแนะนำอย่างต่ำที่สุดในการรายงาน RCT โดยเป็นข้อแนะนำอิงหลักฐาน"[55] CONSORT 2010 มีรายการที่ใช้ตรวจสอบ 25 รายการ (และบางรายการจะมีรายการย่อย ๆ) ที่เน้นใช้ในงานที่มี "การจัดกลุ่มแบบสุ่มที่ทำเป็นรายบุคคล แบ่งเป็นสองกลุ่ม ทำแบบ parallel" ซึ่งเป็น RCT แบบที่ใช้สามัญที่สุด[1] และสำหรับแบบการศึกษาของ RCT อื่น มีบทแถลงความที่เรียกว่า "CONSORT extensions" ซึ่งได้รับการเผยแพร่แล้ว[1]
Remove ads
ข้อดี
สรุป
มุมมอง
มีการพิจารณาโดยมากว่า RCT เป็นหลักฐานทางวิทยาศาสตร์ที่น่าเชื่อถือที่สุดในลำดับชั้นหลักฐาน (hierarchy of evidence) ที่มีอิทธิพลต่อนโยบายและวิธีการรักษาพยาบาล เพราะว่า RCT สามารถลดการแสดงเหตุผลที่ไม่เป็นจริงและความเอนเอียงต่าง ๆ ผลของ RCT หลายงานอาจจะมีการรวบรวมในงานปริทัศน์เป็นระบบ (systematic review) ที่มีการใช้เพิ่มขึ้นเรื่อย ๆ เพื่อเป็นแนวทางในเวชปฏิบัติอิงหลักฐาน (evidence-based medicine)
ตัวอย่างองค์กรวิทยาศาสตร์ที่พิจารณา RCT หรืองานปริทัศน์เป็นระบบของ RCT ว่าเป็นหลักฐานที่มีคุณภาพสูงสุดรวมทั้ง
- โดยปี ค.ศ. 1998 องค์กรอิสระ คณะกรรมการงานวิจัยสุขภาพและการแพทย์แห่งชาติ (National Health and Medical Research Council) ของประเทศออสเตรเลียกำหนดระดับ "Level I" สำหรับหลักฐานที่ "ได้มาจากงานปริทัศน์เป็นระบบของ RCT ที่เกี่ยวข้องกับประเด็นศึกษาทั้งหมด" และระดับ "Level II" สำหรับหลักฐานที่ "ได้มาจาก RCT ที่มีการออกแบบที่เหมาะสมอย่างน้อยหนึ่งงาน"[56]
- เริ่มตั้งแต่ปี ค.ศ. 2001 ในการทำคำแนะนำเกี่ยวกับแนวทางการปฏิบัติทางคลินิก คณะทำงานเฉพาะกิจเพื่อการบริการป้องกัน (ทางสุขภาพ) ประเทศสหรัฐอเมริกา (United States Preventive Services Task Force) พิจารณาทั้งการออกแบบและทั้งความสมเหตุสมผล (internal validity) ว่าเป็นตัวบ่งชี้คุณภาพของงานศึกษา[57] และยอมรับว่า "หลักฐานที่ได้มาจากการทดลองแบบสุ่มและมีกลุ่มควบคุม" ที่มีความสมเหตุสมผล (เช่นอย่างน้อยในระดับ "I-good") ว่าเป็นหลักฐานที่มีคุณภาพดีที่สุดที่หาได้[57]
- กลุ่ม GRADE Working Group สรุปในปี ค.ศ. 2008 ว่า "การทดลองแบบสุ่มที่ไม่มีข้อจำกัดที่สำคัญ เป็นหลักฐานที่มีคุณภาพสูง"[58]
- ในประเด็นเกี่ยวกับ "การรักษาบำบัด/การป้องกัน และสมุฏฐานของโรค/ผลเสีย" ศูนย์เวชปฏิบัติอิงหลักฐานออกซฟอร์ด (Oxford Centre for Evidence-based Medicine) โดยปี ค.ศ. 2001 กำหนดหลักฐานระดับ "Level 1a" ว่าเป็นงานปริทัศน์เป็นระบบของ RCT ที่มีผลคล้องจองกัน และกำหนดหลักฐานระดับ "Level 1b" ว่าเป็น "RCT งานหนึ่ง ๆ ที่มีช่วงความเชื่อมั่น (Confidence Interval) ที่แคบ"[59]
ตัวอย่างสำคัญของ RCT ที่มีผลไม่คาดฝัน แล้วช่วยเปลี่ยนวิธีปฏิบัติทางคลินิกรวมทั้ง
- หลังจากที่ได้รับการอนุมัติจากองค์การอาหารและยาสหรัฐอเมริกา ยาป้องกันหัวใจเสียจังหวะ (antiarrhythmic agents) รวมทั้ง flecainide และ encainide ก็เกิดวางตลาดขายในปี ค.ศ. 1986 และ 1987 ตามลำดับ[60] งานศึกษาที่ไม่มีการสุ่มเกี่ยวกับยาเหล่านั้นแสดงผลบวกอย่างน่าพึงใจ[61] และยอดขายของยาก็เพิ่มขึ้นรวมกันนับเป็นใบสั่งยาถึง 165,000 ชุดต่อเดือนในต้นปี ค.ศ. 1989[60] แต่ว่า ในปีนั้นเอง มีรายงานเบื้องต้นของ RCT ที่สรุปว่า ยาทั้งสองเพิ่มอัตราการตายของคนไข้[62] และหลังจากนั้น ยอดขายของยาทั้งสองจึงได้ลดลง[60]
- ก่อนปี ค.ศ. 2002 โดยอาศัยงานศึกษาแบบสังเกต (observational studies) แพทย์โดยปกติจะเริ่มการบำบัดด้วยการทดแทนฮอร์โมน (hormone replacement therapy) สำหรับหญิงที่หมดระดูแล้ว เพื่อป้องกันกล้ามเนื้อหัวใจตายเหตุขาดเลือด (myocardial infarction)[61] แต่ว่าในปี ค.ศ. 2002 และ 2004 มีการตีพิมพ์ผลงาน RCT จาก Women's Health Initiative (โครงการริเริ่มสุขภาพหญิง) ที่อ้างว่า หญิงที่รับการบำบัดด้วยการทดแทนฮอร์โมนเอสโทรเจนกับฮอร์โมน progestin มีอัตรากล้ามเนื้อหัวใจตายเหตุขาดเลือดสูงกว่าหญิงที่ได้ยาหลอก และหญิงที่รับการบำบัดด้วยการทดแทนฮอร์โมนเอสโทรเจนเพียงอย่างเดียวมีอุบัติการณ์ของโรคหัวใจที่ไม่ได้ลดลง[53][63] คำอธิบายความแตกต่างระหว่างผลของงานศึกษาแบบสังเกตและ RCT รวมทั้งความแตกต่างระหว่างระเบียบวิธีที่ใช้ การใช้ฮอร์โมน และกลุ่มประชากรที่ศึกษา[64][65] หลังจากการตีพิมพ์ RCT เหล่านี้ การบำบัดด้วยการทดแทนฮอร์โมนจึงได้ลดลง[66]
Remove ads
ข้อเสีย
สรุป
มุมมอง
มีบทความมากมายที่แสดงข้อเสียของ RCT[67][68] ข้อเสียที่กล่าวถึงบ่อยที่สุดจะกล่าวในหัวข้อย่อยดังต่อไปนี้
ความเป็นจริงมีความจำกัดนอกการทดลอง
ระดับที่ผลของ RCT สามารถใช้ได้จริง ๆ ในสถานการณ์นอกการทดลองมีความต่าง ๆ กัน ซึ่งก็หมายความว่า ระดับ external validity ของ RCT นั้นอาจจะจำกัด[67][69]
องค์ประกอบที่มีอิทธิพลต่อการใช้ผลของ RCT ได้จริง ๆ รวมทั้ง[69]
- ภูมิภาคที่ทำการทดลอง (คือ การรักษาที่มีผลในประเทศหนึ่งอาจจะใช้ไม่ได้ในอีกประเทศหนึ่ง)
- ลักษณะต่าง ๆ ของคนไข้ (เช่น RCT อาจจะทำในคนไข้ที่มีพยากรณ์โรค [prognosis] ดีกว่าโดยเฉลี่ย หรืออาจจะไม่รวม "ผู้หญิง เด็ก คนแก่ และบุคคลที่มีอาการโรคที่สามัญทั่วไป"[70])
- วิธีดำเนินการของงานศึกษา (เช่น คนไข้ใน RCT อาจจะได้รับวิธีแบบถี่ถ้วนในการตรวจวินิจฉัยและการรักษาพยาบาลต่อ ๆ มา ที่ยากที่จะทำได้ในสถานการณ์จริง ๆ)
- การวัดผล (คือ RCT อาจจะใช้การวัดผลแบบประกอบ [composite measures]) ซึ่งปกติไม่ใช้ในการปฏิบัติทางคลินิก
- การรายงานที่ไม่สมบูรณ์เกี่ยวกับผลร้ายที่เกิดขึ้นโดยการรักษาพยาบาล
ค่าใช้จ่ายสูง
ค่าใช้จ่ายของ RCT อาจจะสูงมาก[68] งานวิจัยหนึ่งพบว่า งาน RCT ในขั้น Phase III 28 งานที่ได้รับทุนจาก National Institute of Neurological Disorders and Stroke (สถาบันโรคทางประสาทและโรคหลอดเลือดสมองแห่งชาติสหรัฐอเมริกา ซึ่งเป็นส่วนของสถาบันสุขภาพแห่งชาติ (สหรัฐอเมริกา)) ก่อนปี ค.ศ. 2000 มีค่าใช้จ่ายรวมกันถึง 335 ล้านเหรียญสหรัฐ[71] โดยมีค่าใช้จ่ายเฉลี่ยที่ 12 ล้านเหรียญสหรัฐต่องาน อย่างไรก็ดี ผลตอบแทนการลงทุน (ROI) ของ RCT อาจจะสูง คืองานวิจัยเดียวกันนั้นแหละคาดว่า งาน 28 งานนั้นจะให้ผลกำไรสุทธิต่อสังคมถึง 46 เท่าของเงินทุนภายใน 10 ปี โดยประเมินปีอายุที่เพิ่มขึ้น (quality-adjusted life year) เนื่องจากการใช้ผลการทดลอง ว่ามีมูลค่าเท่ากับ GDP เฉลี่ยต่อคน[71]
ใช้ระยะเวลายาว
งาน RCT ใช้เวลาเป็นหลายปีก่อนจะมีการเผยแพร่ และดังนั้นแพทย์จะไม่ได้ข้อมูลเป็นเวลาหลายปี และผลงานอาจจะมีความสำคัญน้อยลงเมื่อพร้อมที่จะเผยแพร่[72]
อาจจะไม่ดีกว่างานศึกษาแบบสังเกต
มีงานวิจัย 2 งานในปี ค.ศ. 2000 พิมพ์ในวารสารการแพทย์นิวอิงแลนด์ที่พบว่า งานศึกษาแบบสังเกต (observational studies) และ RCT โดยรวม ๆ แล้วแสดงผลคล้ายคลึงกัน[73][74] ผลงานเหล่านี้สั่นคลอนความเชื่อว่า "งานศึกษาแบบสังเกตไม่ควรใช้กำหนดการรักษาพยาบาลอิงหลักฐาน" และว่า ผลของงาน RCT เป็น "หลักฐานเกรดดีที่สุด"[73][74] แต่ว่า งานวิจัยในปี ค.ศ. 2001 ที่พิมพ์ใน Journal of the American Medical Association (JAMA) สรุปว่า "ความไม่สอดคล้องกันแบบไม่บังเอิญก็สามารถเกิดขึ้นได้ (คือผลบวกลบที่ต่างกันจริง ๆ โดยไม่บังเอิญก็ยังมี) และความแตกต่างของระดับผลประเมินเพราะการรักษาพยาบาลนั้นเป็นเรื่องสามัญ (คือแสดงผลบวกเหมือนกันแต่มีขนาดผลไม่เท่ากัน)"[75]
มีแนวคิดอีกสองอย่างที่ตั้งความสงสัยว่า RCT มีส่วนส่งเสริมความรู้ทางวิทยาศาสตร์อย่างไรที่เหนือจากการศึกษาแบบอื่น ๆ คือ
- ถ้ามีการให้คะแนนโดยโอกาสที่จะมีการค้นพบใหม่ ๆ หลักฐานเชิงบอกเล่า (anecdotal evidence) จะได้คะแนนสูงสุด ตามมาด้วยงานศึกษาแบบสังเกต และตามมาด้วย RCT[76]
- RCT อาจจะไม่จำเป็นสำหรับการรักษาพยาบาลที่มีผลชัดเจนและรวดเร็ว เมื่อเทียบกับอาการของโรคที่ค่อนข้างจะเสถียรหรือค่อย ๆ แย่ลง[67][77] ยกตัวอย่างเช่น การใช้เคมีบำบัดแบบผสม (combination chemotherapy) รวมทั้งการใช้ยา cisplatin ในการรักษามะเร็งอัณฑะที่แพร่กระจายออกไปแล้ว ซึ่งเพิ่มอัตราการรักษาจาก 5% ไปเป็น 60% ในงานศึกษาแบบไม่สุ่มในปี ค.ศ. 1977[77][78]
เหตุการณ์ที่มีน้อยศึกษาได้ยาก
วิธีการรักษาพยาบาลที่ป้องกันเหตุการณ์ที่เกิดขึ้นน้อยมาก (เช่น กลุ่มอาการทารกตายกะทันหัน) และผลร้ายที่เกิดขึ้นน้อยมาก (เช่น ผลข้างเคียงที่น้อยมากของยา) อาจจะต้องใช้ RCT ที่มีผู้ร่วมการทดลองเป็นจำนวนมาก และดังนั้นการศึกษาแบบสังเกตอาจจะเป็นวิธีการศึกษาที่ทำได้ง่ายกว่า[67]
ผลในอนาคตไกลศึกษาได้ยาก
ค่าใช้จ่ายจะสูงมากถ้าต้องทำ RCT เป็นปี ๆ หรือทศวรรษ ๆ เพื่อจะตรวจสอบผลจากการรักษาพยาบาลในอนาคตไกล ๆ[67][68]
ผลที่ได้สนับสนุนอุตสาหกรรม ถ้าได้ทุนมาจากอุตสาหกรรม
งาน RCT บางงานได้ทุนทั้งหมดหรือบางส่วนมาจากอุตสาหกรรมรักษาสุขภาพ (เช่น จากบริษัทยา) เทียบกับจากรัฐบาล องค์กรไม่เก็งผลกำไร หรือแหล่งเงินทุนอื่น ๆ งานปริทัศน์เป็นระบบ (systematic review) ที่พิมพ์ในปี ค.ศ. 2003 พบบทความ 4 บทความพิมพ์ระหว่างปี ค.ศ. 1986-2002 ที่เปรียบเทียบ RCT ที่ได้ทุนมาจากอุตสาหกรรมและจากแหล่งอื่น ๆ และพบว่า ข้อมูลจากทั้งสี่บทความพบสหสัมพันธ์ระหว่างการได้ทุนจากอุตสาหกรรม กับผลบวกที่ได้จากการรักษาพยาบาลที่เป็นประเด็นการศึกษา[79] งานศึกษาปี ค.ศ. 2004 ของ RCT ในช่วงระหว่างปี ค.ศ. 1999-2001 ที่พิมพ์ในวารสารแนวหน้าทางการแพทย์และทางศัลยกรรมพบว่า RCT ที่ได้ทุนจากอุตสาหกรรม "มีโอกาสสูงกว่าที่จะมีผลงานที่พบนัยสำคัญทางสถิติที่สนับสนุนอุตสาหกรรม"[80] เหตุที่เป็นไปได้อย่างหนึ่งที่เกิดผลงานที่สนับสนุนอุตสาหกรรมสำหรับ RCT ที่ได้ทุนจากอุตสาหกรรมก็คือความเอนเอียงในการตีพิมพ์ (publication bias)[80]
ผู้ร่วมการทดลองเข้าใจผิดเกี่ยวกับการรักษา
แม้ว่าผู้ร่วมการทดลองจะต้องให้ความยินยอมในการเข้าร่วม RCT แต่ว่า งานวิจัยต่าง ๆ ตั้งแต่ปี ค.ศ. 1982 พบว่า ผู้ร่วมการทดลองเป็นจำนวนมากเชื่อว่า ตนจะได้รับการรักษาพยาบาลที่ดีที่สุดสำหรับสภาพโรคของตนอย่างแน่นอน ซึ่งก็คือ ผู้ร่วมการทดลองไม่เข้าใจความแตกต่างกันระหว่างงานวิจัยกับการรักษาพยาบาล[81][82] ดังนั้น ควรที่จะมีการศึกษาเพิ่มขึ้นเพื่อจะกำหนดความแพร่หลายและวิธีการป้องกันความเข้าใจผิดในเรื่องนี้[82]
เป็นการศึกษาที่มีวงแคบ
งานทดลองทางคลินิกแบบสุ่มปกติจะตรวจสอบตัวแปรอย่างหนึ่งหรือเพียงไม่กี่อย่าง ที่ยากที่จะสะท้อนความเป็นจริงในสถานการณ์ทางการแพทย์ที่ซับซ้อนที่มีจริง ๆ เมื่อเทียบกับการรายงานเค้ส (case report) ซึ่งสามารถให้รายละเอียดในด้านต่าง ๆ ของคนไข้ เช่น ประวัติคนไข้ การตรวจร่างกาย การวินิจฉัยทางการแพทย์ สภาพจิตใจที่เกี่ยวเนื่องกับสังคม (psychosocial aspects) และการติดตาม[72]
สามารถมีความผิดพลาดทางสถิติ
RCT สามารถมีทั้งความผิดพลาดทางสถิติทั้งแบบที่ 1 (ผลบวกที่ไม่จริง) และแบบที่ 2 (ผลว่างหรือลบที่ไม่จริง) เกี่ยวกับความผิดพลาดแบบที่ 1 RCT ทั่ว ๆ ไปจะใช้ค่าความน่าจะเป็นที่ 0.05 (คือ 1 ใน 20) ที่จะแสดงวิธีการรักษาสองอย่างที่จริง ๆ มีสมรรถภาพเท่าเทียมกัน ว่าแตกต่างกันอย่างสำคัญ[83] (คือมีโอกาส 5% ว่าผลบวกที่พบไม่มีจริง ๆ) เกี่ยวกับความผิดพลาดแบบที่ 2 แม้ว่าจะมีบทความที่ตีพิมพ์ตั้งแต่ปี ค.ศ. 1978 ที่ให้ข้อสังเกตว่า RCT จำนวนมากที่แสดงผลลบ มีขนาดตัวอย่าง (sample size) ที่เล็กเกินไปที่จะสรุปได้อย่างชัดเจนว่า วิธีการรักษาพยาบาลนั้นมีผลลบ (หรือผลว่าง) จริง ๆ[84] และโดยปี ค.ศ. 2005-2006 ก็ยังมี RCT จำนวนหนึ่งที่รายงานการคำนวณขนาดตัวอย่างที่ไม่ตรงหรือไม่สมบูรณ์[85]
มีผลทางวัฒนธรรมที่ยังไม่เข้าใจ
วิธีการของ RCT สร้างปรากฏการณ์ทางวัฒนธรรมบางอย่างที่ยังไม่มีความเข้าใจดี[86] ยกตัวอย่างเช่น คนไข้บั้นปลายอาจพยายามเข้าร่วมการทดลองเพื่อใช้เป็นวิธีรักษาสุดท้าย แม้ว่าการรักษาพยาบาลนั้นจะมีโอกาสน้อยที่จะประสบความสำเร็จ
มีอันตรายจากการขัดกันแห่งผลประโยชน์
โดยมีจุดมุ่งหมายเพื่อเปิดโปงการขัดกันแห่งผลประโยชน์ของ RCT ที่ใช้เป็นข้อมูลของงานวิเคราะห์อภิมาน (meta-analysis) งานวิจัยในปี ค.ศ. 2011 ทำการปริทัศน์งาน meta-analysis 29 งานแล้วพบว่า การขัดกันแห่งผลประโยชน์ที่มีใน RCT ที่ใช้เป็นข้อมูล แทบไม่มีการเปิดเผย งาน meta-analysis ที่ตรวจสอบ 29 งานรวมทั้ง
- งาน 11 งานจากวารสารการแพทย์ทั่วไป
- งาน 15 งานจากวารสารการแพทย์เฉพาะทาง
- งาน 3 งานจาก Cochrane Database of Systematic Reviews (ฐานข้อมูลงานปริทัศน์เป็นระบบขององค์กรความร่วมมือคอเครน)
งาน meta-analysis 29 งานรวมงาน RCT ทั้งหมด 509 งาน ในบรรดางาน RCT เหล่านั้น 318 งานรายงานแหล่งทุน (62% จากทั้งหมด) โดยมี 219 งานที่ได้ทุนมาจากอุตสาหกรรม (69% จากที่รายงาน) จาก RCT 509 งาน มีงาน 132 งานที่รายงานการขัดกันแห่งผลประโยชน์ทางการเงินของผู้ทำงานวิจัย (26% จากทั้งหมด) โดยมี 91 งานที่รายงานการมีผลประโยชน์ร่วมกับอุตสาหกรรม (69% จากที่รายงาน) แต่ว่า รายงานการขัดกันแห่งผลประโยชน์เหล่านี้แทบไม่มีการกล่าวถึงในงาน meta-analysis คือ มีเพียงแค่ 2 งาน (7% จาก 29 งานทั้งหมด) ที่รายงานแหล่งเงินทุนของ RCT และไม่มีงานไหนเลยที่รายงานการมีผลประโยชน์ร่วมกับอุตสาหกรรมของผู้ทำงานวิจัย ผู้ทำงานวิจัยนี้สรุปว่า
เพราะไม่มีการชี้แจงความขัดกันแห่งผลประโยชน์ เนื่องจากได้รับเงินทุนหรือมีผลประโยชน์ทางการเงินร่วมกับอุตสาหกรรมและธุรกิจ สำหรับงานวิจัยแบบสุ่มและมีกลุ่มควบคุมที่รวมอยู่ใน meta-analysis (ดังนั้น) ความเข้าใจและการประเมินหลักฐานที่ได้มาจาก meta-analysis อาจจะมีความบิดเบือน[87]
Remove ads
ในสังคมศาสตร์
สรุป
มุมมอง
การใช้ RCT ในงานวิจัยทางสังคมศาสตร์ยังเป็นเรื่องที่มีการถกเถียงกันอย่างไม่รู้จักจบสิ้น คือพวกที่มีพื้นฐานประสบการณ์ทางการแพทย์หรือการรักษาพยาบาลกลุ่มหนึ่งก็กล่าวว่า งานวิจัยในประเด็นต่าง ๆ เกี่ยวกับสังคมศาสตร์ขาดความน่าเชื่อถือ และควรจะพัฒนาโดยเพิ่มการใช้ RCT[ต้องการอ้างอิง] ในบางประเทศ เรื่องนี้เป็นเรื่องที่มีการถกเถียงกันในระดับสูงในเรื่องการศึกษาทางการขนส่ง คือมีนักวิชาการบางท่านที่เสนอว่า งบประมาณของรัฐที่ใช้ในโครงการที่เนื่องกับการส่งเด็กไปโรงเรียนนั้นไม่สมควร ยกเว้นถ้ามีอิทธิผลที่มีการรับรองโดย RCT[88] มีงานวิจัยในปี ค.ศ. 2011[89] ที่ทำการปริทัศน์งานประเมินวิธีการปฏิบัติทางการขนส่ง 77 งาน และแบ่งงานเหล่านั้นออกเป็น 5 ระดับขึ้นอยู่กับคุณภาพ นักวิจัยสรุปว่า งานโดยมากมีคุณภาพต่ำ แล้วสนับสนุนให้ใช้ RCT ในงานวิจัยทางการขนส่งต่อไปในอนาคต
แต่ก็มีนักวิชาการท่านหนึ่งที่ไม่เห็นด้วยกับข้อสรุปเหล่านี้ โดยกล่าวว่า ข้อดีที่อ้างกันของ RCT ในการกำหนดเหตุและผล และในการป้องกันความเอนเอียงเป็นเรื่องที่กล่าวเกินความจริง แล้วเสนอ "หลัก 8 อย่างที่จะใช้ RCT ในสถานการณ์ที่ข้อปฏิบัติที่เสนอต้องอาศัยการเปลี่ยนพฤติกรรมของประชาชนเพื่อที่จะมีอิทธิผล"[90]
คือ ข้อปฏิบัติที่เสนอต้องมีลักษณะเหล่านี้คือ
- ยังไม่ได้ใช้กับสมาชิกทุกคนในกลุ่มประชากร (เช่น ทุกคนในประเทศ หรือพนักงานทุกคนขององค์กร เป็นต้น)
- จะใช้ในสถานการณ์สิ่งแวดล้อมที่คล้ายกับที่มีในกลุ่มควบคุม
- สามารถแยกออกจากข้อประพฤติปฏิบัติอื่น ๆ และจุดมุ่งหมายงานศึกษาก็เพื่อตรวจสอบผลของข้อปฏิบัติ
- ช่วงเวลาจากการเริ่มใช้ข้อปฏิบัติและการแสดงผลต้องเป็นระยะเวลาสั้น ๆ
และกลไกที่เป็นเหตุต้องมีลักษณะเหล่านี้ คือ
- เป็นกลไกที่นักวิจัยเข้าใจดีแล้ว หรือว่า กลไกที่อาจเป็นเหตุอย่างอื่น ๆ ต้องสามารถตรวจสอบได้
- ไม่มีกลไกการป้อนกลับอย่างมีนัยสำคัญระหว่างกลุ่มทดลอง (ที่จะใช้ข้อปฏิบัติที่เป็นประเด็นการศึกษา) และสิ่งแวดล้อมภายนอก
- มีความสัมพันธ์กับองค์ประกอบภายนอกที่มีเสถียรภาพและสามารถพยากรณ์ได้
- จะต้องทำงานเช่นเดียวกันถ้ากลุ่มควบคุมกับกลุ่มทดลองนั้นกลับกัน
การพัฒนาระหว่างประเทศ
ปัจจุบันนี้ มีการใช้ RCT ในการตรวจสอบการช่วยเหลือการพัฒนาระหว่างประเทศ (international development) ทั่วโลก นักเศรษฐศาสตร์การพัฒนาที่องค์กรวิจัยต่าง ๆ รวมทั้ง Abdul Latif Jameel Poverty Action Lab[91][92] และ Innovations for Poverty Action[93] ได้ใช้ RCT เพื่อตรวจสอบอิทธิผลของโปรแกรมแก้ปัญหาความยากจน สุขภาพ และการศึกษาในประเทศกำลังพัฒนา
แม้ว่า RCT อาจจะมีประโยชน์ในการประเมินผลของนโยบาย แต่ก็จำเป็นที่จะตีความผลที่ได้ในงานศึกษาทางสังคมศาสตร์อย่างระมัดระวัง ยกตัวอย่างเช่น ข้อปฏิบัติในการแก้ปัญหาอาจจะทำให้เกิดความเปลี่ยนแปลงทางสังคม-เศรษฐกิจ และทางพฤติกรรม ที่สร้างตัวแปรสับสนในความสัมพันธ์ต่าง ๆ ที่พบ[94]
สำหรับนักเศรษฐศาสตร์การพัฒนาบางพวก ประโยชน์ที่ได้จาก RCT เทียบกับวิธีการศึกษาแบบอื่น ๆ ก็คือ การสุ่มจะป้องกันความเอนเอียงโดยการคัดเลือก (selection bias) ซึ่งเป็นปัญหาในงานวิจัยปัจจุบันเกี่ยวกับนโยบายการพัฒนา ในงานศึกษา RCT ตัวอย่างในปี ค.ศ. 2007 ที่น่าสนใจงานหนึ่งในสาขาเศรษฐศาสตร์การพัฒนา มีการสุ่มหมู่บ้าน 608 หมู่บ้านในประเทศอินโดนีเชียที่จะมีการสร้างถนนออกเป็นกลุ่มหลัก 2 กลุ่ม คือ ไม่มีการสอบบัญชีจากรัฐบาลกลาง และมีการสอบบัญชี และในสองกลุ่มนั้น แต่ละกลุ่มจะมีกลุ่มย่อยอีกสามกลุ่มคือ ไม่มีการเชิญให้ (กลุ่มรากหญ้า) เข้าร่วมประชุมที่แสดงบัญชีการใช้จ่าย, มีการเชิญให้เข้าร่วมประชุม, และมีการเชิญให้เข้าร่วมประชุมโดยใบเชิญมีฟอร์มให้กรอกความเห็นแบบนิรนาม[95] หลังจากทำการประเมิน "งบประมาณที่ขาดหายใป" (คือคอร์รัปชั่น) นักวิจัยสรุปว่า การตรวจสอบโดยรัฐบาลมีประสิทธิผลยิ่งกว่า "การเพิ่มการร่วมมือจากกลุ่มรากหญ้าเพื่อการตรวจสอบ" โดยมีจุดมุ่งหมายที่จะลดคอร์รัปชั่น[95] แต่จริง ๆ แล้ว ข้อสรุปเดียวกันนี้ ก็ยังสามารถได้จากการสร้างแบบจำลองที่สมควร แล้วใช้ข้อมูลที่ได้จากการศึกษาระยะยาว (longitudinal studies) อีกด้วย
เรื่องสำคัญที่สุดโดยรวม ๆ ในการศึกษาทางสังคมศาสตร์ก็คือ ต้องสามารถทำการตรวจสอบหาข้อมูลเกี่ยวกับผลที่คาดหวัง และผลที่ไม่คาดหวัง ที่เกิดขึ้นจากนโยบายปฏิบัติที่เป็นประเด็นการศึกษา
อาชญาวิทยา
มีการทำงานศึกษาแบบ RCT เพิ่มขึ้นเรื่อย ๆ ในสาขาอาชญาวิทยา คือ งานปริทัศน์ในปี ค.ศ. 2005 พบงาน RCT 83 งานในสาขาที่พิมพ์ในระหว่างปี ค.ศ. 1982-2004 เทียบกับ 35 งานที่พบในระหว่างปี ค.ศ. 1957-1981[96] ซึ่งจัดประเภทเป็น 5 ประเภท คือ policing (การรักษากฎหมายและความสงบเรียบร้อย) prevention (การป้องกัน) corrections (การลงโทษ) court (ศาล) และ community (ชุมชน)[96] โดยเพ่งความสนใจไปที่โปรแกรมเปลี่ยนพฤติกรรมนักโทษ งานวิจัยในปี ค.ศ. 2008 อ้างว่า RCT อาจจะเป็นเรื่องยากที่จะกระทำ (เช่น ถ้าการดำเนินการ RCT จะต้องมี "การตัดสินลงโทษที่สุ่มนักโทษให้อยู่ในโปรแกรม [ทดลอง] ต่าง ๆ")[97]
การศึกษา
มีการใช้ RCT เพื่อประเมินข้อปฏิบัติทางการศึกษาหลายอย่าง เช่น มีงานในปี ค.ศ. 2009 ที่สุ่มห้องเรียนประถมศึกษา 260 ห้องเป็นกลุ่มควบคุมและกลุ่มทดลองที่มีการตรวจคัดพฤติกรรม (behavioral screening) มีข้อปฏิบัติเพื่อป้องกันแทรกแซงในห้องเรียน และมีการฝึกผู้ปกครอง แล้ววัดคะแนนทางพฤติกรรมและการศึกษาของนักเรียน[98] มีงานอีกงานหนึ่งที่พิมพ์ในปี ค.ศ. 2009 ที่สุ่มห้องเรียนของเด็ก ป.1 678 คนเป็นกลุ่มทดลองที่มีข้อปฏิบัติแทรกแซงมีห้องเป็นศูนย์ (classroom-centered) กลุ่มทดลองที่มีผู้ปกครองเป็นศูนย์ (parent-centered) และที่ไม่มีข้อปฏิบัติ (no intervention คือกลุ่มควบคุม)[99]
Remove ads
เชิงอรรถและอ้างอิง
แหล่งข้อมูลอื่น
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads