临床研究中进行分组时,最理想的状况是 使得已知和未知的非研究因素进行均衡,这样才能保证研究成果有较大的可信性。这时候,常常就会用到随机化原则,在流行病学和统计学中,随机化具有两层含义,第一层为:随机化抽样,即在源人群中以随机方法抽取样本量,以保证样本具有较好的代表性;第二层为随机化分配,即指将研究对象随机分配到各个研究组,以保证组间的均衡性。
1、常见方法特点评价
(1)简单随机抽样:从总体中不加任何分组、划类、排队等,完全随机地抽取受试对象。其特点是每个个体 (样品) 被抽中的概率相同,各样品之间完全独立,彼此间无一定的关联性和排斥性。
TIPS:这个方法虽然容易实施,但不能保证不产生选择偏倚,研究人员具有一定的倾向性,质量监督不严格,方法又未统一的话,就会造成较大的偏倚。
(2)分层随机抽样:先依据一种或几种特征将总体分为若干个子总体,每个子总体称作一个层,然后从每层中随机抽取一个子样本,这些子样本合起来就是总体的样本。
TIPS:该种方法的样本具有较好的代表性,抽样误差较小,一般临床研究中比较常用。
(3)系统随机抽样:将源人群按照与某种调查无关的特征(这个无关的特征可以是住院号或者是门诊号)顺序给相应的个体进行编号,随后再随机的抽取一编号做为第一调查个体,此后则机械地每间隔数量抽取个体。
TIPS:相对简单易行,样本个体在源人群内分布均匀,代表性好,但是抽样的起点必须随机选择,若选择使用不当,容易产生偏倚。
(4)多级随机抽样:从源人群中,先抽取范围大的单元,然后再从中抽取次级单元,随后再从后者中使用简单随机方法抽取所需要的样本。
TIPS:主要适用于大型的现况研究,其优点为代表性好、精确度高,但需要很高的抽样技术,工作量大,要求严格,故在一般的临床研究中不常用。
(5)整群随机抽样:在源人群中,随机抽取人群数量较少但仍具明确范围的一个或多个群体做为样本,样本内的所有成员,凡符合纳入和排除标准的均做为研究对象。
TIPS:简单易行,理论上说适用于大样本量的观察研究,但在相同的条件下,其抽样误差较大,代表性较差,可比性也较差,因此在实际临床中几乎不使用。
2、理清三种随机化分配方法
(1)完全随机化:对受试对象进行随机化分组,常通过掷硬币或随机数字表,或用计算机产生随机数来进行随机化,在事先或者实施过程中不作任何限制和干预或调整。分组后各组受试对象的例数不一定相等。
(2)分层随机化:首先对可能影响实验过程和结果的主要混杂因素 (如年龄、性别、病情、疾病分期等) 进行分层,然后在每一层内进行完全随机化分组,最后分别合并为实验组和对照组。
(3)动态随机化:也称为按不平衡指数最小的分配原则进行分组。具体为:根据专业知识选取几个拟加以控制的重要非实验因素,假定一个是病人的「性别 (分为男、女)」,另一个是病人的「病情 (分为轻、中、重)」。将先来的两位病人在实验组与对照组各放 1 人,记下他们的性别和病情,记分的方法是每个因素的每个水平出现 1 次记 1 分,计算两组各因素对应水平的得分之差的绝对值,最后求出绝对值之总和,称此「和」为两组病人在两个重要非实验因素上的不平衡指数。
若再来第 3 位病人,分别依次将此病人放入实验组、对照组各 1 次,每次都根据他 (或她) 的性别、病情累加到原有病人的基础之上,可以得到两个不平衡指数,取不平衡指数最小的那种分组方法。这样第 3 位病人的分组就定下来了,用同样的方法去分配以后来的该病病人,直到两组有了事先规定的样本含量时就停止。
在临床试验中,我们常见违背随机原则的例子,以下就附上两种并进行简要解析。
随机概念不清
常见的错误,对于随机的概念理解不清,将半随机分组当做随机分组。
例:某研究中总共入组原发性三叉神经痛患者 300 例,年龄为 50-80 岁,平均年龄 57.6±2.3 岁,根据国际头疼协会的相关诊断标准确诊为原发性三叉神经痛,将这 300 例原发性三叉神经痛患者按照就诊先后日期随机分为实验组和对照组,每组为 150 例患者。
错误的辨析与释疑:临床医生常见的错误随机方法就是按照入院日期的先后顺序、择期手术的日期来进行分组的。择期手术,择日入院之类的,都不完全是患者自己决定的,会受医师的影响。
如,择期手术,今天开还是明天开,并不取决于患者,而是很大程度上取决于医师;但是今天开和明天开,患者的分组是可能完全不同的。随机的目的,就是为了避免个人意愿影响患者的治疗分配,让研究对象有均等的机会被分配到对照组或实验组,而择日住院和择期手术,按照单双日来随机,有潜在的无法实现这个目的的风险。
同时这个例子在分组时是按照就诊顺序分组,不能保证分组的效果好,因为病人来医院就诊在患病严重程度、患病时间等重要的非实验因素方面不一定是均衡的,可能带有某种程度上的聚集性。若规定第一个来就诊者分入实验组,第二个来就诊者分人对照组,这样交叉进行分组,最后也可能两组病人在某些重要非实验因素方面相差悬殊,组间缺乏均衡性。因此实例就需要按照不平衡指数最小的分配原则(动态随机分组)进行分组。
3、完全随机和分层随机
例:对比观察拉莫三嗪与卡马西平治疗原发性三叉神经痛的近期临床疗效,假设研究中总共纳入原发性三叉神经痛患者 50 例,这 50 例患者按照完全随机法分为实验组(拉莫三嗪组)和观察组(卡马西平组),两组最后均为 25 人,两组患者在性别、年龄、病程、吸烟、高血压、糖尿病、发病的三叉神经分支区域上无显著统计学差异(P>0.05)。
错误的辨析与释疑:该例主要的错误在于随机方法上存在错误,原文作者将病人按照完全随机法进行了分组,虽然进行检验之后,认为病人在性别、年龄、病程、吸烟、高血压、糖尿病、发病的三叉神经分支区域等方面无统计学差异,但在样本并非足够大时,由常识可知,完全随机化分组能达到如此理想的均衡效果的概率是比较小的,因此,该例的分组结果不能令人十分信服。
比较科学的做法是采用分层随机化,就是根据前述的几个重要非实验因素将全部符合纳入标准不符合排除标准的病人分成很多小组,每个小组中的病人性别比例、年龄大小、病程长短、吸烟与否、发病的三叉神经分支区域上等各项情况较为接近,再将每个小组中的病人完全随机地均分入实验组和对照组,以使各个重要的非实验因素在组间比较均衡,这样得到的结论才令人信服。