手机版 下载桌面 设为首页

做诊断指标的诊断价值研究时样本量如何选择?

  在前一期文章中我们看了t检验中p值的决定因素和诊断指标的诊断价值的决定因素,两者差别在于样本量,即均值和标准差保持不变时,样本量增加时p值变小,但样本量本身不会影响诊断指标的诊断价值。在大样本的临床研究中,如果某指标差异有统计学意义,并不代表其有较好的预测能力

  什么算是大样本呢?我们先来模拟一组数据,我们固定均值差为4和标准差为2(此时灵敏度和特异度在85%左右),减少样本量,观察p值、灵敏度和特异度的变化,我们可以得到下表:

  从上表看出,当样本量为1000时,此时p值小于10-308方,当样本量减少,p值增大,灵敏度和特异度基本不变(由于抽样误差的原因,灵敏度和特异度有波动)。样本量为10时,p还是小于0.001,每组样本量为3时,p<0.05。也即是说预测能力较好的指标在样本量很小时就有统计学差异了

  接着我们再固定p接近0.05,标准差为2,不同样本量下计算指标灵敏度、特异度和ROC曲线下面积。

  从上表可以看到指标的诊断价值随样本量增加而减少,当样本量增加到50,p=0.049时,AUC=0.598,诊断价值已经非常小。也即是说如果你的样本量有几十个还未出现统计学差异,此指标单独进行预测的能力已经不太好。看到这个结果你是不是很震惊,你还会随意拿指标去做预测吗?

  通过上面的数据,我们总结一下,就是在筛选诊断指标时,想看某指标是否有预诊断价值,只需要较小的有代表性的样本就可以了,建议每组的样本量在10-30之间,如果样本量大于30还未出现统计学差异,这个指标就可以放弃了;但在做某指标的诊断价值的验证时,为保证诊断模型的稳定,样本量可不能太小,一般认为100-200例以上可以接受

分类标签:诊断试验研究  样本量  

声明:本文转载仅出于学习和传播信息所需,并不意味着代表本站观点或证实其内容的真实性;其他网站或个人转载使用须保留本站所注“来源”,并自负相关法律责任;如作者不希望被转载或其他事宜,请及时联系我们!