来源:丁香科研

不知道你有没有遇到这样令人崩溃的场景:

  • 开题时,专家问:「你的样本量怎么算的?」

  • 投稿时,编辑问: 「你的样本量怎么算的?」

所以,你的样本量到底是怎么算的?在研究设计中,样本量计算很重要,一个合适的样本量才能确保研究结论准确可靠,并且有足够的统计效力。

但是究竟需要纳入多少病例才能在既经济又省力的前提下,又不会被 diss 呢?我来分享一些样本量计算的方法。

一、进行样本量计算的基础知识

在进行样本量计算时,我们需要考虑以下几个要素:


另外,还要考虑总体平均数( μ )、标准差( σ )或总体率( π )等;μ 、σ 、π 一般未知,通常以样本的平均数、标准差、样本率作为估计值,可以通过预试验、查阅文献、经验估计而获得。

二、样本量计算的常用方法

  1. 公式法:通过样本量计算公式,直接计算出所需的样本量。不同类型的研究(如回归分析、t检验等)会涉及不同的公式。

  2. 经验法:有时候,我们可以借鉴前人经验或者领域内的常用样本量来进行估算。例如,在某些领域中,常常采用 30 个样本作为基本样本量。

  3. 软件工具法:现在有很多专业的样本量计算软件或在线工具,如 PASS 软件、 G*Power 等。这些工具通常集成了多种计算方法,并且可以根据你的研究设计和参数输出合适的样本量。

三、要计算样本量,有个数值你要记住

Z 值为标准正态分布界值,在公式法中经常会用到,当 α 和 β 值不同时,对应 Z 值如下表所示:


(↑可以保存下来,以备不时之需)

四、举个栗子~

「在针对慢性疼痛患者足底压力减轻疼痛程度的横断面研究中,根据文献资料,已知采用足底压力测量仪对慢性疼痛患者足底最大峰值压力的调查计算出的标准差 S=114 ,允许误差 δ=14 , α=0.05 。问需要调查多少人?」

1. 解法一:此研究属于横断面研究,需要估计总体均数样本量,公式是:

n = [(Zα/2×σ)÷ δ ]2

公式中,σ 为总体标准差,一般用样本标准差 S 估计;δ 为允许误差,即样本均数与总体均数的差值,α 取双侧 0.05 ,带入公式。

n = [(1.96 × 114)÷ 14 ]2≈ 225

考虑到问卷应答率,初步估计增加 10% 的调查对象,计算出所需要的样本量为 281 例。

2. 解法二:运用 PASS 软件,计算更加简单:

※在选择界面的导航窗口中,依次单击「Means → One Mean → Confidence Interval 」,在显示窗口中单击「 Confidence Intervals for One Mean 」,打开操作界面。


※ 在操作界面的设置区城中,在「 Distance from Mean to Limit ( s ) 」输入 14 ,「 S ( Standard Deviation ) 」输入 114 ,选择 「 Know Standard Deviation 」表示按正态分布来计算,单击运行键 「 Run 」。


※ 结果显示,样本量为 255 人。


路漫漫其修远兮~样本量计算其实是很大的问题,要根据实际情况,去判断和思考,在进行样本量计算的时候,需要做到:

  1. 要清楚研究目的和设计,选择合适的计算方法。

  2. 考虑到可能的失访、数据不完整等因素,可适当增加样本量。

  3. 及时更新你的样本量计算,随着研究的进展,可能需要调整样本量。


ad1 webp
ad2 webp
ad1 webp
ad2 webp