实证研究样本数量的常见确定方法
实证研究样本数量的常见确定方法
确定调查所需的样本量,是研究开展的第一步。样本量的大小直接影响着研究结果的可靠性和推广性。样本量过小可能使得研究结果不具备代表性,产生误导性结论;样本量过大虽然可以提高估计的准确性,但可能增加研究成本,影响论文写作进度。因此,如何确定合适的样本量,便成为论文写作前需要考虑的关键问题。在C刊论文中,样本量确定主要有经验法、利用统计学公式手工计算、通过统计软件计算等方式。
一、确定样本量的经验法则
利用经验法确定样本量,指的是建立在过去抽取满足统计方法要求的样本量所累积下来的经验。使用这个方法时很少需要统计方法知识,但是得出的样本大小很接近统计方法计算出的结果。
质性研究的经验样本量
- 扎根理论研究的访谈样本量范围一般在5-35之间。多数扎根理论的访谈样本量在10~20人。实际上,扎根理论对样本量没有特殊的要求,只要达到理论饱和即可。论文写作模板参考:
(1)“基于扎根理论的饱和度检验原则,每次访谈后进行编码整理,并与之前的访谈记录进行比较,直到不再出现新的概念和范畴为止,最终样本为……。”(出自《MOOC平台促进教师专业发展的内在机理——基于中国大学 MOOC平台16位教师学习者的扎根理论研究》)。
(2)“根据研究目标及主要问题,首先从……(数据源)收集……(样本特征)的x个样本;然后,对以上x个样本的原始资料进行开放性编码,发现所提取的概念还不够全面和清晰,难以构建一个完整的遴选体系,因此在现有样本基础上,再收集……(样本特征)的x个样本,通过提取一些新概念,对相关概念进行完善,直至理论饱和。”(出自《颠覆性技术遴选的指标体系与流程设计——基于扎根理论的多案例研究》)。
(3)“以……(文本)为分析单位,筛选具体标准如下:……(具体标准)。根据以上x个标准,在……(数据源)筛选得到符合标准的样本x个,而后根据……(筛选标准)最后确定了x个……(样本特征)样本。”(出自《基于建构扎根理论的旅游“好玩”评价过程建构》)。
- 案例研究的样本量范围在4~30之间。个案研究样本量一般在5个以内,多案例研究的样本量在4-10左右。论文写作模板参考:
(1)“根据上述选择标准和数据收集过程,结合Eisenhardt等提出的多案例研究的样本量要求,本研究共筛选了x个代表性……(样本特征)案例”(出自《PPP项目中合作目标互依对团队绩效的影响机制——探索性案例研究》)。
(2)“样本量的选取是根据个案研究选取的方便性原则决定”(出自《中学生体育竞赛愤怒的个案研究:基于解释现象学分析》)。
量化研究的经验样本量
对于探讨多个解释变量与一个被解释变量间的关系,样本量一般是解释变量的5-20倍;对于确定正常值范围的研究,总样本量至少在100以上;地区性调查样本量通常在500-1000,全国性调查样本量在1500-2500左右。论文写作模板参考:
(1)“为避免样本量过少导致的模型过度拟合问题,按照样本量是观察变量20倍以上的经验法则,保证样本量的最低要求。同时,一些拟合指标对样本量高度敏感,样本量过大拟合指标容易拒绝模型的零假设。最终抽取有意义样本x份”(出自《大学生中华文化认同的心理机制与影响因素——基于结构方程模型的实证分析》)。
(2)“最终收集x份有效问卷,满足实证分析的总样本量大于100或至少为题项数目5倍的要求。”(出自《国家文献信息资源保障平台的用户满意度实证研究》)。
二、确定样本量的统计学方法
样本量计算的基础公式
样本量的计算公式取决于具体的统计问题和假设检验方法。根据总体比例是否已知,样本计算公式可划分为:
- 总体比例已知的情况下,可以用计算样本量。其中,n表示样本量,Z表示置信水平,p表示总体中某一特定属性的比例,e表示允许的误差范围。例如,在《乡村振兴背景下农户可行信息能力组成要素、评价与对策建议》这篇论文中,作者研究的是农户可行信息能力,对设置网络精准扶贫试点的农户进行抽样调查。在确定贫困户的比例时,作者根据已知的数据(全国确立的贫困户共计9899万,全国人口13.5亿),计算得出贫困户比例p=0.9899/13.5≈0.07;设置置信区间为95%,对应的Z=1.96;e=±3%,从而计算样本量n=[1.9620.07(1-0.07)]/0.032=277.87≈278。
- 总体比例未知的情况下,可以用计算样本量。其中n表示样本量,Z表示置信水平,σ表示总体标准差,e表示允许的误差范围。例如,在《信息成瘾测量量表构建与实证研究》这篇论文中,作者研究的是信息成瘾问题,对30岁以下的群体进行抽样调查。由于缺乏对信息成瘾群体标准差的估计数据,作者引入变异系数V=标准差σ/平均值X,在不重复抽样的条件下,样本量公式可变形为;设置置信区间为95%,对应的Z=1.96;变异系数的保守估计值为0.5;设置相对抽样误差为±4%,从而计算样本量n=(1.962*0.52)/0.042≈600。
样本量计算的软件实现
上面我们介绍了样本量计算的基础公式,但这两个公式使用时存在前提假设,比如它需要满足样本量正态分布等,因此当需要明确样本量的效应大小,样本分布不可知,或进行多重比较等情况,样本量计算的基础公式可能不适用。这个时候我们就需要采用t检验、F检验、χ2检验等其他方法计算样本量。然而,相比上面两个公式,这些方法对应的样本量计算公式更复杂,不易通过手工计算,这个时候统计软件便派上了用场。常用的计算统计软件有GPower、R语言、Stata、SPSS、Pass等,这些软件都可以根据不同的研究设计、预期效应大小、显著性水平和功效等因素计算所需的样本量。这里,我们主要以GPower软件示例如何计算样本量。
GPower软件是一款开源免费的专门用于计算统计功效及样本量的软件。首先,我们可以在www.gpower.hhu.de官方网址进行下载(如下图左),解压文件夹后,双击setup.exe进行安装。GPower的初始界面如下图右。
使用GPower分析计算分为3步:(1)选择合适的统计方法;(2)选择5种统计力分析类型中的1种;(3)输入分析需要的参数,点击计算。接下来,我们结合C刊论文常用的t检验和F检验,示例如何通过GPower软件计算样本量。
- 基于相关系数的t检验计算样本量。《认知和情感共情与负性情绪:情绪调节的作用机制》这篇论文研究的是大学生认知、共情对情绪的影响,作者参考已有研究计算得到的“共情、情绪调节和负性情绪之间的平均相关系数为0.16”,利用t检验方法计算样本量。按照作者在论文中提供的参数,我们在G*Power软件中选择t-tests方法,选择“Correlation:Point biserial model”,之后设置参数Effect size|ρ|=0.16,α=0.05,β=0.8,最后点击“Calculate”,计算得出Total sample size=301,也即作者在文中呈现的“最小样本量为301”。
《认知和情感共情与负性情绪:情绪调节的作用机制》
- 基于效应大小的t检验计算样本量。《多目标觉知范式检验视觉意识容量》这篇论文研究的是视觉意识容量,作者参考已有研究中“effect size=0.67”,利用t检验方法计算样本量。按照作者在论文中提供的参数,我们在G*Power软件中选择t-tests方法,选择“Means:Difference between two dependent means(matched pairs)”,之后设置参数Effect size dz=0.67,α=0.05,β=0.8,最后点击“Calculate”,计算得出Total sample size=16,也即作者在文中呈现的“估算结果为16人”。
《多目标觉知范式检验视觉意识容量》
- 基于统计功效的F检验计算样本量。《人工智能算法推荐会增加消费者的品牌好感吗?》这篇论文研究的是人工智能算法推荐对消费者品牌好感的影响,作者参考已有研究“将效应规模设置为中等效应值effect size=0.25”,利用F检验方法计算样本量。按照作者在论文中提供的参数,我们在G*Power软件中选择F-tests方法,选择“ANOVA:Fixed effects,omnibus,one-way”,之后设置参数Effect size f=0.25,α=0.05,β=0.8,最后点击“Calculate”,计算得出Total sample size=128,也即作者在文中呈现的“本研究的样本数应当达到128以上”。
《人工智能算法推荐会增加消费者的品牌好感吗?》
三、小结
以上是利用经验法、统计学公式、统计软件等计算样本量的方式。经验法无需计算,按照已有研究的观点选择合适的样本量即可,相对更易操作,但严谨性可能会被质疑;而利用统计学公式或统计软件等计算样本量,对于不具备量化研究的作者来说,可能有操作难度,但会助力论文写作的规范性。因此,在选择样本量进行抽样调查之前,写作者应注意核实样本量与研究目的是否匹配,且尽可能清晰地展示出样本量的计算过程。