现况调查定性资料样本量如何计算？R语言、PASS复现

创作时间:

作者:

@小白创作中心

现况调查定性资料样本量如何计算？R语言、PASS复现

引用

来源

http://www.360doc.com/content/24/0408/08/67596171_1119747360.shtml

在目前医学临床研究设计中，常常会有人在问该怎么计算定性资料横断面研究的样本量？究竟该怎样去计算才能又快又准确呢？
在进行研究设计时，我们就需要确定这项研究所需的样本量。而什么是样本量呢？样本含量就是在保证科研结论具有一定可靠性条件下，确定的最少观察例数。那么，样本量该如何计算呢？
1.首先，需要确定开展什么类型研究；
2.确定研究主要结局指标及其类型；
3.找公式；
4.填参数；
5.计算结果。
接下来，我们来跟着一篇文献分别采用公式计算、R语言、PASS来感受一下定性资料横断面研究的样本量计算过程：
这是一篇发表在BMJ open上的文章，题目为“Seroepidemiology of hepatitis A and B in the general population in Hong Kong: protocol of a cross-sectional survey using spatial sampling in a highly urbanised city”。
原文PDF获取方式：本公众号回复关键词“原文”

1.首先确定这篇文章研究类型属于横断面研究；
2.研究主要结局指标是甲型和乙型肝炎的人群血清阳性率，属于定性资料；
3.定性资料横断面研究的样本量计算公式为：
4.填参数：
Ⅰ类错误α：根据α算出Zα，文章确定显著性水平为95%，因此α为0.05；
容许误差δ：文章控制为0.025；
发生率P：文章参考了香港最新研究的结果，甲肝和乙肝的血清阳性率分别为68.5%和8.9%。
5.根据公式计算结果：文章通过公式分别按照甲肝和乙肝的血清阳性率计算的样本量分别为1326.3和498.4，最终选取两者中最大的取整样本量1327作为研究所需的最小样本量。
6.使用R语言epiR包的epi.sssimpleestb函数进行计算，将参数Py、epsilon、conf.level分别设置为文章对应的发生率P、容许误差δ以及95%置信水平
运行代码得到的结果也是1327。
7.使用PASS软件进行计算，首先在选择界面的导航窗口中，依次单击Proportions → One Proportion →Confidence Interval，在显示窗口中单击Confidence Intervals for One Proportion，打开操作界面

在操作界面的设置区域中，Confidence Interval Width(Two-Sided)是指置信区间的宽度，即置信区间的下限到上限的值，而容许误差是置信区间一半的宽度。本研究的容许误差为0.025，则置信区间的宽度为0.05(即2倍的容许误差)；
分别将Confidence Level(1-Alpha)、Confidence Interval Width(Two-Sided)、 P(Proportion) 参数设置为文章对应的0.95、0.05和0.685；
在Confidence Interval Formula中选择Simple Asymptotie，单击运行键Calculate；
结果显示，样本量也是1327人。