问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

一份送给零基础的统计学入门指南

创作时间:
作者:
@小白创作中心

一份送给零基础的统计学入门指南

引用
丁香园
1.
http://paper.dxy.cn/article/894620

研究X、Y的相关性,采用什么样的统计办法?

有人说:笑死,不说X、Y的变量类型,谁知道怎么选啊?

没错,X、Y的变量类型决定统计方法的选择!

两大变量类型,必须搞懂

  1. 计数资料(Qualitative variable)又称分类变量、定性变量,如:性别、种族、血型、是否患病等。

  2. 计量资料(Quantitative variable)又称连续型变量、定量变量,如:身高、体重、浓度、血压、血脂水平等。

下面来看一个具体的实例:

在这里,性别、疗效是定性观察的结果,属于计数数据,也就是分类变量;而年龄、心率、收缩压、舒张压是定量观察的结果,属于计量数据,即连续型变量。

但是,计量资料和计数资料可以相互转变,有3种方法:

  • 根据文献找界值
  • 常规的经验
  • 等分位法

确定了变量,数据该如何描述?

  1. 计数资料如何描述?

大范围抽样调查可用率(95% 可信区间)表示;普通资料可用频数(百分率)表示,组间比较用卡方检验。

  1. 计量资料如何描述?

如果符合正态分布:用「均数 ± 标准差」或标准误表示;组间比较,用t检验、方差分析、线性回归分析。

如果不符合正态分布用中位数(四分位间距或者全距)表示;组间比较,可用非参数检验(Mann-Whitney检验、K-S检验等)。

研究X、Y回归,3大回归盘点

你知道单因素分析和多因素分析吗?先搞清概念:

  • 单因素分析:对单个因素和因变量的关系进行分析,得出两个因素相关性的初步结果,数据描述也是单因素分析。

  • 多因素分析:将单因素分析结果中满足一定条件的变量纳入多因素分析中,可进行各种回归分析,得出进一步调整后的结果,更具有说服力。

在多因素分析中,根据变量类型不同,常用到3种回归模型:线性回归、逻辑回归及Cox回归。

一表总结:描述方法及回归方法

(注:原文中缺少具体表格内容,此处保留原文中的表格提示,实际生产时需要补充完整)

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号