常用描述性统计概念
创作时间:
作者:
@小白创作中心
常用描述性统计概念
引用
1
来源
1.
https://img02.exam8.com/wantiku/zhangjieke/jijin/jczs/0004.html
描述性统计学是数据分析的基础,它通过一系列的统计量来概括和描述数据的特征。本文将介绍描述性统计学中的基本概念,包括随机变量的类型、分布、数字特征(如期望、方差、标准差、分位数、中位数等)、正态分布以及随机变量的相关性等内容。
随机变量的类型与分布
- 离散型与连续型随机变量
- 如果一个随机变量 x 最多只能取可数的不同值,则为离散型随机变量;如果 x 的取值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。例如,Default 只能取 0 或 1,因而是离散型随机变量;而 S 的取值可能是任意一个大于 0 的数,因而是连续型随机变量。
- 随机变量的分布
- 如果 x 是离散型的,x 最多可能取 n 个值 x0,x1,…,xn,并且记 pi=P {X=xi} 是 Xn取 xi 的概率,所有概率的总和=1
- 如果 x 是一个连续型随机变量,由于无法列出 x 取每个特定值的概率,我们改用概率密度函数来刻画 x 的分布性质。
随机变量的数字特征与描述性统计量
常用的一些数字特征和它们的描述性统计量有下面几种。
- 期望(均值)
- 随机变量 x 的期望(或称均值,记做 E(X))衡量了 X 取值的平均水平;它是对 X 所 有可能取值按照其发生概率大小加权后得到的平均值。
- E(X)==p1x1+p2x2+…+pnxn
- 在 X 的分布未知时,用抽取样本 X1,…,Xn 的算术平均数(样本均值) x-作为E(X)的估计值。
- 例:某投资者将其资金分别投向A、B、C三只股票,占总资金的比重分别为40%、40%、20%;股票A、B、C的期望收益率分别为Ra=14%、Rb=20%、Rc=8%,则该股票组合的收益率Rp =0.4×14%+0.4×20%+0.2×8%=15.2%
- 方差与标准差
方差:对于投资收益率 r,用方差(δ2)或标准差(δ)来衡量它偏离期望值的程度。 其中方差=δ2=E [(r-Er)2 ] 的数值越大,收益率 r 偏离期望收益率 Er 的程度越大,数值越小偏离就越小。
方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股价指数等的 波动情况。
单选题:标准差越大,则数据分布越____,波动性和不可预测性越____。( )
A.集中;弱
B.分散;弱
C.集中;强
D.分散;强
答案:D
解析:方差和标准差可以反映数据分布的离散程度。标准差越大,则表明数据分布越分散,波动性和不可预测性也就越强。
单选题:表1-1列示了对某证券的未来收益率的估计:
表1-1 某证券的未来收益率
该证券的期望收益率等于( )。A.15%
B.5%
C.0%
D.10%
答案:B
解析:该证券的期望收益率为:
- 分位数
- 分位数通常被用来研究随机变量X以特定概率(或者一组数据以特等比例)取得大于或等于(或小于等于)某个值的情况。
- 一般来说,设0≤α≤1,随机变量X的上α分位数是指满足概率值P{X≥xα}=α的数xα,下α分位数是指满足概率值P{X≤xα}=α的数xα。
- 中位数
- 中位数是用来衡量数据取值的中等水平或一般水平的数值。
- 对于随机变量x来说,它的中位数就是上50%分位数x50%,这意味着X的取值大于其中位数和小于其中位数的概率各为50%。
- 对于一组数据来说,中位数就是大小处于正中间位置的那个数值。
- 单选题:在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。
- A.均值
- B.标准差
- C.中位数
- D.方差
- 答案:C
- 解析:中位数是用来衡量数据取值的中等水平或一般水平的数值。中位数能够免疫极端值的影响,较好地反映投资策略的真实水平,尤其适用于收入这类偏斜分布的数值型数据。
正态分布
- 正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从正态分布。
- 在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。
- 正态分布密度函数的显著特点是中间高两边低,由中间(X=p)向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。
- 正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
随机变量的相关性——相关系数
- 相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。我们通常用ρij表示证券i和证券j的收益回报率之间的相关系数。
- 相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
- 相关系数ρij总处于+1和-1之间,亦即|ρij|≤1。若Pji=1,则表示ri和rj完全正相关;相反,若ρij=-1,则表示ri和rj完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρij=0。
- 通常情况下两个证券收益率完全相关和零相关的情形都不会出现,其相关系数往往是区间(-1,1)中的某个值,即0< |ρij|<1,这时我们称这两者不完全相关。
- 当0<ρij<1时,ri与rj正相关,其中一个数值的增加(降低)往往意味着另一个数值的增加(降低);
- 而当-1<ρij<0时,ri与rj负相关,其中一个数值的增加(降低)往往意味着另一个数值的降低(增加)。
- 市场上的不同证券之间经常会显示出明显的相关性。分析工商银行、中国银行、中石油与宝钢股份四只股票的每日收盘价数据,对比分析它们的走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝钢股份的股价高度负相关,相关系数达到-0.72。
单选题:工人的工资随着劳动生产率的提高而增加,这说明二者之间的关系是( )。
- A.正相关
- B.负相关
- C.线性相关
- D.非线性相关
- 答案:A
- 解析:当相关系数大于0小于1时,两研究对象正相关,即其中一个数值的增加(降低)往往意味着另一个数值的增加(降低)。
单选题:根据散点图1-1,可以判断两个变量之间存在( )。
- A.正线性相关关系
- B.负线性相关关系
- C.非线性关系
- D.函数关系
- 答案:A
单选题:分析两种不同证券表现的联动性的统计量是( )。
- A.相关系数
- B.方差
- C.标准差
- D.平均值
- 答案:A
- 解析:相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
单选题:证券间的联动关系由相关系数ρ来衡量,ρ值为1,表明( )。
- A.两种证券间存在完全反向的联动关系
- B.两种证券的收益有同向变动倾向
- C.两种证券的收益有反向变动倾向
- D.两种证券间存在完全正向的联动关系
- 答案:D
- 解析:相关系数ρ总处于+1和-1之间,亦即|ρ|≤1。若ρ=1,则表示完全正相关;相反,若ρ=-1,则表示完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρ=0。
热门推荐
localStorage、sessionStorage、cookie详解
右边腿疼要警惕什么病
高尔夫教学:从零基础到全挥杆的完整指南
高尔夫新手必读:一次讲清高尔夫挥杆动作技巧
项目资金管理方案:如何优化资金流动与收益
令人闻风丧胆的狂犬病,一文带你全了解
狂犬病预防全攻略:这些细节你可能还不知道
研究提出未来医学人工智能模型演进与关键技术
研究生中期考核个人总结的重点是什么?
如何理性看待八字命理对人生的影响
银行的个人理财如何规划应急资金?
古代也有“喷子”?古人脏话大揭秘!
榴莲树护理技术:从种植到收获的全面指南
探索像素艺术的创作魅力:从基础到细节的全方位指南
红木沙发垫用什么材料的好?舒适与美观兼顾之选
肋骨不对称左侧凸起是否有危险
已过63岁,中航油董事长周强任上落马
人工智能在文化传播中的创新应用
羽毛球线怎么选择?深入探讨羽毛球线选择,找到自己的灵魂之线
清朝皇位继承制度探析:无太子之位,传承之道何在?
中暑的常见症状及表现有哪些?如何防范与治疗
交通法规责任如何划分
一文详解:生产计划和排产管理怎么做?
左右眼图像难以融合的影响及解决方法(探索双眼视觉不协调的原因与应对策略)
生活中低血压怎么调养比较好
历史、科幻与玄幻的奇想世界
如何说话声音好听技巧-职场心理
新手必看:三步提升羽毛球球速,轻松称霸球场!
外贸网站表单提交后的即时反馈设计:从技术到用户体验的全面指南
哪些人适合选择使用笔记本电脑