常用描述性统计概念
创作时间:
作者:
@小白创作中心
常用描述性统计概念
引用
1
来源
1.
https://img02.exam8.com/wantiku/zhangjieke/jijin/jczs/0004.html
描述性统计学是数据分析的基础,它通过一系列的统计量来概括和描述数据的特征。本文将介绍描述性统计学中的基本概念,包括随机变量的类型、分布、数字特征(如期望、方差、标准差、分位数、中位数等)、正态分布以及随机变量的相关性等内容。
随机变量的类型与分布
- 离散型与连续型随机变量
- 如果一个随机变量 x 最多只能取可数的不同值,则为离散型随机变量;如果 x 的取值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。例如,Default 只能取 0 或 1,因而是离散型随机变量;而 S 的取值可能是任意一个大于 0 的数,因而是连续型随机变量。
- 随机变量的分布
- 如果 x 是离散型的,x 最多可能取 n 个值 x0,x1,…,xn,并且记 pi=P {X=xi} 是 Xn取 xi 的概率,所有概率的总和=1
- 如果 x 是一个连续型随机变量,由于无法列出 x 取每个特定值的概率,我们改用概率密度函数来刻画 x 的分布性质。
随机变量的数字特征与描述性统计量
常用的一些数字特征和它们的描述性统计量有下面几种。
- 期望(均值)
- 随机变量 x 的期望(或称均值,记做 E(X))衡量了 X 取值的平均水平;它是对 X 所 有可能取值按照其发生概率大小加权后得到的平均值。
- E(X)==p1x1+p2x2+…+pnxn
- 在 X 的分布未知时,用抽取样本 X1,…,Xn 的算术平均数(样本均值) x-作为E(X)的估计值。
- 例:某投资者将其资金分别投向A、B、C三只股票,占总资金的比重分别为40%、40%、20%;股票A、B、C的期望收益率分别为Ra=14%、Rb=20%、Rc=8%,则该股票组合的收益率Rp =0.4×14%+0.4×20%+0.2×8%=15.2%
- 方差与标准差
方差:对于投资收益率 r,用方差(δ2)或标准差(δ)来衡量它偏离期望值的程度。 其中方差=δ2=E [(r-Er)2 ] 的数值越大,收益率 r 偏离期望收益率 Er 的程度越大,数值越小偏离就越小。
方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股价指数等的 波动情况。
单选题:标准差越大,则数据分布越____,波动性和不可预测性越____。( )
A.集中;弱
B.分散;弱
C.集中;强
D.分散;强
答案:D
解析:方差和标准差可以反映数据分布的离散程度。标准差越大,则表明数据分布越分散,波动性和不可预测性也就越强。
单选题:表1-1列示了对某证券的未来收益率的估计:
表1-1 某证券的未来收益率
该证券的期望收益率等于( )。A.15%
B.5%
C.0%
D.10%
答案:B
解析:该证券的期望收益率为:
- 分位数
- 分位数通常被用来研究随机变量X以特定概率(或者一组数据以特等比例)取得大于或等于(或小于等于)某个值的情况。
- 一般来说,设0≤α≤1,随机变量X的上α分位数是指满足概率值P{X≥xα}=α的数xα,下α分位数是指满足概率值P{X≤xα}=α的数xα。
- 中位数
- 中位数是用来衡量数据取值的中等水平或一般水平的数值。
- 对于随机变量x来说,它的中位数就是上50%分位数x50%,这意味着X的取值大于其中位数和小于其中位数的概率各为50%。
- 对于一组数据来说,中位数就是大小处于正中间位置的那个数值。
- 单选题:在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。
- A.均值
- B.标准差
- C.中位数
- D.方差
- 答案:C
- 解析:中位数是用来衡量数据取值的中等水平或一般水平的数值。中位数能够免疫极端值的影响,较好地反映投资策略的真实水平,尤其适用于收入这类偏斜分布的数值型数据。
正态分布
- 正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从正态分布。
- 在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。
- 正态分布密度函数的显著特点是中间高两边低,由中间(X=p)向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。
- 正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
随机变量的相关性——相关系数
- 相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。我们通常用ρij表示证券i和证券j的收益回报率之间的相关系数。
- 相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
- 相关系数ρij总处于+1和-1之间,亦即|ρij|≤1。若Pji=1,则表示ri和rj完全正相关;相反,若ρij=-1,则表示ri和rj完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρij=0。
- 通常情况下两个证券收益率完全相关和零相关的情形都不会出现,其相关系数往往是区间(-1,1)中的某个值,即0< |ρij|<1,这时我们称这两者不完全相关。
- 当0<ρij<1时,ri与rj正相关,其中一个数值的增加(降低)往往意味着另一个数值的增加(降低);
- 而当-1<ρij<0时,ri与rj负相关,其中一个数值的增加(降低)往往意味着另一个数值的降低(增加)。
- 市场上的不同证券之间经常会显示出明显的相关性。分析工商银行、中国银行、中石油与宝钢股份四只股票的每日收盘价数据,对比分析它们的走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝钢股份的股价高度负相关,相关系数达到-0.72。
单选题:工人的工资随着劳动生产率的提高而增加,这说明二者之间的关系是( )。
- A.正相关
- B.负相关
- C.线性相关
- D.非线性相关
- 答案:A
- 解析:当相关系数大于0小于1时,两研究对象正相关,即其中一个数值的增加(降低)往往意味着另一个数值的增加(降低)。
单选题:根据散点图1-1,可以判断两个变量之间存在( )。
- A.正线性相关关系
- B.负线性相关关系
- C.非线性关系
- D.函数关系
- 答案:A
单选题:分析两种不同证券表现的联动性的统计量是( )。
- A.相关系数
- B.方差
- C.标准差
- D.平均值
- 答案:A
- 解析:相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
单选题:证券间的联动关系由相关系数ρ来衡量,ρ值为1,表明( )。
- A.两种证券间存在完全反向的联动关系
- B.两种证券的收益有同向变动倾向
- C.两种证券的收益有反向变动倾向
- D.两种证券间存在完全正向的联动关系
- 答案:D
- 解析:相关系数ρ总处于+1和-1之间,亦即|ρ|≤1。若ρ=1,则表示完全正相关;相反,若ρ=-1,则表示完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρ=0。
热门推荐
轻食减肥:科学解读与实用指南
拥有迷人背景的9种中国犬种
掌握回锅肉做法,带你体验川菜的经典美味与家庭温暖
“扫码刷单+线下取现=诈骗” 这个反诈公式你记住了吗?
什么是经络?经络按摩的好处和3大注意事项
冬天“养残”的3种花,正月底赶紧“剃头”,剃得越狠,长得越旺
面筋的营养价值和功效
探秘天庭权力结构:三清与六御的神秘关系
总是晕车怎么办?两味药!缓解头晕、恶心
王者荣耀英雄调整深度解析:胜率波动背后的平衡艺术
头皮疼痛?瘙痒?还伴随脱发?毛囊炎在作怪!找出元凶,做好预防
减负之下,一些基层形式主义花样仍多
高能物理中喷注重建的一种新颖量子实现
打卡青岛这些小众博物馆 每一个都装满了趣味和知识
老年病术后康复护理指南
上虞十大热门景点盘点,畅游江南水乡的美丽风光
英国为什么教育好
陕西打造智能建造与新型建筑工业化产业链促产业转型发展
赴美留学生存指南:美国留学必备清单
【经典力学与量子力学】:探索两种物理体系数值模拟的差异与联系
洛天依"无限共鸣"演唱会:虚与实之下,音乐仍然会发声
戒烟的最佳小窍门是什么?戒烟对身体有何益处?
不同年龄段该如何护肤?
慢性乙型病毒性肝炎抗病毒治疗全攻略
南陵奎湖:自然美景与历史遗迹的双重魅力
论物业股罕见的投资机会
劳务派遣暂行规定的适用范围有哪些?
《论语》的核心思想及其现代意义
印尼华人年轻一代:因中国强大开始重拾中文,并以中华血统而自豪
探寻雁荡山:自然奇观与历史韵律的交响