常用描述性统计概念
创作时间:
作者:
@小白创作中心
常用描述性统计概念
引用
1
来源
1.
https://img02.exam8.com/wantiku/zhangjieke/jijin/jczs/0004.html
描述性统计学是数据分析的基础,它通过一系列的统计量来概括和描述数据的特征。本文将介绍描述性统计学中的基本概念,包括随机变量的类型、分布、数字特征(如期望、方差、标准差、分位数、中位数等)、正态分布以及随机变量的相关性等内容。
随机变量的类型与分布
- 离散型与连续型随机变量
- 如果一个随机变量 x 最多只能取可数的不同值,则为离散型随机变量;如果 x 的取值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。例如,Default 只能取 0 或 1,因而是离散型随机变量;而 S 的取值可能是任意一个大于 0 的数,因而是连续型随机变量。
- 随机变量的分布
- 如果 x 是离散型的,x 最多可能取 n 个值 x0,x1,…,xn,并且记 pi=P {X=xi} 是 Xn取 xi 的概率,所有概率的总和=1
- 如果 x 是一个连续型随机变量,由于无法列出 x 取每个特定值的概率,我们改用概率密度函数来刻画 x 的分布性质。
随机变量的数字特征与描述性统计量
常用的一些数字特征和它们的描述性统计量有下面几种。
- 期望(均值)
- 随机变量 x 的期望(或称均值,记做 E(X))衡量了 X 取值的平均水平;它是对 X 所 有可能取值按照其发生概率大小加权后得到的平均值。
- E(X)==p1x1+p2x2+…+pnxn
- 在 X 的分布未知时,用抽取样本 X1,…,Xn 的算术平均数(样本均值) x-作为E(X)的估计值。
- 例:某投资者将其资金分别投向A、B、C三只股票,占总资金的比重分别为40%、40%、20%;股票A、B、C的期望收益率分别为Ra=14%、Rb=20%、Rc=8%,则该股票组合的收益率Rp =0.4×14%+0.4×20%+0.2×8%=15.2%
- 方差与标准差
方差:对于投资收益率 r,用方差(δ2)或标准差(δ)来衡量它偏离期望值的程度。 其中方差=δ2=E [(r-Er)2 ] 的数值越大,收益率 r 偏离期望收益率 Er 的程度越大,数值越小偏离就越小。
方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股价指数等的 波动情况。
单选题:标准差越大,则数据分布越____,波动性和不可预测性越____。( )
A.集中;弱
B.分散;弱
C.集中;强
D.分散;强
答案:D
解析:方差和标准差可以反映数据分布的离散程度。标准差越大,则表明数据分布越分散,波动性和不可预测性也就越强。
单选题:表1-1列示了对某证券的未来收益率的估计:
表1-1 某证券的未来收益率
该证券的期望收益率等于( )。A.15%
B.5%
C.0%
D.10%
答案:B
解析:该证券的期望收益率为:
- 分位数
- 分位数通常被用来研究随机变量X以特定概率(或者一组数据以特等比例)取得大于或等于(或小于等于)某个值的情况。
- 一般来说,设0≤α≤1,随机变量X的上α分位数是指满足概率值P{X≥xα}=α的数xα,下α分位数是指满足概率值P{X≤xα}=α的数xα。
- 中位数
- 中位数是用来衡量数据取值的中等水平或一般水平的数值。
- 对于随机变量x来说,它的中位数就是上50%分位数x50%,这意味着X的取值大于其中位数和小于其中位数的概率各为50%。
- 对于一组数据来说,中位数就是大小处于正中间位置的那个数值。
- 单选题:在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。
- A.均值
- B.标准差
- C.中位数
- D.方差
- 答案:C
- 解析:中位数是用来衡量数据取值的中等水平或一般水平的数值。中位数能够免疫极端值的影响,较好地反映投资策略的真实水平,尤其适用于收入这类偏斜分布的数值型数据。
正态分布
- 正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从正态分布。
- 在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。
- 正态分布密度函数的显著特点是中间高两边低,由中间(X=p)向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。
- 正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
随机变量的相关性——相关系数
- 相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。我们通常用ρij表示证券i和证券j的收益回报率之间的相关系数。
- 相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
- 相关系数ρij总处于+1和-1之间,亦即|ρij|≤1。若Pji=1,则表示ri和rj完全正相关;相反,若ρij=-1,则表示ri和rj完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρij=0。
- 通常情况下两个证券收益率完全相关和零相关的情形都不会出现,其相关系数往往是区间(-1,1)中的某个值,即0< |ρij|<1,这时我们称这两者不完全相关。
- 当0<ρij<1时,ri与rj正相关,其中一个数值的增加(降低)往往意味着另一个数值的增加(降低);
- 而当-1<ρij<0时,ri与rj负相关,其中一个数值的增加(降低)往往意味着另一个数值的降低(增加)。
- 市场上的不同证券之间经常会显示出明显的相关性。分析工商银行、中国银行、中石油与宝钢股份四只股票的每日收盘价数据,对比分析它们的走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝钢股份的股价高度负相关,相关系数达到-0.72。
单选题:工人的工资随着劳动生产率的提高而增加,这说明二者之间的关系是( )。
- A.正相关
- B.负相关
- C.线性相关
- D.非线性相关
- 答案:A
- 解析:当相关系数大于0小于1时,两研究对象正相关,即其中一个数值的增加(降低)往往意味着另一个数值的增加(降低)。
单选题:根据散点图1-1,可以判断两个变量之间存在( )。
- A.正线性相关关系
- B.负线性相关关系
- C.非线性关系
- D.函数关系
- 答案:A
单选题:分析两种不同证券表现的联动性的统计量是( )。
- A.相关系数
- B.方差
- C.标准差
- D.平均值
- 答案:A
- 解析:相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
单选题:证券间的联动关系由相关系数ρ来衡量,ρ值为1,表明( )。
- A.两种证券间存在完全反向的联动关系
- B.两种证券的收益有同向变动倾向
- C.两种证券的收益有反向变动倾向
- D.两种证券间存在完全正向的联动关系
- 答案:D
- 解析:相关系数ρ总处于+1和-1之间,亦即|ρ|≤1。若ρ=1,则表示完全正相关;相反,若ρ=-1,则表示完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρ=0。
热门推荐
周易第二卦坤卦六三爻详解:含章可贞,或从王事
周易第二卦坤卦六三爻详解:含章可贞,或从王事,无成有终
中国女乒球员蒯曼与石询瑶的比赛表现反应了教练组态度的差异
氮化镓:半导体领域的璀璨之星,多领域应用的神奇材料全解析
人类发射的文明信息早就飞到宇宙深处,为何没有外星人联系我们?
女厕排队之困,何解?
7个月宝宝体温37.1度算不算发烧?一文读懂婴儿体温管理
中国古代民族西迁:他们征服了亚欧大陆,但是自己也被同化
关于电影《长津湖》背后的一些历史知识点,你需要了解
韩国人说话的特点及常用语汇总
溺水急救,这些知识要掌握,这些误区要避免!
超长时间怎么备份照片
B450主板适合哪些CPU?如何选择最佳搭配?
打坐与人体工程学:从生理到精神的全面优化
中国研发的高血压疫苗预计2026年后上市,高血压患者的希望要来了
2024全国民族类大学排名榜:中央民族大学领跑,19所高校上榜
想要战力快速提升吗?玉剑玩法必须拿下
刷牙时要不要刷舌头?专业医生来解答
有哪些互动式小游戏开发定制方式?
转氨酶高,不能吃西瓜?医生:常吃2果,肝或“感激”你
话剧表演中语言的表达方式
蔡晓东的英雄事迹:用生命诠释舍己救人的崇高精神
零基础如何给孩子讲艺术?
香港电影经典反派盘点,只是看见他们的脸已经不寒而栗
探索温性茶品:哪些茶适合长期饮用?
基于物联网的 AI 智能送药车与自维护基站系统研究
历史成本是什么?从定义到应用的全面解析
阴雨天,广式打边炉太适合啦!
《卡拉马佐夫兄弟》:陀思妥耶夫斯基的巅峰之作?
中国茶文化概述