常用描述性统计概念
创作时间:
作者:
@小白创作中心
常用描述性统计概念
引用
1
来源
1.
https://img02.exam8.com/wantiku/zhangjieke/jijin/jczs/0004.html
描述性统计学是数据分析的基础,它通过一系列的统计量来概括和描述数据的特征。本文将介绍描述性统计学中的基本概念,包括随机变量的类型、分布、数字特征(如期望、方差、标准差、分位数、中位数等)、正态分布以及随机变量的相关性等内容。
随机变量的类型与分布
- 离散型与连续型随机变量
- 如果一个随机变量 x 最多只能取可数的不同值,则为离散型随机变量;如果 x 的取值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。例如,Default 只能取 0 或 1,因而是离散型随机变量;而 S 的取值可能是任意一个大于 0 的数,因而是连续型随机变量。
- 随机变量的分布
- 如果 x 是离散型的,x 最多可能取 n 个值 x0,x1,…,xn,并且记 pi=P {X=xi} 是 Xn取 xi 的概率,所有概率的总和=1
- 如果 x 是一个连续型随机变量,由于无法列出 x 取每个特定值的概率,我们改用概率密度函数来刻画 x 的分布性质。
随机变量的数字特征与描述性统计量
常用的一些数字特征和它们的描述性统计量有下面几种。
- 期望(均值)
- 随机变量 x 的期望(或称均值,记做 E(X))衡量了 X 取值的平均水平;它是对 X 所 有可能取值按照其发生概率大小加权后得到的平均值。
- E(X)==p1x1+p2x2+…+pnxn
- 在 X 的分布未知时,用抽取样本 X1,…,Xn 的算术平均数(样本均值) x-作为E(X)的估计值。
- 例:某投资者将其资金分别投向A、B、C三只股票,占总资金的比重分别为40%、40%、20%;股票A、B、C的期望收益率分别为Ra=14%、Rb=20%、Rc=8%,则该股票组合的收益率Rp =0.4×14%+0.4×20%+0.2×8%=15.2%
- 方差与标准差
方差:对于投资收益率 r,用方差(δ2)或标准差(δ)来衡量它偏离期望值的程度。 其中方差=δ2=E [(r-Er)2 ] 的数值越大,收益率 r 偏离期望收益率 Er 的程度越大,数值越小偏离就越小。
方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股价指数等的 波动情况。
单选题:标准差越大,则数据分布越____,波动性和不可预测性越____。( )
A.集中;弱
B.分散;弱
C.集中;强
D.分散;强
答案:D
解析:方差和标准差可以反映数据分布的离散程度。标准差越大,则表明数据分布越分散,波动性和不可预测性也就越强。
单选题:表1-1列示了对某证券的未来收益率的估计:
表1-1 某证券的未来收益率
该证券的期望收益率等于( )。A.15%
B.5%
C.0%
D.10%
答案:B
解析:该证券的期望收益率为:
- 分位数
- 分位数通常被用来研究随机变量X以特定概率(或者一组数据以特等比例)取得大于或等于(或小于等于)某个值的情况。
- 一般来说,设0≤α≤1,随机变量X的上α分位数是指满足概率值P{X≥xα}=α的数xα,下α分位数是指满足概率值P{X≤xα}=α的数xα。
- 中位数
- 中位数是用来衡量数据取值的中等水平或一般水平的数值。
- 对于随机变量x来说,它的中位数就是上50%分位数x50%,这意味着X的取值大于其中位数和小于其中位数的概率各为50%。
- 对于一组数据来说,中位数就是大小处于正中间位置的那个数值。
- 单选题:在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。
- A.均值
- B.标准差
- C.中位数
- D.方差
- 答案:C
- 解析:中位数是用来衡量数据取值的中等水平或一般水平的数值。中位数能够免疫极端值的影响,较好地反映投资策略的真实水平,尤其适用于收入这类偏斜分布的数值型数据。
正态分布
- 正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从正态分布。
- 在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。
- 正态分布密度函数的显著特点是中间高两边低,由中间(X=p)向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。
- 正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
随机变量的相关性——相关系数
- 相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。我们通常用ρij表示证券i和证券j的收益回报率之间的相关系数。
- 相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
- 相关系数ρij总处于+1和-1之间,亦即|ρij|≤1。若Pji=1,则表示ri和rj完全正相关;相反,若ρij=-1,则表示ri和rj完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρij=0。
- 通常情况下两个证券收益率完全相关和零相关的情形都不会出现,其相关系数往往是区间(-1,1)中的某个值,即0< |ρij|<1,这时我们称这两者不完全相关。
- 当0<ρij<1时,ri与rj正相关,其中一个数值的增加(降低)往往意味着另一个数值的增加(降低);
- 而当-1<ρij<0时,ri与rj负相关,其中一个数值的增加(降低)往往意味着另一个数值的降低(增加)。
- 市场上的不同证券之间经常会显示出明显的相关性。分析工商银行、中国银行、中石油与宝钢股份四只股票的每日收盘价数据,对比分析它们的走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝钢股份的股价高度负相关,相关系数达到-0.72。
单选题:工人的工资随着劳动生产率的提高而增加,这说明二者之间的关系是( )。
- A.正相关
- B.负相关
- C.线性相关
- D.非线性相关
- 答案:A
- 解析:当相关系数大于0小于1时,两研究对象正相关,即其中一个数值的增加(降低)往往意味着另一个数值的增加(降低)。
单选题:根据散点图1-1,可以判断两个变量之间存在( )。
- A.正线性相关关系
- B.负线性相关关系
- C.非线性关系
- D.函数关系
- 答案:A
单选题:分析两种不同证券表现的联动性的统计量是( )。
- A.相关系数
- B.方差
- C.标准差
- D.平均值
- 答案:A
- 解析:相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a与b证券之间的相关系数绝对值|ρab|比a与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
单选题:证券间的联动关系由相关系数ρ来衡量,ρ值为1,表明( )。
- A.两种证券间存在完全反向的联动关系
- B.两种证券的收益有同向变动倾向
- C.两种证券的收益有反向变动倾向
- D.两种证券间存在完全正向的联动关系
- 答案:D
- 解析:相关系数ρ总处于+1和-1之间,亦即|ρ|≤1。若ρ=1,则表示完全正相关;相反,若ρ=-1,则表示完全负相关。如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρ=0。
热门推荐
行业主题ETF的投资时机如何判断?这些依据和方法值得参考
子平八字命理新论:如何解读与应用这一传统命理学的现代视角
从“炭”路到“碳”路 ,看徐州如何走好绿色发展转型之路
办公软件怎么改默认
三国杀36张锦囊有什么用处呢?
新球员培出:如何有效培养杰出球员
25教资认定即将开始,北京率先发布!附超详细认定流程
电动车交通事故责任划分标准及交通肇事罪详解
“li”怎么读?这个拼音对应哪些汉字?
胎菊怎么泡水喝?饮用频率与注意事项全解析
老子简介 老子生平
每天应吃几餐才能实现健康减肥?专家建议来了
青少年抑郁症做心理疏导有用吗
追光领跑跑道提升跑步者的运动表现
如何理解软件需求层次?深度解析关键要素与实际应用
短剧之争祭出单部分账破3000万的短剧,创2024年短剧市场分账新记录
神乐:日本传统音乐与舞蹈的精髓
使用口红的注意事项
2025年北京小学报名需要哪些资料?京籍和非京籍入学材料准备有什么区别?
网线长了会影响网速吗
美国最适合女生学习STEM专业的顶尖院校推荐
这5部治愈系获奖动画短片太适合陪孩子看了,每部堪称人生教科书
@九江家长,“孩子蹿个子秘籍”请查收→
五部动画神作推荐:总有一部戳中你的心
在农村公路可行性研究报告中如何节省投资
邮政编码在邮寄过程中有什么作用?
中医如何改善湿气重的问题
慢性的非萎缩性胃炎是什么意思
如何生动有趣地学习物理:让Physics不再乏味!
二手房交易税费计算指南