数据科学中的 R 语言
创作时间:
作者:
@小白创作中心
数据科学中的 R 语言
引用
1
来源
1.
https://bookdown.org/wangminjie/R4DS/baseR-data-structure.html
第 5 章 数据结构
前面介绍了向量,它是R语言中最基础的数据结构
我们还会遇到其它数据结构
- 矩阵
- 列表
- 数据框
这些数据结构都可以看作由向量衍生出来的1。
5.1 矩阵
矩阵可以存储行(row)和列(column)二维的数据。
它实际上是向量的另一种表现形式,也就说它的本质还是向量,一维的向量用二维的方式呈现。
矩阵可以用
matrix()
函数创建,第一个位置的参数是用于创建矩阵的向量。比如下面把向量
c(2, 4, 3, 1, 5, 7)
转换成2行3列的矩阵
m <- matrix(
c(2, 4, 3, 1, 5, 7),
nrow = 2,
ncol = 3
)
m
## [,1] [,2] [,3]
## [1,] 2 3 5
## [2,] 4 1 7
大家还记得我们的向量是一个竖着的糖葫芦, 那么在转换成矩阵的时候,也是先竖着排,第一列竖着的方法排满后,就排第二列,这是默认的情形。如果想改变这一传统习惯,也可以增加一个语句
byrow = TRUE
,这条语句让向量先横着排,排完第一行,再排第二行。
matrix(
c(2, 4, 3, 1, 5, 7),
nrow = 2,
ncol = 3,
byrow = TRUE
)
## [,1] [,2] [,3]
## [1,] 2 4 3
## [2,] 1 5 7
5.1.1 矩阵的属性
- 类型
class(m)
## [1] "matrix" "array"
- 长度
length(m)
## [1] 6
- 维度
dim(m)
## [1] 2 3
5.2 列表
如果我们想要装更多的东西,可以想象有一个小火车2,小火车的每节车厢是独立的,因此每节车厢装的东西可以不一样。这种结构装载数据的能力很强大,称之为列表(list)。我们可以使用
list()
函数创建列表
list1 <- list(
a = c(5, 10),
b = c("I", "love", "R", "language", "!"),
c = c(TRUE, TRUE, FALSE, TRUE)
)
list1
## $a
## [1] 5 10
##
## $b
## [1] "I" "love" "R" "language" "!"
##
## $c
## [1] TRUE TRUE FALSE TRUE
c()
函数创建向量 对比
list()
函数创建列表
5.2.1 列表的属性
- 类型
class(list1)
## [1] "list"
- 长度
length(list1)
## [1] 3
5.3 数据框
前面说过,列表可以想象成一个小火车,如果每节车厢装的都是向量而且等长,那么这种特殊形式的列表就变成了数据框(data frame)
换句话说,数据框是一种特殊的列表,我们可以使用
data.frame()
函数构建数据框
df <- data.frame(
name = c("Alice", "Bob", "Carl", "Dave"),
age = c(23, 34, 23, 25),
marriage = c(TRUE, FALSE, TRUE, FALSE),
color = c("red", "blue", "orange", "purple")
)
df
## name age marriage color
## 1 Alice 23 TRUE red
## 2 Bob 34 FALSE blue
## 3 Carl 23 TRUE orange
## 4 Dave 25 FALSE purple
数据框类似于我们经常用的excel表格。由于数据框融合了向量、矩阵和列表的特性,所以在数据科学的统计建模和可视化中运用非常广泛。
5.3.1 数据框的属性
- 类型
class(df)
## [1] "data.frame"
- 维度
nrow(df)
## [1] 4
ncol(df)
## [1] 4
5.4 小结
R 对象的数据结构(向量、矩阵、列表和数据框),总结如下
- 向量: 糖葫芦
- 矩阵: 糖葫芦,有多行多列
- 列表: 小火车
- 数据框: excel表格
为了更好地理解相关概念,建议大家阅读Garrett Grolemund的hopr这本书(Grolemund 2014)。
5.5 习题
- 为什么说数据框融合了向量、矩阵和列表的特性?
- 创建一个学生信息的data.frame,包含姓名、性别、年龄,成绩等变量。
热门推荐
在线溶解氧分析仪:实时监控水中氧气含量的利器
鱼价涨、牛蛙涨、白虾涨……水产原材料价格涨疯了!
延迟满足的威力:为什么忍住今天,才是赢在未来?
金融股在股市中有怎样的表现特点?这种表现特点如何反映市场趋势?
四川邻水春季旅游攻略:三条特色路线带你玩转这座川东小城
窦性心律是什么病?养成6个好习惯,保障心跳天天正常
氧化铝陶瓷文献研究进展及其在工业应用中的潜力探讨
理财知多少系列—稳健理财之货币基金
家里用天然大理石(花岗岩和大理石的区别)
私家汽车过户手续怎么办理
排涝系统设备管理:从定期维护到智能监控的全方位解决方案
经典与现代的完美结合
什么是补充内容?法律领域的定义、类别与应用
吕蒙两次偷袭荆州,关羽骁勇善战,为何未能守住?
什么是汽车麋鹿测试?
保护童年:互联网时代的儿童网络安全
介电材料的分类及特点
有256层的蝴蝶酥是上海人的“甜蜜蝴蝶”,51名蝴蝶酥制作高手上海大比武
植物精油检测标准与方法详解
如何安全有效地进行瓷砖施工?这样的施工如何保证质量和美观?
职校:初中毕业读职校,如何平衡技能学习与文化素养提升?
手部皮肤保养全攻略:7个实用方法让双手保持年轻状态
血压偏高怎么调理最好
合同法定解除权产生的情形有哪些内容
合同终止的法律后果及与合同解除的区别
实现无缝集成的顶级API版本控制策略
分析三位亲人接连离婚的原因:家庭矛盾、沟通不足还是感情破裂?
秦始皇的真实面貌:历史记载与后世想象
盗窃抢劫案件的法律分析与防范措施
什么是夫妻调解?全流程解析及优势分析