从线性变换到相似矩阵的本质探讨
从线性变换到相似矩阵的本质探讨
本文将从向量、基底、线性变换到矩阵和相似矩阵,层层递进地探讨线性代数的核心概念。通过具体的数学公式和直观的图形解释,帮助读者深入理解这些基础而又重要的数学工具。
众所周知,矩阵即线性变换。但一直以来,人们对于线性变换究竟改变了向量的什么存在疑问:是名字,还是形状?在线性变换的过程中,我们究竟用什么来唯一标识一个向量?形状不同,是否就意味着不同的向量?名字相同,是否就不可能有多个形状相同的向量?只有理清这些问题,才能更好地理解更复杂的相似矩阵。
接下来,我们将按照从向量→基底→线性变换→矩阵→相似矩阵的顺序,由浅至深地进行探讨。
向量
首先明确一个概念:向量的“名”和“形”并不唯一对应。也就是说,如果给出一个向量(1,2),要求画出它的形状,这是无法完成的。同理,如果给出一个箭头线段,要求确定它代表的向量,同样无法给出确定的答案。这是因为缺少了一个必不可少的参照——基底。
基底
向量形状、向量名字和基底之间存在一个知二求一的关系。对于一个向量而言:
- 同一个名字+不同基底会得到不同形状
- 同一个形状+不同基底会得到不同名字
- 固定同一个基底,形状和名字一一对应
很多人(包括作者)会默认同基底的情况,认为不同形状的向量肯定名字不一样。但这种想法会阻碍对相似矩阵的理解。实际上,很难说到底是什么唯一标识一个向量。或者说,只有先手动确定这三个要素中的其中一个,以它为标识,才能讨论剩下两个的线性变换。
线性变换
线性变换的公式形式为:
Ax1=x2
其中,x1、x2分别为两个拥有不同名字的向量,A为矩阵(线性变换)。由于涉及三个影响要素,可以指定任意一个为不变量,用剩下两个要素的变化关系来定义线性变换,形成三个定义:
- 指定同基底
矩阵A(线性变换):在同一个基底下,把一个向量变成另一个完全陌生的向量,即使向量发生空间位置的变化。
指定同名字
矩阵A(线性变换):描述在另一组基底下的同名向量,在本基底下的名字。这个定义较为绕口,且与第一个定义重复,因此较少使用。指定同形状
个人认为这是最好的理解方式。矩阵A(线性变换):描述在不同基底下,同一个向量形状的不同名字。这个定义最容易理解,因为公式的特性是不体现形状,只体现名字。
在上述线性变换的定义中,需要着重记忆的是第一个和第三个,它们是理解相似矩阵的基石,共同构成了相似矩阵的定义。
矩阵
矩阵的本质就是线性变换,是连接两个向量的桥梁。关于矩阵自身的性质有很多,这里不展开讨论。
相似矩阵
相似矩阵的概念可以理解为线性变换的升级版本。如果用线性变换来解释,那就是第一个和第三个定义的结合。
事实上,如果将第一个和第三个定义的示意图拼在一起,就是相似矩阵的示意图:
简而言之,相似矩阵也是矩阵,矩阵的本质是两个向量的线性变换;那么相似矩阵的本质就是:两个矩阵的线性变换,或者说是线性变换的线性变换。
- 线性变换(T0版本)
- 公式:Ax1=x2
- 理解:两个向量进行线性变换(第三个定义)
- 含义:相同的向量(形状)在不同基底下,有不同的向量名
- 相似矩阵(T1版本)
- 公式:A(Px1)=Px2=P(Bx1)
- 理解:两个矩阵进行线性变换(第三个定义),而矩阵为:两个向量进行线性变换(第一个定义)
- 含义:相同的线性变换(第一个定义)在不同基底下,有不同的矩阵表示
ps. 相同的线性变换(第一个定义)指两个变化前的向量形状相同,变化后的向量形状同样相同。
所以相似矩阵其实可以理解为一款复合线性变换,或者线性变换²。
总结
这些概念可以简要概括为:
- 向量:名字、形状、基底三要素,知二求一
- 线性变换:固定向量三要素之一,剩下两要素随机组合(1个公式,3个定义)
- 矩阵:向量→向量的线性变换
- 相似矩阵:矩阵→矩阵的线性变换