那是我最后一次在西山漾给同学讲课,底下三两人,笔记本都没带,我说今天我们多讲点,下次就不讲了。那天讲了我的第六节线性代数入门,迄今有四个月了罢。 回家我跟我的物竞朋友聊天吐槽。
我:给他们讲特征方程就讲了一个等比数列凑解 太难受了,但我看也没人想听下去了( 他:你真的不打算发知识区吗 给人讲有人听得下去就怪了我觉得是 我:确实 但是很好我再也不用给他们上线性代数了( 自己挖的坑至少自己填掉了( 我应该给大一新生上(? 他:还真是 我:靠 感觉自己脑子里装了一堆用不着的知识 我是指相似矩阵到底除了解特征根还有什么实际意义 而且明明也不需要它解特征根
线代是一种我的奇怪情怀,它以奇怪的方式进入了我原本被社交折磨得稀烂的生活,我只有在那种精神崩溃的时候才能够学的进去。现在我想我依然不喜欢数学,但是我喜欢这些巧妙的东西。这些思维,这些光辉,什么的。
$$\text{题1:}a_{n}=a_{n-1}+2a_{n-2},n\in\mathbb N,n\geq3,a_{1}=2,a_{2}=1,求a_{n}.$$
当然这是个小题,我们知道可以解特征方程LATEX_BLOCK1 求得$r{1}=2,r{2}=-1$. 于是我们就得到$a{n}=C{1}2^n+C{2}(-1)^n$,又因为$a{1}=2,a{2}=1$,我们不正好有了两个约束,解出了$C{1},C{2}$这两个未知量吗?求出来了.
但为啥呀? 我觉得是个人第一次接触到特征方程做法的时候都一头雾水。就这个特征方程很无中生有。 但是,除了特征方程之外,我们观察,刚才的这个解法,a1和a2是当作两个方程的参数去决定的:我可不可以这么理解,$a{n}=a{n-1}+2a{n-2}$本就可以求出一个普遍的通式?那我怎么确保这个通式一定对呢? 我们再观察,$2^n$和$(-1)^n$都是等比数列…… 抛开$a{1}=2,a{2}=1$不谈,$a{n}=2^n\text{ }or\text{ }(-1)^n$时,不也能满足递推式吗?事实上,我们是不是在解这样一个方程:$$r^{n}=r^{n-1}+2r^{n-2},r\ne 0$$ 那么这个跟我们的带参通解有什么关系呢?等下,我的微分方程理论和线性方程组理论正在向我涌来……
对一个n元齐次线性方程组,若两组不同的解Xa,Xb满足该方程组,则Xa和Xb的线性组合也满足该方程组.
线性代数语言:设 $A\mathbf{x} = \mathbf{0}$ 是一个 $m \times n$ 的齐次线性方程组, 若 $\mathbf{X}_a$ 和 $\mathbf{X}_b$ 都是它的解(即 $A\mathbf{X}_a = \mathbf{0},\ A\mathbf{X}_b = \mathbf{0}$),则对任意常数 $c_1, c_2 \in \mathbb{R}$(或 $\mathbb{C}$), $\mathbf{X} = c_1 \mathbf{X}_a + c_2 \mathbf{X}_b$也是该方程组的解。
$e.g.$矩阵表示的方程组举例:
$$
\underbrace{
\begin{bmatrix}
\ \ 2 & -1 & \ \ 3 & -1 \\
-4 & \ \ 2 & -6 & \ \ 2 \\
\ \ 1 & \ \ 0 & \ \ 1 & -2
\end{bmatrix}
}_{A}
\,
\underbrace{
\begin{bmatrix}
x_1 \\ x_2 \\ x_3 \\ x_4
\end{bmatrix}
}_{\mathbf{x}}
=
\underbrace{
\begin{bmatrix}
0 \\ 0 \\ 0
\end{bmatrix}
}_{\mathbf{0}}
$$
这与LATEX_BLOCK4是对应的,读者可以自行对照理解矩阵的运算方式。
同理,若${b{n}},{c{n}}$都能满足$a{n}=a{n-1}+2a{n-2}$,那么${C{1}b{n}+C{2}C{n}}$也能满足——也就是“特解+特解=特解”。(线性方程组的叠加原理:线性齐次方程的解的叠加还是解。)
现在可以说明为什么通解会长成$a{n}=C{1}2^n+C{2}(-1)^n$的模样了。
可是为什么$a{n}$只由两个参数决定?
我们会看给定的递推方程,认为这个方程只需要给定两个未知数(无关)就够了,比如$a{1},a{2}$,直觉上很显然。
事实上,对一个 k 阶常系数齐次线性递推关系
$$a_{n+k} + c_{k-1} a_{n+k-1} + \cdots + c_0 a_n = 0,n \ge 0,c_i \in \mathbb{R}, $$
其解空间的维数恰好为 k。
想理解这个问题,我们可以定义一个向量和一个矩阵LATEX_BLOCK6
显然,$A\mathbf{X{n-1}}=\mathbf{X_{n}}$.
我们把它化成了一个k次的线性方程组,它是齐次的。
刚才我总是以为,特征方程可能是古人一拍脑袋凑出来的产物——谁知道等比数列恰好有这么一个齐次又可解的性质呢!果真如此吗? 根据$A\mathbf{X{n-1}}=\mathbf{X{n}}$,可以知道: $$\mathbf{X_{n}}=A^{n-1}X_{1}$$ 在刚才的实例中就是$$\begin{bmatrix} a_{n}\\ a_{n+1}\end{bmatrix} \\ =\begin{bmatrix} 0&1 \\ 2&1\\ \end{bmatrix} \\ \begin{bmatrix} a_{n-1} \\ a_{n}\\ \end{bmatrix} =\begin{bmatrix} 0&1 \\ 2&1\\ \end{bmatrix} ^{n-1} \begin{bmatrix} a_{1} \\ a_{2}\\ \end{bmatrix}$$ 我们称之为快速幂。 计算$A$的特征多项式(下面说明这东西的好处),$$\det(\lambda E-A)=\begin{vmatrix}\lambda&-1 \\ -2&\lambda-1\end{vmatrix}=\lambda^2-\lambda-2=(\lambda-2)(\lambda+1).$$ 其中LATEX_BLOCK10 对角线均为1. 解$\det(\lambda E-A)=0,$我们称之为特征方程。 特征方程的特征解,也就是特征多项式解出来的这个东西有这样一个特性: 它使得$\mathbf{\beta}=A\mathbf{\alpha}=\lambda \mathbf{\alpha}$,也就使得$\mathbf{X{n}}=A\mathbf{X{n-1}}=\lambda\mathbf{X{n-1}}$. 这很重要!这将我们的矩阵变成了数乘! 根据这个重要性质,我知道$a_{n}=\lambda^n$一定满足递推公式。 所以这个等比数列他不是一拍脑袋凭空想出来的,特征方程的源头,就是线性代数的特征多项式。
$\lambda^2-\lambda-2=(\lambda-2)(\lambda+1)$是没错,但是这是一个二次函数$f(\lambda)$吧,我怎么知道他一定有解呢?如果,我说用初中的方法,它的$\Delta<0$,没解呢?如果$\Delta=0$又如何处理呢? 如果$f(\lambda)$是一个更多次的多项式函数呢?
关于$\Delta<0$的情况,无非就是把实数运算变成了复数运算,事实上是类似共轭运算的方法,结果仍然是实数。复数不在我们今天的讲解范围内。 但$\Delta=0$又是怎么回事呢? 以新题为参考:$$r^2=r+2,$$1 (是的我就是改了一下系数)
那么,我们运用传统的特征方程解法会发现我们解出来$\lambda=1$这个重特征根。 但是我们知道要解出这个通解,需要至少两个特解,我们现在好像只发现一个$a_{n}=1^n\dots$ 去哪里寻找第二个呢?
这可真是把我难坏了,没事我有Internet.
我们搜到第一个被忽略的点。
一个 $n\times n$ 矩阵 可以对角化,当且仅当它有 $n$ 个线性无关的特征向量。 线性无关:任意一个向量不能被其他n-1个向量线性表示,也就是n个向量不能表征n维空间。 特别地,如果矩阵有 n 个互不相同的特征值,那么它一定可以对角化(因为不同特征值对应的特征向量线性无关)。
什么是对角化?什么是特征向量?别急。 回顾线代“特征值”一章,对于$A\mathbf{x}=\lambda \mathbf{x}$,满足条件的$\lambda$称为$A$的特征根,此时对应的向量即为特征向量。 特征向量怎么算呢?我们为了矩阵运算的方便,在右式乘上矩阵$E$,并移项(是的就是$\lambda E-A$) 得到$$r^2=r+2,$$2 怎么解呢?方法就是直接代。 我们以题1为例,设$$r^2=r+2,$$3 带入方程,得$$r^2=r+2,$$4 解得(我们只要解出方向就可以了)$$r^2=r+2,$$5 确实线性无关。
1、特征向量,可以用另一种方式表示矩阵,还可以作对角化,究竟是如何做到的?
2021-2026 三叶工作室·Think3355