正交变换#
在固体力学中,正交变换是分析材料对称性、坐标系变换以及张量客观性的重要工具。正交变换通常由正交矩阵表示,用于描述坐标系的旋转,在应力、应变和本构关系的分析中尤为重要基本定义#
正交变换是指在实内积空间(如欧几里得空间)中,保持向量内积不变的线性变换。若线性变换 \(\mathcal{Q}:V\rightarrow V\) 满足:
则称 \(\mathcal{Q}\) 为正交变换
等价定义一
保持向量长度:\(\|\mathcal{Q}\mathbf{v}\|=\|\mathbf{v}\|\) 对所有 \(\mathbf{v}\in V \) 成立
\(0\Rightarrow1\):
\(1\Rightarrow0\):
等价定义二
在标准正交基下,对应的矩阵是正交矩阵 \(Q\),满足 \(Q^{T}Q=I\)
\(0\Rightarrow2\):
\(2\Rightarrow0\):
正交变换的性质#
在正交变换具有以下核心性质:
保持向量的长度不变:\(\|Q\mathbf{v}\|=\|\mathbf{v}\|\)
保持向量间夹角不变:\((Q\mathbf{u},Q\mathbf{v}) = (\mathbf{u},\mathbf{v})\)
\(\det(Q)=\pm1\):\(\det(Q)=1\) 时为旋转变换;\(\det(Q)=-1\) 时为反射变换
特征值 \(|\lambda| = 1\):\(\mathbf{u}^{T}\mathbf{u} = \mathbf{u}^{\dagger}Q^{\dagger}Q\mathbf{u}=|\lambda|^2\mathbf{u}^{T}\mathbf{u}\)
\(Q^{-1} = Q^{T}\)
\(Q\) 的行/列向量,形成一组标准正交基:\(Q^{T}Q = I\)
\(Q_{1}, Q_{2}\) 为正交矩阵,则 \(Q_{1}Q_{2}\) 也是正交矩阵:\((Q_{1}Q_{2})^{T}Q_{1}Q_{2} = Q_{2}^{T}Q_{1}^{T}Q_{1}Q_{2} = I\)
相似变换#
相似变换是同一线性变换在不同基下的矩阵表示之间的转换关系基本定义#
给定线性变换
设其在基 \(\{\mathbf{v}_{1},\mathbf{v}_{2},\cdots,\mathbf{v}_{n}\}\) 的矩阵表示为 \(A\),在基 \(\{\mathbf{w}_{1},\mathbf{w}_{2},\cdots,\mathbf{w}_{n}\}\) 下的矩阵表示为 \(B\),且两组基之间的转换矩阵为 \(P\),即
于是,向量 \(\mathbf{x}\) 在基 \(\{\mathbf{v}_{i}\}\) 下的坐标 \(\mathbf{x}^{v}=[x^{v}_{1},x^{v}_{2},\cdots,x^{v}_{n}]^{T}\) 与在基 \(\{\mathbf{w}_{i}\}\) 下的坐标 \(\mathbf{x}^{w}=[x^{w}_{1},x^{w}_{2},\cdots,x^{w}_{n}]^{T}\) 满足
即
因此
又因为
故
称矩阵 \(A\) 和矩阵 \(B\) 是相似的
相似变换的性质#
保特征值#
代数重数:代数重数是矩阵特征多项式的根的重数
故特征根及其重数保持不变
几何重数:几何重数是特征值对应特征空间的维数,即 \(\dim(\ker(\lambda I-A))\)
这是自然的,因为线性变换 \(\ker(\lambda I-A)\) 和 \(\ker(\lambda I-B)\) 通过 可逆变换 \(P\) 和 \(P^{-1}\) 一一对应
保迹 \(\text{tr}(A)\)#
保行列式 \(\det(A) = \prod_{i=1}^{n} \lambda_i\)#
或
合同变换#
基本定义#
对实对称矩阵 \(A\),其二次型为
设存在变量替换 \(\mathbf{x} = P\mathbf{y}\)(不同基下的坐标表示,见相似变换),则
则称 \(A\) 与 \(B\) 为合同矩阵,这种变换称为合同变换。合同变换的重要目标是将二次型化为标准形(对角矩阵形式)
合同变换的性质#
保对称性#
Sylvester 惯性定理#
对于任意实二次型 \( f(x) = x^T A x \) (\( A \) 为实对称矩阵),通过合同变换可唯一化简为以下标准形:
其中正惯性指数 \( p \)、负惯性指数 \( q \)、零惯性指数 \( r = n - p - q \) 唯一确定,仅依赖于原二次型矩阵 \( A \) 的性质
根据 Sylvester 惯性定理,可得到以下结论:
合同变换下,矩阵的正定性、半正定性保持不变
二次曲面(如椭球面、双曲面)的类型由正负惯性指数唯一确定
惯性指数与特征值的符号直接相关,合同变换不改变符号分布
正交变换#
由于正交矩阵满足 \(Q^{T} = Q^{-1}\),因此正交变换
既是相似变换,也是合同变换(一般应用于对称矩阵)
正交变换的几何意义#
由于正交变换保持向量的长度和向量间的夹角不变,这使得正交变换可以被视为刚体运动中的旋转和反射
二维空间#
在二维空间中,正交矩阵具有两种形式
\(R\) 表示旋转变换,旋转角度为 \(\theta\)
\(M\) 表示反射变换,对称面为 \(y = \tan\frac{\theta}{2}x\)
三维空间#
旋转变换#
标准旋转矩阵:
Rodrigues 旋转矩阵:
设旋转轴为单位向量 \(\mathbf{u}=[u_{x},u_{y},u_{z}]\),旋转角为 \(\theta\),则旋转矩阵为
对于旋转轴不经过原点的情况,则需要通过平移-旋转-逆平移的复合变换实现
Rodrigues 公式证明
将任意向量 \(\mathbf{v}\) 进行分解
其中
平行于轴的分量:\(\mathbf{v}_{\scriptscriptstyle/\!/}=\mathbf{u}\ (\mathbf{v}\cdot\mathbf{u})=\mathbf{u}\ (\mathbf{u}^{T}\mathbf{v}) = (\mathbf{u}\mathbf{u}^{T})\mathbf{v}\)
垂直于轴的分量:\(\mathbf{v}_{\perp}=\mathbf{v} - \mathbf{v}_{\scriptscriptstyle/\!/} = (I - \mathbf{u}\mathbf{u}^{T})\mathbf{v}\)
绕 \(u\) 旋转时(旋转是线性变换)
平行分量保持不变:\(\mathbf{v}_{\scriptscriptstyle/\!/}^{'} = \mathbf{v}_{\scriptscriptstyle/\!/}\)
垂直分量绕 \(\mathbf{u}\) 旋转 \(\theta\):\(\mathbf{v}_{\perp}^{'}=\cos\theta\cdot\mathbf{v}_{\perp} + \sin\theta\cdot(\mathbf{u}\times\mathbf{v}_{\perp})\)
关于垂直分量:
\(\mathbf{v}_{\perp}\) 和 \(\mathbf{u}\times\mathbf{v}_{\perp}\) 是垂直于 \(\mathbf{u}\) 的平面上的一组正交基,且满足
和
于是,总旋转后的向量为
由于
因此
故
反射变换#
标准反射矩阵
一般反射矩阵
关于单位法向量 \(\mathbf{n}=[n_{x}\ n_{y}\ n_{z}]^{T}\) 定义的(过原点的)平面的反射矩阵为
对于平面不经过原点的情况,则需要通过平移-反射-逆平移的复合变换实现
反射公式证明
将任意向量 \(\mathbf{v}\) 进行分解
其中
平行于平面的分量:\(\mathbf{v}_{\scriptscriptstyle/\!/}\)
垂直于平面的分量:\(\mathbf{v}_{\perp}=\mathbf{n}\ (\mathbf{v}\cdot\ \mathbf{n})=(\mathbf{n}\mathbf{n}^{T})\mathbf{v}\)
反射操作不改变 \(\mathbf{v}_{\scriptscriptstyle/\!/}\),并将 \(\mathbf{v}_{\perp}\) 反向,故反射后的向量为
因此,反射矩阵为
实对称矩阵的对角化(谱分解)#
对于实对称矩阵 \(A\),存在正交矩阵 \(Q\) 和对角矩阵 \(\Lambda\),使得
矩阵 \(A\) 的特征值为实数#
设 \(\lambda\in\mathbb{C}\) 为矩阵 \(A\) 的特征值,\(\mathbf{v}\in\mathbb{C}^{n}\) 为对应的特征向量,则
另一方面
由于 \(\mathbf{v}^{\dagger}\mathbf{v}>0\),故 \(\lambda = \bar{\lambda}\),得到 \(\lambda\in\mathbb{R}\)
设 \(\mathbf{v} = \mathbf{a} + i\mathbf{b}\),其中,\(\mathbf{a},\mathbf{b}\in\mathbb{R}^{n},\)则
因此
这表明特征值 \(\lambda\) 存在对应的实特征向量
不同特征根的特征向量正交#
设特征值 \(\lambda_{1}\neq\lambda_{2}\) 对应的特征向量分别为 \(\mathbf{v}_{1}\in\mathbb{R}^{n}\) 和 \(\mathbf{v}_{2}\in\mathbb{R}^{n}\),则
由于 \(\lambda_{1} \neq \lambda_{2}\),因此 \(\mathbf{v}_{1}^{T}\mathbf{v}_{2} = 0\),
正交对角化#
假设对于 \(n-1\) 阶实对称矩阵,结论成立,则对于 \(n\) 阶实对称矩阵 \(A\),取其某一单位特征向量 \(\mathbf{v}_{1}\),构造正交矩阵 \(V = [\mathbf{v}_{1}\ V_{n-1}]\in\mathbb{R}^{n\times n}\),则
由于矩阵 \(V_{n-1}^{T} A\ V_{n-1}\) 是 \(n-1\) 阶实对称矩阵,因此存在正交矩阵 \(M\in\mathbb{R}^{(n-1)\times (n-1)}\) 将其对角化
因此
其中,\((V\begin{bmatrix} I & \\ & M \end{bmatrix})\in\mathbb{R}^{n\times n}\) 是正交矩阵
由于
代入 \(Q=[\mathbf{q}_{1}\ \mathbf{q}_{2}\ \cdots \mathbf{q}_{n}]\),和 \(\Lambda = \text{diag}(\lambda_{1},\lambda_{2},\cdots,\lambda_{n})\),得到
因此 \(Q\) 的列向量是矩阵 \(A\) 的特征向量,\(\Lambda\) 的对角元素是对应的特征值
非唯一性#
特征值的排序和特征向量的选取会影响 \(Q\) 和 \(\Lambda\) 的取值,因此分解并不唯一
奇异值分解#
对于任意实矩阵 \(A\in\mathbb{R}^{m\times n}\),存在正交矩阵 \(U\in\mathbb{R}^{m\times m},V\in\mathbb{R}^{n\times n}\)和非负对角矩阵 \(\Sigma\in\mathbb{R}^{m\times n}\),使得
奇异值分解将矩阵分解为了旋转-拉缩-旋转的叠加模式
存在性#
由于 \(A^{T}A\) 是半正定对称阵,根据谱分解定理,存在正交矩阵 \(V\) 和非负对角阵 \(\Lambda\), 使得
其中
且 \(\lambda_{1}\geq\lambda_{2}\geq\cdots\geq\lambda_{n}\),设前 \(r(\leq\min(m,n))\) 个为非零值。记 \(\sigma_{i} = \sqrt{\lambda_{i}},i=1:r\),定义向量
有
将 \(\{\mathbf{u}_{i}\}\) 扩展为 \(\mathbb{R}^{m}\) 下的标准正交基,形成正交矩阵
由于 \((AV)^{T}(AV) = \Lambda\),对于 \(i>r\),此时 \(\lambda_{i} = 0\),因此 \(A\mathbf{v} = \mathbf{0}\),
其中,\(\Sigma\in\mathbb{R}^{m\times n}\),其中,对角元素称为矩阵 \(A\) 的奇异值(非零元素为 \(\sigma_{i}\))
极分解#
任意实矩阵 \(A\in\mathbb{R}^{n\times n}\) 可以分解为正交矩阵与对称半正定阵的乘积
其中
\(R\) 是正交矩阵,表示刚体旋转或反射
\(U,V\) 是对称半正定阵,表示拉伸或缩放
当 \(A\) 是可逆时,分解是唯一的,且 \(U,V\) 是对称正定阵
存在性#
根据矩阵的奇异值分解,存在正交矩阵 \(Q,P\) 和正对角阵 \(\Sigma\)(奇异值 \(\geq0\)) 使得
于是,令
于是 \(R\) 是正交矩阵,\(U,V\) 是对称半正定阵
当 \(A\) 可逆时,\(\Sigma\) 的对角元素(\(A\) 的奇异值)均为正,因此 \(U,V\) 是对称正定阵
唯一性#
当 \(A\) 可逆,若存在正交矩阵 \(R_{1},R_{2}\) 和对称正定阵 \(U_{1},U_{2}\) 满足
则
接下来证明 \(U_{1} = U_{2}\),由于 \(U_{1}^{2} = U_{2}^{2}\) 且均为对称正定阵(特征值 \(>0\)),因此 \(U_{1}\) 和 \(U_{2}\) 拥有相同的特征值,设分别存在正交矩阵 \(P\) 和 \(Q\) 使得
由 \(U_{1}^{2} = U_{2}^{2} \),得
由于 \(\Lambda^2\) 与 \(\Lambda\) 具有一致的矩阵结构,因此必然有 \(QP^{T}\Lambda = \Lambda QP^{T}\),于是
由于 \(U_{1},U_{2}\) 可逆,因此 \(R_{1}=R_{2}\)