0%

四元数与三维旋转

在三维空间中描述旋转是一件挺麻烦的事。常用的欧拉角虽然直观简单,但是存在顺序依赖万向节死锁的问题,在通用的旋转运算上并不可行。进而引入的四维数虽然在运算上很有效,但是对于第一次见到的人来说一点也不算直观、易懂。

Krasjet的文章从二维复数出发,进而理解三维四元数的表示意义,循序渐进,通俗易懂,因此记录一下学习笔记。

复数与2D旋转

复数的定义和运算性质不再赘述。对于$ z = a + bi $,相当于对复数基底 $ (1,i) $ 的线性组合,因此可以表示为一个列向量 \(z=[a,b]^T\),但更进一步,其实我们能把复数表示为矩阵。

对于两个复数\(z_1 = a + bi , z_2=c + di\),可以得到观察一下其乘法结果:

\[ \begin{aligned} z_1z_2&=a \boldsymbol{c} -b \boldsymbol{d} \\ &+(b \boldsymbol{c}+a \boldsymbol{d})i \\ &=\left[\begin{array}{cc} a & -b \\ b & a \end{array}\right]\left[\begin{array}{l} c \\ d \end{array}\right] \end{aligned} \]

我们知道右边的\([c,d]^T\)\(z_2\)的列向量表示形式,而左边的矩阵,也只和\(z_1\)的系数有关,因此也可以看做是\(z_1=a+bi\)的矩阵表示。我们不妨尝试将两边都写成矩阵形式:

\[ z_1z_2=\left[\begin{array}{cc} a & -b \\ b & a \end{array}\right] \left[\begin{array}{l} c & -d\\ d & c \end{array}\right] =\left[\begin{array}{cc} ac-bd & -(bc+ad) \\ bc+ad & ac-bd \end{array}\right] =ac-bd + (bc+ad)i \]

上式可以看出\(z_1,z_2,z_1z_2\)在矩阵表示下也同样满足复数基本运算。这时我们可以发现一个神奇的现象:复数可以表示为矩阵,复数乘法可以表示为矩阵乘法,而矩阵乘法进而可以让我们联想到矩阵表示的仿射变换:

\[ z=\left[\begin{array}{cc} a & -b \\ b & a \end{array}\right] =\sqrt{a^2+b^2} \left[\begin{array}{cc} \frac{a}{\sqrt{a^2+b^2}} & \frac{-b}{\sqrt{a^2+b^2}} \\ \frac{b}{\sqrt{a^2+b^2}} & \frac{a}{\sqrt{a^2+b^2}} \end{array}\right] \]

这种式子是不是很眼熟——即以a,b为边的三角变换式:

\[ z=\sqrt{a^2+b^2}\left[\begin{array}{cc} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{array}\right] =\left[\begin{array}{cc} ||z|| & 0 \\ 0 & ||z|| \end{array}\right] \left[\begin{array}{cc} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{array}\right] \]

此时复数\(z=a+bi=||z||(cos\theta+sin\theta i)\)表示的二维变换水落石出,左边的矩阵是一个 等比放缩矩阵,右边的矩阵是一个 旋转矩阵复数乘法,即是两个变换矩阵的作用。

并且再将复数的三角形式代回\(z_1z_2\)可知,\(z_1z_2=cos(\theta+\alpha)+sin(\theta+\alpha) i\) ,即复数的累乘,在变换上体现为旋转角度的累加\(\theta+\alpha\),以及缩放上的累乘。

三维旋转

三维旋转描述起来比二维旋转更弯弯绕绕一些,但其实理解起来也不难。

要旋转\(\theta\)角,三维向量\(v\)首先得确定一个三维的旋转轴心\(u\),并且通过投影分解成垂直平面的二维旋转

  • \(v\)\(u\)构成的平面\(\alpha\):在这个平面上不进行任何旋转,因为这个平面的旋转是靠近或远离\(u\)的旋转,而这不符合我们以\(u\)为旋转轴的初心。
  • 垂直于\(\alpha\)的平面\(\beta\):在这个平面上\(u\)为圆心旋转\(\theta\)

因此简单计算可得任意轴旋转公式为:

\[ \begin{aligned} v^`&=\mathbf{v}_{\|}+\cos (\theta) \mathbf{v}_{\perp}+\sin (\theta)\left(\mathbf{u} \times \mathbf{v}_{\perp}\right) \\ &=cos\theta v + (1-cos\theta)(uv)u + sin\theta (u \times v) \end{aligned} \]

\(v_{\|}=cos\theta v\)\(v\)\(u\)上的投影向量,其不参与旋转。后面一大串即垂直平面上\(v_{\perp}\)的二维旋转,具体推导细节可参考Krasjet的文章第2节

四元数与三维旋转

四元数基本性质:

\[ \begin{aligned} q&=a+bi+cj+dk \\ i^2&=j^2=k^2=ijk=-1 \\ ij&=k, jk=i, ki=j \\ qq^{-1}&=1 \end{aligned} \]

同样我们可以写成向量形式:\(q=[a,b,c,d]^T\)。将实部和虚部分离,可以写为:

\[ q=\left[\begin{array}{cc} a \\ \boldsymbol{u} \end{array}\right] , (\boldsymbol{u}=[x,y,z]^T) \]

那么我们可以找到四元数的矩阵形式吗?同样通过\(q_1q_2\)来尝试一下:

\[ \begin{aligned} q_{1} q_{2}=& a e+a f i+a g j+a h k+\\ & b e i-b f+b g k-b h j+\\ & c e j-c f k-c g+c h i+\\ & d e k+d f j-d g i-d h \\ =&(a e-b f-c g-d h)+\\ &(b e+a f-d g+c h) i+\\ &(c e+d f+a g-b h) j+\\ &(d e-c f+b g+a h) k \\ =&\left[\begin{array}{cccc} a & -b & -c & -d \\ b & a & -d & c \\ c & d & a & -b \\ d & -c & b & a \end{array}\right]\left[\begin{array}{l} e \\ f \\ g \\ h \end{array}\right] \end{aligned} \]

可以发现\(q_1\)表现为这样的矩阵对我们帮助不大。一方面由于四元数乘法不满足交换律,\(q_1\)用来左乘和右乘时的矩阵并不一样。另一方面,这样的矩阵晦涩抽象,难以整理出相关三维联系。

因此借鉴之前实部与虚部分离的整理方式,可以写出\(q_1q_2=[a,\boldsymbol{u}] \cdot [e,\boldsymbol{v}]\)简化版本:

\[ q_1q_2=[ae-\boldsymbol u \boldsymbol v, a\boldsymbol v+e\boldsymbol u+\boldsymbol u \times \boldsymbol v] \\ \]

从中可以推导出一个有用的共轭性质:\(qq^*=[a,\boldsymbol{u}][a,\boldsymbol{-u}]=[a^2+\|v\|^2,0]\)

再回想\(\boldsymbol{v}\)的旋转公式,可以发现形式有点相似了:

\[ v^`=\mathbf{v}_{\|}+\cos (\theta) \mathbf{v}_{\perp}+\sin (\theta)\left(\mathbf{u} \times \mathbf{v}_{\perp}\right) \]

此时不如尝试用四元数替换掉旋转公式里的三维向量,令\(\dot v=[0,\boldsymbol v],\dot u=[0,\boldsymbol u],\dot v_\|,\dot v_\perp\)等同理。这样一来,旋转公式中\(v_\|,v_\perp\)可以直接替换成四元数\(\dot v_\|,\dot v_\perp\),但是\(\mathbf{u} \times \mathbf{v}_{\perp}\)还不行。

\([0,v],[0,u]\)中的向量即三维空间中的旋转向量\(v\)和旋转轴向量\(u\)

再看四元数乘积公式\(q_1q_2=[ae-\boldsymbol v \boldsymbol u, a\boldsymbol u+e\boldsymbol v+\boldsymbol u \times \boldsymbol v]\)\(a,e\)是两个四元数的实部,而在我们的替换中,所有的实部都为0,此时四元数乘积为\(q_1q_2=[0,\boldsymbol u \times \boldsymbol v]\)。因此我们可以用四元数\(\dot u \dot v_\perp=[0,\boldsymbol u \times \boldsymbol v_\perp]\) 来替换 \(\mathbf{u} \times \mathbf{v}_{\perp}\)

至此,可以得到四元数版本的旋转公式:

\[ \begin{aligned} \dot v^`&=\dot{v_{\|}}+\cos (\theta) \dot{v_{\perp}}+\sin (\theta)\left(\dot u \dot v_\perp\right) \\ &= \dot{v_{\|}}+(\cos (\theta) +\sin (\theta)\dot u) \dot v_\perp \\ &= \dot{v_{\|}} + \dot q \dot v_\perp, \ \ \ \ \ where \ \ \dot q=[cos\theta,0]+[0,sin\theta u]=\cos (\theta) +\sin (\theta)\dot u \end{aligned} \]

最终,我们实现通过一个额外的四元数\(\dot q=[\cos (\theta),\sin (\theta) \boldsymbol{u}]\),即可表示\(v\)绕任意轴\(u\)的旋转\(\theta\)角。反过来,给定一个四元数,我们也可以很轻易地从实部得到其代表的旋转角度\(\theta\),从虚部得到其代表的旋转轴\(\boldsymbol{u}\)

代码小提示:可以发现,四元数的x,y,z,w属性并不直接代表旋转角度,因此不能在旋转时直接修改四元数的属性。当然,也不能先转成欧拉角——修改——再存回四元数,这样就失去了四元数的意义。通常,我们构造一个表示旋转变换的四元数,然后与原来的角度相乘,即可完成旋转。

根据四元数运算可以将旋转 \(\theta\) 角进一步化简为:

\[ \begin{aligned} \dot v^`&=\dot p \dot v \dot p^* , \ \ \ where \ \ \ \ \dot p=[cos\frac{\theta}{2},sin\frac{\theta}{2} \boldsymbol{u}] \\ &= [0, \cos (\theta) \mathbf{v}+(1-\cos (\theta))(\mathbf{u} \cdot \mathbf{v}) \mathbf{u}+\sin (\theta)(\mathbf{u} \times \mathbf{v})] \end{aligned} \]

而这种表示形式下也可以很方便地进行旋转的复合:

\[ v^`=\dot p_2 ( \dot p_1 v \dot p_1^* ) \dot p_2^* \]

当然,在已知最终变换\(p=p_2p_1\)和初始变换\(p_1\)的情况下,我们可能要求解中间变换\(p_2\),此时:

\[ \begin{aligned} p_2p_1&=p \\ p_2p_1p_1^{-1} &=p p_1^{-1} \\ p_2 &= pp_1^{-1} \\ p_2 &=pp_1^* \end{aligned} \]

默认所有变换向量都是单位向量,因此变换四元数都是单位四元数,有\(p^{-1}=p^*\)

更进一步,多次求解中间变换即可实现高阶变换插值。