変換行列 - Wikiwand

線形代数において、線形変換は行列で表すことができる。 $T$ が $\mathbb {R} ^{n}$ から $\mathbb {R} ^{m}$ への写像を行う線形変換であり、 $\mathbf {x}$ がn個の要素を持つ列ベクトルであるとき、以下の式のような $m\times n$ の行列 $A$ が存在し、 $T$ の変換行列（へんかんぎょうれつ、Transformation matrix）と呼ばれる^[1]。 $T(\mathbf {x} )=A\mathbf {x}$ $A$ は $m$ 行と $n$ 列を持つのに対し、変換行列 $T$ は $\mathbb {R} ^{n}$ から $\mathbb {R} ^{m}$ への変換であることに注意。行ベクトルを対象とする変換行列の表現もあり、この表記を好む者もいる^[2]^[3]。

この項目「変換行列」は翻訳されたばかりのものです。不自然あるいは曖昧な表現などが含まれる可能性があり、このままでは読みづらいかもしれません。（原文：:en:Transformation matrix 21:08, 14 April 2025版）
修正、加筆に協力し、現在の表現をより自然な表現にして下さる方を求めています。ノートページや履歴も参照してください。（2025年5月）

Remove ads

使用

行列を用いることで、任意の線形変換を計算に適した一貫した形式で表示することができる^[1]。これにより、変換を（行列の乗算により）容易に合成することもできる。

行列によって表現することができるのは線形変換だけではない。n次元のユークリッド空間Rⁿにおける非線形な変換の一部は、(n+1)次元空間Rⁿ⁺¹における線形変換として表現することができる。これにはアフィン変換（平行移動など）及び射影変換が含まれる。そのため、4×4の変換行列は3次元コンピュータグラフィックスで広く用いられている。この(n+1)次元の変換行列は用途に応じて「アフィン変換行列」、「射影変換行列」またはより一般的に「非線形変換行列」と呼ばれる。n次元の行列に関して、(n+1)次元の行列は拡大行列と説明することができる。

物理科学において、能動変換(en:active transformation)は、系の物理的な位置を実際に変化させる変換であり、座標系が存在しない場合にも意味を持つ。一方で、受動変換(en:passive transformation)は、物理系の座標記述における変化（基底変換）である。能動変換と受動変換との区別は重要である。数学者は通常「変換」という場合にはそれは能動変換を指すが、物理学者の場合はどちらも指す場合がある。

言い換えると、「受動的な」変換は同じ物体を2つの異なる座標系から見た場合の記述である。

Remove ads

変換行列の見つけ方

要約

視点

線形変換 $T(x)$ が関数形式で与えられている場合、標準基底の各ベクトルをTで変換し、その結果を行列の列に挿入することで変換行列Tを簡単に決定することができる。言い換えると以下のように表すことができる。 $A={\begin{bmatrix}T(\mathbf {e} _{1})&T(\mathbf {e} _{2})&\cdots &T(\mathbf {e} _{n})\end{bmatrix}}$

例えば、関数 $T(x)=5x$ は線形変換である。上記の過程を適用すると（n = 2とする）、次のようになる。 $T(\mathbf {x} )=5\mathbf {x} =5I\mathbf {x} ={\begin{bmatrix}5&0\\0&5\end{bmatrix}}\mathbf {x}$

ベクトルと作用素の行列表現は選択した基底により異なる。基底を変えても相似した行列が得られる。ただし、成分を求める方法は変わらない。

詳しく言うと、ベクトル $\mathbf {v}$ は、基底ベクトル $E={\begin{bmatrix}\mathbf {e} _{1}&\mathbf {e} _{2}&\cdots &\mathbf {e} _{n}\end{bmatrix}}$ において、座標 $[\mathbf {v} ]_{E}={\begin{bmatrix}v_{1}&v_{2}&\cdots &v_{n}\end{bmatrix}}^{\mathrm {T} }$ によって以下のように表現することができる。 $\mathbf {v} =v_{1}\mathbf {e} _{1}+v_{2}\mathbf {e} _{2}+\cdots +v_{n}\mathbf {e} _{n}=\sum _{i}v_{i}\mathbf {e} _{i}=E[\mathbf {v} ]_{E}$

ここで、与えられた基底における $\mathbf {v}$ への変換行列Aの結果を次のように表す。 ${\begin{aligned}A(\mathbf {v} )&=A\left(\sum _{i}v_{i}\mathbf {e} _{i}\right)=\sum _{i}{v_{i}A(\mathbf {e} _{i})}\\&={\begin{bmatrix}A(\mathbf {e} _{1})&A(\mathbf {e} _{2})&\cdots &A(\mathbf {e} _{n})\end{bmatrix}}[\mathbf {v} ]_{E}=A\cdot [\mathbf {v} ]_{E}\\[3pt]&={\begin{bmatrix}\mathbf {e} _{1}&\mathbf {e} _{2}&\cdots &\mathbf {e} _{n}\end{bmatrix}}{\begin{bmatrix}a_{1,1}&a_{1,2}&\cdots &a_{1,n}\\a_{2,1}&a_{2,2}&\cdots &a_{2,n}\\\vdots &\vdots &\ddots &\vdots \\a_{n,1}&a_{n,2}&\cdots &a_{n,n}\\\end{bmatrix}}{\begin{bmatrix}v_{1}\\v_{2}\\\vdots \\v_{n}\end{bmatrix}}\end{aligned}}$

行列Aの要素 $a_{i,j}$ は、与えられた基底Eに対してAを全ての $\mathbf {e} _{j}={\begin{bmatrix}0&0&\cdots &(v_{j}=1)&\cdots &0\end{bmatrix}}^{\mathrm {T} }$ に適用し、応答ベクトルを観察することで決定される。 $A\mathbf {e} _{j}=a_{1,j}\mathbf {e} _{1}+a_{2,j}\mathbf {e} _{2}+\cdots +a_{n,j}\mathbf {e} _{n}=\sum _{i}a_{i,j}\mathbf {e} _{i}$

この式は行列Aのj番目の列の要素である $a_{i,j}$ を定義する^[4]。

固有基底と対角行列

→詳細は「対角行列」および「固有値と固有ベクトル」を参照

成分が対角行列を形成し、その結果として乗算の計算量が $n$ に減少するような作用素には特別な基底がある。対角行列とは、係数 $a_{i,j}$ のうち $a_{i,i}$ 以外が全てゼロであり、上記の和 ${\textstyle \sum a_{i,j}\mathbf {e} _{i}}$ において1つの項しか残らないことを意味する。残った対角要素 $a_{i,i}$ は固有値として知られており、簡約化された定義式 $A\mathbf {e} _{i}=\lambda _{i}\mathbf {e} _{i}$ において $\lambda _{i}$ と表される。この式は固有値方程式として知られる^[5]。固有ベクトルと固有値は、特性多項式を介して導出される。

対角化により、固有基底との相互変換がしばしば可能となる。

Remove ads

2次元における例

要約

視点

原点を固定したほとんどの一般的な幾何学的変換は線形であり、回転、拡大縮小、せん断、鏡映、正射影などが含まれる。アフィン変換が純粋な平行移動でない場合は不動な点が存在し、その点を原点と選択することで変換を線形化することができる。2次元では、線形変換は2×2の変換行列を用いて表すことができる。

伸張

xy平面における伸張(stretch)は、特定の方向への距離を定数倍して拡大し、その垂直方向には影響を与えない線形変換である。ここではx軸とy軸に沿った伸縮のみを考慮する。x軸に沿った伸張は、ある正の定数kに対して $x' = kx$ ; $y' = y$ という形をとる（ $k > 1$ の場合、実際に「伸張」であるが $k < 1$ は厳密には「圧縮」である。しかしこの場合も同様に伸張と呼ぶ。また、 $k = 1$ の場合、この変換は恒等変換、つまり何の影響も与えない）。

x軸に沿って係数kにより引き伸ばす行列は次のように与えられる。 ${\begin{bmatrix}k&0\\0&1\end{bmatrix}}$

同様に、y軸に沿って係数kにより引き伸ばすと $x' = x$ ; $y' = ky$ という形になるため、この変換に関連する行列は次のようになる。 ${\begin{bmatrix}1&0\\0&k\end{bmatrix}}$

圧搾

上記伸長を2つ逆数値で組み合わせると、変換行列は圧搾写像（英語版）を表す。 ${\begin{bmatrix}k&0\\0&1/k\end{bmatrix}}.$ 軸に平行な辺を持つ正方形は、正方形と同じ面積を持つ長方形に変換される。二軸が相互に伸縮しても面積は変化しない。

回転

原点周りに反時計回り（正方向）に角度θだけ回転する場合の関数形式は $x'=x\cos \theta -y\sin \theta$ と $y'=x\sin \theta +y\cos \theta$ である。行列の形で書くと、以下のようになる^[6]。 ${\begin{bmatrix}x'\\y'\end{bmatrix}}={\begin{bmatrix}\cos \theta &-\sin \theta \\\sin \theta &\cos \theta \end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}$

同様に、原点周りに時計回り（負方向）する場合の関数形式は $x'=x\cos \theta +y\sin \theta$ と $y'=-x\sin \theta +y\cos \theta$ である。行列の形は以下のようになる。 ${\begin{bmatrix}x'\\y'\end{bmatrix}}={\begin{bmatrix}\cos \theta &\sin \theta \\-\sin \theta &\cos \theta \end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}$

これらの式は、x軸が右向き、y軸が上向きであることを前提としている。

せん断

せん断写像（視覚的には傾斜に似る）の場合、2つの行列が考えられる。

x軸に平行なせん断は、 $x'=x+ky$ と $y'=y$ という関数形式をとり、行列の形では以下のように書ける。 ${\begin{bmatrix}x'\\y'\end{bmatrix}}={\begin{bmatrix}1&k\\0&1\end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}$

y軸に平行なせん断は、 $x'=x$ と $y'=y+kx$ という関数形式をとり、行列の形では以下のように書ける。 ${\begin{bmatrix}x'\\y'\end{bmatrix}}={\begin{bmatrix}1&0\\k&1\end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}$

鏡映

→詳細は「ハウスホルダー変換」を参照

原点を通る直線の鏡映では、直線方向のベクトルを $\mathbf {l} =(l_{x},l_{y})$ とすると、変換行列は以下のようになる。 $\mathbf {A} ={\frac {1}{\lVert \mathbf {l} \rVert ^{2}}}{\begin{bmatrix}l_{x}^{2}-l_{y}^{2}&2l_{x}l_{y}\\2l_{x}l_{y}&l_{y}^{2}-l_{x}^{2}\end{bmatrix}}$

正射影

→詳細は「射影作用素」を参照

ベクトルを原点を通る直線に正射影するには、直線方向のベクトルを $\mathbf {u} =(u_{x},u_{y})$ とすると、変換行列は次のようになる。 $\mathbf {A} ={\frac {1}{\lVert \mathbf {u} \rVert ^{2}}}{\begin{bmatrix}u_{x}^{2}&u_{x}u_{y}\\u_{x}u_{y}&u_{y}^{2}\end{bmatrix}}$

鏡映と同様に、原点を通らない直線への正射影は線形変換ではなくアフィン変換である。

平行射影も線形変換であり、単純に行列で表すことができる。しかし、透視投影は線形変換ではなく、行列で表すには同次座標（英語版）を使用することができる。

Remove ads

3次元コンピュータグラフィックスにおける使用

要約

視点

回転

単位ベクトル(x,y,z)により定義される任意の軸周りの角度θの回転行列は以下で与えられる^[7]。 ${\begin{bmatrix}xx(1-\cos \theta )+\cos \theta &yx(1-\cos \theta )-z\sin \theta &zx(1-\cos \theta )+y\sin \theta \\xy(1-\cos \theta )+z\sin \theta &yy(1-\cos \theta )+\cos \theta &zy(1-\cos \theta )-x\sin \theta \\xz(1-\cos \theta )-y\sin \theta &yz(1-\cos \theta )+x\sin \theta &zz(1-\cos \theta )+\cos \theta \end{bmatrix}}$

鏡映

→詳細は「ハウスホルダー変換」を参照

ある点を平面 $ax+by+cz=0$ （原点を通る）に関して鏡映させるために、 $\mathbf {A} =\mathbf {I} -2\mathbf {NN} ^{\mathrm {T} }$ を用いることができる。ここで $\mathbf {I}$ は3×3の単位行列で $\mathbf {N}$ は平面の法線ベクトルとなる3次元単位ベクトルである。a, b, cのL²ノルムが1の場合、変換行列は次のように表すことができる $\mathbf {A} ={\begin{bmatrix}1-2a^{2}&-2ab&-2ac\\-2ab&1-2b^{2}&-2bc\\-2ac&-2bc&1-2c^{2}\end{bmatrix}}$

これらは2次元及び3次元におけるハウスホルダー鏡映の特殊なケースである。原点を通らない直線又は平面に関する鏡映は線形変換ではなく、アフィン変換である。4×4のアフィン変換行列は次のように表すことができる（法線が単位ベクトルであると仮定）。 ${\begin{bmatrix}x'\\y'\\z'\\1\end{bmatrix}}={\begin{bmatrix}1-2a^{2}&-2ab&-2ac&-2ad\\-2ab&1-2b^{2}&-2bc&-2bd\\-2ac&-2bc&1-2c^{2}&-2cd\\0&0&0&1\end{bmatrix}}{\begin{bmatrix}x\\y\\z\\1\end{bmatrix}}$ ここでdは、平面上のある点 $\mathbf {p}$ に対して $d=-\mathbf {p} \cdot \mathbf {N}$ 、または等価な式 $ax+by+cz+d=0$ を満たす。

ベクトルの4番目の成分が1ではなく0である場合、ベクトルの方向のみが鏡映され大きさは変化しない。これは、元の鏡映面と平行で原点を通る平面によって鏡映されたかのように見える。このことは位置ベクトルと法線ベクトルの両方を同じ行列で変換することができる点で便利な性質である。後段のアフィン変換も参照のこと。

Remove ads

変換の合成と逆変換

線形変換を表現するために行列を用いる主な理由の1つは、変換の合成や逆変換が容易になることである。

合成は行列の乗算により行われる。

AとBが2つの線形変換の行列であり、列ベクトル $\mathbf {x}$ に最初にAを適用しその後Bを適用することは以下の式で与えられる。 $\mathbf {B} (\mathbf {A} \mathbf {x} )=(\mathbf {BA} )\mathbf {x} .$

言い換えると、変換Aと変換Bを続けて行う変換の行列は、単に各々の行列の積である。

Aが可逆行列であるとき、Aとの合成が単位行列になりAを「元に戻す」変換を表す行列A⁻¹が存在する。実用的な応用の中には、一般的な逆行列アルゴリズムを用いたり、逆演算（逆方向への回転など幾何学的な解釈が明らかなもの）を実行することで逆行列を計算する方法がある。変換が複数の合成である場合は、逆行列を逆順に合成する必要がある。鏡映行列はそれ自体の逆行列であるため、別途計算する必要がない。

Remove ads

他の種類の変換

要約

視点

アフィン変換

2次元平面上のアフィン変換は3次元でも実行できる。平行移動はxy平面に平行にせん断することで行われ、回転はz軸を中心に行われる。

アフィン変換を行列で表すには同次座標（英語版）を使用することができる。これは、2次元ベクトル (x, y) を3次元ベクトル (x, y, 1)として表すことを意味し、より高次元の場合も同様である。これにより並進を行列の乗算で表すことができる。関数形式は $x'=x+t_{x};y'=y+t_{y}$ であり、行列は以下のように表される。 ${\begin{bmatrix}x'\\y'\\1\end{bmatrix}}={\begin{bmatrix}1&0&t_{x}\\0&1&t_{y}\\0&0&1\end{bmatrix}}{\begin{bmatrix}x\\y\\1\end{bmatrix}}$

通常の線形変換は全てアフィン変換の集合に含まれており、アフィン変換の簡略化された形式として記述できる。したがって、任意の線形変換は一般化された変換行列によっても表すことができる。アフィン変換の変換行列は対応する線形変換行列を1行1列拡張して右下隅の要素を1に、他の要素を0にすることで得られる。例えば上記の反時計回りの回転行列は次のようになる。 ${\begin{bmatrix}\cos \theta &-\sin \theta &0\\\sin \theta &\cos \theta &0\\0&0&1\end{bmatrix}}$

同次座標を含む変換行列を用いると、平行移動は線形となり他のあらゆる種類の変換とシームレスに混在させることができる。これは、実平面が実射影空間の $w = 1$ 平面に写像されるため、実ユークリッド空間における平行移動は実射影空間におけるせん断として表すことができるためである。平行移動は直交座標で記述される2次元又は3次元ユークリッド空間では非線形変換である（つまり、可換性やその他の特性を維持しながら他の変換と組み合わせることはできない）が、同次座標で記述される3次元又は4次元射影空間では単純な線形変換（せん断）になる。

2つ以上のアフィン変換を合成することで、より多くのアフィン変換が得られる。例えば、ベクトル $(t'_{x},t'_{y})$ の平行移動 T'、反時計回りの角度θの回転R、要素 $(s_{x},s_{y})$ の拡大縮小S、 $(t_{x},t_{y}),$ の平行移動Tが与えられるとき、それらを合成したT'RSTの変換行列は以下のようになる^[8]。 ${\begin{bmatrix}s_{x}\cos \theta &-s_{y}\sin \theta &t_{x}s_{x}\cos \theta -t_{y}s_{y}\sin \theta +t'_{x}\\s_{x}\sin \theta &s_{y}\cos \theta &t_{x}s_{x}\sin \theta +t_{y}s_{y}\cos \theta +t'_{y}\\0&0&1\end{bmatrix}}$

アフィン変換を用いると、座標ベクトルの同次成分（通常はwと呼ばれる）は変化しない。したがって、常に1であると仮定して無視しても問題ない。しかし、透視投影を用いる場合は異なる。

透視投影

→詳細は「透視投影」を参照

→詳細は「ピンホールカメラモデル」を参照

3次元コンピュータグラフィックスにおいて重要なもう1つの変換は透視投影である。平行投影は点を平行線に沿って画像平面に投影するために使用されるが、透視投影は投影中心と呼ばれる単一の点から発せられる線に沿って画像平面に点を投影する。このことは物体が投影中心から遠いほど投影範囲が小さくなり、近いほど投影範囲が大きくなることを意味する。

最も単純な透視投影では、原点を投影の中心として $z=1$ の平面を像平面とする。すると、この変換の関数形式は $x'=x/z$ ; $y'=y/z$ となる。これを同次座標で表すと次のようになる。 ${\begin{bmatrix}x_{c}\\y_{c}\\z_{c}\\w_{c}\end{bmatrix}}={\begin{bmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&1&0\end{bmatrix}}{\begin{bmatrix}x\\y\\z\\1\end{bmatrix}}={\begin{bmatrix}x\\y\\z\\z\end{bmatrix}}$

行列の乗算を行うと、同次成分 $w_{c}$ は $z$ の値と等しくなり、他の3つは変化しない。したがって、実平面に写像し直すには各成分を $w_{c}$ により割る同次除算(homogeneous divide)または透視除算(perspective divide)を実行する必要がある。 ${\begin{bmatrix}x'\\y'\\z'\\1\end{bmatrix}}={\frac {1}{w_{c}}}{\begin{bmatrix}x_{c}\\y_{c}\\z_{c}\\w_{c}\end{bmatrix}}={\begin{bmatrix}x/z\\y/z\\1\\1\end{bmatrix}}$

これを回転、拡大縮小、平行移動およびせん断と組み合わせて像平面と投影中心を任意の場所に移動することで、より複雑な透視投影を作成できる。

Remove ads

出典

Loading content...

外部リンク

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads