初級Mathマニアの寝言

数学は色々なところで応用可能であり、多くの人が数学の抽象的な概念の意味や意義を鮮明に知ることができれば今まで以上に面白い物や仕組みが生まれるかもしれません。このブログは数学を専門にしない人のために抽象的な概念の意味や意義を分かりやすく説明することを目的としています。数学を使って何かしたい人のお役に立てたら幸いです。

可制御性グラミアンと可観測性グラミアン

対象とする線形システム

f:id:ogyahogya:20170630161131p:plain

の可制御性と可観測性の定義は

ogyahogya.hatenablog.com

で紹介しましたが、この記事では可制御性と可観測性の「大きさ」を定量的に測る手段を紹介します。線形システムについては

ogyahogya.hatenablog.com

で紹介しています。この記事の中では行列 A を安定、つまり、 A のすべての固有値の実部は負であると仮定します。

入力エネルギー最小化問題

まず、線形写像 \Psi_c: L^2(-\infty,0] \rightarrow {\bf R}^n

f:id:ogyahogya:20170630161918p:plain

と定義します。ここで、 L^2(-\infty,0] は区間 (-\infty,0] 上で定義された2乗可積分な関数全体の線形空間です。このような空間については、

ogyahogya.hatenablog.com

でも紹介しています。この \Psi_c(u) は無限の過去 t=-\infty に状態が0であるときの現在 t=0の状態 x(0) を表していると解釈できます。実際に、 \lim_{t\rightarrow -\infty} x(t) =0 とすると、行列 A が安定なので、\begin{align}
x(0) &= \lim_{t_0\rightarrow -\infty}\left(e^{-At_0}x(t_0)\right) + \int_{-\infty}^0 e^{A(0-t)}Bu(t)dt\\&=\int_{-\infty}^0 e^{-At}Bu(t)dt = \Psi_c(u)
\end{align}となるからです。

 v_1, v_2\in L^2(-\infty,0] とするとき、 \langle v_1, v_2 \rangle_2:= \int_{-\infty}^0 v_1^T(t) v_2(t) dt によって \langle \cdot, \cdot \rangle_2 を定義し、 ||v_1||_2:=\sqrt{\langle v_1, v_1 \rangle_2} によって ||\cdot ||_2 を定義します。

このとき、次の入力エネルギー最小化問題を考えます。

f:id:ogyahogya:20170630164230p:plain

ただし、 ||\cdot|| はユークリッドノルムを表します。この問題は、「状態を原点から単位球面上に到達させることが可能な2乗可積分な入力の中で、エネルギーが最小になるものを求めよ。」ということを意味しています。

可制御性グラミアン

上の入力エネルギー最小化問題と次の可制御性グラミアン

f:id:ogyahogya:20170703161119p:plain

 は密接な関係があります。ここでは、その関係を見るための準備をします。

線形作用素 \Psi_c と行列 W_c の間には次の関係が成り立ちます。

f:id:ogyahogya:20170703161504p:plain

ここで、 \Psi_c^* \Psi_c共役作用素です。共役作用素はこちらで説明しましたので、興味がありましたら参照してください。

ogyahogya.hatenablog.com

上の関係が成り立つことは次のように確認できます。

f:id:ogyahogya:20170703163148p:plain

f:id:ogyahogya:20170703163648p:plain

任意の \xi\in {\bf R}^n に対して、上記の式が成り立つことから W_c=\Psi_c\Psi_c^* が成り立つことが証明できました。

可制御性グラミアンの表式から W_c は半正定値対称行列だということが分かります。実は、線形システムが可制御であることと、 W_c が正定値対称行列であることは等価です。ここでは簡単のために、線形システムは可制御であるとして話を進めます。

直交射影

 入力エネルギー最小化問題の解と可制御性グラミアンの関係を、すっきりと理解するために、直交射影の概念を紹介します。

f:id:ogyahogya:20170704093559p:plain

直交射影には、次の性質があります。

f:id:ogyahogya:20170704100020p:plain

入力エネルギー最小化問題の解と可制御性グラミアンの関係

入力エネルギー最小化問題の解は、次のように可制御性グラミアン W_c を用いて表現できることが分かります。

f:id:ogyahogya:20170703164814p:plain

実は、ある直交射影 P: L^2(-\infty,0] \rightarrow L^2(-\infty,0] が存在し、(※)を満たす任意の u\in L^2(\infty,0] に対して、 Pu=u_{最適} となって Pu も(※)を満たすことが示せます。直交射影の定義の下で示したように、 ||Pu||_2 \leq ||u||_2 なので、上の主張が成り立つということになります。

そのような直交射影 P

f:id:ogyahogya:20170704101524p:plain

で与えられます。 Pu が(※)を満たすことは、

f:id:ogyahogya:20170704101724p:plain

から分かります。さらに、★が直交射影であることも少し計算すれば示せます。

さらに、入力エネルギーと可制御性グラミアンの間には、次の関係が成り立つことが分かります。

f:id:ogyahogya:20170704102951p:plain

なお、 W_c の逆行列 W_c^{-1} は、線形システムを可制御であると考えているので存在します。

 可制御性グラミアンの幾何学的解釈

ここでは、入力 u\in L^2(-\infty,0] ( ||u||_2\leq 1) で到達可能な状態を可制御性グラミアン W_c を用いて特徴付けます。この特徴付けは次の事実に基づきます。

f:id:ogyahogya:20170704111337p:plain

f:id:ogyahogya:20170704111350p:plain

上で示したことから、入力 u\in L^2(-\infty,0] ( ||u||_2\leq 1) で到達可能な状態は W_c^{1/2} x ( ||x||\leq 1 )だということが分かりました。

以上のことから「可制御性の大きさ」、すなわち、「制御のしやすさ」と可制御性グラミアン W_c の関係を調べることができます。このことを見るために、単位エネルギー ||u||_2= 1 の入力 u\in L^2(-\infty,0] で到達可能な状態の集合は

f:id:ogyahogya:20170704122935p:plain

であることに注意しましょう。今、 W_c^{1/2} の固有値を \lambda_1,\lambda_2,\ldots, \lambda_n、対応する正規直交固有ベクトルを v_1,v_2,\ldots,v_n とすると、

f:id:ogyahogya:20170704123212p:plain

となり、 \mathcal{E}_c は固有ベクトル v_1,v_2,\ldots,v_n の方向を主軸として固有値 \lambda_1,\lambda_2,\ldots,\lambda_n を主値とする楕円であることが分かります。イメージ図は下のような感じです。

f:id:ogyahogya:20170704123700p:plain

つまり、単位エネルギー ||u||_2= 1 の入力 u\in L^2(-\infty,0] で原点から最も遠くまで到達可能な方向が可制御性グラミアン W_c の最大固有値に対応する固有ベクトルの方向で、2番目に遠くまで到達可能な方向が2番目に大きい固有値に対応する固有ベクトルの方向、3番目に・・・ということになります。言い換えると、最も制御しやすい方向が可制御性グラミアン W_c の最大固有値に対応する固有ベクトルの方向で、最も制御しにくい方向が W_c の最小固有値に対応する固有ベクトルの方向だということです。

以上から、線系システムが可制御であっても、制御のしやすい方向としにくい方向があり、それらを定量的に調べるためには可制御性グラミアン W_c の固有値と固有ベクトルを調べれば良いということが分かりました。

可観測性グラミアン

次に、観測のしやすさを定量的に評価する可観測性グラミアンについて説明します。

今、現在の状態 x(0) x_0 とします。このとき、 \Psi_o:{\bf R}^n\rightarrow [0,\infty)

f:id:ogyahogya:20170704142459p:plain

で定義します。線形写像 \Psi_o [0,t] 上で入力を u=0 としたときの線形システムの出力値と関係付きます。なぜなら、 y(t) = C\exp (At) x_0 = \Psi_o x_0 が成り立つからです。可制御性グラミアンの時と同様の計算で、 \Psi_o は可観測性グラミアン

f:id:ogyahogya:20170704142729p:plain

f:id:ogyahogya:20170704142927p:plain

の関係があることが分かります。ここでは、 L^2 [0,\infty) 上に内積を \langle f_1, f_2 \rangle_2 := \int_0^{\infty} f_1(t)^Tf_2(t) dt で定め、ノルムを ||f||_2:= \sqrt{\langle f, f \rangle_2} で定めることにします。すると、出力は y=\Psi_o x_0 のため、出力エネルギーが

f:id:ogyahogya:20170704143554p:plain

と可観測性グラミアン W_0 を用いて表せることが分かります。可制御性グラミアンの時と同様に、可観測性グラミアン W_o を用いて定義された集合

f:id:ogyahogya:20170704143756p:plain

は楕円であり、主軸は W_o の固有ベクトルの方向で、主値は固有値の平方根ということになります。これは球面上の状態 x_0 にも「観測のしやすさ 」があり、可観測性グラミアン W_o の最大固有値に対応する固有ベクトルの方向の状態が最も観測しやすく、最小固有値に対応する固有ベクトルの方向の状態が最も観測しにくいという意味になります。(ここで、観測のしやすさを出力エネルギー ||y||_2^2 の大小で解釈しています。)

参考文献

 記事を書くにあたって次の本を参考にしました。

A Course in Robust Control Theory: A Convex Approach (Texts in Applied Mathematics)

A Course in Robust Control Theory: A Convex Approach (Texts in Applied Mathematics)