初級Mathマニアの寝言

数学は色々なところで応用可能であり、多くの人が数学の抽象的な概念の意味や意義を鮮明に知ることができれば今まで以上に面白い物や仕組みが生まれるかもしれません。このブログは数学を専門にしない人のために抽象的な概念の意味や意義を分かりやすく説明することを目的としています。数学を使って何かしたい人のお役に立てたら幸いです。

可制御可観測な線形システム全体の集合は多様体になる

この記事では、可制御・可観測な線形システム全体の集合は多様体になることを説明します。ここで言う線形システムとは、

で解説した

f:id:ogyahogya:20180511094841p:plain

のことですが、状態方程式表現は行列の三つ組  (A,B,C)\in {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} で決定するので、一つの線形システムは  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の一点である\begin{align} (A,B,C)\end{align}

のことだ考えられます。そうすると、線形システム全体の集合とは\begin{align} {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n}\end{align}

のこととなります。この線形システム全体の集合の中には、

で解説した可制御な線形システムや可観測な線形システムが含まれることになり、上の解説記事を注意深く読むと可制御な線形システム全体の集合とは、 \begin{align} S_c:=\{ (A,B,C)\, |\, {\rm rank} \begin{pmatrix} B & AB & \cdots & A^{n-1}B \end{pmatrix}=n\} \end{align}

のことであり、可観測な線形システム全体の集合とは、 \begin{align} S_o:=\{ (A,B,C)\, |\, {\rm rank} \begin{pmatrix} C \\ CA \\ \vdots \\ CA^{n-1} \end{pmatrix}=n\} \end{align}

のことだということになります。つまり、この記事では、

\begin{align} S_c\cap S_o\end{align}

という可制御可観測な線形システム全体の集合が多様体になるということを説明します。多様体については、

を参照してください。

多様体の開集合は多様体になる。

結論から先に言うと、可制御可観測な線形システム全体の集合  S_c\cap S_o が多様体であることは、  S_c\cap S_o が多様体である  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の開集合であることから分かります。そこで、多様体の開集合は多様体になるという事実を解説しておきます。あとで、  S_c\cap S_o {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の開集合だということを説明します。

そもそも開集合とは何かというと、

で説明したように、位相空間の要素のことでした。位相空間  (X,\mathcal{O}) が与えられると、 X の任意の部分集合  Y に対して、

\begin{align} \mathcal{O}_Y:= \{ U\cap Y\,|\, U\in \mathcal{O} \} \end{align}

とすることで、 \mathcal{O}_Y Y の位相になります。このような  \mathcal{O}_Y X の位相  \mathcal{O} から導かれた  Y相対位相と呼んで、位相空間  (Y,\mathcal{O}_Y) (X,\mathcal{O})部分空間と呼びます。多様体は上のリーマン多様体の記事で定義したように任意の異なる2点を開集合で分離できるという性質を持ったハウスドルフ空間でした。実は、ハウスドルフ空間  X の部分空間  Y もハウスドルフ空間になります。なぜなら、任意の  a, b\in Y,  a\neq b に対して、 X はハウスドルフ空間なので、 a\in U, b\in V, U\cap V=\emptyset となる  X の開集合  U, V が存在して、 U':= U\cap Y, V':=V\cap Y Y の開集合で  a\in U', b\in V', U'\cap V'=\emptyset となるからです。

上のことから、多様体  (X,\mathcal{O}) の開集合  Y \mathcal{O} から導かれた相対位相を導入すると開集合  Y はハウスドルフ空間となります。さらに、多様体  X C^{\infty} 級の座標近傍系が  \{ (U_{\lambda}, \phi_{\lambda})\}_{\lambda\in \Lambda} だとすると、これを  Y に制限した  \{ (U_{\lambda}\cap Y, \phi_{\lambda}|U_{\lambda}\cap Y)\}_{\lambda\in \Lambda} Y C^{\infty} 級の座標近傍系になります。したがって、多様体  X の任意の開集合は  X の位相から導かれた相対位相を導入することで多様体になります

距離空間は位相空間になる

応用上もっとも重要な空間は距離が定められた空間であり、その距離を使って位相を導入できる、つまり、空間の異なる点たちの近さを議論できるようになります。あとで線形システム全体の集合にも距離を導入して位相空間としますので、ここでは簡単に距離空間について説明しときます。

距離空間の定義は以下の通りです。

f:id:ogyahogya:20180513132711p:plain

ベクトル空間にノルムが導入されたノルム空間は距離空間になります。ここで、ノルム空間の定義は以下の通りです。

f:id:ogyahogya:20180513132822p:plain

実際に、ベクトル空間  X にノルム  ||\cdot || が導入されているとすると、 X 上の任意の2点  x,y に対して

\begin{align} d_{\rm norm}(x,y):= ||x-y|| \end{align}

と定めると、 X 上に距離  d_{\rm norm}:X\times X\rightarrow {\bf R} が導入できます。この  d_{\rm norm} をノルム  ||\cdot|| から定められる距離と言います

距離はノルムを使わなくても定義できます。例えば、集合  X の任意の2点  x,y に対して

\begin{align} d(x,y) := \begin{cases} 1\quad (x\neq y\, のとき) \\ 0 \quad (x=y\, のとき) \end{cases} \end{align}

と定めると、 X 上に距離  d が導入できますが、これはあるノルムから定められた距離ではありません。 というのは、ノルムから定められる距離  d_{\rm norm} はノルムの定義の(3)から  d_{\rm norm}(\lambda x, \lambda y) = |\lambda| d_{\rm norm}(x,y) を満たしますが、上の距離  d はこれを満たさないからです。

距離空間  (X,d) に対しては次のように距離  d を用いて位相を導入できます。

f:id:ogyahogya:20180513140632p:plain

f:id:ogyahogya:20180513140643p:plain

f:id:ogyahogya:20180513140820p:plain

工学系の研究論文は、距離空間を扱うことが多く、位相について何も言わなくても暗黙のうちに上の意味での距離  d から定められる位相  \mathcal{O}_d が導入されていることがほとんどです。この記事でも距離空間の位相は上のように距離  d から定義された位相を導入するとします。

線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} は多様体になる

線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} が多様体になることを確認しておきます。

まず、線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n}  は次の和(+)とスカラー倍( \cdot)でベクトル空間になります。

\begin{align}  (A_1,B_1,C_1)+(A_2,B_2,C_2) &:=(A_1+A_2,B_1+B_2,C_1+C_2)  \\  \lambda \cdot (A,B,C)&:= (\lambda A,\lambda B, \lambda C) \end{align}

次に、ベクトル空間である線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} に以下のノルムを導入します。任意の  (A,B,C)\in {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} に対して、

\begin{align} ||(A,B,C)||:= ||A||_F +||B||_F + ||C||_F \end{align}

この  ||\cdot ||_Fフロベニウスノルムと呼ばれており、任意のサイズの行列  M に対して

\begin{align} ||M||_F:= \sqrt{\sum_{i,j} m_{ij}^2} \end{align}

というように各成分の2乗和の平方根で定義され、行列の集合のノルムとしてよく使われています。上で説明したように、線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} には

\begin{align} d( (A_1,B_1,C_1), (A_2,B_2,C_2) ) &:= ||(A_1,B_1,C_1)- (A_2,B_2,C_2)|| \\ &=||A_1-A_2||_F + ||B_1-B_2||_F+||C_1-C_2||_F\end{align}

というように上のノルムを用いて距離が定義できて距離空間となります。したがって、上で説明したように、この距離  d を用いて線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} には位相  \mathcal{O}_d が定義でき位相空間になります。

この位相空間  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} がハウスドルフ空間 (任意の異なる2点が開集合で分離できる位相空間) になることは任意の  p_1:=(A_1,B_1,C_1), p_2:=(A_2,B_2,C_2)\in {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} とすると、 B(p_1; d(p_1,p_2)/2), B(p_2; d(p_1,p_2)/2) \in \mathcal{O}_d

\begin{align} B(p_1; d(p_1,p_2)/2)\cap B(p_2; d(p_1,p_2)/2) =\emptyset \end{align}

となることから分かります。さらに、 {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の座標近傍は {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} 自身と行列の3つ組をベクトル化することと同値な微分同相写像  \psi: {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n}\rightarrow {\bf R}^{n(n+m+p)} の組だけの集合  \{({\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n}, \psi)\} であり、これは  C^{\infty} 級の座標近傍系なので線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} は多様体になります。

可制御可観測な線形システム全体の集合  S_c\cap S_o は多様体になる

可制御可観測な線形システム全体の集合  S_c\cap S_o が多様体になることは  S_c S_o が線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の開集合であることから従います。なぜなら、 S_c S_o が多様体  {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n} の開集合なら位相空間の定義から  S_c\cap S_o も開集合となり、多様体の開集合は上で説明したように多様体になるからです。

可制御な線形システム全体の集合  S_c が開集合であることを示します。可観測な線形システム全体の集合  S_o が開集合であることも同様に示せます。 S_c が開集合であるとは、任意の  (A,B,C)\in S_c とすると、ある \delta > 0 が存在して、

\begin{align} B( (A,B,C); \delta ) \subset S_c \end{align}

となることを意味しているので、これを示します。 (A,B,C)\in S_c だとすると

\begin{align} \begin{pmatrix} B & AB & \cdots & A^{n-1} B \end{pmatrix} \end{align}

の行ベクトル  v_1, v_2, \ldots, v_n\in {\bf R}^{1\times nm} は1次独立です。つまり、

\begin{align} (\lambda_1, \lambda_2, \ldots, \lambda_n)\neq (0, 0, \ldots, 0)\quad \Rightarrow \quad  \lambda_1 v_1+\lambda_2v_2+\cdots +\lambda_n v_n \neq 0 \end{align}

が成り立ちます。行ベクトル  v_1,v_2\ldots, v_n たちは行列  A, B の各成分の和と積から構成されているので、

\begin{align}  f_i: {\bf R}^{n\times n}\times {\bf R}^{n\times m}\times {\bf R}^{p\times n}\rightarrow {\bf R}^{1\times nm}\quad {\rm s.t.}\quad v_i= f_i(A,B,C) \end{align}

となる連続関数  f_1,f_2,\ldots, f_n が存在します。連続関数のスカラー倍や連続関数同士の和も連続関数となるので、

\begin{align} f(A,B,C):= \lambda_1 f_1(A,B,C) + \lambda_2 f_2(A,B,C)+\cdots +\lambda_n f_n(A,B,C) \end{align}

で定義された関数  f も連続関数となります。よって、任意の  \epsilon>0 に対して、ある  \delta>0 が存在して、 \begin{align} d( (A,B,C), (A',B',C') ) < \delta \Rightarrow \| f(A,B,C)-f(A',B',C') \|_F < \epsilon \end{align}

となります。これより、 \epsilon を適切に選ぶことで

\begin{align} \begin{pmatrix} B' & A'B' & \cdots & A'^{n-1} B' \end{pmatrix} \end{align}

の行ベクトルが1次独立にできることを示せれば、ある \delta > 0 が存在して、

\begin{align} B( (A,B,C); \delta ) \subset S_c \end{align}

となることが示せたことになります。いま  v_1,v_2,\ldots, v_n が1次独立だったことに注意すると、

\begin{align} \exists \alpha>0\quad {\rm s.t.}\quad ||f(A,B,C)||_F=\alpha \end{align}

が成り立ちます。さらに、\begin{align} | \|f(A',B',C') \|_F - \|f(A,B,C)\|_F | < \| f(A,B,C)-f(A',B',C') \|_F < \epsilon \end{align}

が成り立つので、\begin{align} \| f(A,B,C)\|_F -\epsilon< \| f(A',B',C') \|_F<\| f(A,B,C)\|_F +\epsilon  \end{align}

が成り立ちます。よって、\begin{align} \alpha -\epsilon< \| f(A',B',C') \|_F<\alpha +\epsilon \end{align} が成り立つので、 \epsilon 0<\epsilon<\alpha が成り立つように選ぶと、\begin{align} \| f(A',B',C')\|_F \neq 0 \end{align} が成り立ちます。これは、関数  f の作り方から、\begin{align} \begin{pmatrix} B' & A'B' & \cdots & A'^{n-1} B' \end{pmatrix} \end{align} の行ベクトルが1次独立であることを意味しているので、証明完了です。

このように可制御可観測な線形システムの全体の集合  S_c\cap S_o は多様体になって、特に開集合であることが分かりました。  S_c\cap S_o は開集合なので、ある一つの可制御可観測な線形システムの十分小さな近傍内のすべての線形システムは可制御可観測だということになります。実は、可制御可観測な線形システムの全体の集合  S_c\cap S_o は線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m} \times {\bf R}^{p\times n} の中で稠密であることも示すことができます。つまり、線形システム全体の集合  {\bf R}^{n\times n}\times {\bf R}^{n\times m} \times {\bf R}^{p\times n} の任意の開集合を  U としたとき、 (S_c\cap S_o)\cap U\neq \emptyset が成り立ちます。このことより、一様にランダムに線形システム  (A,B,C) を生成すると、可制御可観測なシステムが得られる可能性が極めて高いということや、可制御可観測でないシステムに微小な摂動が加わっただけで可制御可観測なシステムになるということが言えます。言い換えると、可制御可観測なシステムであっても、実際上はほとんど可制御可観測とは言えないようなシステムもあるということであり、

で紹介したような指標を使って可制御性や可観測性の大きさを測ることが応用上は重要だということになります。

参考文献

記事を書くにあたって以下の本を参考にしました。

(1) 距離空間とかの部分を参考にしました。

集合・位相入門

集合・位相入門

 

 (2) 第2章の定理11の可制御な線形システム全体の集合は開集合であることの証明を参考にしました。

現代の最適制御理論〈上〉 (1974年) (数学叢書〈23〉)

現代の最適制御理論〈上〉 (1974年) (数学叢書〈23〉)