Powerpoint - システム制御理論研究室
Download
Report
Transcript Powerpoint - システム制御理論研究室
4. 可制御性・可観測性
教科書 5章, 8.2
入出力付きシステム
入出力付きシステム:
x Ax Bu
y Cx Du
x … 状態ベクトル ( n)
u … 入力ベクトル ( m)
y … 出力ベクトル ( )
A … n n行列, B … n m行列, C … n行列, D … 行列
通常、D = 0 のケース(直達項が無い場合)を考えることが多い。
D 0 でも、y’ = y - Du という仮想的な出力を考えればよい。
解の公式 (再掲)
システム
x Ax Bu
y Cx Du
の解
x(t) を求める公式:
x(t ) etA x(0) e(t - ) A Bu( )d
t
0
y(t) を求める公式:
y(t ) Ce x(0) Du(t ) C e(t - ) A Bu( )d
tA
t
0
状態の座標変換 (重要)
状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステ
ムに変換することができる。
元のシステム
座標変換
x Ax Bu
y Cx Du
z Tx, x T -1z
(T は変換行列で正則でなくてはならない)
新しいシステム
z Tx TAx TBu TAT -1z TBu
y Cx Du CT -1z Du
z A z B u
y C z Du
A TAT -1, B TB, C CT -1, D D
座標変換後も、
さまざまな性
質が保存され
る。
可制御性・可観測性の概念
入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」
制御すべき x が出力 y から「観測」できることが前提。
○ システムの状態を入力で動かすことができるか? … 可制御性
○ システムの状態を出力から推定することが出来るか? … 可観測性
「安定性との関連」
もし、可制御でなければ、系を安定化できないかも…。
もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。
可制御ではない/可観測ではない系とは
可制御でない系とは….
たとえば、座標変換で次のような形になるシステム
A A2 B1
x 1
x 0 u
0
A
3
x1 A1x1 A2 x2 B1u
x2 A3 x2
閉じているシステム
可観測でない系とは….
たとえば、座標変換で次のような形になるシステム
A 0 B1
x 1
x u
A
A
3
B2
2
y C1 0x Du
x2の影響を受けない
x1 A1 x1 B1u
x2 A2 x1 A3 x2 B2u
y C1 x1 Du
x1だけが見える
可制御性の定義
任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれ
ば、システムは可制御であるという。
原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、シス
テムは可到達であるという。
連続時間線形系では、
(可制御性) = (可到達性)
ただし、離散時間線形系(コースによっては3年前期授業で習うはず)では、
(可制御な系) (可到達な系)
可観測性の定義
ある時間 tf が存在して、0 t tf の入出力のデータから、システムの初期値 x0
を一意に定めることが出来るとき、システムは可観測であるという。
系の線形性より、
「入力が 0 のとき、ある時間 tf が存在して、0 t tf の出力のデータから、シス
テムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であると
いう。」
と言い換えても良い。
可制御性の条件
[定理] 以下の4つの条件は等価である。
システム x Ax Bu が可制御である。
可制御性行列がフルランクすなわち
重要!
rank GC rank B AB A2 B An-1B n
となること。(条件1)
可制御性グラミアン
WC (t ) (e B)(e B) d e BB e
t
-A
0
が正則であること。 (条件2)
すべての複素数 l に対して、
ranklI - A B n
となること。 (条件3)
-A
T
t
0
-A
T -AT
d
条件2の十分性
Wc(t1) が正則とする。
そのとき、任意のx1に対し、入力 u(t ) -(etAB)T Wc (t1)-1( x0 - e-t1A x1 )が存在し、
x(t1 ) e x0 - e(t1 - ) A B(e-A B)TWc (t1 )-1 ( x0 - e-t1A x1 )d
t1 A
t1
0
t1 A t1
e x0 - e
t1 A
0
(e-A B)(e-A B)T d Wc (t1 )-1 ( x0 - e-t1A x1 )
et1A x0 - et1A ( x0 - e-t1A x1 ) x1
となる。
(条件2) → 可制御性
条件2の必要性
t を固定する。Wc(t) が正則でないなら、非ゼロベクトル z が存在して、Wc(t)z = 0。
よって、
t
2
zTWc (t ) z zT e-A B d 0
0
となり、zTe-AB = 0 (0 t)。一方、可制御だと仮定すると、入力 u()が存在し、初
期状態 z から、0に移すことができる。
0e z e
tA
t
(t - ) A
0
Bu( )d z - e-A Bu( )d
t
0
したがって、
z zT z - zT e-A Bu( )d 0
2
t
0
となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。
可制御性 → (条件2)
条件1の十分性
条件2が成り立たないとすると、 s() = zTe-AB = 0 (0 t) 。 これは恒等式なので、
何回微分しても0。
s(0) zT B 0
s(0) zT AB 0
s(0) zT A2 B 0
(dsn-1 / d )(0) zT An-1B 0
これをまとめると、
zT B
AB A2 B An-1B 0
よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1
が成り立つならば条件2が成り立つことがいえる。
(条件1) → (条件2)
条件1の必要性
可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、
zT B
AB A2 B An-1B 0
となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。
行列指数関数の定義より、 zTe-tAB = 0。
すると、
t
0
( zT e-A B)(zT e-A B)T d zTWc (t ) z 0
となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立
つならば条件1が成り立つことがいえる。
(条件2) → (条件1)
座標変換と可制御性
元のシステム
座標変換: z = Tx
変換後のシステム
x Ax Bu
z A z B u
A TAT -1, B TB
元のシステムの可制御性の条件:
rank B AB A2 B An-1B n
変換後のシステムの可制御性の条件:
rank B
AB
A 2 B A n-1B n
「可制御性は、座標変換に対して不変」
B
AB
A 2 B A n-1B TB TAB TA2 B TAn-1B
T B AB A2 B An-1B
可観測性の条件
次の4つの条件は同値である。
システム x Ax, y Cx は、可観測である。
ランク条件
C
CA
rank GO rank
n
n-1
CA
を満たす。(条件1)
可観測性グラミアン
WO (t ) e CT CeAd
t AT
0
が正則。(条件2)
全ての複素数 l に対して、
となる。(条件3)
lI - A
rank
n
C
重要!
条件2と可観測性の等価性の証明
y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、
t
0
(CeA )T y( )d WO (t ) x0
よって、 WO(t) が正則ならば、
x0 WO (t )
A T
(
Ce
) y( )d
-1 t
0
と x0 が決定できる。(十分性の証明終わり)
逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。
z WO (t ) z (Ce z) (Ce z)d CeA z d 0
T
t
0
A
T
A
t
2
0
であるから、Cet’Az = 0 (0 t’ t) 。これは、初期値が z であるときに、出力が恒等的
にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性
が成り立たない。(必要性の証明終わり)
可観測性グラミアンが正則(条件2)
可観測性
条件1の十分性の証明
WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t 0)。
s(0) Cz 0, s(0) CAz 0, s(0) CA2 z 0,
(d n-1s / dt n-1 )(0) CAn-1 z 0
よって、
C
CA
z 0
n-1
CA
となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性
がいえる。
(条件1) →(条件2)
条件1の必要性
可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在し
て、
z T CT
(CA)T (CAn-1 )T 0
となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。した
がって、CeAtz = 0 (t 0)となり、これより、
t
0
Ce z d z e CT CeA zd zTWO (t ) z 0
A
2
t
T AT
0
となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性が
いえる。
(条件2) →(条件1)
可観測性と座標変換
可制御性と同様に、可観測性も座標変換に関して不変である。
このことを確かめる。
システム:
可観測性行列:
C
CA
n-1
CA
x Ax, y Cx
座標変換: z = Tx
変換後のシステム:
変換後の可観測性行列:
z A z, y C z
( A TAT -1 , C CT -1 )
ランクが一致
C CT -1 C
CA
-1
C
A
CAT
T -1
n-1 n-1 -1 n-1
C A CA T CA
双対システム
システム
x Ax Bu
(S1)
y Cx Du
に双対なシステム:
z AT z CT u
(S2)
T
T
y
B
z
D
u
(S1)が可制御
(S1)が可観測
(S2)が可観測
(S2)が可制御
双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。
1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。
双対システムと座標変換
元のシステム
x Ax Bu
(S1)
y Cx Du
座標変換
x Tx
x A x B u
(S1)'
y C x Du
A TAT -1 , B TB,
C CT -1 , D D
双対システム
座標変換
z AT z CT u
(S2)
T
T
y
B
z
D
u
z (T T )-1 z
z A T z C T u
(S2)'
T
T
y B z D u
A TAT -1 , B TB,
C CT -1 , D D
可制御正準分解 (教科書にはない)
AB A B r n
となっているとしよう。すると、(n - r) n 行列 P が存在し、
PB AB A B 0
n-1
rank B
n-1
となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、
PA B AB An-1B 0
が成り立つから、 (n - r) (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。
ここで、z2 = Px とおくと、
z2 PAx PBu PAx A3 Px A3 z2
次の座標変換を考える。
Q
z Tx x
P
ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、
A
z 1
0
の形になる。(可制御正準分解)
A2 B1
z
u
A3 0
可制御正準分解されたシステム
可制御正準分解されたシステム:
A1 A2 z1 B1
z1
A
z
B
u
u
z2
0 A3 z2 0
z1 … 可制御な状態変数 (一意ではない)
z2 … 不可制御な状態変数
(z2 同士の座標変換の自由度を除いて一意に決まる)
可制御正準分解されたシステムの可制御性行列
B
B1 A1B1 A12 B1 A1n-1B1
AB A B
0
0
0
0
n-1
上の m 行はフルランク
可観測正準分解 (教科書にはない)
rank CT
(CA)T
(CAn-1 )T r n
とする。すると、r n フルランク行列 P とnl r フルランク行列 K が存在し、
KP CT
(CA)T (CAn-1 )T
T
とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r r 正則行
列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。
次に、座標変換 z = Tx (T は正則) を考える。ここで、T は
P
T の形をしているものとする。T -1 R S とすると、 PS = 0 となる。
Q
ただし、S は n (n – m) 行列。座標変換後のシステムを、
A1 G B1
z
z u, y C1 Dz
A2 A3 B2
とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を
取り出した行列。
可観測正準分解:
A1
z
A2
0 B1
z u, y C1 0z
A3 B2
可観測正準分解されたシステム
可観測正準分解されたシステム:
A
z1
A z B u 1
z2
A2
z
y C z C1 0 1
z2
0 z1 B1
u
A3 z2 B2
z1 … 可観測な状態変数
(z1 同士の座標変換の自由度を除いて一意に決まる)
z2 … 不可観測な状態変数 (一意には決まらない)
可観測正準分解されたシステムの可観測性行列
C C1
CA
C
A
1 1
n-1
n -1
C
A
C
A
1
1
0
0
0
可制御正準形 (重要)
1入力で可制御なシステム x Ax bu を考える。
p b Ab An-1b 0 0 1 となる、ベクトル p を考える。
もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。
座標変換行列
p
pA
T
n-1
pA
変換後の
可制御性行列
を考えると、
0 0 1
0
1 *
n-1
rank{T b Ab A b } rank
n
*
*
* *
1
であるから T は正則行列 。
可制御正準形 (続き)
z = (z1,…,zn)T = Tx とおくと、
z1 p( Ax bu) pAx z2
z2 pA( Ax bu) pA2 x z3
ただし、i は A の特性多項式の係数で、
det(lI - A) ln n-1ln-1 1l 0
zn-1 pAn-2 ( Ax bu) pAn-1 x zn
zn pAn-1 ( Ax bu) pAn x pAn-1bu
p(-0 I - 1 A - - n-1 An-1 ) x pAn-1bu
-0 z1 - 1 z2 - - n-1zn u
可制御正準形:
1
0 0
0
z
z u
0
1 0
0
- 0 - 1 - n-1 1
ケーリー・ハミ
ルトンの定理
重要!
可観測正準形 (教科書には無いが重要)
可制御正準形の相対システムを考える。
元のシステム (1出力・可観測なシステム):
x Ax Bu
y cx
座標変換:
-1
z Tx s As An-1s x
T
T
n-1 T T
c
(
cA
)
(
cA
) s 0 0 1T
s は非ゼロベクトルで、
可観測正準形:
0
1
z
0
y 0
0 - 0
z TBu
0
1 - n-1
0 1z
コンパニオン行列
コンパニオン行列:
1
0
0
0
0
1
1
n-1
0
0 0 - 0
1
あるいは、 0
0
1
n -1
コンパニオン行列の特性多項式は、
ln n-1ln-1 1l 0
可制御・可観測正準形の役割
可制御(可観測)ならば、1通りに定まる。
正準形(canonical form)という言い方ではなく「標準形」ということもある。
正準形では、特性多項式の係数が現れる。
可制御正準形は、極配置などで使われる。
可観測正準形は、オブザーバ設計などで使われる。
その他、正準形が使われる局面は多い。
しかし、…
正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。
理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しな
いほうが良い場合が多い。