Powerpoint - システム制御理論研究室

Download Report

Transcript Powerpoint - システム制御理論研究室

4. 可制御性・可観測性
教科書 5章, 8.2
入出力付きシステム
 入出力付きシステム:
x  Ax  Bu
y  Cx  Du
x … 状態ベクトル ( n)
u … 入力ベクトル ( m)
y … 出力ベクトル ( )
A … n  n行列, B … n  m行列, C …   n行列, D …    行列
 通常、D = 0 のケース(直達項が無い場合)を考えることが多い。
D  0 でも、y’ = y - Du という仮想的な出力を考えればよい。
解の公式 (再掲)
 システム
x  Ax  Bu
y  Cx  Du
の解
 x(t) を求める公式:
x(t )  etA x(0)   e(t - ) A Bu( )d
t
0
 y(t) を求める公式:
y(t )  Ce x(0)  Du(t )  C  e(t - ) A Bu( )d
tA
t
0
状態の座標変換 (重要)
 状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステ
ムに変換することができる。
 元のシステム
 座標変換
x  Ax  Bu
y  Cx  Du
z  Tx, x  T -1z
(T は変換行列で正則でなくてはならない)
 新しいシステム
z  Tx  TAx  TBu  TAT -1z  TBu
y  Cx  Du  CT -1z  Du
z  A z  B u
y  C z  Du
A  TAT -1, B  TB, C  CT -1, D  D
座標変換後も、
さまざまな性
質が保存され
る。
可制御性・可観測性の概念
 入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」
 制御すべき x が出力 y から「観測」できることが前提。
○ システムの状態を入力で動かすことができるか? … 可制御性
○ システムの状態を出力から推定することが出来るか? … 可観測性
「安定性との関連」
もし、可制御でなければ、系を安定化できないかも…。
もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。
可制御ではない/可観測ではない系とは
 可制御でない系とは….
たとえば、座標変換で次のような形になるシステム
 A A2  B1 
x   1
 x   0 u
0
A
3
 

x1  A1x1  A2 x2  B1u
x2  A3 x2
閉じているシステム
 可観測でない系とは….
たとえば、座標変換で次のような形になるシステム
 A 0   B1 
x   1
x   u

A
A
3
B2 
 2
y  C1 0x  Du
x2の影響を受けない
x1  A1 x1  B1u
x2  A2 x1  A3 x2  B2u
y  C1 x1  Du
x1だけが見える
可制御性の定義
 任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれ
ば、システムは可制御であるという。
 原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、シス
テムは可到達であるという。
 連続時間線形系では、
(可制御性) = (可到達性)
 ただし、離散時間線形系(コースによっては3年前期授業で習うはず)では、
(可制御な系)  (可到達な系)
可観測性の定義
 ある時間 tf が存在して、0  t  tf の入出力のデータから、システムの初期値 x0
を一意に定めることが出来るとき、システムは可観測であるという。
 系の線形性より、
「入力が 0 のとき、ある時間 tf が存在して、0  t  tf の出力のデータから、シス
テムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であると
いう。」
と言い換えても良い。
可制御性の条件
[定理] 以下の4つの条件は等価である。
 システム x  Ax  Bu が可制御である。
 可制御性行列がフルランクすなわち


重要!
rank GC  rank B AB A2 B  An-1B  n
となること。(条件1)
 可制御性グラミアン
WC (t )   (e B)(e B) d   e BB e
t
-A
0
が正則であること。 (条件2)
 すべての複素数 l に対して、
ranklI - A B  n
となること。 (条件3)
-A
T
t
0
-A
T -AT
d
条件2の十分性
Wc(t1) が正則とする。
そのとき、任意のx1に対し、入力 u(t )  -(etAB)T Wc (t1)-1( x0 - e-t1A x1 )が存在し、
x(t1 )  e x0 -  e(t1 - ) A B(e-A B)TWc (t1 )-1 ( x0 - e-t1A x1 )d
t1 A
t1
0

t1 A t1
 e x0 - e
t1 A
0
(e-A B)(e-A B)T d Wc (t1 )-1 ( x0 - e-t1A x1 )
 et1A x0 - et1A ( x0 - e-t1A x1 )  x1
となる。
(条件2) → 可制御性
条件2の必要性
t を固定する。Wc(t) が正則でないなら、非ゼロベクトル z が存在して、Wc(t)z = 0。
よって、
t
2
zTWc (t ) z   zT e-A B d  0
0
となり、zTe-AB = 0 (0   t)。一方、可制御だと仮定すると、入力 u()が存在し、初
期状態 z から、0に移すことができる。
0e z e
tA
t
(t - ) A
0
Bu( )d  z  - e-A Bu( )d
t
0
したがって、
z  zT z  - zT e-A Bu( )d  0
2
t
0
となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。
可制御性 → (条件2)
条件1の十分性
条件2が成り立たないとすると、 s() = zTe-AB = 0 (0   t) 。 これは恒等式なので、
何回微分しても0。
s(0)  zT B  0
s(0)  zT AB  0
s(0)  zT A2 B  0
(dsn-1 / d )(0)  zT An-1B  0
これをまとめると、

zT B

AB A2 B  An-1B  0
よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1
が成り立つならば条件2が成り立つことがいえる。
(条件1) → (条件2)
条件1の必要性
可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、

zT B

AB A2 B  An-1B  0
となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。
行列指数関数の定義より、 zTe-tAB = 0。
すると、

t
0
( zT e-A B)(zT e-A B)T d  zTWc (t ) z  0
となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立
つならば条件1が成り立つことがいえる。
(条件2) → (条件1)
座標変換と可制御性
元のシステム
座標変換: z = Tx
変換後のシステム
x  Ax  Bu
z  A z  B u
A  TAT -1, B  TB
 元のシステムの可制御性の条件:


rank B AB A2 B  An-1B  n
 変換後のシステムの可制御性の条件:

rank B
AB

A 2 B  A n-1B  n
「可制御性は、座標変換に対して不変」
B
AB
 

A 2 B  A n-1B  TB TAB TA2 B  TAn-1B


 T B AB A2 B  An-1B
可観測性の条件
次の4つの条件は同値である。
 システム x  Ax, y  Cx は、可観測である。
 ランク条件
 C 
 CA 
rank GO  rank
n

 n-1 
CA 
を満たす。(条件1)
 可観測性グラミアン
WO (t )   e CT CeAd
t AT
0
が正則。(条件2)
 全ての複素数 l に対して、
となる。(条件3)
lI - A
rank
n

C


重要!
条件2と可観測性の等価性の証明
y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、

t
0
(CeA )T y( )d  WO (t ) x0
よって、 WO(t) が正則ならば、
x0  WO (t )
A T
(
Ce
) y( )d

-1 t
0
と x0 が決定できる。(十分性の証明終わり)
逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。
z WO (t ) z   (Ce z) (Ce z)d   CeA z d  0
T
t
0
A
T
A
t
2
0
であるから、Cet’Az = 0 (0  t’  t) 。これは、初期値が z であるときに、出力が恒等的
にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性
が成り立たない。(必要性の証明終わり)
可観測性グラミアンが正則(条件2)
可観測性
条件1の十分性の証明
WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t  0)。
s(0)  Cz  0, s(0)  CAz  0, s(0)  CA2 z  0,
(d n-1s / dt n-1 )(0)  CAn-1 z  0
よって、
 C 
 CA 
  z  0
 n-1 
CA 
となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性
がいえる。
(条件1) →(条件2)
条件1の必要性
可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在し
て、

z T CT

(CA)T  (CAn-1 )T  0
となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。した
がって、CeAtz = 0 (t  0)となり、これより、

t
0
Ce z d   z e CT CeA zd  zTWO (t ) z  0
A
2
t
T AT
0
となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性が
いえる。
(条件2) →(条件1)
可観測性と座標変換
 可制御性と同様に、可観測性も座標変換に関して不変である。
 このことを確かめる。
システム:
可観測性行列:
 C 
 CA 


  
 n-1 
CA 
x  Ax, y  Cx
座標変換: z = Tx
変換後のシステム:
変換後の可観測性行列:
z  A z, y  C z
( A  TAT -1 , C  CT -1 )
ランクが一致
 C   CT -1   C 

 
 CA 
-1 
C
A
CAT



T -1
        
 n-1   n-1 -1   n-1 
C A  CA T  CA 
双対システム
 システム
x  Ax  Bu
(S1) 
 y  Cx  Du
に双対なシステム:
z  AT z  CT u
(S2) 
T
T
y

B
z

D
u

 (S1)が可制御
 (S1)が可観測
(S2)が可観測
(S2)が可制御
 双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。
 1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。
双対システムと座標変換
元のシステム
x  Ax  Bu
(S1) 
 y  Cx  Du
座標変換
x  Tx
x  A x  B u
(S1)' 
 y  C x  Du
A  TAT -1 , B  TB,
C  CT -1 , D  D
双対システム
座標変換
z  AT z  CT u
(S2) 
T
T
y

B
z

D
u

z  (T T )-1 z
z  A T z  C T u
(S2)' 
T
T
y  B z  D u
A  TAT -1 , B  TB,
C  CT -1 , D  D
可制御正準分解 (教科書にはない)
 AB  A B  r  n
となっているとしよう。すると、(n - r)  n 行列 P が存在し、
PB AB  A B  0
n-1
rank B
n-1
となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、


PA B AB  An-1B  0
が成り立つから、 (n - r)  (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。
ここで、z2 = Px とおくと、
z2  PAx  PBu  PAx  A3 Px  A3 z2
次の座標変換を考える。
Q
z  Tx    x
 P
ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、
A
z   1
0
の形になる。(可制御正準分解)
A2  B1 
z
u
A3   0 
可制御正準分解されたシステム
 可制御正準分解されたシステム:
 A1 A2  z1  B1 
 z1 

A
z

B
u

 
    u


 z2 
 0 A3  z2   0 
 z1 … 可制御な状態変数 (一意ではない)
 z2 … 不可制御な状態変数
(z2 同士の座標変換の自由度を除いて一意に決まる)
 可制御正準分解されたシステムの可制御性行列
B
B1 A1B1 A12 B1  A1n-1B1 
AB  A B  

0
0
0

0


n-1

上の m 行はフルランク
可観測正準分解 (教科書にはない)

rank CT
(CA)T

 (CAn-1 )T  r  n
とする。すると、r  n フルランク行列 P とnl  r フルランク行列 K が存在し、

KP  CT
(CA)T  (CAn-1 )T

T
とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r  r 正則行
列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。
次に、座標変換 z = Tx (T は正則) を考える。ここで、T は
 P
T    の形をしているものとする。T -1  R S  とすると、 PS = 0 となる。
Q
ただし、S は n  (n – m) 行列。座標変換後のシステムを、
 A1 G   B1 
z  
z   u, y  C1 Dz

 A2 A3  B2 
とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を
取り出した行列。
可観測正準分解:
 A1
z  
 A2
0   B1 
z   u, y  C1 0z

A3  B2 
可観測正準分解されたシステム
 可観測正準分解されたシステム:
A
 z1 
   A z  B u   1
 z2 
 A2
z 
y  C z  C1 0 1 
 z2 
0  z1   B1 
    u

A3  z2  B2 
 z1 … 可観測な状態変数
(z1 同士の座標変換の自由度を除いて一意に決まる)
 z2 … 不可観測な状態変数 (一意には決まらない)
 可観測正準分解されたシステムの可観測性行列
 C   C1

 CA
C
A

 1 1
    
 n-1  
n -1
C
A
C
A
1
1



0
0


0
可制御正準形 (重要)
 1入力で可制御なシステム x  Ax  bu を考える。
 p b Ab  An-1b  0  0 1 となる、ベクトル p を考える。
もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。
座標変換行列


 p 
 pA 
T 


 n-1 
 pA 
変換後の
可制御性行列
を考えると、
0  0 1
0
1 *
n-1
rank{T b Ab  A b }  rank
n

*
*


* *
1

であるから T は正則行列 。

可制御正準形 (続き)
z = (z1,…,zn)T = Tx とおくと、
z1  p( Ax  bu)  pAx  z2
z2  pA( Ax  bu)  pA2 x  z3

ただし、i は A の特性多項式の係数で、
det(lI - A)  ln  n-1ln-1  1l  0
zn-1  pAn-2 ( Ax  bu)  pAn-1 x  zn
zn  pAn-1 ( Ax  bu)  pAn x  pAn-1bu
 p(-0 I - 1 A - -  n-1 An-1 ) x  pAn-1bu
 -0 z1 - 1 z2 - -  n-1zn  u
可制御正準形:
1
0   0
 0

 
 
z  
z   u

0
1   0
 0
- 0 - 1  -  n-1   1 
ケーリー・ハミ
ルトンの定理
重要!
可観測正準形 (教科書には無いが重要)
 可制御正準形の相対システムを考える。
 元のシステム (1出力・可観測なシステム):
x  Ax  Bu
y  cx
 座標変換:


-1
z  Tx  s As  An-1s x
T
T
n-1 T T
c
(
cA
)

(
cA
) s  0  0 1T
s は非ゼロベクトルで、

 可観測正準形:
0
1
z  

0
y  0
 0 - 0 
 
 
z  TBu
 0
 
1 -  n-1 
 0 1z

コンパニオン行列
 コンパニオン行列:
1
0 
 0






 0
 0
1 






1
n-1 
 0
0  0 -  0 
1  




あるいは、   0
 


0
1

n -1 

 コンパニオン行列の特性多項式は、
ln  n-1ln-1  1l  0
可制御・可観測正準形の役割
 可制御(可観測)ならば、1通りに定まる。
正準形(canonical form)という言い方ではなく「標準形」ということもある。
 正準形では、特性多項式の係数が現れる。
 可制御正準形は、極配置などで使われる。
 可観測正準形は、オブザーバ設計などで使われる。
 その他、正準形が使われる局面は多い。
しかし、…
 正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。
理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しな
いほうが良い場合が多い。