模糊与卡尔曼滤波目标跟踪控制系统的比较 Comparison of Fuzzy and Kalman-Filter Target-Tracking control system 导

Download Report

Transcript 模糊与卡尔曼滤波目标跟踪控制系统的比较 Comparison of Fuzzy and Kalman-Filter Target-Tracking control system 导

模糊与卡尔曼滤波目标跟踪控制系统的比较
Comparison of Fuzzy and Kalman-Filter
Target-Tracking control system
Peter J.Pacini , Bart Kosko
导
学
师:吴顺君 教授
生:胡亮兵
内容简介
1、模糊控制器与卡尔曼滤波器的比较
2、实时目标跟踪系统
3、模糊控制器的工作原理
4、卡尔曼滤波跟踪与模糊跟踪的仿真
5、自适应FAM
1、模糊控制器与卡尔曼滤波器的比较
卡尔曼滤波器需要
明确的数学模型来定义
输出与输入之间的关系
X k   k ,k 1 X k 1  k ,k 1U k 1  Wk 1
Z k  H k X k  Vk
通过测量估计真实 代价(最小
均方误差)
递推
模糊控制器是
一个模糊系统,
其输出与输入之
间没有经典的数
学模型。
(1)模糊控制器
模糊控制器不同于传统的基于数学模型的控制器,模糊系
统不需精确的数学模型:不需要根据输入来函数式地描述输出;
同时模糊系统对于所描述状态和怎样描述状态并不是不确定的。
模糊控制器是一个模糊系统,是单位立方体之间的映射:
包含了空间所有的模糊子集
;
包含了空
间的所有模糊子集
。模糊系统
将模糊子集I
映射成模糊
F :In  I p
p
I
子集I n
。通常
和
是连续的集合。
X  {x1 ,..., xn }
X
Y
F
Y
X
Y
输
输
入
出
模
模
糊
糊
p
Y I
集 X In
集
n
X
Y
模糊控制器有一系列的FAM(模糊自联想记忆)
“规则”,它描述模糊的专家知识或学习训练好的输
入到输出的转换。一个FAM可以总结概括一个特定的
数学模型的动作。模糊系统可以非线性地将一个确定
的或模糊化的输入转变成一个模糊集输出。这个输出
模糊集通过质心化(“去模糊”)可得到一个具体的
数值。模糊控制器需要我们说明或估计出FAM规则。
虽然模糊控制器是一个数字化的系统,但专家可以将
他的知识用自然语言总结,这一点对于复杂问题具有
重要的意义。
(2)数学模型控制器
数学模型控制器在输出和输入的函数关系确定的情况下的
工作性能会很好。对于不确定的环境,数学模型控制器一般
采用概率分布来描述。存在以下问题:
(1)不确定性一般很难用经典数据模型加以准确描述。
(2)很难将专家的知识加到系统中去,在这种系统中,
专家的知识一般只能用来估计初始状态和协方差条件。
2、目标实时跟踪系统
目标实时跟踪系统一般采用雷达或其它设备去探测目标与设备所
在平面的的高度和方位角。由两个马达控制设备的探测方向,通过连
续地调整两个马达的转速,保持对目标的连续跟踪。
对高度和方位角的控制可以采用相同的算法进行。
Clock
ek
Latch
Delay
Target
Position +
Vk
+
+
ek 1
-
-
+
Controller

Transducer
Motor
ek
Delay
Vk 1
目标跟踪系统输入量
e
位置误差: k

位置误差变化量:e k
上次输出速度:Vk 1
目标跟踪系统输出量
马达转速:Vk
FAM规则1
ek
dek
vk1
模糊化
FAM规则2
O1
O2
...
FAM规则n
On

O
vk 到区间[-6,6],同
我们限制模糊控制器的输出角速度

样 ek 、
ek 、vk 1也划分为7个等级:
LN:大负
MN:中负
SN:小负
ZE:零
SP:小正
MP:中正
LP:大正
模糊论域采用梯形,重叠25%
-6
-4
-2
0
2
4
6
2
1.5
LN
MN
SN
ZE
SP
MP
LP
-6
-4
-2
0
2
4
6
1
0.5
0
-8
这样,每一个输入量都对应着一个隶属度矢量:
例如:
ek  2.6
LN MN SN ZE SP MP LP
( 0
0 0 0 1 .4 0 )

e k  2.0
(
0
0
1
0
0
0
0 )
Vk 1  1.8
(
0
0
0
.1
1 0
0 )
8
输入到输出的映射
FAM(模糊联想记忆)规则是将输入模糊集映射到输出模糊
集的关键机制。例如:

IF
‘
ek  MP AND e k  SN AND Vk 1  ZE
THEN
Vk  SP
mMP (ek )  0.4

mSN (e k )  1
mZE (Vk 1 )  0.1
因为该规则中使用的是合取联结词AND,则
的有效系数:
wi  min( 0.4, 1, 0.1)  0.1
Vk  SP
MP
SN
ZE
i  0.1
SP
ek
dek
vk1
一条FAM规则
相
关
乘
积
推
理
Oi  i Li
对于一组FAM规则,一个输入量将对应一组输出结果。
例如:
i
wi
1
0.0
MP
2
3
0.2
1.0
SP
ZE
4
0.4
SN
5
6
7
0.1
0.8
0.6
SP
ZE
SN
Consequent
模糊质心的计算
p
vk 
i
wi
1
2
3
4
5
6
7
0.0
0.2
1.0
0.4
0.1
0.8
0.6
{
(yj)yj
O
j 1
p
m
j 1
Consequent
MP
SP
ZE
SN
SP
ZE
SN
m
O
(yj)
SN 1.0
ZE 1.8
SP 0.3
vk 
 2 1  0 1.8  2  0.3
 0.452
1  1.8  0.3
第九章模糊集输出采用最小相关编码,这里采用相关乘法编码:
moi ( y )  wi mli ( y )
N
mo( y )   moi ( y )
i 1
p
vk 
输出模糊集的形状:
 ymO ( y)dy
m
O
( y )dy
vk 
y m
j 1
p
输出模糊集的形状与FAM规则的编码模式有关。
mOi ( y )  min( wi , mLi ( y ))
wi
Consequent Li
(2)相关乘积编码
Output Oi
mOi ( y )  wi  mLi ( y )
Oi  i Li
wi
Consequent Li
Output Oi
O
m
j 1
(1)相关最小编码
j
O
(yj)
(yj)
最后的输出
vk
ymo( y)dy


 mo( y)dy
(11-7)
p
对于离散的情况
vk 
 y mo( y
j 1
j
j
p
 mo( y
j 1
j
)
)
定理1:如果使用相关乘法推理产生输出模糊集,那么我们通
过局部模糊中心来计算全局的模糊中心。
N
vk 
wc I
i 1
N
i i i
w I
i 1
i i
I i 、 c i 分别代表第 i 个模糊规则输出集 Li 的面积和质心
I i   m Li ( y )dy
ci
(11-10)
ym ( y )dy  ym ( y )dy



I
 m ( y)dy
Li
Li
Li
i
定理2:如果论域中的7个模糊集是对称的、单峰的并且我们使
用乘法相关推理,那么我们可以根据分别7个模糊输出集的质
心来计算最终的输出 v k 。
7
vk 
 mo( y
j 1
j
)y jJ j
7
 mo( y
j 1
j
)J j
模糊控制面
控制系统把输入映
射为输出
输入到输出的变换
定义为控制面
(control surface)
Control surface of
the fuzzy controller
for constant error
ek=0
6
4
2
0
-2
-4
-6
-8
150
100
50
0
140
120
100
80
60
40
20
0
4.模糊跟踪仿真


实时目标跟踪系统一般采用雷达或其它设备去探测目标与设
备所在平面的的高度和方位角。由两个马达控制设备的探测
方向,通过连续地调整两个马达的转速,保持对目标的连续
跟踪。
通过平台与目标的误差、误差的变化量以及前一时刻电机的
转速来调节当前时刻电机的转速,保持对目标的跟踪。
模糊跟踪仿真
180
10
160
0
-10
Azimuth error in degrees
Azimuth in degrees
140
120
100
80
60
-30
-40
-50
40
-60
20
0
-20
0
10
20
30
40
50
Time
60
70
80
90
100
-70
0
10
20
30
40
50
Time
Best performance of the fuzzy controller
60
70
80
90
100
10
160
0
140
-10
Azimuth error in degrees
Azimuth in degrees
180
120
100
80
60
-20
-30
-40
40
-50
20
-60
0
0
10
20
30
40
50
Time
60
70
80
90
100
-70
0
10
20
30
40
50
Time
60
Too much overlap causes excessive overshoot
70
80
90
100
180
10
160
0
-10
Azimuth error in degrees
Azimuth in degrees
140
120
100
80
60
-30
-40
-50
40
-60
20
0
-20
-70
0
10
20
30
40
50
Time
60
70
80
90
100
0
10
20
30
40
50
Time
60
70
80
Too little overlap causes lead or lag for several consecutive time intervals
90
100
Kalman 跟踪仿真
tracking
180
10
true
filtered
160
0
140
Azimuth error in degrees
-10
Azimuth
120
100
80
-20
-30
-40
60
-50
40
-60
20
0
10
20
30
40
50
time
60
70
80
90
100
-70
0
10
20
30
40
50
Time
60
70
80
90
Kalman-filter controller with unmodeled-effects noise variance Var(w)=0
100
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
Kalman-filter controller with Var(w)=0
100
tracking
10
180
true
filtered
160
0
-10
Azimuth error in degrees
140
Azimuth
120
100
80
-20
-30
-40
60
-50
40
-60
20
0
10
20
30
40
50
time
60
70
80
90
100
-70
0
10
20
30
Kalman-filter controller with Var(w)=1.0
40
50
Time
60
70
80
90
100
灵敏度分析
在正常环境下,当状态噪声的方差Var(w)很小时,两种
控制器间的性能几乎相同。
当增加了更多的不确定条件后,两者的性能就不同了。
以下是卡尔曼滤波器的状态方程:

xk 1  xk  ek  e wk
其中,噪声项wk 是目标的状态噪声,当噪声增加越
多时,状态方程就变得越不确定。噪声增大,卡尔曼滤
波器的均方根误差(RMSE)急剧增大。
2.5
2
1.5
1
0.5
0
0
10
20
30
40
50
60
Root-mean-squared error of the Kalman-filter controller as Var(w) varies
模糊控制器的不确定性控制完全是由FAM规则库来承担的。
那么减少模糊控制器的FAM规则的数量,就相当于增加了系统的
不确定性。
实验表明:即使模糊规则减少60%,系统的RMSE依然增加
很小。
模糊控制器在处理系统不确定性上表现良好。
将“稳态”FAM规则进行篡改:
(ZE,ZE,ZE;ZE)
(ZE,ZE,ZE;LP)
系统会迅速调整以降低误差。
模糊控制器具有很强的鲁棒性
5、自适应FAM
使用无监督的乘积空间聚类(unsupervised product-space
clustering)来训练自适应的FAM模糊控制器,也就是产生
FAM规则。

输出空间
输入空间与输出空间构成
了一个乘积空间
LN
LN


给出一条目标运动轨迹就
能产生很多乘积空间训练
矢量
把这些矢量在乘积空间中
聚类,得到规则
MN
输
入
空
间
SN
ZE
SP
MP

聚类的时候可以使用
DCL
LP
MN
SN
ZE
SP
MP
LP
250
200
150
100
50
0
0
5
10
15
20
25
30
35
40
45
50
LN
LN
MN
SN
ZE
SP
MP
LP
MN
SN
ZE
SP
MP
LP
160
170
190
230
190
170
160
谢谢!