自适应控制——仿真实验一用李雅普诺夫稳定性理论设计自适应规律

一、问题描述
二、问题建模
三、问题求解
附录：实现MATLAB代码
参考书目

一、问题描述

设控制对象的状态方程为
$\dot{\boldsymbol{x}}_{p}=\boldsymbol{A}_{p}(t) x_{p}+\boldsymbol{b}_{p}(t) u \tag{1}$
式中
$\boldsymbol{A}_{p}=\left[$

\begin{array}{cc} 0 & 1 \\ - 6 & - 7 \end{array}

\right], \quad \boldsymbol{b}_{p}=\left[

\begin{array}{l} 2 \\ 4 \end{array}

\right] \tag{2}

A_{p} = [0 - 6 1 - 7], b_{p} = [24] (2)

参考模型的状态方程为

\dot{\boldsymbol{x}}_{m}=\boldsymbol{A}_{m} x_{m}+\boldsymbol{b}_{m} r \tag{3}

式中

\begin{array}{cc} 0 & 1 \\ - 10 & - 5 \end{array}

用李雅普诺夫稳定性理论设计自适应规律。

二、问题建模

由于控制对象的参数（状态矩阵 $\boldsymbol{A}_{p}$ 和控制矩阵 $\boldsymbol{b}_{p}$ ）一般是未知的，且无法直接调整。所以为改变控制对象的动态特性，需采用前馈控制加反馈控制。

控制信号 $u$ 由前馈信号 $Kr$ 和反馈信号 $Fx_p$ 组成，即
$\boldsymbol{x}_{p} \tag{5}$
式中， $r$ 为 $m$ 维输入向量， $\boldsymbol{x}_{p}$ 为 $n$ 维状态向量， $K$ 为 $\times m$ 前馈增益矩阵， $F$ 为 $\times n$ 反馈增益矩阵；具体在本次仿真实验中，输入向量维度 $m = 1$ ，状态向量维度 $n = 2$ 。

将(5)式代入控制对象的状态方程，可得
$\dot{\boldsymbol{x}}_{p}=\left[\boldsymbol{A}_{p}(t)+\boldsymbol{b}_{p}(t) F\right] \boldsymbol{x}_{p}+\boldsymbol{b}_{p}(t) K r \tag{6}$
设系统的广义状态误差向量为
$\boldsymbol{e}=\boldsymbol{x}_{m}-\boldsymbol{x}_{p} \tag{7}$
由参考模型的状态方程，结合(6)式及(7)式，可得：
$\dot{\boldsymbol{e}}=\boldsymbol{A}_{m} \boldsymbol{e}+\left(\boldsymbol{A}_{m}-\boldsymbol{A}_{p}-\boldsymbol{b}_{p} F\right) \boldsymbol{x}_{p}+\left(\boldsymbol{b}_{m}-\boldsymbol{b}_{p} K\right) r \tag{8}$
在理想情况，即 $\rightarrow 0$ 的情况下，(8)式等号右端后两项应等于0。设前馈增益矩阵 $K$ 和反馈增益矩阵 $F$ 的理想值分别为 $\bar{K}$ 和 $\bar{F}$ 。

则最终可将(8)式写成
$\dot{\boldsymbol{e}}=\boldsymbol{A}_{m} \boldsymbol{e}+\boldsymbol{b}_{m} \bar{K}^{-1} \Phi \boldsymbol{x}_{p}+\boldsymbol{b}_{m} \bar{K}^{-1} \Psi r \tag{9}$
式中， $\Phi=\bar{F}-F$ 为 $\times n$ 矩阵， $\Psi=\bar{K}-K$ 为 $\times m$ 矩阵。

选取李雅普诺夫函数为：
$V=\frac{1}{2}\left[\boldsymbol{e}^{T} \boldsymbol{P} \boldsymbol{e}+\operatorname{tr}\left(\Phi^{T} \Gamma_{1}^{-1} \Phi+\Psi^{T} \Gamma_{2}^{-1} \Psi\right)\right] \tag{10}$
式中， $\boldsymbol{P}$ 为 $\times n$ 维正定对称阵， $\Gamma_{1}$ 和 $\Gamma_{2}$ 均为 $\times m$ 维正定对称阵；符号 $\operatorname{tr}$ 表示矩阵的迹。

求(10)式对时间的导数，得
$\dot{V}=\frac{1}{2}\left[\dot{\boldsymbol{e}} \boldsymbol{P} \boldsymbol{e}+\boldsymbol{e}^{T} \boldsymbol{P} \dot{\boldsymbol{e}}+\operatorname{tr}\left(\dot{\Phi}^{T} \Gamma_{1}^{-1} \Phi+\Phi^{T} \Gamma_{1}^{-1} \dot{\Phi}+\dot{\Psi}^{T} \Gamma_{2}^{-1} \Psi+\Psi^{T} \Gamma_{2}^{-1} \dot{\Psi}\right)\right] \tag{11}$
将(9)式代入(11)式，再根据矩阵迹的性质，于是有

\begin{aligned} \dot{V} = & \frac{1}{2} e^{T} (P A_{m} + A_{m}^{T} P) e + tr ({\dot{Φ}}^{T} Γ_{1}^{- 1} Φ + x_{p} e^{T} P b_{m} {\bar{K}}^{- 1} Φ) \\ + tr ({\dot{Ψ}}^{T} Γ_{2}^{- 1} Ψ + r e^{T} P b_{m} {\bar{K}}^{- 1} Ψ) \end{aligned}

\tag{12}

\dot{V} = \frac{1}{2} e^{T} (P A_{m} + A_{m}^{T} P) e + tr (\dot{Φ}^{T} Γ_{1}^{- 1} Φ + x_{p} e^{T} P b_{m} \overset{ˉ}{K}^{- 1} Φ) + tr (\dot{Ψ}^{T} Γ_{2}^{- 1} Ψ + r e^{T} P b_{m} \overset{ˉ}{K}^{- 1} Ψ) (12)

为满足李雅普诺夫第二法，需保证(12)式是负定的，对应的情况为(12)式第一项是负定的，后两项都为零。

因为 $\boldsymbol{A}_{m}$ 为稳定矩阵，则可选定正定对称阵 $Q$ ，使 $\boldsymbol{P} \boldsymbol{A}_{m}+\boldsymbol{A}_{m}^{\boldsymbol{T}} \boldsymbol{P}=-\boldsymbol{Q}$ 成立。同时根据上述对应情况， $\Phi$ 和 $\Psi$ 的选择如下：

\begin{aligned} \dot{Φ} & = - Γ_{1} {(b_{m} {\bar{K}}^{- 1})}^{T} P e x_{p}^{T} \\ \dot{Ψ} & = - Γ_{2} {(b_{m} {\bar{K}}^{- 1})}^{T} P e r^{T} \end{aligned}

\tag{13}

\dot{Φ} \dot{Ψ} = - Γ_{1} (b_{m} \overset{ˉ}{K}^{- 1})^{T} P e x_{p}^{T} = - Γ_{2} (b_{m} \overset{ˉ}{K}^{- 1})^{T} P e r^{T} (13)

当

\boldsymbol{A}_{p}

和

\boldsymbol{b}_{p}

为常值或缓慢变化时，可得自适应调节规律：

\begin{aligned} F (t) & = \int_{0}^{t} Γ_{1} {(b_{m} {\bar{K}}^{- 1})}^{T} P e x_{p}^{T} d τ + F (0) \\ K (t) & = \int_{0}^{t} Γ_{2} {(b_{m} {\bar{K}}^{- 1})}^{T} P e r d τ + K (0) \end{aligned}

需额外说明的一点是，按上述步骤推导得到的自适应调节规律要求

\boldsymbol{x}_{p}

与

r

线性独立。两者独立的条件是

r (t)

为具有一定频率的方波信号或为

q

个不同频率的正弦信号组成的分段连续信号，其中

q > n /2

或

q > (n - 1) /2

。

三、问题求解

由上述推导可知，为采取李雅普诺夫稳定性理论设计该MRACS，需引入前馈增益矩阵 $K$ 和反馈增益矩阵 $F$ ，设计的目标是确定 $K$ 和 $F$ 的系数。

在引入两个增益矩阵进行自适应控制后，可调系统的状态方程变为：
$\dot{\boldsymbol{x}}_{p}=\left[\boldsymbol{A}_{p}(t)+\boldsymbol{b}_{p}(t) F\right] \boldsymbol{x}_{p}+\boldsymbol{b}_{p}(t) K r \tag{15}$
由之前的推导可知，(14)式中的 $\boldsymbol{b}_{m} \bar{K}^{-1}$ 与 $\boldsymbol{b}_{p}$ 的关系如下：
$\boldsymbol{b}_{m} \bar{K}^{-1}=\boldsymbol{b}_{p}=\left[$

\begin{array}{l} 2 \\ 4 \end{array}

\right] \tag{16}

b_{m} \overset{ˉ}{K}^{- 1} = b_{p} = [24] (16)

选取(14)式中的部分自适应参数如下：

\begin{array}{ll} 3 & 1 \\ 1 & 1 \end{array}

所以可得最终的自适应规律：

\begin{aligned} F (t) & = \int_{0}^{t} [\begin{array}{ll} 2 & 4 \end{array}] [\begin{array}{ll} 3 & 1 \\ 1 & 1 \end{array}] e x_{p}^{T} d τ + F (0) \\ K (t) & = \int_{0}^{t} [\begin{array}{ll} 2 & 4 \end{array}] [\begin{array}{ll} 3 & 1 \\ 1 & 1 \end{array}] e r d τ + K (0) \end{aligned}

下将上述连续自适应规律进行离散化，用于实际的数值仿真实验。设数值积分步长为

h

，则各时刻的参考模型状态向量及控制对象状态向量如下：

\begin{aligned} x_{m} (k + 1) & = x_{m} (k) + h [A_{m} (k) x_{m} (k) + B_{m} (k) r (k)] \\ x_{p} (k + 1) & = x_{p} (k) + h [A_{p} (k) x_{p} (k) + B_{p} (k) u (k)] \end{aligned}

由于上述推导得到的自适应控制规律要求

\boldsymbol{x}_{p}

与

r

线性独立，即要求

r (t)

为具有一定频率的方波信号或为

q

个不同频率的正弦信号组成的分段连续信号，其中

q > n /2

或

q > (n - 1) /2

。在本次实验中，

n = 2

，对应就要求

q > 1

，所以本次实验中选取由3个不同频率的正弦信号组成的分段连续信号，具体的输入信号的形式如下：

r(k)=\sin (0.01 \pi k)+4 \sin (0.2 \pi k)+\sin (\pi k) \tag{20}

我们设计自适应规律时引入的控制信号

u

的离散化形式如下：

\boldsymbol{x}_{p}(k) \tag{21}

最终，还需将自适应规律离散化：

\begin{aligned} F (k) & = h \cdot \sum_{j = 0}^{k} b_{p}^{T} P e (k) {(x_{p} (k))}^{T} + F (0) \\ K (k) & = h \cdot \sum_{j = 0}^{k} b_{p}^{T} P e (k) r (k) + K (0) \end{aligned}

在推导出全部的自适应规律并对相应规律进行离散化后，通过MATLAB进行了相关的仿真实验。

可以得到2个维度的状态向量的参考模型值与可调系统值的情况如下：

在这里插入图片描述

图1. 状态向量的参考模型值与可调系统值

可以看到，可调系统并没有很好的跟踪参考模型，这是由于在该例中不存在最优匹配。

附录：实现MATLAB代码

% 课本习题3.4-用李雅普诺夫稳定性理论设计自适应规律
clear, clc;
close all;

h=0.01;L=100/h;     % 数值积分步长和仿真步数
% 可调系统的系数矩阵
Ap = [0 1;-6 -7];
Bp = [2; 4];
% 参考模型的系数矩阵
Am = [0 1;-10 -5];
Bm = [1; 2];
% n为行向量维数、m为列向量维数，Bp是n*m的矩阵
n = size(Bp, 1);
m = size(Bp, 2);

P = [3 1;1 1];              % 经计算得到的用于自适应规律的正定对称矩阵

% 设定所有参数的初始值
yr0 = zeros(m, 1);
xp0 = zeros(n, 1);
xm0 = zeros(n, 1);
u0 = zeros(m, 1);
e0 = zeros(n, 1);
F0 = zeros(m, n);           % 反馈增益矩阵初始值
K0 = zeros(m, m);           % 前馈增益矩阵初始值

% 初始分配参数空间
time = zeros(1, L);         % 用于记录仿真的时刻，对应绘图的横轴
yr = zeros(m, L);           % 输入信号(L个m维向量)
xp = zeros(n, L);           % 可调系统的状态向量(L个n维向量)
xm = zeros(n, L);           % 参考模型的状态向量(L个n维向量)
u = zeros(m, L);            % 控制信号(L个m维向量)
e = zeros(n, L);            % 系统的广义状态误差向量(L个n维向量)

for k = 1:L
    time(k) = k*h;
    % 输入信号
    yr(k) = 1*sin(0.01*pi*time(k))+4*sin(0.2*pi*time(k))+sin(1*pi*time(k));
    xp(:,k) = xp0+h*(Ap*xp0+Bp*u0);     % 计算xp
    xm(:,k) = xm0+h*(Am*xm0+Bm*yr0);    % 计算xm
    e(:,k) = xm(:,k)-xp(:,k);           % e=xm-xp
    
    % 代入F和K的自适应控制规律
    F = F0+h*(Bp'*P*e0*xp0');
    K = K0+h*(Bp'*P*e0*yr0);

    % 控制信号u=K*r+F*xp（K是前馈增益矩阵，F是反馈增益矩阵）
    u(:,k) = K*yr(k)+F*xp(:,k);
    
    % 将本轮求解得到的参数赋值给参数初始值，方便下一轮迭代使用
    yr0 = yr(:,k);
    u0 = u(:,k);
    e0 = e(:,k);
    xp0 = xp(:,k);
    xm0 = xm(:,k);
    F0 = F;
    K0 = K;
end

subplot(2,1,1);
plot(time, xm(1,:), 'Color', 'b', 'LineWidth', 0.9);
hold on
plot(time, xp(1,:), 'Color', 'r', 'LineStyle', '--', 'LineWidth', 1.1);
xlabel('t');
ylabel('x_m_1(t)、x_p_1(t)');
legend('x_m_1(t)','x_p_1(t)');
hold off
subplot(2,1,2);
plot(time, xm(2,:), 'Color', 'b', 'LineWidth', 0.9)
hold on
plot(time, xp(2,:), 'Color', 'r', 'LineStyle', '--', 'LineWidth', 1.1)
xlabel('t');
ylabel('x_m_2(t)、x_p_2(t)');
legend('x_m_2(t)', 'x_p_2(t)');
hold off
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

参考书目

李言俊, 张科. 自适应控制理论及应用[M]. 西北工业大学出版社, 2005.

相关阅读:
CDR插件开发之Addon插件007 - Addon插件简介和案例演示
idea正常，jar启动报错
2022年全球及中国工程机械行业头部企业市场占有率及排名调研报告
题目0063-射击比赛
SAGI GAMES 创始人曾嵘：瞄准休闲游戏，将“创意”转化为“商业”
自动化python的简单使用
完美解决configure: error: APR not found. Please read the documentation.
电脑重装系统word从第二页开始有页眉页脚如何设置
数据的距离度量三、Jaccard距离，卡方相似度，相关系数，Dice系数
万宾科技亮相2023中国传感器与应用技术大会，创始人CEO发表演讲

原文地址：https://blog.csdn.net/alan1ly/article/details/126056136

自适应控制——仿真实验一 用李雅普诺夫稳定性理论设计自适应规律