2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于扰动观测器的AUVs固定时间编队控制

高振宇 郭戈

高振宇, 郭戈. 基于扰动观测器的AUVs固定时间编队控制. 自动化学报, 2019, 45(6): 1094-1102. doi: 10.16383/j.aas.c180809
引用本文: 高振宇, 郭戈. 基于扰动观测器的AUVs固定时间编队控制. 自动化学报, 2019, 45(6): 1094-1102. doi: 10.16383/j.aas.c180809
GAO Zhen-Yu, GUO Ge. Fixed-time Formation Control of AUVs Based on a Disturbance Observer. ACTA AUTOMATICA SINICA, 2019, 45(6): 1094-1102. doi: 10.16383/j.aas.c180809
Citation: GAO Zhen-Yu, GUO Ge. Fixed-time Formation Control of AUVs Based on a Disturbance Observer. ACTA AUTOMATICA SINICA, 2019, 45(6): 1094-1102. doi: 10.16383/j.aas.c180809

基于扰动观测器的AUVs固定时间编队控制


DOI: 10.16383/j.aas.c180809
详细信息
    作者简介:

    高振宇  大连海事大学博士研究生.2013年获得山东理工大学电气与电子工程学院自动化专业学士学位.主要研究方向为水面及水下航行器编队控制.E-mail:18840839109@163.com

    通讯作者: 郭戈  东北大学特聘教授, 大连海事大学博导.1998年获得东北大学控制理论与控制工程专业博士学位.主要研究方向为智能交通系统, 共享出行系统, 信息物理融合系统.本文通信作者.E-mail:geguo@yeah.net
  • 基金项目:

    国家自然科学基金 61573077

    国家自然科学基金 U1808205

Fixed-time Formation Control of AUVs Based on a Disturbance Observer

More Information
    Author Bio:

    Ph. D. candidate in the Department of Automation, Dalian Maritime University. He received his bachelor degree in automation from School of Electrical and Electronic Engineering, Shandong University of Technology in 2013. His research interest covers formation control of surface and underwater vehicles

    Corresponding author: GUO Ge Professor at Northeastern University and doctoral supervisor of Dalian Maritime University. He received his Ph. D. degree in control theory and control engineering from Northeastern University in 1998. His research interest covers intelligent transportation systems, mobility on-demand systems, cyber-physical systems. Corresponding author of this paper
  • Fund Project:

    National Natural Science Foundation of China 61573077

    National Natural Science Foundation of China U1808205

图(12) / 表(1)
计量
  • 文章访问数:  330
  • HTML全文浏览量:  138
  • PDF下载量:  329
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-12-05
  • 录用日期:  2019-02-15
  • 刊出日期:  2019-06-20

基于扰动观测器的AUVs固定时间编队控制

doi: 10.16383/j.aas.c180809
    作者简介:

    高振宇  大连海事大学博士研究生.2013年获得山东理工大学电气与电子工程学院自动化专业学士学位.主要研究方向为水面及水下航行器编队控制.E-mail:18840839109@163.com

    通讯作者: 郭戈  东北大学特聘教授, 大连海事大学博导.1998年获得东北大学控制理论与控制工程专业博士学位.主要研究方向为智能交通系统, 共享出行系统, 信息物理融合系统.本文通信作者.E-mail:geguo@yeah.net
基金项目:

国家自然科学基金 61573077

国家自然科学基金 U1808205

摘要: 考虑含有模型参数不确定及未知海洋扰动的多AUVs协同编队问题,本文提出一种新的控制方法,该方法可保证编队在固定时间内实现.首先,将模型参数不确定及海洋扰动看作复合扰动,设计扰动观测器,实现固定时间内对扰动的精确估计.基于扰动观测器,指令滤波技术、固定时间理论及虚拟轨迹概念,设计编队控制律,实现编队目标,并保证闭环系统中的所有信号是全局固定时间稳定的.最后通过两艘AUV的编队仿真验证了所提算法的有效性.

本文责任编委 刘艳军

English Abstract

  • 随着海洋科技的发展, 自主水下航行器(Autonomous underwater vehicle, AUV)在各种海洋应用中扮演着重要角色, 例如深海检测、海洋测绘、海底地形测绘等[1-6].在一些特定应用中, 多AUVs以确定的构型协同工作展现出来更多的鲁棒性、协同性和容错性, 使其受到越来越多的关注.编队控制是指通过选取合适的控制策略, 使得多个同类或相似个体组成的系统保持期望的相对姿态, 维持队形的协同运动, 最终完成特定的任务.在多AUVs协同编队控制策略中, 领航–跟随策略(Leader-follower strategy)由于其简单性及可伸缩性, 成为运用最广泛的策略, 且获得了一些显著研究成果[7-10].

    由于AUV高度非线性、交叉耦合的动力学, 模型参数不确定以及不可预测的复杂环境, 给多AUVs编队控制带来了极大的挑战.为了处理模型参数不确定及海洋扰动, 多种算法被提出, 主要有基于神经网络近似算法[8, 11-12]及基于扰动观测器算法[13-14].在基于神经网络算法[8, 11-12]中, 利用神经网络强大的近似能力对参数不确定及海洋扰动进行估计.由于神经网络算法中近似残差的存在, 基于神经网络算法只能得到全局一致有界的跟踪性能, 而不是渐近稳定.在基于扰动观测器的算法[13-14]中, 参数不确定及海洋扰动由扰动观测器进行估计.文章[13]设计的观测器只可保证观测误差收敛至确定区域, 得到一致有界的观测效果.为了得到更好的观测效果, 文章[14]给定一种基于有限时间的扰动观测器, 实现对参数不确定及海洋扰动的精确估计, 从而获得全局有限时间稳定的跟踪性能.虽然基于有限时间的观测器[14]可对扰动精确估计, 但其收敛时间与初始观测误差有关, 限制了其适用性.

    在多AUVs协同编队控制中, 收敛速度是一个重要性能指标, 它反映了编队系统的响应特性.当前大部分研究结果只能得到渐近稳定的跟踪性能, 这意味着系统的收敛速度最好也只是指数收敛, 跟踪误差在无限时间内收敛到零.如果可以在有限时间内实现期望编队, 将会是该领域的一个巨大进步.幸运的是, 最新的一些成果表明可以在稳态时间内实现协同控制[15-17].这些研究成果都是基于固定时间理论[18].该理论可以保证系统在稳定时间内达到稳定且收敛时间独立于系统状态.针对一些对收敛时间有严格要求的系统, 该理论更加适用.目前, 该理论只有少部分运用到了多智能体系统的一致性控制.本文尝试对该理论进行实际应用中的扩展, 实现严格收敛时间限制下的AUVs协同编队控制.

    本文针对含有模型参数不确定及海洋扰动的多AUVs编队控制问题, 提出了一种基于扰动观测器的控制器设计方法.首先将模型参数不确定及海洋扰动看作为复合扰动, 设计扰动观测器实现对扰动精确估计.基于观测器, 指令滤波技术, 提出一种新的固定时间编队控制律, 保证编队系统的全局固定时间稳定.与已有文献相比, 本文主要创新点总结如下:

    1) 将模型参数不确定及海洋扰动看作为复合扰动, 基于固定时间理论, 构造了一种新型扰动观测器, 实现对复合扰动的精确估计.该观测器不仅保证了观测误差为零, 同时确保观测误差稳定时间内收敛, 且该时间独立于初始观测误差.

    2) 基于扰动观测器, 固定时间理论及虚拟轨迹概念, 设计编队控制律, 确保系统全局固定时间稳定, 闭环系统中所有跟踪误差稳定时间内收敛到零.此外, 在控制器设计过程中, 引入指令滤波器, 避免了传统反推法中的复杂求导问题, 使得控制器设计简单易于工程中实现.

    本文组织结构如下:第1节给出问题描述及预备知识; 第2节给出本文主要结果; 第3节是数值仿真; 最后在第4节进行总结.

    • 考虑前进、横漂、艏遥3个自由度, AUV水平面运动学及动力学模型为[8]:

      $$ \begin{equation}\label{sys1} \dot{\eta}=R(\psi)\upsilon \end{equation} $$ (1)
      $$ \begin{equation}\label{sys2} M\dot{\upsilon}+C(\upsilon)\upsilon+D(\upsilon)\upsilon=\tau+\tau_w \end{equation} $$ (2)

      式中: $\eta=[x, y, \psi]^{\rm T}$为AUV在惯性坐标系下的位置及航向; $\upsilon=[u, v, r]^{\rm T}$为AUV在附体坐标系下的前进速度(Surge)、横漂速度(Sway)及艏遥角速度(Yaw), 如图 1所示; $\tau=[\tau_u, \tau_v, \tau_r]^{\rm T}$为控制输入; $\tau_w=[\tau_{wu}, \tau_{wv}, \tau_{wr}]^{\rm T}$为海洋扰动; $R(\psi)\in {\bf R}^{3\times3}$为旋转矩阵, 满足$R(\psi)R^{\rm T}(\psi)=I_{3\times3}$, 表达式为:

      图  1  AUV坐标系示意图

      Figure 1.  The diagram of earth-fixed frame and bady-fixed frame

      $$ \begin{equation}\label{sys3} R(\psi)=\left[ \begin{matrix} \cos(\psi)&-\sin(\psi)&0\\ \sin(\psi)&\cos(\psi)&0\\ 0&0&1 \end{matrix}\right] \end{equation} $$ (3)

      $M\in {\bf R}^{3\times3}$为惯量矩阵; $C(\upsilon)\in {\bf R}^{3\times3}$为科里奥利和向心力矩阵; $D(\upsilon)\in{\bf R}^{3\times3}$为非线性阻尼矩阵, 具体形式如下:

      $$ \begin{equation}\label{sys4} \begin{aligned} M=\left[\begin{matrix} m_{u}&0&0\\0&m_{v}&0\\0&0&m_{r} \end{matrix}\right] \end{aligned} \end{equation} $$ (4)
      $$ \begin{equation}\label{sys5} \begin{aligned} C(\upsilon)=\left[\begin{matrix} 0&0&-m_{v}v\\0&0&m_{u}u\\m_{v}v&-m_{u}u&0 \end{matrix}\right] \end{aligned} \end{equation} $$ (5)
      $$ \begin{equation}\label{sys6} \begin{aligned} D(\upsilon)=\left[\begin{matrix} d_{u}&0&0\\0&d_{v}&0\\0&0&d_{r} \end{matrix}\right] \end{aligned} \end{equation} $$ (6)

      式中: $m_{u}=m-X_{\dot{u}}$, $m_{v}=m-Y_{\dot{v}}$, $m_{r}=I_{z}-N_{\dot{{r}}}$; $d_{u}=-(X_{u}+X_{u|u|}u)$, $d_{v}=-(Y_{v}+Y_{v|v|}|v|)$, $d_{r}=-(N_{r}+N_{r|r|}|r|)$.其中, $m$为AUV质量; $X_{u}$, $X_{u|u|}$, $Y_{v}$, $ Y_{|v|v}$, $Y_{r}$, $Y_{|r|r}$, $N_{\dot{r}}$, $ N_{v}$, $N_{v|v|}$, $N_{r}$, $N_{|r|r}$为阻尼系数; $X_{\dot{u}}$, $Y_{\dot{v}}$, $ Y_{\dot{r}}$, $N_{\dot{r}}$为附加质量; $I_{z}$为转动惯量.

      由于AUV动态与其自身特性、操作条件和速度都是相关的, 而这些因素时常变化且难以预知.为了更真实地反映AUV动态, 将上述矩阵描述为下面含有不确定项形式: $M=M_0+\Delta M$, $C=C_0+\Delta C$, $D=D_0+\Delta D$, 其中, $M_0$, $C_0$和$D_0$均为标称矩阵; $M_0$为正定对称矩阵; $\Delta M$, $\Delta C$和$\Delta D$均为不确定矩阵.

      为简单起见, 式(2)写成如下形式

      $$ \begin{equation}\label{sys7} \dot{\upsilon}=\frac{1}{M_0}(-C_0(\upsilon)\upsilon-D_0(\upsilon)\upsilon+\tau)+\Delta \end{equation} $$ (7)

      式中: $\varDelta=(\varDelta M\dot{\upsilon}+\varDelta C(\upsilon)\upsilon+\varDelta D(\upsilon)\upsilon+\tau_w)/{M_0}$表示作用到AUV上由模型参数不确定和海洋扰动构成的复合扰动项.

      假设1.   式(7)中的$\varDelta$是有界的, 即$\lVert\varDelta\rVert\leq\rho<\infty $, 其中: $\rho$为已知常数; $\lVert\cdot\rVert$为矩阵或向量的2-范数.

      注1. 由于AUV运行速度, 携带能源的约束以及外界海洋扰动能量的有限性, 可知假设1是合理的.

      为方便控制器的设计, 本文引入"虚拟轨迹"概念, 将编队控制转化为轨迹跟踪问题, 如图 2所示.虚拟轨迹的构建基于期望的编队构型$(d^d_{lf}, \varphi^d_{if})$, 分别定义纵向距离$d_x=l^d_{lf}\cos(\varphi^d_{lf})$及横向距离$d_y=l^d_{lf}\sin(\varphi^d_{lf})$.在惯性坐标系下, 虚拟轨迹表达式为:

      图  2  领航–跟随多AUVs编队示意图

      Figure 2.  The diagram of leader-follower formation of AUVs

      $$ \begin{equation}\label{sys8} \begin{cases} x_v=x_l+d_x\cos(\psi_l)-d_y\sin(\psi_l)\\ y_v=y_l+d_x\sin(\psi_l)+d_y\cos(\psi_l)\\ \psi_v=\psi_l \end{cases} \end{equation} $$ (8)

      也可写为:

      $$ \begin{equation}\label{sys9} \eta_v=\eta_l+R(\psi_l)L \end{equation} $$ (9)

      式中: $\eta_l=[x_l, y_l, \psi_l]^{\rm T}$为领航AUV的广义位置及航向; $\eta_v=[x_v, y_v, \psi_v]^{\rm T}$为虚拟轨迹; $L=[d_x, d_y, 0]^{\rm T}$.

      假设2. 领航AUV的位置信息、航向信息、速度信息都可用.

      假设3. 领航AUV的轨迹$\eta_l$是光滑可导且有界的, 其一阶导数$\dot{\eta}_l$和二阶导数$\ddot{\eta}_l$存在且有界.

      控制目标:在假设1$\, \sim\, $3下, 设计基于扰动观测器的编队控制律, 使跟随AUV跟踪上虚拟轨迹, 进而实现AUV间的编队控制, 同时保证闭环系统中的所有信号是全局固定时间稳定的, 数学形式描述如下:

      $$ \begin{equation}\label{sys10} \lim\limits_{t\longrightarrow T}{\lVert{\eta_f}-\eta_v\rVert=0} \end{equation} $$ (10)

      $$ \begin{equation}\label{sys11} \lVert{\eta_f}-\eta_v\rVert=0, \forall t\geq T \end{equation} $$ (11)

      式中: $\eta_f=[x_f, y_f, \psi_f]^{\rm T}$为跟随AUV的位置信息及航向信息, $T$是正常数, 为期望的收敛时间, 且$T\in [0, \infty)$.

    • 引理1[18]. 如果存在一个连续径向有界函数$V\!:{\bf R}^n\longrightarrow {\bf R}_+\cup\{0\}$满足:

      1) $V(x)=0\Leftrightarrow x=0$.

      2) 对于任何$x(t)$均可满足不等式$\dot{V}(x)\leq-\gamma_1V^\alpha(x)-\gamma_2V^\beta(x)$, 其中$\gamma_1$, $\gamma_2$, $\alpha$和$\beta$均为正常数, 且$0<\alpha<1$, $\beta>1$, 则原系统可以在固定时间内收敛到零, 且收敛时间$T$满足:

      $$ \begin{equation}\label{sys12} T\leq T_{\max}:=\frac{1}{\gamma_1(1-\alpha )}+\frac{1}{\gamma_2(\beta-1)} \end{equation} $$ (12)

      注2. 由式(12)可以看出系统的收敛时间只与系统参数$\gamma_1$, $\gamma_2$, $\alpha$, $\beta$有关, 与系统初始状态无关.在实际工程中, 对收敛时间有严格要求的情况, 此算法更加适用.

      引理2[18]. 如果存在一个连续径向有界函数$V\!:{\bf R}^n\longrightarrow {\bf R}_+\cup\{0\}$满足:

      1) $V(x)=0\Leftrightarrow x=0$.

      2) 对于任何$x(t)$均可满足不等式$\dot{V}(x)\leq-\gamma_1V^\alpha(x)-\gamma_2V^\beta(x)+\vartheta$, 其中$\gamma_1$, $\gamma_2$, $\alpha$, $\beta$, $\vartheta$均为正常数, 且$0<\alpha<1$, $\beta>1$, 则原系统是实际固定时间稳定的, 且收敛时间$T$满足:

      $$ \begin{equation}\label{sys14} \begin{aligned} T\leq T_{\max}:=\frac{1}{\gamma_1 \theta(1-\alpha)}+\frac{1}{\gamma_2\theta(\beta -1)} \end{aligned} \end{equation} $$ (13)

      这里$\theta$为正常数, 满足$0<\theta<1$.

      引理3[9]. 取$\epsilon_1, \epsilon_2, \cdots, \varepsilon_M\geq0$, 则

      $$ \begin{equation}\label{sys16} \begin{cases} \sum\limits_{i=1}^M\epsilon_i^p\geq\left(\sum\limits_{i=1}^M\epsilon_i\right)^p, 0<p\leq1\\ \sum\limits_{i=1}^M\epsilon_i^p\geq M^{1-p}\left(\sum\limits_{i=1}^M\epsilon_i\right)^p, 1<p\leq\infty \end{cases} \end{equation} $$ (14)
    • 在本节中, 首先给出基于固定时间的扰动观测器, 确保对扰动的精确估计, 然后基于观测器及固定时间理论设计跟踪控制律, 实现编队控制, 如图 3所示.

      图  3  编队跟踪控制示意图

      Figure 3.  The diagram of formation control

    • 为观测器设计, 首先定义变量$\Pi=\upsilon_f-\chi$, 其中,

      $$ \begin{align}\label{sys17} \dot{\chi}=\, &\lambda_1\Pi+\lambda_2\Pi^\alpha+\lambda_3\Pi^\beta+ \lambda_4\text{sign}(\Pi)-\nonumber\\&\frac{1}{M_0}(C_0(\upsilon_f)\upsilon_f+D_0(\upsilon_f)\upsilon_f-\tau_f) \end{align} $$ (15)

      式中: $\lambda_i\in {\bf R}^{3\times3}~(i=1, 2, 3, 4)$为正定对角待设计矩阵, 其中矩阵$\lambda_4$中的每个元素满足$\lambda_4\geq\rho$. $\alpha$和$\beta$为正常数, 满足: $0<\alpha<1$, $\beta>1$.

      根据式(7)和(15), 对$\Pi$求导得:

      $$ \begin{align}\label{sys18} \dot{\Pi}\, &\, =\, \dot{\upsilon}_f-\dot{\chi}=\nonumber\\& -\lambda_1\Pi-\lambda_2\Pi^\alpha-\lambda_3\Pi^\beta- \lambda_4\text{sign}(\Pi)+\nonumber\\& \frac{1}{M_0}(C_0(\upsilon_f)\upsilon_f+D_0(\upsilon_f)\upsilon_f-\tau_f)-\nonumber\\ &\frac{1}{M_0}(C_0(\upsilon_f)\upsilon_f+ D_0(\upsilon_f)\upsilon_f-\tau_f)+\varDelta=\nonumber\\ &-\lambda_1\Pi-\lambda_2\Pi^\alpha-\lambda_3\Pi^\beta- \lambda_4\text{sign}(\Pi)+\varDelta \end{align} $$ (16)

      这里, 选择$\hat{\varDelta}$如下:

      $$ \begin{equation}\label{sys19} \begin{aligned} \hat{\varDelta}=\lambda_1\Pi+\lambda_2\Pi^\alpha+ \lambda_3\Pi^\beta+\lambda_4\text{sign}(\Pi) \end{aligned} \end{equation} $$ (17)

      定义观测误差为$\tilde{\varDelta}=\hat{\varDelta}-\varDelta$, 具体表达式如下:

      $$ \begin{align}\label{sys20} \tilde{\varDelta}=\, &\hat{\varDelta}-\varDelta=\nonumber\\&\lambda_1\Pi+ \lambda_2\Pi^\alpha+\lambda_3\Pi^\beta+\lambda_4\text{sign}(\Pi)- \dot{\upsilon_f}+\nonumber\\&\frac{1}{M_0}(C_0(\upsilon_f)\upsilon_f+ D_0(\upsilon_f)\upsilon_f-\tau_f)=\nonumber\\& \dot{\chi}-\dot{\upsilon_f}=-\dot{\Pi} \end{align} $$ (18)

      由上式可知, 如果$\dot{\Pi}$收敛, 可确保$\tilde{\varDelta}$收敛.

      根据上述分析, 得到如下定理.

      定理1.   在假设1下, 构造的扰动观测器(17)可以在稳定时间内对复合扰动$\varDelta$精确估计, 且估计误差为零.

      证明. 选取如下李雅普诺夫函数:

      $$ \begin{equation}\label{sys21} V_d=\frac{1}{2}\Pi^{\rm T}\Pi \end{equation} $$ (19)

      根据式(16), 对$V_d$求导得:

      $$ \begin{align}\label{sys22} \dot{V}_d=\, &\Pi^{\rm T}\dot{\Pi}=\Pi^{\rm T}(-\lambda_1\Pi-\nonumber\\ &\lambda_2\Pi^\alpha-\lambda_3\Pi^\beta- \lambda_4\text{sign}(\Pi)+\varDelta)\leq\nonumber\\& -\lambda_1(\Pi^{\rm T}\Pi)-\lambda_2(\Pi^{\rm T}\Pi)^\frac{\alpha+1}{2}-\nonumber\\& \lambda_3(\Pi^{\rm T}\Pi)^\frac{\beta+1}{2}\leq -\lambda_{\min}(\lambda_2)(\Pi^{\rm T}\Pi)^\frac{\alpha+1}{2}-\nonumber\\& \lambda_{\min}(\lambda_3)(\Pi^{\rm T}\Pi)^\frac{\beta+1}{2}=\nonumber\\& -2^{\frac{\alpha+1}{2}}\lambda_{\min}(\lambda_2) (\frac{1}{2}\Pi^{\rm T}\Pi)^\frac{\alpha+1}{2}-\nonumber\\&2^{\frac{\beta+1}{2}} \lambda_{\min}(\lambda_3)(\frac{1}{2}\Pi^{\rm T}\Pi)^\frac{\beta+1}{2}=\nonumber\\ &-2^{\frac{\alpha+1}{2}}\lambda_{\min}(\lambda_2)(V_d)^\frac{\alpha+1}{2}-\nonumber\\ &2^{\frac{\beta+1}{2}}\lambda_{\min}(\lambda_3)(V_d)^\frac{\beta+1}{2} \end{align} $$ (20)

      根据引理1, 可知, 系统$\Pi$是全局固定时间稳定的, 且收敛时间$T_o$满足:

      $$ \begin{equation}\label{sys23} \begin{aligned} T_o\leq T_{\max}:=\frac{2^{\frac{1-\alpha}{2}}}{\lambda_{\min}(\lambda_2) (1-\alpha)}+\frac{2^{\frac{1-\beta}{2}}}{\lambda_{\min}(\lambda_3)(\beta-1)} \end{aligned} \end{equation} $$ (21)

      根据$V_d$的定义可知, 当$t\geq T_o$时, $V_d\equiv0$, $\dot{V}_d\equiv0$, $\dot{\Pi}=0$, 进一步得到如下结论:

      $$ \begin{equation}\label{sys24} \tilde{\varDelta}=0, t\geq T_0 \end{equation} $$ (22)

      注3. 与给定扰动观测器[13-14]相比, 本文提出的观测器(17)可实现对扰动精确估计, 同时确保观测误差在稳定时间内收敛到零, 且收敛时间独立于初始观测误差.

    • 在假设1$\, \sim\, $3下, 基于设计的扰动观测器, 指令滤波技术及固定时间理论, 设计控制律, 使跟随AUV跟踪虚拟轨迹, 进而实现AUV间的编队控制.整个控制器设计过程包括以下两个步骤: 1)设计运动学控制器实现对虚拟轨迹的跟踪; 2)设计动力学控制器实现对1)中运动学控制器的跟踪.

      运动学控制器设计

      定义位置及航向跟踪误差:

      $$ \begin{equation}\label{sys25} z_1=\eta_f-\eta_v \end{equation} $$ (23)

      根据式(1)和(9), 对其求导得

      $$ \begin{align}\label{sys26} \dot{z_1}=\, &\dot{\eta}_f-\dot{\eta}_v=\nonumber\\& R(\psi_f)\upsilon_f-R(\psi_l)\upsilon_l-R(\psi_l)S(r_l)L \end{align} $$ (24)

      式中: $ S(r_l)=\left[ \begin{matrix} 0&-r_l&0\\ r_l&0&0\\ 0&0&0 \end{matrix} \right]$, $r_l$为领航AUV的艏遥角速度.

      选择运动学控制器$\alpha_\upsilon$如下:

      $$ \begin{equation}\label{sys27} \begin{aligned} \alpha_{\upsilon_f}=-R^{\rm T}(\psi_f)[\Phi(z_1)+R(\psi_l)\upsilon_l+R(\psi_l)S(r_l)L] \end{aligned} \end{equation} $$ (25)

      式中: $\Phi(z_1)=k_1z^\alpha_1+k_2z^\beta_1$, $k_i~(i=1, 2)$为$3\times3$正定对角实数矩阵.

      为了验证$z_1$的收敛性, 构造如下李雅普诺夫函数:

      $$ \begin{equation}\label{sys28} V_1=\frac{1}{2}z_1^{\rm T}z_1 \end{equation} $$ (26)

      根据式(24)和(25), 对$V_1$求导得:

      $$ \begin{align}\label{sys29} \dot{V}_1=\, &z_1^{\rm T}\dot{z}_1=\nonumber\\& z_1^{\rm T}\{R(\psi_f)(-R^{\rm T}(\psi_f)[\Phi(z_1)+R(\psi_l)\upsilon_l+\nonumber\\ &R(\psi_l)S(r_l)L]-R(\psi_l)\upsilon_l-R(\psi_l)S(r_l)L)\}=\nonumber\\& z_1^{\rm T}R(\psi_f)(-R^{\rm T}(\psi_f)\Phi(z_1)= -z_1^{\rm T}\Phi(z_1)=\nonumber\\&-k_1(z_1^{\rm T}z_1)^{\frac{\alpha+1}{2}}- k_2(z_1^{\rm T}z_1)^{\frac{\beta+1}{2}}\leq\nonumber\\&-\lambda_{\min}(k_1)2^ {\frac{\alpha+1}{2}}V^{\frac{\alpha+1}{2}}_1-\lambda_{\min}(k_2)2^{\frac{\beta+1}{2}}V^{\frac{\beta+1}{2}}_1 \end{align} $$ (27)

      根据引理1, 可得系统$z_1$是全局固定时间稳定的.

      为了得到$\alpha_{\upsilon_f}$的导数, 方便动力学控制器的设计, 引入指令滤波器[19], 得到新的变量$\alpha^d_{\upsilon_f}$及$\dot{\alpha}^d_{\upsilon_f}.$

      指令滤波器表达式如下:

      $$ \begin{equation}\label{sys30} \begin{cases} \dot{\varphi}_1=f\iota_1\\ \dot{\iota}_1=-2\zeta f\iota_1-f(\varphi_1-\alpha_{\upsilon_f}) \end{cases} \end{equation} $$ (28)

      式中: $\alpha_{\upsilon_f}$为输入信号, $\varphi_1$和$\iota_1$是滤波器输出信号, $f>0$和$\zeta\in(0, 1]$是滤波器设计增益, 分别表示滤波器自然频率及阻尼比, 这里$\varphi_1(0)=\alpha_{\upsilon_f}(0)$, $\iota_1(0)=0$.

      注4. 与传统反推法相比, 指令滤波技术避免了对虚拟控制律的求导, 大大降低了计算量, 使控制器设计更加简单, 在工程中更加适用.

      动力学控制器设计

      定义速度跟踪误差:

      $$ \begin{equation}\label{sys31} z_2=\upsilon_f-\alpha_{\upsilon_f}^d \end{equation} $$ (29)

      根据式(7), 对其求导得:

      $$ \begin{equation}\label{sys32} \begin{aligned} \dot{z}_2=\, &\frac{1}{M_0}(-C_0(\upsilon_f)\upsilon_f-D_0(\upsilon_f) \upsilon_f+\tau_f)+\varDelta-\dot{\alpha}_{\upsilon_f}^d \end{aligned} \end{equation} $$ (30)

      选择动力学控制器为:

      $$ \begin{align}\label{sys33} \tau_f=\, &M_0[-\Phi(z_2)+\hat{\varDelta}]+C_0(\upsilon_f) \upsilon_f+\nonumber\\&D_0(\upsilon_f)\upsilon_f+\dot{\alpha}^d_{\upsilon_f} \end{align} $$ (31)

      式中: $\Phi(z_2)=k_3z^\alpha_2+k_4z^\beta_2+k_5z_2$, $k_i~(i=3, 4, 5)$为$3\times3$正定对角实数矩阵且满足$\lambda_{\min}(k_5)>{1}/{2}$.

      验证系统$z_2$的收敛性, 构造李雅普诺夫函数

      $$ \begin{equation}\label{sys34} V_2=\frac{1}{2}z_2^{\rm T}z_2 \end{equation} $$ (32)

      根据式(30)及Young's不等式, 对其求导得:

      $$ \begin{align}\label{sys35} \dot{V}_2=\, &z_2^{\rm T}\{\frac{1}{M_0}(-C_0(\upsilon_f)\upsilon_f-D_0(\upsilon_f) \upsilon_f)+\nonumber\\&\frac{1}{M_0}[-M_0[\Phi(z_2)+\hat{\varDelta}]+C_0 (\upsilon_f)\upsilon_f+\nonumber\\&D_0(\upsilon_f)\upsilon_f+\dot{\alpha}^ d_{\upsilon_f}]+\varDelta-\dot{\alpha}_{\upsilon_f}^d\}=\nonumber\\&z_2^{\rm T}[-\Phi(z_2)+ \hat{\varDelta}-\varDelta]=\nonumber\\&z_2^{\rm T}[-\Phi(z_2)+\tilde{\varDelta}]=\nonumber\\ &z_2^{\rm T}(-k_3z_2^\alpha-k_4z_2^\beta-k_5z_2)+z_2^{\rm T}\tilde{\varDelta}\leq\nonumber\\& -k_3(z_2^{\rm T}z_2)^{\frac{\alpha+1}{2}}-k_4(z_2^{\rm T}z_2)^{\frac{\beta+1}{2}}-\nonumber\\ &\frac{2k_5-1}{2}(z_2^{\rm T}z_2)+\frac{1}{2}\lVert\tilde{\varDelta}\rVert\leq\nonumber\\& -\lambda_{\min}(k_3)2^{\frac{\alpha+1}{2}}V_2^{\frac{\alpha+1}{2}}-\nonumber\\& \lambda_{\min}(k_4)2^{\frac{\beta+1}{2}}V_2^{\frac{\beta+1}{2}}+ \frac{1}{2}\lVert\tilde{\varDelta}\rVert \end{align} $$ (33)

      根据定理1, 我们可知存在一个正常数$\varpi$使得$\tilde{\varDelta}\leq\varpi, t\in[0, T_o]$和$\tilde{\varDelta}=0, \forall t\geq T_o$.根据引理1和2, 可得系统$z_2$是固定时间稳定的.

      根据上述分析, 可得下面定理.

      定理2. 考虑模型为式(1)和(2)的AUV, 在假设1$\, \sim\, $3下, 设计基于扰动观测器(17)、指令滤波器(28)及运动学控制器(25)的动力学控制器(31)可实现多AUVs间的编队控制(如(10)和(11)), 且保证闭环系统中的所有信号都是固定时间稳定的, 跟踪误差$(z_1, z_2)$在固定时间$T$内收敛到零且$T$满足下面不等式:

      $$ \begin{equation}\label{sys36} T\leq T_o+T_1 \end{equation} $$ (34)

      式中$T_1$将会在后面给出.

      证明. 为了验证整个跟踪系统的稳定性, 构造如下李雅普诺夫函数:

      $$ \begin{equation}\label{sys37} \begin{aligned} V=V_1+V_2 \end{aligned} \end{equation} $$ (35)

      根据式(24)和(30)及引理3, 对其求导得:

      $$ \begin{align}\label{sys38} \dot{V}=\, &\dot{V}_1+\dot{V}_2\leq\nonumber\\& -\lambda_{\min}(k_1)2^{\frac{\alpha+1}{2}}V^{\frac{\alpha+1}{2}}_1-\lambda_{\min}(k_2)2^{\frac{\beta+1}{2}}V^{\frac{\beta+1}{2}}_1-\nonumber\\&\lambda_{\min}(k_3)2^{\frac{\alpha+1}{2}}V_2^{\frac{\alpha+1}{2}}-\lambda_{\min}(k_4)2^{\frac{\beta+1}{2}}V_2^{\frac{\beta+1}{2}}\leq\nonumber\\& -aV^{\frac{\alpha+1}{2}}-bV^{\frac{\beta+1}{2}} \end{align} $$ (36)

      式中:

      $$ \begin{equation*} a=2^{\frac{\alpha+1}{2}}\lambda_{\min}\left\lbrace k_1, k_3\right\rbrace \end{equation*} $$
      $$ \begin{equation*} b=2\lambda_{\min}\left\lbrace k_2, k_4\right\rbrace \end{equation*} $$

      收敛时间为$T_1$, 满足下面不等式

      $$ \begin{equation}\label{sys39} T_1\leq T_{\max}:=\frac{2}{a(1-\alpha)}+\frac{2}{b(1-\beta)} \end{equation} $$ (37)

      注5. 本文所提控制理论可以确保编队跟踪目标设定时间内实现且设定时间只与控制器参数有关.该理论虽可通过参数调节实现任意时间内的编队控制, 但由于AUV实际存在约束(如执行器饱和、输入受限等), 无法任意调节收敛时间.根据执行器最大输出, 该收敛时间存在最小下界.

    • 以两艘AUV组成的系统进行编队研究, 通过仿真验证所提控制算法的有效性.

    • 跟随AUV运动学模型中的标称矩阵$M_0$, $C_0(\upsilon_f)$, $D_0(\upsilon_f)$如表 1所示, 领航AUV轨迹由运动学方程(1)产生, 其速度$\upsilon_l=[u_l, v_l, r_l]^{\rm T}$为:

      表 1  AUV模型参数

      Table 1.  Parameters of AUV

      SymbolValueUnit
      $m$185kg
      $X_u$$-$70kg/s
      $Y_v$$-$100kg/s
      $N_r$$-$50$\text{kgm}^2$
      $X_{\dot{u}}$$-$30kg
      $Y_{\dot{v}}$$-$80kg
      $N_{\dot{r}}$$-$30$\text{kgm}^2$
      $X_{u|u|}$$-$100kg/m
      $Y_{|v|v}$$-$200kg/m
      $N_{|r|r}$$-$100$\text{kgm}^2$
      $I_z$50$\text{kgm}^2$
      $$ \begin{equation} u_l=1\, \text{m/s}; v_l=0.5\, \text{m/s}; r_l= \begin{cases} 0 , &~ 0\leq t<30\\ 0.1, &\mbox{其他} \end{cases} \end{equation} $$ (38)

      初始条件为: $\eta_l=[0\, \text{m}, 0\, \text{m}, 0\, \text{rad }]^{\rm T}$, $\eta_f=[-8\, \text{m}, $ $-10\, \text{m}, 0\, \text{rad}]^{\rm T}$, $\upsilon_f=[0.01\, \text{m/s}, 0\, \text{m/s}, 0\, \text{rad/s}]^{\rm T}$.期望的编队构型为: $d^d_{lf}=5\sqrt{2}\, \text{m}$, $\varphi^d_{lf}={5\pi}/{4}\, \text{rad}$.

      海洋扰动$\tau_w=[\tau_{wu}, \tau_{wv}, \tau_{wr}]^{\rm T}$为:

      $$ \begin{align}\label{sys40} &\left[\begin{matrix} \tau_{wu}\\\tau_{wv}\\\tau_{wr} \end{matrix} \right] =\nonumber\\&\begin{bmatrix} 1.5+2\sin(0.02t)+1.5\sin(0.1t)\!&\text{N}\\ 1+2\sin(0.02t-\frac{\pi}{6})+1.5\sin(0.3t)\!&\text{N}\\ -2+2\sin(0.05t)+2\sin(0.1t)\!&\text{N}\cdot\text{m} \end{bmatrix} \end{align} $$ (39)
    • 情况1.   设$\varDelta M_f=0$, $\varDelta C_f(\upsilon_f)=0$, $\varDelta D_f(\upsilon_f)=0$, 即只存在海洋扰动.

      扰动观测器设计参数为: $\lambda_1=\text{diag}\{5, 5, 5\}$, $\lambda_2=\text{diag}\{5/7, 5/7, 5/7\}$, $\lambda_3=\text{diag}\{3/5, 3/5, 3/5\}$, $\lambda_6=\text{diag}\{6, 5, 6\}$, $\alpha=5/7$, $\beta=5/3$.控制器设计参数为: $k_1=k_3=$ $\text{diag}\{5/7, 5/7, 5/7\}$, $k_2=k_4=\text{diag}\{3/5, 3/5, 3/5)$, $k_5=\text{diag}\{5, 10, 10\}$, $f=25$, $\zeta=0.8$.

      仿真结果如下:图 4给出了领航AUV轨迹, 虚拟轨迹及跟随AUV实际行驶轨迹; 图 5给出了跟随AUV实际轨迹与虚拟轨迹的跟踪误差; 根据图 4图 5, 可以看出在本文设计的控制器作用下, 跟随AUV可以实现对虚拟轨迹的跟踪, 从而实现领航–跟随策略下的多AUVs编队跟踪控制. 图 6图 7给出设计的运动学控制器及动力学控制器; 图 8给出了在动力学控制器作用下的速度跟踪误差$z_2$, 从图中可以看出, 在所设计的动力学控制器作用下, 可以实现对运动学控制器的跟踪; 图 9给出了扰动真实值及观测器作用下的观测值, 由图可得所设计的观测器可以实现对复合扰动的精确估计.

      图  4  领航AUV轨迹、虚拟轨迹及跟随AUV轨迹

      Figure 4.  Trajectory of leader, virtual trajectory and trajectory of follower

      图  5  跟随AUV轨迹与虚拟轨迹跟踪误差$z_1$

      Figure 5.  Tracking error $z_1$ between follower trajectory and virtual trajectory

      图  6  跟随AUV运动学控制器

      Figure 6.  Kinematic controller $\alpha_{\upsilon_f}$ of follower

      图  7  跟随AUV动力学控制器$\tau_f$

      Figure 7.  Dynamic controller $\tau_f$ of follower

      图  8  跟随AUV速度跟踪误差$z_2$

      Figure 8.  Velocity tracking error$z_2$ of follower

      图  9  复合干扰$\varDelta$及其观测值$\hat{\varDelta}$

      Figure 9.  Compound disturbance $\varDelta$ and its estimate $\hat{\varDelta}$

      情况2.   设$\varDelta M_f=0.2M_{f0}$, $\varDelta C_f(\upsilon_f)=0.2C_{f0}(\upsilon_f)$, $\varDelta D_f(\upsilon_f)=0.2D_{f0}(\upsilon_f)$, 即存在模型参数不确定及海洋扰动.

      扰动观测器设计参数为: $\lambda_1=\text{diag}\{5, 5, 5\}$, $\lambda_2=\text{diag}\{5/7, 5/7, 5/7\}$, $\lambda_3=\text{diag}\{3/5, 3/5, 3/5\}$, $\lambda_6=\text{diag}\{3, 2, 3\}$, $\alpha=5/7$, $\beta=5/3$.

      根据图 10可以看出, 当模型参数不确定及海洋扰动同时存在时, 设计的扰动观测器仍是有效的.为简单起见, 这里我们只验证了扰动观测器的有效性.

      图  10  复合扰动$\varDelta$及其观测值$\hat{\varDelta}$

      Figure 10.  Compound disturbance $\varDelta$ and its estimate $\hat{\varDelta}$

      为了验证系统在所设计控制律下, 系统的收敛时间与初始状态无关, 在不同初始状态下验证本文算法: $\eta_{f1}(0)=[-8, -10, 0]^{\rm T}$, $\eta_{f2}(0)=[-5, -10, 0]^{\rm T}$, 仿真结果如图 11图 12所示.

      图  11  领航AUV轨迹、虚拟轨迹及不同初始状态下跟随AUV轨迹

      Figure 11.  Trajectory of leader, virtual trajectory and trajectory of follower under different initial states

      图  12  不同初始状态下跟随AUV轨迹与虚拟轨迹位置及航向跟踪误差$z_1$

      Figure 12.  Tracking error $z_1$ between follower trajectory and virtual trajectory with different initial states

      图 11图 12仿真结果验证了所设计控制算法的正确性及有效性.不同初始状态下, 该控制器可以确保相同时间达到系统稳定, 实现编队控制目标.

      综上可得, 上述仿真结果验证了所设计的扰动观测器及协同编队控制律的有效性及正确性.

    • 本文研究了带有模型参数不确定及海洋扰动的多AUVs编队控制问题, 提出了一种基于固定时间理论的控制器设计算法.首先, 为了对由模型参数不确定及海洋扰动组成的复合干扰实现精确估计, 设计了固定时间扰动观测器, 确保对干扰精确估计.然后, 基于扰动观测器, 固定时间理论、指令滤波技术及虚拟轨迹, 设计了编队控制律, 实现编队控制目标, 同时确保闭环系统中的所有信号是全局固定时间稳定的.通过仿真验证了所提算法的正确性及有效性.

参考文献 (19)

目录

    /

    返回文章
    返回