当期目录
2025, 51(7): 1403-1422.
doi: 10.16383/j.aas.c240538
cstr: 32138.14.j.aas.c240538
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
2025, 51(7): 1423-1462.
doi: 10.16383/j.aas.c240139
cstr: 32138.14.j.aas.c240139
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并展望未来发展方向.
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并展望未来发展方向.
2025, 51(7): 1463-1479.
doi: 10.16383/j.aas.c240707
cstr: 32138.14.j.aas.c240707
摘要:
航空航天、海洋舰船、轨道交通等领域的重大装备制造在引领经济发展与保障国防安全中发挥着举足轻重的作用. 传统制造模式依赖人工和专机设备, 在灵活性与智能化方面存在不足, 难以满足大型化、多品种的柔性制造需求. 集群机器人利用生物集群的协作机制, 能在复杂场景中不断拓展并优化执行能力, 实现高效协同和智能制造. 数字孪生作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、调度规划和协同控制提供集成方案和工具链支撑, 能有效提升系统的效率和安全. 本文介绍数字孪生技术的研究背景、研究现状、关键技术和发展趋势, 并以自主研发的面向飞机壁板装配的集群机器人数字孪生系统为例进行分析, 对于了解数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
航空航天、海洋舰船、轨道交通等领域的重大装备制造在引领经济发展与保障国防安全中发挥着举足轻重的作用. 传统制造模式依赖人工和专机设备, 在灵活性与智能化方面存在不足, 难以满足大型化、多品种的柔性制造需求. 集群机器人利用生物集群的协作机制, 能在复杂场景中不断拓展并优化执行能力, 实现高效协同和智能制造. 数字孪生作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、调度规划和协同控制提供集成方案和工具链支撑, 能有效提升系统的效率和安全. 本文介绍数字孪生技术的研究背景、研究现状、关键技术和发展趋势, 并以自主研发的面向飞机壁板装配的集群机器人数字孪生系统为例进行分析, 对于了解数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
2025, 51(7): 1480-1524.
doi: 10.16383/j.aas.c240235
cstr: 32138.14.j.aas.c240235
摘要:
视频超分辨率重建是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 首先, 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
视频超分辨率重建是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 首先, 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
2025, 51(7): 1525-1545.
doi: 10.16383/j.aas.c240341
cstr: 32138.14.j.aas.c240341
摘要:
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低对新类的识别能力. 为解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器(BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉\begin{document}$l_p $\end{document} 正则项”显式地减少背景判别性知识对构建新类分类器的干扰, 并利用“权重范数管理器”调节分类器中各类别的权重范数, 以提高模型对新类别的关注度, 同时降低其对背景类别的偏好. 此外, 考虑到 BDKMR 可能改变特征空间分布, 提出“分类器解耦模块”, 以调控模型微调过程中正则化分类器对特征提取器学习的影响. 多个数据集上的实验结果表明, 所提出的方法能够有效减少模型对新类实例的错误分类, 进而显著提升对新类的检测性能.
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低对新类的识别能力. 为解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器(BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉
2025, 51(7): 1546-1561.
doi: 10.16383/j.aas.c240599
cstr: 32138.14.j.aas.c240599
摘要:
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响跨用户情绪识别的准确性. 鉴于此, 首先提出规则降维的多标签TSK (RDR-MLTSK)模糊系统, 以优化模糊系统结构和训练效率; 进一步提出多标签模糊域适应算法实现多源域迁移学习, 提高RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能够有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响跨用户情绪识别的准确性. 鉴于此, 首先提出规则降维的多标签TSK (RDR-MLTSK)模糊系统, 以优化模糊系统结构和训练效率; 进一步提出多标签模糊域适应算法实现多源域迁移学习, 提高RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能够有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
2025, 51(7): 1562-1584.
doi: 10.16383/j.aas.c240658
cstr: 32138.14.j.aas.c240658
摘要:
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
2025, 51(7): 1585-1598.
doi: 10.16383/j.aas.c240738
cstr: 32138.14.j.aas.c240738
摘要:
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(\begin{document}$\mu=0.05$\end{document} )下, 自适应控制策略通过\begin{document}$0.061\;0 \;\text{m}$\end{document} 的质心高度调整, 在维持\begin{document}$1.428\;4 \text{ m/s}$\end{document} 运动速度的同时, 将足端滑动距离控制在\begin{document}$0.308 \pm 0.005\;0 \text{ cm}$\end{document} , 充分验证了所提控制方法的有效性和实用价值.
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(
2025, 51(7): 1599-1611.
doi: 10.16383/j.aas.c250007
cstr: 32138.14.j.aas.c250007
摘要:
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为解决该问题, 提出一种非均匀采样预测控制方法. 首先, 建立一种城市污水处理过程增广式动态线性化模型, 实现非均匀采样城市污水处理关键过程变量的准确预测; 其次, 设计基于控制增益优化策略的预测控制器, 实现非均匀采样城市污水处理关键过程变量的稳定控制; 最后, 分析非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为解决该问题, 提出一种非均匀采样预测控制方法. 首先, 建立一种城市污水处理过程增广式动态线性化模型, 实现非均匀采样城市污水处理关键过程变量的准确预测; 其次, 设计基于控制增益优化策略的预测控制器, 实现非均匀采样城市污水处理关键过程变量的稳定控制; 最后, 分析非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
2025, 51(7): 1612-1625.
doi: 10.16383/j.aas.c240497
cstr: 32138.14.j.aas.c240497
摘要:
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计一种广义高斯核参数自适应调整策略, 用于在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计一种广义高斯核参数自适应调整策略, 用于在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
2025, 51(7): 1626-1641.
doi: 10.16383/j.aas.c240074
cstr: 32138.14.j.aas.c240074
摘要:
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间II型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫方法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间II型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫方法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
2025, 51(7): 1642-1650.
doi: 10.16383/j.aas.c240802
cstr: 32138.14.j.aas.c240802
摘要:
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
2025, 51(7): 1651-1661.
doi: 10.16383/j.aas.c240337
cstr: 32138.14.j.aas.c240337
摘要:
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
2025, 51(7): 1662-1672.
doi: 10.16383/j.aas.c240356
cstr: 32138.14.j.aas.c240356
摘要:
针对一类不确定非线性系统, 提出一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后, 通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了本文控制算法的有效性与先进性.
针对一类不确定非线性系统, 提出一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后, 通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了本文控制算法的有效性与先进性.
2025, 51(7): 1673-1687.
doi: 10.16383/j.aas.c240723
cstr: 32138.14.j.aas.c240723
摘要:
马尔科夫跳跃系统镇定过程常伴随通信信道堵塞、状态信息未知、时滞效应不全等问题. 基于此, 提出一种基于动态事件触发观测器的广义记忆异步滑模控制器. 其中动态事件触发观测器结合丢包补偿, 克服了已有文献单一考虑网络环境下频繁数据传输导致的通道堵塞问题. 针对观测时滞状态与控制器异步行为, 在滑模函数中引入时变时滞及其边界条件, 设计基于隐马尔科夫模型的广义记忆异步滑模控制器. 由于高效时滞利用率和多独立控制增益相互补偿, 闭环系统稳定性、收敛速度和超调等静态/动态性能较传统记忆/无记忆滑模控制器稳定提升. 同时, 为进一步耦合广义记忆控制时滞信息, 提出一组指数型反凸组合不等式, 通过预置指数型参数, 在不增加计算复杂度的前提下, 降低广义控制镇定条件保守性, 提升控制增益镇定精度. 最后通过数值算例和柔性机械臂实例验证了所提控制方案的有效性.
马尔科夫跳跃系统镇定过程常伴随通信信道堵塞、状态信息未知、时滞效应不全等问题. 基于此, 提出一种基于动态事件触发观测器的广义记忆异步滑模控制器. 其中动态事件触发观测器结合丢包补偿, 克服了已有文献单一考虑网络环境下频繁数据传输导致的通道堵塞问题. 针对观测时滞状态与控制器异步行为, 在滑模函数中引入时变时滞及其边界条件, 设计基于隐马尔科夫模型的广义记忆异步滑模控制器. 由于高效时滞利用率和多独立控制增益相互补偿, 闭环系统稳定性、收敛速度和超调等静态/动态性能较传统记忆/无记忆滑模控制器稳定提升. 同时, 为进一步耦合广义记忆控制时滞信息, 提出一组指数型反凸组合不等式, 通过预置指数型参数, 在不增加计算复杂度的前提下, 降低广义控制镇定条件保守性, 提升控制增益镇定精度. 最后通过数值算例和柔性机械臂实例验证了所提控制方案的有效性.
2025, 51(7): 1688-1702.
doi: 10.16383/j.aas.c240323
cstr: 32138.14.j.aas.c240323
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
2025, 51(7): 1703-1714.
doi: 10.16383/j.aas.c230654
cstr: 32138.14.j.aas.c230654
摘要:
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证了所提方法的有效性.
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证了所提方法的有效性.