2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
目录
目录
2025, 51(5).  
[封面浏览] [PDF 7914KB](0)
无人飞行器集群自主控制专题
无人飞行器集群自主控制专题序言
段海滨
2025, 51(5): 903-904.   doi: 10.16383/j.aas.c202502 cstr: 32138.14.j.aas.c202502
[摘要](7) [HTML全文](3) [PDF 203KB](2)
性能函数引导的无人机集群深度强化学习控制方法
王耀南, 华和安, 张辉, 钟杭, 樊叶心, 梁鸿涛, 常浩, 方勇纯
2025, 51(5): 905-916.   doi: 10.16383/j.aas.c240519 cstr: 32138.14.j.aas.c240519
[摘要](599) [HTML全文](241) [PDF 4530KB](67)
摘要:
针对无人机集群系统, 提出一种性能函数引导的深度强化学习控制方法, 同时评估性能函数的示范经验与学习策略的探索动作, 保证高效可靠的策略更新, 实现无人机集群系统的高性能控制. 首先, 利用领航–跟随集群框架, 将无人机集群的控制问题转化为领航–跟随框架下的跟踪问题, 进而提出基于模型的跟踪控制方法, 利用性能函数将集群编队误差约束在给定范围内, 实现无人机集群的模型驱动控制. 接下来, 为解决复杂工况下性能函数极易失效难题, 将深度强化学习方法和性能函数驱动方法结合, 提出性能函数引导的深度强化学习控制方法, 利用性能函数的示范经验辅助训练强化学习网络, 通过同时评估探索与示范动作, 保证学习策略显著优于性能函数驱动控制方法, 有效提高无人机编队控制精度与鲁棒性. 实验结果表明, 该方法能够显著提升无人机集群的控制性能, 实现兼顾鲁棒性与飞行精度的高性能集群控制.
基于覆盖理论的高速强机动目标集群协同围捕
江涌, 王林波, 王蒙一
2025, 51(5): 917-930.   doi: 10.16383/j.aas.c240606 cstr: 32138.14.j.aas.c240606
[摘要](85) [HTML全文](54) [PDF 7911KB](11)
摘要:
集群协同围捕技术在空天防御领域逐渐扮演愈加关键的角色, 本文基于碰撞平面等效覆盖方法, 在三维空间内基于非线性动态模型提出一种新的高速强机动目标的覆盖策略. 首先基于三维圆锥体可达域提出新的碰撞平面等效覆盖方法, 阐释加速度覆盖和位置覆盖的区别与联系, 并从几何角度分析交会角对完全覆盖的影响; 其次, 考虑实际环境下飞行器过载弱于目标的情况, 基于偏置比例导引设计协同制导律, 能够实现对目标加速度的覆盖, 并基于覆盖率和零控脱靶量提出分段覆盖动态调节与快速收敛策略, 使得多飞行器在前期能够保持高覆盖率, 后期能够降低整体的脱靶量, 实现围捕覆盖的优势; 最后, 结合数值仿真进行了可行性验证.
无人飞行器集群自主控制: 预设性能驱动的安全编队控制
方浩, 赵欣悦, 陈杰
2025, 51(5): 931-941.   doi: 10.16383/j.aas.c240603 cstr: 32138.14.j.aas.c240603
[摘要](460) [HTML全文](182) [PDF 2127KB](88)
摘要:
针对障碍环境下多无人机编队跟踪问题, 提出一种兼顾编队跟踪性能与安全的控制框架. 在该框架中, 首先利用性能边界可调的预设性能控制方法生成期望控制信号, 使无人机跟踪虚拟领导者的期望轨迹, 跟踪过程中满足瞬态与稳态误差约束. 进一步, 基于控制障碍函数描述无人机的安全状态集合并建立二次规划问题, 利用Karush-Kuhn-Tucker条件得到最小干预安全控制器的闭式解. 最后, 利用安全控制的闭式解构造辅助系统, 实现性能函数的自适应更新. 理论分析表明, 该算法能够在编队跟踪与安全性冲突条件下确保系统安全, 在不发生冲突时实现性能约束下的编队跟踪. 仿真结果验证了提出算法的有效性.
无人飞行器集群自主控制: 基于联盟形成博弈的任务分配
姜斌, 马亚杰, 薛舒心
2025, 51(5): 942-959.   doi: 10.16383/j.aas.c240593 cstr: 32138.14.j.aas.c240593
[摘要](509) [HTML全文](292) [PDF 2860KB](52)
摘要:
针对复杂多约束条件下异构无人飞行器集群问题, 提出一种基于联盟形成博弈的分布式任务预分配和重分配方法. 考虑时效性、同时性等耦合约束条件, 引入准确的能耗模型建立任务分配模型, 利用联盟形成博弈将任务分配问题转化为联盟划分问题, 并设计一种无故障条件下的分布式任务预分配方法, 降低任务分配求解的复杂度, 同时提高最终解的平均质量; 进一步, 针对无人机故障问题, 准确分析健康无人机的运动模型, 合理划分重分配范围, 基于任务预分配结果设计重分配算法. 仿真结果证明了所提分布式任务预分配与重分配方法在不同场景下的实时性和有效性.
仿鸟群自推进机制的无人机集群相变控制
段海滨, 尤灵辰, 范彦铭, 李明
2025, 51(5): 960-971.   doi: 10.16383/j.aas.c240598 cstr: 32138.14.j.aas.c240598
[摘要](154) [HTML全文](83) [PDF 1241KB](20)
摘要:
针对无人机集群的运动相态转换问题, 提出一种仿鸟群自推进粒子模型的无人机集群相变控制方法. 首先, 从鸟群运动行为中获得启发, 通过设计速度保持项和势能梯度项构建仿鸟群运动模型, 并设计相变控制项模拟巢穴对鸟群的吸引, 以实现集群在不同相态之间的转换. 然后, 讨论集群在设计的相变控制律作用下的运动相态, 证明无人机集群能够实现两种稳定的运动相态并进行相互转换. 最后, 仿真验证了集群存在的两种稳定运动构型, 所提出相变控制律能够实现两种集群运动相态的互相转换.
基于固定时间模型参考方法的倾转旋翼无人机姿态控制
朱纪洪, 张骁骏, 杨赟杰, 袁夏明
2025, 51(5): 972-984.   doi: 10.16383/j.aas.c240621 cstr: 32138.14.j.aas.c240621
[摘要](189) [HTML全文](165) [PDF 2731KB](19)
摘要:
倾转旋翼无人机动力学特性复杂, 过渡过程中的变速变构型特性导致系统具有较大的模型不确定性, 且容易受到阵风扰动等影响, 对姿态控制律设计提出很高要求. 针对该问题, 本文建立一种扰动观测器结合终端滑模补偿器的模型参考姿态控制方法. 基于齐次系统理论设计固定时间收敛扰动观测器, 实现对倾转旋翼无人机未建模动态和外部扰动的准确估计; 基于一种新型非线性饱和函数设计固定时间收敛终端滑模控制器, 结合低通滤波实现对指令的快速高品质跟踪; 为进一步解决控制奇异性问题, 提出在纵轴附近邻域对控制器的改进策略. 仿真结果表明, 所提方法在应对倾转旋翼无人机模型不确定性和外部扰动方面具有较强的鲁棒性, 相比基于有限时间稳定性理论的模型参考姿态控制方法, 固定时间收敛控制提供了更高的控制精度和更平滑的输出.
综述
深度长尾学习研究综述
韩佳艺, 刘建伟, 陈德华, 徐璟东, 代琪, 夏鹏飞
2025, 51(5): 985-1020.   doi: 10.16383/j.aas.c240077 cstr: 32138.14.j.aas.c240077
[摘要](928) [HTML全文](840) [PDF 13924KB](92)
摘要:
深度学习是一门依赖于数据的科学, 传统深度学习方法假定在平衡数据集上训练模型, 然而, 现实世界中大规模数据集通常表现出长尾分布现象, 样本数量众多的少量头部类主导模型训练, 而大量尾部类样本数量过少, 难以得到充分学习. 近年来, 长尾学习掀起学术界的研究热潮. 本文综合梳理和分析近年来发表在高水平会议或期刊上的文献, 对长尾学习进行全面综述. 具体而言, 根据深度学习模型设计流程, 将图像识别领域的长尾学习算法分为丰富样本数量与语义信息的优化样本空间方法, 关注特征提取器、分类器、logits和损失函数这四个基本组成部分的优化模型方法, 以及通过引入辅助任务来帮助模型训练并在多个空间共同优化长尾学习模型的辅助任务学习3大类, 根据提出的分类方法综合对比分析每类长尾学习方法的优缺点. 然后, 进一步将基于样本数量的狭义长尾学习概念推广至多尺度广义长尾学习. 此外, 对文本数据、语音数据等其他数据形式下的长尾学习算法进行简要评述. 最后, 讨论目前长尾学习面临的可解释性较差、数据质量较低等挑战, 并展望如多模态长尾学习、半监督长尾学习等未来具有潜力的发展方向.
提示学习在计算机视觉中的分类、应用及展望
刘袁缘, 刘树阳, 刘云娇, 袁雨晨, 唐厂, 罗威
2025, 51(5): 1021-1040.   doi: 10.16383/j.aas.c240177 cstr: 32138.14.j.aas.c240177
[摘要](219) [HTML全文](175) [PDF 11349KB](11)
摘要:
随着计算机视觉(CV)的快速发展, 人们对于提高视觉任务的性能和泛化能力的需求不断增长, 导致模型的复杂度与对各种资源的需求进一步提高. 提示学习(PL)作为一种能有效地提升模型性能和泛化能力、重用预训练模型和降低计算量的方法, 在一系列下游视觉任务中受到广泛的关注与研究. 然而, 现有的PL综述缺乏对PL方法全面的分类和讨论, 也缺乏对现有实验结果进行深入的研究以评估现有方法的优缺点. 因此, 本文对PL在CV领域的分类、应用和性能进行全面的概述. 首先, 介绍PL的研究背景和定义, 并简要回顾CV领域中PL研究的最新进展. 其次, 对目前CV领域中的PL方法进行分类, 包括文本提示、视觉提示和视觉−语言联合提示, 对每类PL方法进行详细阐述并探讨其优缺点. 接着, 综述PL在十个常见下游视觉任务中的最新进展. 此外, 提供三个CV应用的实验结果并进行总结和分析, 全面讨论不同PL方法在CV领域的表现. 最后, 基于上述讨论对PL在CV领域面临的挑战和机遇进行分析, 为进一步推动PL在CV领域的发展提供前瞻性的思考.
论文与报告
SignBrain: 无线可穿戴脑电采集技术
孟庆桐, 常东明, 曹姗, 胡若晨, 蒋田仔, 左年明
2025, 51(5): 1041-1051.   doi: 10.16383/j.aas.c240578 cstr: 32138.14.j.aas.c240578
[摘要](233) [HTML全文](155) [PDF 6107KB](12)
摘要:
介绍一种自主研发的无线可穿戴非侵入式脑电信号采集技术: SignBrain (型号P). SignBrain设备为爪形结构, 设计符合国际10-20导联标准, 具有18个盐水电极, 配合万向活动抱紧部件, 始终保持电极与头皮紧密接触, 弥补了头型较大、发量较多佩戴使用的问题. 设备不用打导电膏实现“即戴即用”的使用方式, 采集的脑电信号通过低功耗蓝牙实时传输至软件系统, 系统支持在线阻抗检测、Marker同步记录等功能. 同时研发了与设备配套的PC端软件、应用接口以及移动终端(手机、平板电脑等)软件, 能在线、离线、远程查看数据. SignBrain技术已在临床医院及相关单位完成小批量的试用, 通过脑机交互领域中闭眼想象写字实验、高频视觉诱发实验来验证设备的可靠性及稳定性. 关于设备的开发和应用讨论请访问网站: www.SignBrain.cn.
无人机/无人艇异构协同固定时间预设性能演化控制
袁洋, 段海滨, 魏晨
2025, 51(5): 1052-1066.   doi: 10.16383/j.aas.c240141 cstr: 32138.14.j.aas.c240141
[摘要](214) [HTML全文](119) [PDF 9084KB](17)
摘要:
针对执行器故障的无人机/无人艇异构协同系统编队包容控制问题, 提出一种固定时间预设性能演化控制方法. 为保证基于视觉测量的相对位置信号的连续性和准确性, 设计控制误差收敛的演化路径, 通过固定时间预设性能函数使误差限制在演化路径的邻域内, 并利用转换函数将受约束跟踪问题转换为无约束镇定问题. 采用动态面技术对转换后的误差动力学进行控制, 并利用干扰观测器和自适应技术对干扰和未知执行器故障进行估计. 通过 Lyapunov 函数证明误差动力学闭环系统所有信号都是最终一致有界的, 并进一步证明编队误差是固定时间稳定的, 数值仿真验证了所提方法的有效性.
高速铁路多列车运行态势推演方法
王荣笙, 袁志明, 闫璐, 吕宜生, 丁舒忻
2025, 51(5): 1067-1079.   doi: 10.16383/j.aas.c240623 cstr: 32138.14.j.aas.c240623
[摘要](200) [HTML全文](124) [PDF 2834KB](36)
摘要:
多列车运行态势是列车调度员和司机分别调整运行图和列车驾驶策略的关键信息和重要依据, 表征各列车在未来运行各位置处的速度、加速度、通过时刻等信息. 然而, 由于高铁信号系统的交互信息利用率较低, 列车调度员和司机只能凭经验推演多列车运行态势, 基于此给出的运行图和列车驾驶策略的自动化程度较低, 影响铁路运营效率. 为此, 针对多列车运行态势推演问题, 构建多列车运行态势推演系统架构及模型. 以单列车运行态势的离线推演和在线推演方法为基础, 提出多列车运行态势微观推演方法, 以及基于虚拟编队模式的多列车运行态势宏观实时推演方法. 仿真结果表明, 微观推演方法能在 420 s 内计算多列车超速防护曲线和运行图调整的安全下界. 宏观推演方法针对任意临时限速场景, 都能在 7 s 内为列车调度员和司机分别实时提供列车运行调整方案和辅助驾驶策略, 有效降低铁路人员的工作强度, 提升高铁运营效率和应急处置能力.
基于改进粒子群优化和Stackelberg博弈的武器部署
刘富樯, 刘中阳, 周伦, 皮阳军, 蒲华燕, 罗均
2025, 51(5): 1080-1091.   doi: 10.16383/j.aas.c240257 cstr: 32138.14.j.aas.c240257
[摘要](115) [HTML全文](77) [PDF 1274KB](5)
摘要:
为应对来袭目标的机动调整对防区防御能力的影响, 针对性设计全新的部署优化模型和求解算法. 首先, 从战术层面出发, 提出一种考虑攻防信息变化的新型武器部署模型, 该模型能够动态调整部署策略以提高防御系统的整体效能; 其次, 设计基于混沌映射机制和K均值聚类与重心法的算法初始化方案, 以应对资源紧缺和充足两种情况, 降低算法陷入局部最优的风险; 然后, 设计基于Metropolis准则的个体最优更新方法和基于Stackelberg博弈模型的全局最优更新方法用以指导种群的进化方向; 最后, 通过提供多规模场景仿真实验, 验证了新模型和所提算法的有效性. 对比实验结果表明新模型能够更准确地反映部署方案之间的差异, 所提算法在求解质量与收敛性方面均有显著提高.
基于磁链在线辨识的异步电机超螺旋滑模控制
谢国超, 段纳, 万昌晖, 臧航
2025, 51(5): 1092-1102.   doi: 10.16383/j.aas.c240526 cstr: 32138.14.j.aas.c240526
[摘要](251) [HTML全文](118) [PDF 4476KB](10)
摘要:
研究基于磁链在线辨识的异步电机超螺旋滑模控制问题. 针对异步电机, 设计一种改进的超螺旋滑模速度控制器, 提升系统的动态响应性能. 为抑制算法中符号函数高频切换所引起的系统抖振问题, 构造一种可变指数切换函数. 进一步地, 考虑到转子磁链受惯性延迟的影响, 设计磁链在线观测器, 可辨识转子磁链幅值, 提升系统的控制精度和参数鲁棒性. 数值仿真和实验结果验证了所提算法的可行性和有效性.
基于域对抗自适应学习的旋翼无人机姿态稳定方法
李凤岐, 金佳玉, 杜学峰, 张鑫, 徐凤强, 王德广
2025, 51(5): 1103-1117.   doi: 10.16383/j.aas.c240186 cstr: 32138.14.j.aas.c240186
[摘要](161) [HTML全文](124) [PDF 1579KB](24)
摘要:
针对复杂海风环境下旋翼无人机姿态控制不稳定的问题, 提出姿态稳定方法(SymTAL-POP). 该方法包括离线学习和在线预测两个部分. 在离线学习阶段, 引入对称式时序域对抗自适应学习算法SymTAL. 结合域对抗学习、对称网络和双向时序网络, SymTAL有效解决了海风环境中无人机姿态稳定问题. 利用深度学习优化加速框架和改进的Adam优化器, 提升了SymTAL的学习能力和计算效率. 在线预测阶段, 设计风场预测模型POP, 实现海风环境的实时感知与预测. POP采用变分模态分解技术处理风速信号, 通过特征选择策略预测不同风况下的风速, 增强了无人机的环境适应能力. 测试结果表明, SymTAL在学习效率和控制精度方面均优于其他姿态稳定算法, POP在连续风、间歇风和湍流风的多风况条件下的预测精度优于其他模型. 仿真实验表明SymTAL-POP在轨迹跟踪误差上表现突出, 平均值降低23.5%, 均方根误差减少55.2%.
基于质量关联虚拟变量的质量相关变量划分及故障检测
刘美枝, 孔祥玉, 胡昌华
2025, 51(5): 1118-1130.   doi: 10.16383/j.aas.c240627 cstr: 32138.14.j.aas.c240627
[摘要](123) [HTML全文](77) [PDF 1690KB](24)
摘要:
质量相关故障检测作为数据驱动的多元统计过程监测的重要研究内容, 是保障复杂装备或工业过程安全高效运行的关键技术, 而确定或划分质量相关变量是该方法的核心环节. 现有质量相关故障检测方法通常高度依赖于质量变量, 一旦质量变量不可测, 其有效性便受到严重挑战. 为解决这一挑战, 提出基于质量关联虚拟变量(Quality-related virtual variable, QRV)的质量相关变量划分方法, 基于此建立一种独立成分分析(Independent component analysis, ICA)质量相关故障检测模型, 并开展故障检测应用研究. 首先, 构造一个QRV, 以间接反映系统的质量特性; 其次, 基于该QRV, 利用假设检验将过程变量划分为质量相关和质量无关变量组; 随后, 将该划分结果应用于基于ICA的质量相关故障检测, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量, 并构造综合检测指标; 最后, 通过数值仿真和田纳西−伊斯曼过程(Tennessee-Eastman process, TEP)实验验证了所提方法的可行性和有效性.
基于主动−被动增量集成的概念漂移适应方法
祁晓博, 陈佳明, 史颖, 亓慧, 郭虎升, 王文剑
2025, 51(5): 1131-1144.   doi: 10.16383/j.aas.c240503 cstr: 32138.14.j.aas.c240503
[摘要](222) [HTML全文](96) [PDF 1928KB](11)
摘要:
数据流是一组随时间连续到来的数据序列, 在数据流不断产生的过程中, 由于各种因素的影响, 数据分布随时间推移可能以不可预测的方式发生变化, 这种现象称为概念漂移. 在漂移发生后, 当前模型需要及时响应数据流中的实时分布变化, 并有效处理不同类型的概念漂移, 从而避免模型泛化性能下降. 针对这一问题, 提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE). 该方法首先使用在线增量集成策略构建被动集成模型, 对新样本进行实时预测以动态更新基模型权重, 有利于快速响应数据分布的瞬时变化, 并增强模型适应概念漂移的能力. 在此基础上, 利用增量学习和概念漂移检测技术构建主动基模型, 提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能. 实验结果表明, CDAM-APIE能够对概念漂移做出及时响应, 同时有效提高模型的泛化性能.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
当前状态:  doi: 10.16383/j.aas.c240805  cstr: 32138.14.j.aas.c240805
[摘要](0) [HTML全文](0)
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的旧知识. 为解决该挑战, 持续学习 (Continual learning, CL) 受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即相对传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
考虑牵引链温度场的货运列车动态建模及优化算法研究
陶新坤, 冯晓云, 郭佑星, 王青元, 孙鹏飞
当前状态:  doi: 10.16383/j.aas.c240658  cstr: 32138.14.j.aas.c240658
[摘要](53) [HTML全文](61)
摘要:
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 并提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型, 并提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
数据驱动自适应评判控制研究进展
王鼎, 赵明明, 刘德荣, 乔俊飞, 宋世杰
当前状态:  doi: 10.16383/j.aas.c240706  cstr: 32138.14.j.aas.c240706
[摘要](306) [HTML全文](115)
摘要:
最优控制与人工智能的融合发展产生一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 给最优控制器的设计构成挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结了数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望了一些未来的研究方向.
梯度引导的JPEG压缩图像超分辨率重建
曹坪, 林树冉, 张淳杰, 郑晓龙, 赵耀
当前状态:  doi: 10.16383/j.aas.c240517  cstr: 32138.14.j.aas.c21072
[摘要](46) [HTML全文](29)
摘要:
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和图像超分辨率重建网络. 该网络以超分辨率分支为主导, 融合去伪影分支与梯度引导分支的非对称特征, 实现了高质量图像重建. 去伪影分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
基于异构图神经网络的可解释兵棋态势预测方法
陈露, 尚家兴, 刘大江, 张玉芳, 倪晚成
当前状态:  doi: 10.16383/j.aas.c240468  cstr: 32138.14.j.aas.c240468
[摘要](83) [HTML全文](52)
摘要:
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
双端切换拓扑下基于二值通信的多智能体系统容错控制
王祚, 朱延正, 陈新开, 杨帆, 苏春翌
当前状态:  doi: 10.16383/i.aas.c210722  cstr: 32138.14.j.aas.c210722
[摘要](34) [HTML全文](19)
摘要:
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证所提方法的可行性与有效性.
基于IT2FBLS强化学习PID的MSWI过程炉膛温度控制
田昊, 汤健, 夏恒, 王天峥, 余文, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c250074  cstr: 32138.14.j.aas.c250074
[摘要](79) [HTML全文](80)
摘要:
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
通信链路故障下高阶非匹配非线性MAS领导跟随一致性
游秀, 张红, 梁吉业
当前状态:  doi: 10.16383/j.aas.c240644  cstr: 32138.14.j.aas.c240644
[摘要](105) [HTML全文](64)
摘要:
研究了通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为了处理非匹配非线性项和通信链路故障, 提出了一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计了一个完全分布式控制器以保证系统的领导-跟随一致性, 并以矩阵不等式的形式给出了确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
基于梯度损失的离线强化学习算法
陈鹏宇, 刘士荣, 段帅, 端军红, 刘扬
当前状态:  doi: 10.16383/j.aas.c240481  cstr: 32138.14.j.aas.c240481
[摘要](98) [HTML全文](87)
摘要:
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到了有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出了一种梯度损失函数(GLF), 并基于此设计了一种新的离线强化学习算法—梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下 的普适性和有效性.
基于全过程隐私保护的多智能体系统平均一致性
纪良浩, 唐少洪, 郭兴, 解燕
当前状态:  doi: 10.16383/j.aas.c240471  cstr: 32138.14.j.aas.c240471
[摘要](34) [HTML全文](20)
摘要:
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态.不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出了基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 多智能体系统的平均一致性仍然可以被实现且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
基于大语言模型的兵棋推演智能决策技术
王彤, 赵美静, 徐沛, 尹奇跃, 焦建彬, 黄凯奇
当前状态:  doi: 10.16383/j.aas.c240657  cstr: 32138.14.j.aas.c240657
[摘要](28) [HTML全文](26)
摘要:
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得了一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为了缓解上述问题, 提出了基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划-交流-记忆-反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免了对智能体参数的高成本训练. 通过兵棋推演实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
基于域适应物理信息神经网络的时间序列预测方法
曹力丰, 阎高伟, 肖舒怡, 董珍柱, 董平
当前状态:  doi: 10.16383/j.aas.c240566  cstr: 32138.14.j.aas.c240566
[摘要](133) [HTML全文](75)
摘要:
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
基于图像特定分类器的弱监督语义分割
郭子麟, 吴东岳, 高常鑫, 桑农
当前状态:  doi: 10.16383/j.aas.c240636  cstr: 32138.14.j.aas.c240636
[摘要](102) [HTML全文](85)
摘要:
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素, 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实该方案的有效性.
松弛图嵌入的判别宽度学习系统以及在视觉识别中的应用
金军委, 常少凯, 耿彪, 李艳婷, 赵孟, 王震, 陈俊龙, 李鹏
当前状态:  doi: 10.16383/j.aas.c240734  cstr: 32138.14.j.aas.c240734
[摘要](91) [HTML全文](44)
摘要:
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.
大语言模型的工具使用综述
郑逸宁, 余镇, 杨捷, 李不凡, 殷林琪, 印张悦, 袁枫烨, 魏海洋, 陆嘉昊, 方世成, 李拟珺, 桂韬, 李昀, 陈爽, 邱锡鹏
当前状态:  doi: 10.16383/j.aas.c240793  cstr: 32138.14.j.aas.c240793
[摘要](72) [HTML全文](53)
摘要:
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
基于深度强化学习的无人机自主感知−规划−控制策略
吕茂隆, 丁晨博, 韩浩然, 段海滨
当前状态:  doi: 10.16383/j.aas.c240639  cstr: 32138.14.j.aas.c240639
[摘要](794) [HTML全文](280) [PDF 26662KB](86)
摘要:
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
基于深度学习的视频插帧研究进展
吴晨阳, 张勇, 韩树豪, 郭春乐, 李重仪, 程明明
当前状态:  doi: 10.16383/j.aas.c240572  cstr: 32138.14.j.aas.c240572
[摘要](105) [HTML全文](95)
摘要:
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
基于强化学习的控制方向未知非线性系统的最优输出调节
齐佳鑫, 孟桂芝
当前状态:  doi: 10.16383/j.aas.c240323  cstr: 32138.14.j.aas.c240323
[摘要](55) [HTML全文](37)
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行—评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证所提方法的有效性.
面向不同粗糙程度地面的四足机器人自适应控制方法
张楠杰, 陈玉全, 季茂沁, 孙运康, 王冰
当前状态:  doi: 10.16383/j.aas.c240738  cstr: 32138.14.j.aas.c240738
[摘要](93) [HTML全文](52)
摘要:
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(\begin{document}$\mu=0.05$\end{document})下, 自适应控制策略通过\begin{document}$0.0610 \text{m}$\end{document}的质心高度调整, 在维持\begin{document}$1.4284 \text{ m/s}$\end{document}运动速度的同时, 将足端滑动距离控制在\begin{document}$0.308 \pm 0.005 \text{ cm}$\end{document}, 充分验证所提控制方法的有效性和实用价值.
前额叶皮层启发的Transformer模型应用及其进展
潘雨辰, 贾克斌, 张铁林
当前状态:  doi: 10.16383/j.aas.c240538  cstr: 32138.14.j.aas.c240538
[摘要](306) [HTML全文](188) [PDF 5199KB](35)
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
基于CE TransNet的腹部CT图像多器官分割
廖苗, 杨睿新, 赵于前, 邸拴虎, 杨振
当前状态:  doi: 10.16383/j.aas.c240489  cstr: 32138.14.j.aas.c240489
[摘要](222) [HTML全文](145)
摘要:
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (Cross-connection enhanced transformer, CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dise相似系数(Dise similarity coefficient, DSC)值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
工业外观检测中的图像扩增方法综述
魏静, 史庆丰, 沈飞, 张正涛, 陶显, 罗惠元
当前状态:  doi: 10.16383/j.aas.c240139  cstr: 32138.14.j.aas.c240139
[摘要](122) [HTML全文](103)
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
从RAG到SAGE: 现状与展望
田永林, 王雨桐, 王兴霞, 杨静, 沈甜雨, 王建功, 范丽丽, 郭超, 王寿文, 赵勇, 武万森, 王飞跃
当前状态:  doi: 10.16383/j.aas.c240163  cstr: 32138.14.j.aas.c240163
[摘要](143) [HTML全文](118)
摘要:
大模型技术提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等问题, 阻碍了可信可靠人工智能系统的构建. 检索增强生成方法(Retrieval-augmented generation, RAG)通过外接知识库和查询关联的检索有效提升了大模型的知识和能力水平, 为大模型掌握实时型、行业型及私有型知识提供了有力支撑, 进而加速了大模型技术向多样场景的推广与落地. 本文围绕检索增强生成技术, 阐述了其基本原理、发展现状及典型应用, 并分析了其优势和面临的挑战. 在此基础上, 引入搜索和缓存管理思想, 提出了RAG的拓展框架SAGE (Search-augmented generation and extension), 以建立更加灵活和高效的大模型知识外挂工具链.
基于高斯过程的不确定非线性系统在线学习控制及应用
刘玉发, 练桂铭, 刘勇华, 苏春翌
当前状态:  doi: 10.16383/j.aas.c240356  cstr: 32138.14.j.aas.c240356
[摘要](120) [HTML全文](91)
摘要:
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
定位系统恶意攻击同源性分析及协同观测器定位矫正方法
史雨堃, 李肖磊, 上官义恒, 车万里, 王友清
当前状态:  doi: 10.16383/j.aas.c240717  cstr: 32138.14.j.aas.c240717
[摘要](48) [HTML全文](55)
摘要:
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 针对定位系统中恶意攻击的同源性进行了深入分析, 并设计了分布式观测器以实现定位矫正. 针对定位系统中常见的三种攻击, 分别设计了恰当的模拟实现方式, 能够在多次蒙特卡洛实验很好的控制环境变量, 从而得到具有统计意义的实验结果. 本文还建立了不随偏差注入攻击幅值变化的定位偏移同源性的衡量指标, 分析了三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到了限制. 同时提出了一种适配复杂系统的观测器来实现恶意攻击下的定位校正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
基于预定义时间的舰载机抗干扰着舰控制
李钊星, 蔡云鹏, 刘茂汉, 王霞, 许斌
当前状态:  doi: 10.16383/j.aas.c240766  cstr: 32138.14.j.aas.c240766
[摘要](128) [HTML全文](96)
摘要:
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明了系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
基于深度学习的视频超分辨率重建算法进展
唐麒, 赵耀, 刘美琴, 姚超
当前状态:  doi: 10.16383/j.aas.c240235  cstr: 32138.14.j.aas.c240235
[摘要](249) [HTML全文](451)
摘要:
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法如雨后春笋般涌现, 在帧间对齐、信息传播等方面取得了突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理了现有的视频超分辨率重建的公共数据集及相关算法; 接着, 重点综述了基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结了视频超分辨率重建算法面临的挑战及未来的发展趋势.
未知大规模互联系统在线分散式动态事件触发控制
何怡睿, 苏涵光, 张化光, 栾鑫洋
当前状态:  doi: 10.16383/j.aas.c240262  cstr: 32138.14.j.aas.c240262
[摘要](253) [HTML全文](154) [PDF 2555KB](36)
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
面向可再生能源消纳的火电机组控制结构综合与分析
马士全, 丁进良
当前状态:  doi: 10.16383/j.aas.c230210
[摘要](286) [HTML全文](237)
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
当前状态:  doi: 10.16383/j.aas.c190277
[摘要](968) [HTML全文](425)
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
当前状态:  doi: 10.16383/j.aas.c200007
[摘要](2131) [HTML全文](730)
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
当前状态:  doi: 10.16383/j.aas.2020.c200033
[摘要](2837) [HTML全文](1862)
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.