2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

优先发表

优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
, doi: 10.16383/j.aas.c240805 , cstr: 32138.14.j.aas.c240805
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的旧知识. 为解决该挑战, 持续学习 (Continual learning, CL) 受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即相对传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
考虑牵引链温度场的货运列车动态建模及优化算法研究
陶新坤, 冯晓云, 郭佑星, 王青元, 孙鹏飞
, doi: 10.16383/j.aas.c240658 , cstr: 32138.14.j.aas.c240658
摘要:
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 并提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型, 并提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
数据驱动自适应评判控制研究进展
王鼎, 赵明明, 刘德荣, 乔俊飞, 宋世杰
, doi: 10.16383/j.aas.c240706 , cstr: 32138.14.j.aas.c240706
摘要:
最优控制与人工智能的融合发展产生一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 给最优控制器的设计构成挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结了数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望了一些未来的研究方向.
梯度引导的JPEG压缩图像超分辨率重建
曹坪, 林树冉, 张淳杰, 郑晓龙, 赵耀
, doi: 10.16383/j.aas.c240517 , cstr: 32138.14.j.aas.c21072
摘要:
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和图像超分辨率重建网络. 该网络以超分辨率分支为主导, 融合去伪影分支与梯度引导分支的非对称特征, 实现了高质量图像重建. 去伪影分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
基于异构图神经网络的可解释兵棋态势预测方法
陈露, 尚家兴, 刘大江, 张玉芳, 倪晚成
, doi: 10.16383/j.aas.c240468 , cstr: 32138.14.j.aas.c240468
摘要:
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
双端切换拓扑下基于二值通信的多智能体系统容错控制
王祚, 朱延正, 陈新开, 杨帆, 苏春翌
, doi: 10.16383/i.aas.c210722 , cstr: 32138.14.j.aas.c210722
摘要:
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证所提方法的可行性与有效性.
基于IT2FBLS强化学习PID的MSWI过程炉膛温度控制
田昊, 汤健, 夏恒, 王天峥, 余文, 乔俊飞
, doi: 10.16383/j.aas.c250074 , cstr: 32138.14.j.aas.c250074
摘要:
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
通信链路故障下高阶非匹配非线性MAS领导跟随一致性
游秀, 张红, 梁吉业
, doi: 10.16383/j.aas.c240644 , cstr: 32138.14.j.aas.c240644
摘要:
研究了通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为了处理非匹配非线性项和通信链路故障, 提出了一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计了一个完全分布式控制器以保证系统的领导-跟随一致性, 并以矩阵不等式的形式给出了确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
基于梯度损失的离线强化学习算法
陈鹏宇, 刘士荣, 段帅, 端军红, 刘扬
, doi: 10.16383/j.aas.c240481 , cstr: 32138.14.j.aas.c240481
摘要:
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到了有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出了一种梯度损失函数(GLF), 并基于此设计了一种新的离线强化学习算法—梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下 的普适性和有效性.
基于全过程隐私保护的多智能体系统平均一致性
纪良浩, 唐少洪, 郭兴, 解燕
, doi: 10.16383/j.aas.c240471 , cstr: 32138.14.j.aas.c240471
摘要:
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态.不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出了基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 多智能体系统的平均一致性仍然可以被实现且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
基于大语言模型的兵棋推演智能决策技术
王彤, 赵美静, 徐沛, 尹奇跃, 焦建彬, 黄凯奇
, doi: 10.16383/j.aas.c240657 , cstr: 32138.14.j.aas.c240657
摘要:
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得了一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为了缓解上述问题, 提出了基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划-交流-记忆-反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免了对智能体参数的高成本训练. 通过兵棋推演实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
基于域适应物理信息神经网络的时间序列预测方法
曹力丰, 阎高伟, 肖舒怡, 董珍柱, 董平
, doi: 10.16383/j.aas.c240566 , cstr: 32138.14.j.aas.c240566
摘要:
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
基于图像特定分类器的弱监督语义分割
郭子麟, 吴东岳, 高常鑫, 桑农
, doi: 10.16383/j.aas.c240636 , cstr: 32138.14.j.aas.c240636
摘要:
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素, 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实该方案的有效性.
松弛图嵌入的判别宽度学习系统以及在视觉识别中的应用
金军委, 常少凯, 耿彪, 李艳婷, 赵孟, 王震, 陈俊龙, 李鹏
, doi: 10.16383/j.aas.c240734 , cstr: 32138.14.j.aas.c240734
摘要:
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.
大语言模型的工具使用综述
郑逸宁, 余镇, 杨捷, 李不凡, 殷林琪, 印张悦, 袁枫烨, 魏海洋, 陆嘉昊, 方世成, 李拟珺, 桂韬, 李昀, 陈爽, 邱锡鹏
, doi: 10.16383/j.aas.c240793 , cstr: 32138.14.j.aas.c240793
摘要:
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
基于深度学习的视频插帧研究进展
吴晨阳, 张勇, 韩树豪, 郭春乐, 李重仪, 程明明
, doi: 10.16383/j.aas.c240572 , cstr: 32138.14.j.aas.c240572
摘要:
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
基于强化学习的控制方向未知非线性系统的最优输出调节
齐佳鑫, 孟桂芝
, doi: 10.16383/j.aas.c240323 , cstr: 32138.14.j.aas.c240323
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行—评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证所提方法的有效性.
面向不同粗糙程度地面的四足机器人自适应控制方法
张楠杰, 陈玉全, 季茂沁, 孙运康, 王冰
, doi: 10.16383/j.aas.c240738 , cstr: 32138.14.j.aas.c240738
摘要:
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(\begin{document}$\mu=0.05$\end{document})下, 自适应控制策略通过\begin{document}$0.0610 \text{m}$\end{document}的质心高度调整, 在维持\begin{document}$1.4284 \text{ m/s}$\end{document}运动速度的同时, 将足端滑动距离控制在\begin{document}$0.308 \pm 0.005 \text{ cm}$\end{document}, 充分验证所提控制方法的有效性和实用价值.
前额叶皮层启发的Transformer模型应用及其进展
潘雨辰, 贾克斌, 张铁林
, doi: 10.16383/j.aas.c240538 , cstr: 32138.14.j.aas.c240538
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
基于CE TransNet的腹部CT图像多器官分割
廖苗, 杨睿新, 赵于前, 邸拴虎, 杨振
, doi: 10.16383/j.aas.c240489 , cstr: 32138.14.j.aas.c240489
摘要:
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (Cross-connection enhanced transformer, CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dise相似系数(Dise similarity coefficient, DSC)值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
工业外观检测中的图像扩增方法综述
魏静, 史庆丰, 沈飞, 张正涛, 陶显, 罗惠元
, doi: 10.16383/j.aas.c240139 , cstr: 32138.14.j.aas.c240139
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
从RAG到SAGE: 现状与展望
田永林, 王雨桐, 王兴霞, 杨静, 沈甜雨, 王建功, 范丽丽, 郭超, 王寿文, 赵勇, 武万森, 王飞跃
, doi: 10.16383/j.aas.c240163 , cstr: 32138.14.j.aas.c240163
摘要:
大模型技术提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等问题, 阻碍了可信可靠人工智能系统的构建. 检索增强生成方法(Retrieval-augmented generation, RAG)通过外接知识库和查询关联的检索有效提升了大模型的知识和能力水平, 为大模型掌握实时型、行业型及私有型知识提供了有力支撑, 进而加速了大模型技术向多样场景的推广与落地. 本文围绕检索增强生成技术, 阐述了其基本原理、发展现状及典型应用, 并分析了其优势和面临的挑战. 在此基础上, 引入搜索和缓存管理思想, 提出了RAG的拓展框架SAGE (Search-augmented generation and extension), 以建立更加灵活和高效的大模型知识外挂工具链.
基于高斯过程的不确定非线性系统在线学习控制及应用
刘玉发, 练桂铭, 刘勇华, 苏春翌
, doi: 10.16383/j.aas.c240356 , cstr: 32138.14.j.aas.c240356
摘要:
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
定位系统恶意攻击同源性分析及协同观测器定位矫正方法
史雨堃, 李肖磊, 上官义恒, 车万里, 王友清
, doi: 10.16383/j.aas.c240717 , cstr: 32138.14.j.aas.c240717
摘要:
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 针对定位系统中恶意攻击的同源性进行了深入分析, 并设计了分布式观测器以实现定位矫正. 针对定位系统中常见的三种攻击, 分别设计了恰当的模拟实现方式, 能够在多次蒙特卡洛实验很好的控制环境变量, 从而得到具有统计意义的实验结果. 本文还建立了不随偏差注入攻击幅值变化的定位偏移同源性的衡量指标, 分析了三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到了限制. 同时提出了一种适配复杂系统的观测器来实现恶意攻击下的定位校正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
基于预定义时间的舰载机抗干扰着舰控制
李钊星, 蔡云鹏, 刘茂汉, 王霞, 许斌
, doi: 10.16383/j.aas.c240766 , cstr: 32138.14.j.aas.c240766
摘要:
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明了系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
基于深度学习的视频超分辨率重建算法进展
唐麒, 赵耀, 刘美琴, 姚超
, doi: 10.16383/j.aas.c240235 , cstr: 32138.14.j.aas.c240235
摘要:
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法如雨后春笋般涌现, 在帧间对齐、信息传播等方面取得了突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理了现有的视频超分辨率重建的公共数据集及相关算法; 接着, 重点综述了基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结了视频超分辨率重建算法面临的挑战及未来的发展趋势.
面向可再生能源消纳的火电机组控制结构综合与分析
马士全, 丁进良
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
论文与报告
基于深度强化学习的无人机自主感知−规划−控制策略
吕茂隆, 丁晨博, 韩浩然, 段海滨
, doi: 10.16383/j.aas.c240639 , cstr: 32138.14.j.aas.c240639
摘要:
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
未知大规模互联系统在线分散式动态事件触发控制
何怡睿, 苏涵光, 张化光, 栾鑫洋
, doi: 10.16383/j.aas.c240262 , cstr: 32138.14.j.aas.c240262
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.