当期目录
2025年 第51卷 第6期
2025, 51(6): 1145-1169.
doi: 10.16383/j.aas.c240163
cstr: 32138.14.j.aas.c240163
摘要:
大模型技术的兴起显著提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战, 阻碍了可信可靠人工智能系统的构建. 检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平, 为大模型掌握实时型、行业型及私有型知识提供有力支撑, 进而促进大模型技术向多样场景的快速推广和实施. 围绕RAG, 阐述其基本原理、发展现状及典型应用, 并分析其优势和面临的挑战. 在RAG的基础上, 通过结合搜索模块和多级缓存管理模块, 提出RAG的拓展框架SAGE, 以建立更加灵活和高效的大模型知识外挂工具链.
大模型技术的兴起显著提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战, 阻碍了可信可靠人工智能系统的构建. 检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平, 为大模型掌握实时型、行业型及私有型知识提供有力支撑, 进而促进大模型技术向多样场景的快速推广和实施. 围绕RAG, 阐述其基本原理、发展现状及典型应用, 并分析其优势和面临的挑战. 在RAG的基础上, 通过结合搜索模块和多级缓存管理模块, 提出RAG的拓展框架SAGE, 以建立更加灵活和高效的大模型知识外挂工具链.
2025, 51(6): 1170-1190.
doi: 10.16383/j.aas.c240706
cstr: 32138.14.j.aas.c240706
摘要:
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 对最优控制器的设计提出挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望一些未来的研究方向.
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 对最优控制器的设计提出挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望一些未来的研究方向.
2025, 51(6): 1191-1204.
doi: 10.16383/j.aas.c240636
cstr: 32138.14.j.aas.c240636
摘要:
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素; 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素; 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
2025, 51(6): 1205-1217.
doi: 10.16383/j.aas.c240657
cstr: 32138.14.j.aas.c240657
摘要:
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为缓解上述问题, 提出基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划−交流−记忆−反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免对智能体参数的高成本训练. 实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为缓解上述问题, 提出基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划−交流−记忆−反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免对智能体参数的高成本训练. 实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
2025, 51(6): 1218-1232.
doi: 10.16383/j.aas.c240481
cstr: 32138.14.j.aas.c240481
摘要:
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出一种梯度损失函数, 并基于此设计一种新的离线强化学习算法——梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下的普适性和有效性.
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出一种梯度损失函数, 并基于此设计一种新的离线强化学习算法——梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下的普适性和有效性.
2025, 51(6): 1233-1247.
doi: 10.16383/j.aas.c240766
cstr: 32138.14.j.aas.c240766
摘要:
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短期记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短期记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
2025, 51(6): 1248-1260.
doi: 10.16383/j.aas.c240468
cstr: 32138.14.j.aas.c240468
摘要:
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
2025, 51(6): 1261-1276.
doi: 10.16383/j.aas.c240517
cstr: 32138.14.j.aas.c240517
摘要:
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络. 该网络以超分辨率分支为主导, 融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征, 实现了高质量图像重建. JPEG压缩伪影去除分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络. 该网络以超分辨率分支为主导, 融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征, 实现了高质量图像重建. JPEG压缩伪影去除分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
2025, 51(6): 1277-1289.
doi: 10.16383/j.aas.c240717
cstr: 32138.14.j.aas.c240717
摘要:
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 相关研究认为上述定位偏差具有同源性进而利用分布式协同实现定位矫正, 然而具体同源性没有在实验中明确分析. 针对定位系统中常见的三种攻击, 分别设计恰当的模拟实现方式, 能够在多次蒙特卡洛实验中很好地控制环境变量, 从而得到具有统计意义的实验结果. 还建立衡量定位偏移同源性的指标, 分析三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到限制. 同时提出一种适配复杂系统的观测器来实现恶意攻击下的定位矫正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 相关研究认为上述定位偏差具有同源性进而利用分布式协同实现定位矫正, 然而具体同源性没有在实验中明确分析. 针对定位系统中常见的三种攻击, 分别设计恰当的模拟实现方式, 能够在多次蒙特卡洛实验中很好地控制环境变量, 从而得到具有统计意义的实验结果. 还建立衡量定位偏移同源性的指标, 分析三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到限制. 同时提出一种适配复杂系统的观测器来实现恶意攻击下的定位矫正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
2025, 51(6): 1290-1304.
doi: 10.16383/j.aas.c240541
cstr: 32138.14.j.aas.c240541
摘要:
论辩对抽取是论辩挖掘领域中的一项重要研究任务, 旨在从对话文档的两个段落中抽取互动论辩对. 现有研究通常将其分为序列标记和关系分类两个子任务, 通过预测段落间的句子级关系来抽取论辩对. 然而, 这些研究在整体论点级语义及句子内部细粒度语义逻辑信息的显式建模上仍存在不足, 且未充分考虑两个段落间复杂的上下文感知交互关系. 基于此, 提出一种双向多视角关系图卷积网络. 首先, 从段落内、依存语法和段落间视角分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义交互关系, 为模型提供丰富的上下文语义信息. 然后, 通过引入多视角关系图卷积和图匹配模块, 在两个段落之间进行双向交互, 充分利用不同层次的论点间互动关系, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 实验结果表明, 相较于基线模型, 该方法在性能上有了显著提升.
论辩对抽取是论辩挖掘领域中的一项重要研究任务, 旨在从对话文档的两个段落中抽取互动论辩对. 现有研究通常将其分为序列标记和关系分类两个子任务, 通过预测段落间的句子级关系来抽取论辩对. 然而, 这些研究在整体论点级语义及句子内部细粒度语义逻辑信息的显式建模上仍存在不足, 且未充分考虑两个段落间复杂的上下文感知交互关系. 基于此, 提出一种双向多视角关系图卷积网络. 首先, 从段落内、依存语法和段落间视角分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义交互关系, 为模型提供丰富的上下文语义信息. 然后, 通过引入多视角关系图卷积和图匹配模块, 在两个段落之间进行双向交互, 充分利用不同层次的论点间互动关系, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 实验结果表明, 相较于基线模型, 该方法在性能上有了显著提升.
2025, 51(6): 1305-1319.
doi: 10.16383/j.aas.c240639
cstr: 32138.14.j.aas.c240639
摘要:
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
2025, 51(6): 1320-1328.
doi: 10.16383/j.aas.c240644
cstr: 32138.14.j.aas.c240644
摘要:
研究通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为处理非匹配非线性项和通信链路故障, 提出一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计一个完全分布式控制器以保证系统的领导跟随一致性, 并以矩阵不等式的形式给出确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
研究通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为处理非匹配非线性项和通信链路故障, 提出一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计一个完全分布式控制器以保证系统的领导跟随一致性, 并以矩阵不等式的形式给出确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
2025, 51(6): 1329-1346.
doi: 10.16383/j.aas.c240566
cstr: 32138.14.j.aas.c240566
摘要:
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
2025, 51(6): 1347-1358.
doi: 10.16383/j.aas.c240722
cstr: 32138.14.j.aas.c240722
摘要:
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证了所提方法的可行性与有效性.
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证了所提方法的可行性与有效性.
2025, 51(6): 1359-1370.
doi: 10.16383/j.aas.c240471
cstr: 32138.14.j.aas.c240471
摘要:
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态. 不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 仍然可以实现多智能体系统的平均一致性且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态. 不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 仍然可以实现多智能体系统的平均一致性且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
2025, 51(6): 1371-1387.
doi: 10.16383/j.aas.c240489
cstr: 32138.14.j.aas.c240489
摘要:
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 所提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dice相似系数值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 所提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dice相似系数值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
2025, 51(6): 1388-1402.
doi: 10.16383/j.aas.c240734
cstr: 32138.14.j.aas.c240734
摘要:
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.