2025, 51(6): 1145-1169.
doi: 10.16383/j.aas.c240163
cstr: 32138.14.j.aas.c240163
摘要:
大模型技术的兴起显著提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战, 阻碍了可信可靠人工智能系统的构建. 检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平, 为大模型掌握实时型、行业型及私有型知识提供有力支撑, 进而促进大模型技术向多样场景的快速推广和实施. 围绕RAG, 阐述其基本原理、发展现状及典型应用, 并分析其优势和面临的挑战. 在RAG的基础上, 通过结合搜索模块和多级缓存管理模块, 提出RAG的拓展框架SAGE, 以建立更加灵活和高效的大模型知识外挂工具链.
大模型技术的兴起显著提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战, 阻碍了可信可靠人工智能系统的构建. 检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平, 为大模型掌握实时型、行业型及私有型知识提供有力支撑, 进而促进大模型技术向多样场景的快速推广和实施. 围绕RAG, 阐述其基本原理、发展现状及典型应用, 并分析其优势和面临的挑战. 在RAG的基础上, 通过结合搜索模块和多级缓存管理模块, 提出RAG的拓展框架SAGE, 以建立更加灵活和高效的大模型知识外挂工具链.
2025, 51(6): 1170-1190.
doi: 10.16383/j.aas.c240706
cstr: 32138.14.j.aas.c240706
摘要:
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 对最优控制器的设计提出挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望一些未来的研究方向.
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 对最优控制器的设计提出挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望一些未来的研究方向.
2025, 51(6): 1191-1204.
doi: 10.16383/j.aas.c240636
cstr: 32138.14.j.aas.c240636
摘要:
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素; 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素; 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器, 以提升对同类像素的识别能力, 从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数, 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
2025, 51(6): 1205-1217.
doi: 10.16383/j.aas.c240657
cstr: 32138.14.j.aas.c240657
摘要:
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为缓解上述问题, 提出基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划−交流−记忆−反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免对智能体参数的高成本训练. 实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
兵棋推演通过控制棋子的行为来模拟真实的对抗场景, 在智能决策领域具有重大研究意义. 已有的研究大多聚焦于知识驱动的规则型智能体或数据驱动的学习型智能体. 尽管这些方法在小规模兵棋推演上取得一定的进展, 但是由于知识规则的高获取代价、弱泛化性, 以及学习算法的低稳定性、学习过程的高算力需求, 导致已有方法难以在更加贴近真实场景的大规模兵棋推演环境中灵活应用. 为缓解上述问题, 提出基于大语言模型的大规模多智能体分层任务规划框架, 该框架利用大语言模型分别进行组队层次的粗粒度任务规划和个体层次的细粒度任务分解, 围绕“规划−交流−记忆−反思”实现策略生成. 相较于之前的工作, 该方法能有效缓解泛化性的难题, 同时在维持智能体一定的自我增强能力的情况下避免对智能体参数的高成本训练. 实验表明, 该模型能以较高胜率击败高水平AI, 且具备自我增强能力、泛化能力以及可解释能力, 在大规模对抗环境中具有显著优势.
2025, 51(6): 1218-1232.
doi: 10.16383/j.aas.c240481
cstr: 32138.14.j.aas.c240481
摘要:
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出一种梯度损失函数, 并基于此设计一种新的离线强化学习算法——梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下的普适性和有效性.
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 该研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出一种梯度损失函数, 并基于此设计一种新的离线强化学习算法——梯度损失离线强化学习算法 (GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将该研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下的普适性和有效性.
2025, 51(6): 1233-1247.
doi: 10.16383/j.aas.c240766
cstr: 32138.14.j.aas.c240766
摘要:
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短期记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短期记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
2025, 51(6): 1248-1260.
doi: 10.16383/j.aas.c240468
cstr: 32138.14.j.aas.c240468
摘要:
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 而且注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%. 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证了模型的可解释性.
2025, 51(6): 1261-1276.
doi: 10.16383/j.aas.c240517
cstr: 32138.14.j.aas.c240517
摘要:
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络. 该网络以超分辨率分支为主导, 融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征, 实现了高质量图像重建. JPEG压缩伪影去除分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
在真实场景中, 图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响. 现有方法通常聚焦于单一退化类型, 难以应对复杂的复合退化情况. 为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题, 提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络. 该网络以超分辨率分支为主导, 融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征, 实现了高质量图像重建. JPEG压缩伪影去除分支专注于压缩伪影抑制, 缓解了主导分支的重建负担. 梯度引导分支则精准估计图像梯度, 引导主导分支恢复更多细节与纹理. 实验结果表明, 该方法提升了低分辨率JPEG压缩图像的重建质量.
2025, 51(6): 1277-1289.
doi: 10.16383/j.aas.c240717
cstr: 32138.14.j.aas.c240717
摘要:
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 相关研究认为上述定位偏差具有同源性进而利用分布式协同实现定位矫正, 然而具体同源性没有在实验中明确分析. 针对定位系统中常见的三种攻击, 分别设计恰当的模拟实现方式, 能够在多次蒙特卡洛实验中很好地控制环境变量, 从而得到具有统计意义的实验结果. 还建立衡量定位偏移同源性的指标, 分析三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到限制. 同时提出一种适配复杂系统的观测器来实现恶意攻击下的定位矫正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 相关研究认为上述定位偏差具有同源性进而利用分布式协同实现定位矫正, 然而具体同源性没有在实验中明确分析. 针对定位系统中常见的三种攻击, 分别设计恰当的模拟实现方式, 能够在多次蒙特卡洛实验中很好地控制环境变量, 从而得到具有统计意义的实验结果. 还建立衡量定位偏移同源性的指标, 分析三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到限制. 同时提出一种适配复杂系统的观测器来实现恶意攻击下的定位矫正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
2025, 51(6): 1290-1304.
doi: 10.16383/j.aas.c240541
cstr: 32138.14.j.aas.c240541
摘要:
论辩对抽取是论辩挖掘领域中的一项重要研究任务, 旨在从对话文档的两个段落中抽取互动论辩对. 现有研究通常将其分为序列标记和关系分类两个子任务, 通过预测段落间的句子级关系来抽取论辩对. 然而, 这些研究在整体论点级语义及句子内部细粒度语义逻辑信息的显式建模上仍存在不足, 且未充分考虑两个段落间复杂的上下文感知交互关系. 基于此, 提出一种双向多视角关系图卷积网络. 首先, 从段落内、依存语法和段落间视角分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义交互关系, 为模型提供丰富的上下文语义信息. 然后, 通过引入多视角关系图卷积和图匹配模块, 在两个段落之间进行双向交互, 充分利用不同层次的论点间互动关系, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 实验结果表明, 相较于基线模型, 该方法在性能上有了显著提升.
论辩对抽取是论辩挖掘领域中的一项重要研究任务, 旨在从对话文档的两个段落中抽取互动论辩对. 现有研究通常将其分为序列标记和关系分类两个子任务, 通过预测段落间的句子级关系来抽取论辩对. 然而, 这些研究在整体论点级语义及句子内部细粒度语义逻辑信息的显式建模上仍存在不足, 且未充分考虑两个段落间复杂的上下文感知交互关系. 基于此, 提出一种双向多视角关系图卷积网络. 首先, 从段落内、依存语法和段落间视角分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义交互关系, 为模型提供丰富的上下文语义信息. 然后, 通过引入多视角关系图卷积和图匹配模块, 在两个段落之间进行双向交互, 充分利用不同层次的论点间互动关系, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 实验结果表明, 相较于基线模型, 该方法在性能上有了显著提升.
2025, 51(6): 1305-1319.
doi: 10.16383/j.aas.c240639
cstr: 32138.14.j.aas.c240639
摘要:
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
近年来, 随着深度强化学习(DRL)方法快速发展, 其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注. 然而, 面对复杂未知的环境, 现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景中的应用潜力. 为解决上述问题, 提出多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建自主感知−规划−控制架构, 赋予UAV在多样复杂环境中自主导航的能力.
2025, 51(6): 1320-1328.
doi: 10.16383/j.aas.c240644
cstr: 32138.14.j.aas.c240644
摘要:
研究通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为处理非匹配非线性项和通信链路故障, 提出一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计一个完全分布式控制器以保证系统的领导跟随一致性, 并以矩阵不等式的形式给出确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
研究通信链路故障下一类高阶非匹配非线性多智能体系统的领导跟随一致性控制问题. 为处理非匹配非线性项和通信链路故障, 提出一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计一个完全分布式控制器以保证系统的领导跟随一致性, 并以矩阵不等式的形式给出确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
2025, 51(6): 1329-1346.
doi: 10.16383/j.aas.c240566
cstr: 32138.14.j.aas.c240566
摘要:
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
2025, 51(6): 1347-1358.
doi: 10.16383/j.aas.c240722
cstr: 32138.14.j.aas.c240722
摘要:
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证了所提方法的可行性与有效性.
针对一类双端切换拓扑下基于二值通信的多智能体系统, 研究其迭代学习容错均值一致性控制问题. 为降低通信负担和提高数据传输的安全性, 假设每个智能体只能从其邻居处接收到二值信息, 建立一类双端切换拓扑结构以调控智能体之间的信息传递, 放宽通信拓扑在时间轴上需要完整生成树的限制. 在双迭代尺度框架下, 通过二值信息的估计过程和迭代学习控制技术的交替使用, 实现对智能体邻居状态的估计, 并完成均值一致性控制任务. 进一步地, 针对系统存在执行器故障的影响, 提出一种迭代学习容错均值一致性控制方案, 利用迭代学习实现对故障参数的迭代估计, 以保证系统在执行器故障影响下的性能. 基于非负的复合能量函数理论, 证明所得到的误差系统是有界的. 最后, 利用数值仿真算例验证了所提方法的可行性与有效性.
2025, 51(6): 1359-1370.
doi: 10.16383/j.aas.c240471
cstr: 32138.14.j.aas.c240471
摘要:
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态. 不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 仍然可以实现多智能体系统的平均一致性且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
针对通信网络可能遭受多邻居联合窃听的多智能体系统, 研究其基于全过程隐私保护的平均一致性问题, 具体包括保护智能体的初始状态以及智能体在实现平均一致性整个过程中的实时状态. 不同于现有的隐私保护平均一致性算法仅能保护智能体的初始状态且无法抵御联合窃听, 提出基于虚拟子网和非消失扰动的全过程隐私保护平均一致性算法. 在所提算法下, 即使智能体的所有信道都被窃听, 仍然可以实现多智能体系统的平均一致性且智能体的状态可以得到全过程保护. 最后, 通过几个数值仿真实验验证了算法的有效性.
2025, 51(6): 1371-1387.
doi: 10.16383/j.aas.c240489
cstr: 32138.14.j.aas.c240489
摘要:
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 所提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dice相似系数值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 所提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dice相似系数值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
2025, 51(6): 1388-1402.
doi: 10.16383/j.aas.c240734
cstr: 32138.14.j.aas.c240734
摘要:
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.
宽度学习系统作为一种轻量级网络, 在效率和准确性之间实现了良好的平衡. 然而, 宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息, 这些问题限制了模型的性能. 为解决此问题, 提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别, 旨在通过松弛图结构与柔性标签的引入提升模型性能. 创新性如下: 1)创新地使用双变换矩阵构建松弛图, 将变换矩阵的责任分离, 减少变换矩阵的负担, 从而学习更加灵活的变换矩阵, 解决了模型过拟合问题; 2)引入柔性标签策略, 扩大不同类别标签之间的距离, 解决了严苛二元标签的问题, 提高了模型的判别能力; 3)提出一种基于交替方向乘子法的迭代优化算法, 实现了模型的高效优化. 在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
摘要:
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
摘要:
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
摘要:
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(\begin{document}$\mu=0.05$\end{document} )下, 自适应控制策略通过\begin{document}$0.061\;0 \;\text{m}$\end{document} 的质心高度调整, 在维持\begin{document}$1.428\;4 \text{ m/s}$\end{document} 运动速度的同时, 将足端滑动距离控制在\begin{document}$0.308 \pm 0.005\;0 \text{ cm}$\end{document} , 充分验证了所提控制方法的有效性和实用价值.
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(
摘要:
航空航天、海洋舰船、轨道交通等领域的重大装备制造在服务于国家重大需求、引领国民经济发展与保障国防安全中占据举足轻重的作用. 传统人工加工一致性差、效率低, 专机加工工作空间受限、柔性不足, 车间加工协同性弱、智能化程度低, 这些都难以满足大型化、多品种的柔性制造需求. 集群机器人协同制造利用生物集群的智能协作机理, 能在大型复杂场景中不断拓展并优化各类作业的执行能力, 克服传统制造模式中的不足, 实现制造过程的高效协同和智能制造. 数字孪生技术作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、智能感知、通信协作、调度规划和协同控制等方面提供技术集成方案和工具链支撑, 能有效提升制造系统的效率, 保障制造过程安全性. 本文详细介绍数字孪生技术的研究背景与意义、国内外研究现状、关键技术及应用和发展趋势, 并以自主研发的一套面向飞机壁板装配的集群机器人数字孪生系统为例进行具体分析. 本文对于了解数字孪生在制造领域的技术方案和工具体系以及数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
航空航天、海洋舰船、轨道交通等领域的重大装备制造在服务于国家重大需求、引领国民经济发展与保障国防安全中占据举足轻重的作用. 传统人工加工一致性差、效率低, 专机加工工作空间受限、柔性不足, 车间加工协同性弱、智能化程度低, 这些都难以满足大型化、多品种的柔性制造需求. 集群机器人协同制造利用生物集群的智能协作机理, 能在大型复杂场景中不断拓展并优化各类作业的执行能力, 克服传统制造模式中的不足, 实现制造过程的高效协同和智能制造. 数字孪生技术作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、智能感知、通信协作、调度规划和协同控制等方面提供技术集成方案和工具链支撑, 能有效提升制造系统的效率, 保障制造过程安全性. 本文详细介绍数字孪生技术的研究背景与意义、国内外研究现状、关键技术及应用和发展趋势, 并以自主研发的一套面向飞机壁板装配的集群机器人数字孪生系统为例进行具体分析. 本文对于了解数字孪生在制造领域的技术方案和工具体系以及数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
摘要:
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
摘要:
本文研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}(1+{{\cal{P}}_K}))$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}(1+{{\cal{P}}_K}))$\end{document} 的动态遗憾上界, 其中\begin{document}$K$\end{document} 是总迭代次数, \begin{document}${\cal{P}}_K$\end{document} 是路径变差度量. 进一步, 当\begin{document}${\cal{P}}_K$\end{document} 能够被提前估计时, 两种算法分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 的期望动态遗憾上界. 最后, 通过对在线分布式岭回归问题的仿真实验, 验证了算法的收敛性以及理论结果的正确性.
本文研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得
摘要:
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为了解决该问题, 文中提出了一种非均匀采样预测控制方法. 首先, 建立了一种城市污水处理过程增广式动态线性化模型, 实现了非均匀采样城市污水处理关键过程变量的准确预测. 其次, 设计了基于控制增益优化策略的预测控制器, 实现了非均匀采样城市污水处理关键过程变量的稳定控制. 最后, 分析了非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为了解决该问题, 文中提出了一种非均匀采样预测控制方法. 首先, 建立了一种城市污水处理过程增广式动态线性化模型, 实现了非均匀采样城市污水处理关键过程变量的准确预测. 其次, 设计了基于控制增益优化策略的预测控制器, 实现了非均匀采样城市污水处理关键过程变量的稳定控制. 最后, 分析了非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
摘要:
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
摘要:
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
摘要:
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
摘要:
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(Generalized maximum correntropy criterion, GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计了流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计了一种广义高斯核参数自适应调整策略, 以在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(Generalized maximum correntropy criterion, GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计了流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计了一种广义高斯核参数自适应调整策略, 以在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
摘要:
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低了对新类的识别能力. 为了解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器 (Background discriminative knowledge minimizing regulator, BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉\begin{document}$l_p $\end{document} 正则项(Background discriminative knowledge minimizing cross-\begin{document}$l_p $\end{document} regularization, BMCR)”显式地减少背景判别性知识对构建新类分类器的干扰, 并利用“权重范数管理器(Weight norm manager, WNM)”调节分类器中各类别的权重范数, 以提高模型对新类别的关注度, 同时降低其对背景类别的偏好. 此外, 考虑到 BDKMR 可能改变特征空间分布, 提出“分类器解耦模块(Decoupled box classifier, DBC)”, 以调控模型微调过程中正则化分类器对特征提取器学习的影响. 多个数据集上的实验结果表明, 所提出的方法能够有效减少模型对新类实例的错误分类, 进而显著提升对新类的检测性能.
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低了对新类的识别能力. 为了解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器 (Background discriminative knowledge minimizing regulator, BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉
摘要:
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
摘要:
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
摘要:
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
摘要:
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为了其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略了维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响了跨用户情绪识别的准确性. 本文首先提出了规则降维的多标签TSK模糊系统(RDR-MLTSK), 以优化模糊系统结构和训练效率; 进一步提出了多标签模糊域适应算法(MLFDA)实现多源域迁移学习, 提高了RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为了其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略了维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响了跨用户情绪识别的准确性. 本文首先提出了规则降维的多标签TSK模糊系统(RDR-MLTSK), 以优化模糊系统结构和训练效率; 进一步提出了多标签模糊域适应算法(MLFDA)实现多源域迁移学习, 提高了RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
摘要:
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
摘要:
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证所提方法的有效性.
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证所提方法的有效性.
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
摘要:
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
摘要:
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
当前状态:
, 最新更新时间: ,
doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
当前状态:
, 最新更新时间: ,
doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
当前状态:
, 最新更新时间: ,
doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
当前状态:
, 最新更新时间: ,
doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.