优先发表
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
摘要:
空地行人重识别任务旨在包含地面与空中视角的监控相机网络中, 实现对特定行人的精确识别与跨镜关联. 该任务的特有挑战在于克服空地成像设备之间巨大的视角差异对于学习判别性行人身份特征的干扰. 现有工作在行人特征建模方面存在不足, 未充分考虑跨视角特征对齐对识别与检索性能的提升作用. 基于此, 本文提出一种基于隐式特征对齐的空地行人重识别方法, 主要包含两方面的创新: 在模型设计方面, 提出基于自注意力解码器的隐式对齐框架, 通过在解码阶段利用一组可学习的口令特征挖掘行人判别部件区域, 并提取和对齐行人局部特征, 从而实现判别性行人表征的学习; 在优化目标方面, 提出正交性和一致性损失函数, 前者约束口令特征以多样化判别性行人部件为关注点, 后者缓解了跨视角特征表达的偏置分布. 在当前最大可用的空地重识别数据集CARGO上进行实验, 结果表明本文方法在检索性能上优于现有重识别方法, 实现显著的性能提升.
空地行人重识别任务旨在包含地面与空中视角的监控相机网络中, 实现对特定行人的精确识别与跨镜关联. 该任务的特有挑战在于克服空地成像设备之间巨大的视角差异对于学习判别性行人身份特征的干扰. 现有工作在行人特征建模方面存在不足, 未充分考虑跨视角特征对齐对识别与检索性能的提升作用. 基于此, 本文提出一种基于隐式特征对齐的空地行人重识别方法, 主要包含两方面的创新: 在模型设计方面, 提出基于自注意力解码器的隐式对齐框架, 通过在解码阶段利用一组可学习的口令特征挖掘行人判别部件区域, 并提取和对齐行人局部特征, 从而实现判别性行人表征的学习; 在优化目标方面, 提出正交性和一致性损失函数, 前者约束口令特征以多样化判别性行人部件为关注点, 后者缓解了跨视角特征表达的偏置分布. 在当前最大可用的空地重识别数据集CARGO上进行实验, 结果表明本文方法在检索性能上优于现有重识别方法, 实现显著的性能提升.
摘要:
为解决传统图像分类方法边缘信息提取模糊、多尺度特征聚合不充分的问题, 提出全息梯度差分卷积的图像分类网络(HGDNet). HGDNet以ResNet-34为基础网络, 通过设计全息梯度差分卷积(HGDConv)与多尺度特征聚合模块(FARM)实现对图像特征的高效提取与精细聚合. HGDConv通过设计\begin{document}$0^{\circ}$\end{document} 、\begin{document}$45^{\circ}$\end{document} 、\begin{document}$90^{\circ}$\end{document} 、\begin{document}$135^{\circ}$\end{document} 四种角度的梯度差分操作, 结合传统卷积的特性, 有效拓宽感受野, 提高对图像多角度特征的捕获能力, 显著增强网络在细节特征和边缘信息上的表达能力. FARM通过通道注意力机制动态调整特征通道的重要性, 提升特征选择的精准性, 进一步优化了特征提取与融合; 同时, FARM结合全局特征集成和多尺度特征细化, 在捕捉全局语义信息的同时, 对关键区域进行细化处理, 有效减少冗余信息并增强重要特征表达. 实验结果表明, HGDNet在CIFAR-10、CIFAR-100、SVHN、STL-10、Imagenette和Imagewoof上均表现出优异的分类性能, 相较于当前先进方法准确率显著提升. 此外, HGDConv作为一个即插即用的卷积, 与其他卷积相比也展现出更好的特征表示能力.
为解决传统图像分类方法边缘信息提取模糊、多尺度特征聚合不充分的问题, 提出全息梯度差分卷积的图像分类网络(HGDNet). HGDNet以ResNet-34为基础网络, 通过设计全息梯度差分卷积(HGDConv)与多尺度特征聚合模块(FARM)实现对图像特征的高效提取与精细聚合. HGDConv通过设计
摘要:
控制系统隐私保护是随着数字化、信息化和智能化的发展而诞生的新兴方向, 具有广泛的实际需求与应用价值, 是现代控制理论在新时代的重要发展. 鉴于此, 本综述从研究背景与意义、国内外现状、未来研究方向及总结与展望四个方面, 对该方向进行系统梳理. 控制系统隐私问题无处不在, 隐私保护对控制系统至关重要. 由于该方向具有交叉性、不确定性、实时性和应用性等特点, 其研究具有挑战性. 在国内外研究现状部分, 详细介绍基于系统结构的方法、基于确定性变换的方法和基于随机混淆或扰动的方法, 并着重阐述同态加密、安全多方计算、差分隐私等常见技术的理论基础及在控制系统中的应用. 针对面临的诸多挑战性问题, 总结未来重点研究方向, 尤其是隐私、控制与通信的一体化设计, 以及隐私保护与系统性能之间的权衡. 最后, 对该方向进行总结与展望, 旨在为相关研究人员提供参考, 进一步推动国家安全战略的实施.
控制系统隐私保护是随着数字化、信息化和智能化的发展而诞生的新兴方向, 具有广泛的实际需求与应用价值, 是现代控制理论在新时代的重要发展. 鉴于此, 本综述从研究背景与意义、国内外现状、未来研究方向及总结与展望四个方面, 对该方向进行系统梳理. 控制系统隐私问题无处不在, 隐私保护对控制系统至关重要. 由于该方向具有交叉性、不确定性、实时性和应用性等特点, 其研究具有挑战性. 在国内外研究现状部分, 详细介绍基于系统结构的方法、基于确定性变换的方法和基于随机混淆或扰动的方法, 并着重阐述同态加密、安全多方计算、差分隐私等常见技术的理论基础及在控制系统中的应用. 针对面临的诸多挑战性问题, 总结未来重点研究方向, 尤其是隐私、控制与通信的一体化设计, 以及隐私保护与系统性能之间的权衡. 最后, 对该方向进行总结与展望, 旨在为相关研究人员提供参考, 进一步推动国家安全战略的实施.
摘要:
滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键. 针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题, 提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att). 该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力, 采用双向建模的方式捕捉前后向信息, 最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测. 所提方法在滚动轴承数据集上进行实验验证, 结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势, 并通过消融实验证明了模型各组件的合理性和有效性, 为滚动轴承的寿命预测提供了全新可行的解决方案.
滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键. 针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题, 提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att). 该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力, 采用双向建模的方式捕捉前后向信息, 最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测. 所提方法在滚动轴承数据集上进行实验验证, 结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势, 并通过消融实验证明了模型各组件的合理性和有效性, 为滚动轴承的寿命预测提供了全新可行的解决方案.
摘要:
约束多目标优化问题主要考虑如何在复杂约束条件下同时优化多个相互冲突的目标, 其广泛存在于工程实践中. 解决多目标优化问题的关键在于约束满足和目标优化之间的平衡. 然而, 当问题具有复杂可行域时, 现有算法往往存在选择压力大小的矛盾: 若算法的选择压力较大, 种群容易陷入局部最优; 若算法的选择压力较小, 种群则难以搜索到完整的约束前沿. 针对此, 提出一种双种群协同进化约束多目标优化算法. 所提算法采用双种群协同进化框架, 引入粒子群和向量群以实现种群间的信息共享和优势互补. 其中粒子群使用带有辅助档案的粒子群优化器, 通过粒子间的相互学习实现快速收敛, 而辅助档案则借助逃逸机制帮助粒子群跳出局部最优. 同时, 设计一种新的\begin{document}$\epsilon$\end{document} -约束技术, 动态调整约束松弛因子, 使种群在进化初期注重不可行解的遗传信息, 跨越不可行区域. 向量群使用不考虑约束的参考向量法引导种群进化, 使种群均匀分布于前沿面, 有效维护了种群的多样性. 在当前基准测试集和真实世界73个问题上的实验结果表明, 所提出的算法超越对比算法, 能够在保持种群多样性的同时快速收敛到约束前沿.
约束多目标优化问题主要考虑如何在复杂约束条件下同时优化多个相互冲突的目标, 其广泛存在于工程实践中. 解决多目标优化问题的关键在于约束满足和目标优化之间的平衡. 然而, 当问题具有复杂可行域时, 现有算法往往存在选择压力大小的矛盾: 若算法的选择压力较大, 种群容易陷入局部最优; 若算法的选择压力较小, 种群则难以搜索到完整的约束前沿. 针对此, 提出一种双种群协同进化约束多目标优化算法. 所提算法采用双种群协同进化框架, 引入粒子群和向量群以实现种群间的信息共享和优势互补. 其中粒子群使用带有辅助档案的粒子群优化器, 通过粒子间的相互学习实现快速收敛, 而辅助档案则借助逃逸机制帮助粒子群跳出局部最优. 同时, 设计一种新的
摘要:
联合稀疏角度CT重建和金属伪影校正任务旨在通过受金属迹污染的少视角投影数据重建高质量的CT图像. 现有稀疏角度CT重建方法和金属伪影校正方法通常依赖于CT图像或投影数据, 但其存在临床投影数据难以获取和校正精度差的问题. 为解决这些问题, 提出一种基于伪影提示Transformer的图像域方法, 仅利用受伪影影响的CT图像即可同时实现稀疏角度CT重建和金属伪影校正. 该方法将伪影区域作为提示, 并将提示特征融入Transformer提取的特征中, 提出伪影提示Transformer架构. 该架构能够通过伪影区域特征提示, 利用伪影区域和非伪影区域之间的全局上下文相关性提升伪影校正精度. 针对多种伪影校正问题, 在包含伪影的CT图像上构建伪影区域估计网络来估计伪影区域, 并设计由局部信息提取模块、伪影区域注意力模块和通道注意力融合模块构成的局部−全局信息交互网络来融合局部与全局信息. 实验结果表明, 该方法能够同时进行高精度CT重建并有效去除金属伪影.
联合稀疏角度CT重建和金属伪影校正任务旨在通过受金属迹污染的少视角投影数据重建高质量的CT图像. 现有稀疏角度CT重建方法和金属伪影校正方法通常依赖于CT图像或投影数据, 但其存在临床投影数据难以获取和校正精度差的问题. 为解决这些问题, 提出一种基于伪影提示Transformer的图像域方法, 仅利用受伪影影响的CT图像即可同时实现稀疏角度CT重建和金属伪影校正. 该方法将伪影区域作为提示, 并将提示特征融入Transformer提取的特征中, 提出伪影提示Transformer架构. 该架构能够通过伪影区域特征提示, 利用伪影区域和非伪影区域之间的全局上下文相关性提升伪影校正精度. 针对多种伪影校正问题, 在包含伪影的CT图像上构建伪影区域估计网络来估计伪影区域, 并设计由局部信息提取模块、伪影区域注意力模块和通道注意力融合模块构成的局部−全局信息交互网络来融合局部与全局信息. 实验结果表明, 该方法能够同时进行高精度CT重建并有效去除金属伪影.
摘要:
研究无人水面舰艇−无人机(USVs-UAV)系统中基于电量状态的编队控制、避障与轨迹跟踪问题, 提出一种分布式模型预测控制方法以实现多无人载具协同. 第一, 基于USV电量设计编队模型, 实时调整编队构型. 第二, 设计空海协同避障机制, 利用UAV空中高度优势构建障碍物监测网络, 实时更新水面障碍物信息至USV群. 第三, 优化控制框架将编队控制、避障与轨迹跟踪问题统一转化为带约束的优化问题, 通过求解最优控制输入实现多无人载具协同.
研究无人水面舰艇−无人机(USVs-UAV)系统中基于电量状态的编队控制、避障与轨迹跟踪问题, 提出一种分布式模型预测控制方法以实现多无人载具协同. 第一, 基于USV电量设计编队模型, 实时调整编队构型. 第二, 设计空海协同避障机制, 利用UAV空中高度优势构建障碍物监测网络, 实时更新水面障碍物信息至USV群. 第三, 优化控制框架将编队控制、避障与轨迹跟踪问题统一转化为带约束的优化问题, 通过求解最优控制输入实现多无人载具协同.
摘要:
模型集成对抗攻击通过整合多个替代模型的梯度信息, 能够显著增强对抗样本的跨模型迁移能力, 是当前黑盒攻击中最具潜力的策略之一. 然而, 现有集成方法在动态加权过程中通常依赖扰动引起的预测误差作为权重依据, 未能有效区分扰动作用与模型自身固有误差. 由此可能高估低质量模型对扰动优化的贡献, 干扰攻击方向, 进而削弱对抗样本的实际迁移效果. 鉴于此, 提出基于扰动响应的自适应集成黑盒对抗攻击算法(Perturbation response-based adaptive ensemble black-box adversarial attack algorithm, PRA-EA). 首先, 提出扰动响应感知的权重分配策略(Perturbation response-aware weight allocation, PRA-WA), 通过引入KL散度与集成相似度指标来衡量扰动对模型输出的真实影响, 避免低质量模型对集成过程的干扰; 其次, 提出梯度协同扰动缩放策略(Gradient-collaborative based perturbation scaling, GCPS), 结合像素级梯度一致性度量, 动态调整扰动幅度, 缓解集成过程中的局部过拟合现象, 增强对抗样本在多模型间的泛化能力; 最后, 在多个黑盒攻击任务中进行综合评估, 实验结果表明所提出的基于扰动响应的自适应集成黑盒对抗攻击算法在迁移性能、攻击成功率与扰动效率方面均显著优于现有方法.
模型集成对抗攻击通过整合多个替代模型的梯度信息, 能够显著增强对抗样本的跨模型迁移能力, 是当前黑盒攻击中最具潜力的策略之一. 然而, 现有集成方法在动态加权过程中通常依赖扰动引起的预测误差作为权重依据, 未能有效区分扰动作用与模型自身固有误差. 由此可能高估低质量模型对扰动优化的贡献, 干扰攻击方向, 进而削弱对抗样本的实际迁移效果. 鉴于此, 提出基于扰动响应的自适应集成黑盒对抗攻击算法(Perturbation response-based adaptive ensemble black-box adversarial attack algorithm, PRA-EA). 首先, 提出扰动响应感知的权重分配策略(Perturbation response-aware weight allocation, PRA-WA), 通过引入KL散度与集成相似度指标来衡量扰动对模型输出的真实影响, 避免低质量模型对集成过程的干扰; 其次, 提出梯度协同扰动缩放策略(Gradient-collaborative based perturbation scaling, GCPS), 结合像素级梯度一致性度量, 动态调整扰动幅度, 缓解集成过程中的局部过拟合现象, 增强对抗样本在多模型间的泛化能力; 最后, 在多个黑盒攻击任务中进行综合评估, 实验结果表明所提出的基于扰动响应的自适应集成黑盒对抗攻击算法在迁移性能、攻击成功率与扰动效率方面均显著优于现有方法.
摘要:
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
摘要:
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
摘要:
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
摘要:
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
摘要:
高炉炼铁过程是钢铁冶炼制造中能耗最大、成本最高、排放最多的核心环节, 其能耗、成本约占钢铁流程的70%, 而碳排放占总排放的近80%, 其平稳生产决定着整个钢铁制造流程的生产水平. 为此, 高效的高炉炼铁过程故障检测与诊断, 是保障钢铁制造流程生产的有效手段, 也是近年业界与学界的研究热点. 立足于该领域的未来发展需求, 首先总结国内外研究现状, 着重于近20年来数据驱动方法在高炉炼铁过程故障检测与诊断; 其次, 按照数据量需求, 阐述并分析不同技术方法基本思想、优势与不足, 并分类概述最新技术进展; 最后, 提出未来发展趋势, 以期对高炉炼铁过程故障检测与诊断的持续发展提供参考.
高炉炼铁过程是钢铁冶炼制造中能耗最大、成本最高、排放最多的核心环节, 其能耗、成本约占钢铁流程的70%, 而碳排放占总排放的近80%, 其平稳生产决定着整个钢铁制造流程的生产水平. 为此, 高效的高炉炼铁过程故障检测与诊断, 是保障钢铁制造流程生产的有效手段, 也是近年业界与学界的研究热点. 立足于该领域的未来发展需求, 首先总结国内外研究现状, 着重于近20年来数据驱动方法在高炉炼铁过程故障检测与诊断; 其次, 按照数据量需求, 阐述并分析不同技术方法基本思想、优势与不足, 并分类概述最新技术进展; 最后, 提出未来发展趋势, 以期对高炉炼铁过程故障检测与诊断的持续发展提供参考.
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
摘要:
研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}(1+{{\cal{P}}_K}))$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}(1+{{\cal{P}}_K}))$\end{document} 的动态遗憾上界, 其中\begin{document}$K$\end{document} 是总迭代次数, \begin{document}${\cal{P}}_K$\end{document} 是路径变差度量. 进一步, 当\begin{document}${\cal{P}}_K$\end{document} 能够被提前估计时, 两种算法分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 的期望动态遗憾上界. 最后, 通过对在线分布式岭回归问题的仿真实验, 验证了算法的收敛性以及理论结果的正确性.
研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得
摘要:
基于有向图的邻接矩阵和距离矩阵, 提出有向图顶点度集、距离谱与距离和集的定义, 将基于邻接矩阵的同构判定条件推广到简单有向图的距离矩阵. 在此基础上, 给出两个简单有向图的同构性判据, 这两个判据均可判定任意两个简单有向图是否同构; 给出复杂有向图的同构性判据, 该判据可判定任意两个复杂有向图是否同构. 上述三个判据均是充要条件且均具有多项式时间复杂度.
基于有向图的邻接矩阵和距离矩阵, 提出有向图顶点度集、距离谱与距离和集的定义, 将基于邻接矩阵的同构判定条件推广到简单有向图的距离矩阵. 在此基础上, 给出两个简单有向图的同构性判据, 这两个判据均可判定任意两个简单有向图是否同构; 给出复杂有向图的同构性判据, 该判据可判定任意两个复杂有向图是否同构. 上述三个判据均是充要条件且均具有多项式时间复杂度.
摘要:
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
摘要:
针对具有Snapback层间耦合框架的多层网络化数据采样系统的状态能控性展开研究. 首先构建出多层Snapback网络化数据采样系统的数学模型, 并推导出通用三层Snapback网络化数据采样系统能控性的充要条件, 揭示了层内网络拓扑结构, 节点动力学, 外部控制输入, 数据采样及层间耦合框架等因素对能控性的影响. 然后, 针对层内耦合矩阵为可对角化矩阵的基本Snapback网络化数据采样系统, 进一步简化了其能控性条件, 并将其结论进行了推广. 最后, 考虑由简单Snapback结构叠加而成的复合Snapback多层网络, 给出网络化数据采样系统能控性的充分条件. 通过例子验证了本文给出的结论.
针对具有Snapback层间耦合框架的多层网络化数据采样系统的状态能控性展开研究. 首先构建出多层Snapback网络化数据采样系统的数学模型, 并推导出通用三层Snapback网络化数据采样系统能控性的充要条件, 揭示了层内网络拓扑结构, 节点动力学, 外部控制输入, 数据采样及层间耦合框架等因素对能控性的影响. 然后, 针对层内耦合矩阵为可对角化矩阵的基本Snapback网络化数据采样系统, 进一步简化了其能控性条件, 并将其结论进行了推广. 最后, 考虑由简单Snapback结构叠加而成的复合Snapback多层网络, 给出网络化数据采样系统能控性的充分条件. 通过例子验证了本文给出的结论.
摘要:
针对多智能体强化学习中隐私泄露及联邦强化学习在多微网设备异构环境下失效的问题, 提出了一种基于个性化联邦强化学习的异构多区域微电网能量调度方法. 该方法将状态—动作对拆分为“私有”和“共有”两类, 分别输入模块化Critic网络中的私有解构层和公有解构层, 仅在前者中部署联邦框架, 既实现了公共设备网络参数的同步共享, 又保留了各区域私有设备的个性化训练, 从而在保护数据隐私的前提下完成协同优化; 同时, 引入多Critic网络随机抽样架构进行本地训练, 有效缓解Q值高估导致的策略性能下降问题. 最后, 基于三类典型微电网模型构成的异构多区域微网系统开展仿真实验. 结果表明该方法可有效克服设备异构限制, 使区域智能体快速收敛至接近最优的策略, 合理分配设备出力, 实现多微网实时能量调度并提升经济效益.
针对多智能体强化学习中隐私泄露及联邦强化学习在多微网设备异构环境下失效的问题, 提出了一种基于个性化联邦强化学习的异构多区域微电网能量调度方法. 该方法将状态—动作对拆分为“私有”和“共有”两类, 分别输入模块化Critic网络中的私有解构层和公有解构层, 仅在前者中部署联邦框架, 既实现了公共设备网络参数的同步共享, 又保留了各区域私有设备的个性化训练, 从而在保护数据隐私的前提下完成协同优化; 同时, 引入多Critic网络随机抽样架构进行本地训练, 有效缓解Q值高估导致的策略性能下降问题. 最后, 基于三类典型微电网模型构成的异构多区域微网系统开展仿真实验. 结果表明该方法可有效克服设备异构限制, 使区域智能体快速收敛至接近最优的策略, 合理分配设备出力, 实现多微网实时能量调度并提升经济效益.
摘要:
因果关系挖掘对工业过程异常工况定位和控制方案推理至关重要. 然而, 传统的因果关系挖掘方法缺乏对时空动态变化的综合考虑, 难以有效消除虚假因果关系. 针对上述问题, 提出了基于跨时空稳定因果动态贝叶斯网络的工业过程安全控制方法. 该方法利用稳定学习(Stable learning, SL)挖掘并优化不同时空数据分布下的因果一致性特征, 确保所挖掘的因果关系在不同时空单元中具有稳定性. 在此基础上, 利用动态贝叶斯网络(Dynamic Bayesian network, DBN)引入滞后节点, 捕捉时序数据中的滞后依赖关系, 刻画因果关系的时空演化特性并利用信息熵建立因果关系筛选机制. 此外, 采用基于协变量平衡的样本重加权技术, 通过调整样本权重, 使模型能够更准确地反映理想情况下的因果特性. 最后, 选取12种典型工况案例验证了方法的有效性.
因果关系挖掘对工业过程异常工况定位和控制方案推理至关重要. 然而, 传统的因果关系挖掘方法缺乏对时空动态变化的综合考虑, 难以有效消除虚假因果关系. 针对上述问题, 提出了基于跨时空稳定因果动态贝叶斯网络的工业过程安全控制方法. 该方法利用稳定学习(Stable learning, SL)挖掘并优化不同时空数据分布下的因果一致性特征, 确保所挖掘的因果关系在不同时空单元中具有稳定性. 在此基础上, 利用动态贝叶斯网络(Dynamic Bayesian network, DBN)引入滞后节点, 捕捉时序数据中的滞后依赖关系, 刻画因果关系的时空演化特性并利用信息熵建立因果关系筛选机制. 此外, 采用基于协变量平衡的样本重加权技术, 通过调整样本权重, 使模型能够更准确地反映理想情况下的因果特性. 最后, 选取12种典型工况案例验证了方法的有效性.
摘要:
机器学习中的诸多非凸优化问题, 如鲁棒相位恢复、低秩矩阵补全以及稀疏字典学习等, 本质上可归结为弱凸优化问题. 然而, 弱凸优化问题固有的非凸特性使得此类问题的求解极具挑战. 此外, 由于系统复杂度和问题规模的增加以及相关参数的分布式存储需求, 传统基于单个个体的集中式计算框架难以高效求解此类问题. 针对上述挑战, 设计了一种分布式镜像下降算法, 并从Bregman-Moreau包络的角度分析了其收敛性, 证明了算法的收敛速度为\begin{document}${O}(\ln K/{\sqrt K})$\end{document} , 其中\begin{document}$K$\end{document} 为算法的迭代步数. 进一步地, 考虑目标函数梯度信息难以精确获取的情形, 采用正交随机方向矩阵法进行梯度估计. 相较于传统的基于随机向量的方法, 该方法利用多维方向信息进行估计, 从而显著提高了梯度信息的估计精度和效率. 基于高效的梯度信息估计, 提出了一种分布式零阶镜像下降算法, 并获得了与已知精确梯度信息情形下相一致的收敛速度. 最后, 通过相位恢复问题的数值仿真和实验验证了所提出的两种算法的有效性.
机器学习中的诸多非凸优化问题, 如鲁棒相位恢复、低秩矩阵补全以及稀疏字典学习等, 本质上可归结为弱凸优化问题. 然而, 弱凸优化问题固有的非凸特性使得此类问题的求解极具挑战. 此外, 由于系统复杂度和问题规模的增加以及相关参数的分布式存储需求, 传统基于单个个体的集中式计算框架难以高效求解此类问题. 针对上述挑战, 设计了一种分布式镜像下降算法, 并从Bregman-Moreau包络的角度分析了其收敛性, 证明了算法的收敛速度为
摘要:
面对复杂系统装配对高精度、高时效协同的迫切需求, 飞机总装制造亟需构建具备感知−传输−控制一体化能力的现场级工业网络系统. 为此, 本文率先建立现场级网络控制系统容量模型, 提出双向融合−协同管控的工业互联网新型架构. 围绕感知、传输、计算与控制的全链条任务闭环, 系统构建多维时效性综合评价指标体系, 深入探索多域异构资源的联合调度与协同优化机制. 最后, 面向飞机总装过程中活动面动态测量与多工序协同优化, 设计并实现高保真数字孪生验证平台, 有效支撑理论模型、控制策略与实际部署之间的闭环映射.
面对复杂系统装配对高精度、高时效协同的迫切需求, 飞机总装制造亟需构建具备感知−传输−控制一体化能力的现场级工业网络系统. 为此, 本文率先建立现场级网络控制系统容量模型, 提出双向融合−协同管控的工业互联网新型架构. 围绕感知、传输、计算与控制的全链条任务闭环, 系统构建多维时效性综合评价指标体系, 深入探索多域异构资源的联合调度与协同优化机制. 最后, 面向飞机总装过程中活动面动态测量与多工序协同优化, 设计并实现高保真数字孪生验证平台, 有效支撑理论模型、控制策略与实际部署之间的闭环映射.
摘要:
针对多队列系统中的车辆编队协同控制问题, 研究了在单向通信下实现高效队列协同的方法. 首先, 建立了多队列系统的车辆动力学模型, 设计了以各队列领航车为根节点的全局通信拓扑, 以支持信息在队列内和队列间的传递. 基于此拓扑结构, 提出了一种包含队列内和队列间耦合约束的分布式模型预测控制方法, 分别针对队列内跟随车辆和队列间领航车辆制定了不同的局部优化问题, 以实现车辆和队列的并行优化. 其次, 通过Lyapunov稳定性分析, 证明了所提控制方法在单向通信拓扑下的渐近稳定性, 并推导了保证系统弦稳定性的参数设计条件. 数值仿真对比分析了三种队列间通信拓扑结构(领航车-尾车跟踪、领航车-领航车跟踪、领航车与领航车-尾车结合策略)的控制效果, 结果表明领航车与领航车-尾车结合策略在响应速度和系统稳定性之间取得了最佳平衡. 此外, 研究还验证了所提方法对不同惯性滞后参数和异质车辆特性的适应能力, 为多队列车辆系统的协同控制提供了理论基础和实用方法, 对智能交通系统的实际应用具有重要参考价值.
针对多队列系统中的车辆编队协同控制问题, 研究了在单向通信下实现高效队列协同的方法. 首先, 建立了多队列系统的车辆动力学模型, 设计了以各队列领航车为根节点的全局通信拓扑, 以支持信息在队列内和队列间的传递. 基于此拓扑结构, 提出了一种包含队列内和队列间耦合约束的分布式模型预测控制方法, 分别针对队列内跟随车辆和队列间领航车辆制定了不同的局部优化问题, 以实现车辆和队列的并行优化. 其次, 通过Lyapunov稳定性分析, 证明了所提控制方法在单向通信拓扑下的渐近稳定性, 并推导了保证系统弦稳定性的参数设计条件. 数值仿真对比分析了三种队列间通信拓扑结构(领航车-尾车跟踪、领航车-领航车跟踪、领航车与领航车-尾车结合策略)的控制效果, 结果表明领航车与领航车-尾车结合策略在响应速度和系统稳定性之间取得了最佳平衡. 此外, 研究还验证了所提方法对不同惯性滞后参数和异质车辆特性的适应能力, 为多队列车辆系统的协同控制提供了理论基础和实用方法, 对智能交通系统的实际应用具有重要参考价值.
摘要:
因果推理在复杂工业系统中对产能分析和产出优化具有重要意义. 然而, 现有方法难以有效处理这种高度非线性和时延的复杂因果关系. 为此提出了一种基于Koopman特征核的时频因果与时延推理网络(Koopman feature kernel-based time-frequency causal and delay inference network, KTFCDN), 用于复杂工业过程的因果分析与时延识别. 该方法结合Koopman特征变换与再生核理论设计了核回归层, 在保留时间信息的基础上, 将数据映射到高维再生核希尔伯特空间以提取时不变的非线性关系. 同时, 通过证明非线性格兰杰因果关系在时频域上的一致性, 进而在时域上融入频域特征以提取时间维度的全局信息并捕获变量间的时延关系. 此外, 针对长时延问题, 设计了基于状态空间模型的时延发现网络. 实验结果表明, 该方法在三个公共数据集上表现优异, 并在聚酯纤维酯化过程的实际应用中进一步验证了其有效性.
因果推理在复杂工业系统中对产能分析和产出优化具有重要意义. 然而, 现有方法难以有效处理这种高度非线性和时延的复杂因果关系. 为此提出了一种基于Koopman特征核的时频因果与时延推理网络(Koopman feature kernel-based time-frequency causal and delay inference network, KTFCDN), 用于复杂工业过程的因果分析与时延识别. 该方法结合Koopman特征变换与再生核理论设计了核回归层, 在保留时间信息的基础上, 将数据映射到高维再生核希尔伯特空间以提取时不变的非线性关系. 同时, 通过证明非线性格兰杰因果关系在时频域上的一致性, 进而在时域上融入频域特征以提取时间维度的全局信息并捕获变量间的时延关系. 此外, 针对长时延问题, 设计了基于状态空间模型的时延发现网络. 实验结果表明, 该方法在三个公共数据集上表现优异, 并在聚酯纤维酯化过程的实际应用中进一步验证了其有效性.
摘要:
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
摘要:
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
, 最新更新时间
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
, 最新更新时间
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
, 最新更新时间
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
, 最新更新时间
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.