• 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

优先发表

优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
论文与报告
基于传感重构的高可靠无人飞行器自动防撞策略
李睿, 许斌, 阎振鑫, 杨林
, doi: 10.16383/j.aas.c250535 , cstr: 32138.14.j.aas.c250535
摘要:
面向低空经济发展中无人飞行器对复杂空域安全飞行的需求, 系统考虑大气传感器在强风干扰下的失效问题, 并提出一种基于传感重构的高可靠自动防撞策略. 首先建立含湍流扰动的飞行器动力学模型, 采用自适应容积卡尔曼滤波融合导航量测与控制信号, 实现真空速与气流角等状态的鲁棒在线重构; 其次针对逃逸阶段的模型失配与噪声扰动, 设计智能学习自适应控制律补偿状态估计误差, 实现逃逸姿态指令稳定跟踪; 最后构建滤波协方差驱动的动态碰撞包络, 结合控制系统模型量化轨迹预测不确定度, 完成地形碰撞检测, 并生成多逃逸轨迹择优避障指令. 仿真结果表明, 在突风与强湍流条件下, 可实现气流角精确重构及鲁棒防撞告警与改出控制, 相关技术可为低空无人飞行器防撞系统设计提供可靠方案.
考虑方向约束与最短偏航路径的双旋翼无人机轨迹规划
韩京良, 于海, 张兆鹏, 何慰, 梁潇, 方勇纯
, doi: 10.16383/j.aas.c250434 , cstr: 32138.14.j.aas.c250434
摘要:
传统多旋翼无人机广泛应用于工业检测、物资运输和灾后搜救等任务. 然而在狭窄空间内, 其飞行往往受到机体尺寸和姿态调节能力的限制, 影响通行效率与飞行安全性. 为此, 面向串联倾转双旋翼无人机平台, 提出一种针对受限环境下考虑方向约束并基于平面速度分量计算偏航角的轨迹生成策略. 该方法改进了最小二阶加速度(SNAP)轨迹生成方法, 实现对位置与偏航轨迹的协调优化, 并设计最短偏航路径算法和航点附近插值平滑算法来提升飞行过程的平滑性与安全性. 将所提方法与不考虑偏航方向约束的最小SNAP方法进行对比, 结果表明改进后的最小SNAP方法更加适用于双旋翼无人机平台. 进一步通过丰富的实验验证了所提方法的有效性与适用性.
低空立体交通跨模式协同与智能调度研究综述
段海滨, 梅宇, 范彦铭
, doi: 10.16383/j.aas.c250369 , cstr: 32138.14.j.aas.c250369
摘要:
随着低空立体交通系统进程的加速推进, 空中、地面与水面三维异构交通平台的协同愈加关键. 智能调度与资源优化的深度融合, 正逐步成为智慧城市建设与应急响应体系中不可或缺的核心支撑力量. 围绕多模式协同调度的研究热点展开综述. 首先, 综合回顾了无人机、无人车与无人艇在多源信息融合、环境感知与自适应决策方面的协同机制. 其次, 从任务分解、路径规划、协同控制与系统调度四个层面, 总结了强化学习、图优化、进化算法等在复杂动态环境下的典型调度方法. 进一步地, 梳理了集中式、分布式与混合式控制架构下的任务分配与通信策略, 并分析了传感器数据、仿真数据与运行大数据在调度优化中的作用. 最后, 探讨了当前低空立体交通系统在资源分配、安全保障与跨域协同中的关键挑战, 并展望了基于大数据驱动与智能增强的低空立体交通系统未来发展路径.
多障碍场景下基于多策略进化机制的无人机三维路径规划
朱润泽, 赵静, 陆宁云, 马亚杰, 宋来收
, doi: 10.16383/j.aas.c250319 , cstr: 32138.14.j.aas.c250319
摘要:
针对无人机(UAV)在三维多障碍物场景下路径规划存在的收敛精度低、稳定性不足等问题, 提出一种多策略进化粒子群算法(MSEPSO). 在初始化阶段, 针对粒子群算法(PSO)对粒子初始位置敏感的问题, 采用拉丁超立方采样(LHS)优化粒子初始分布, 提高种群多样性; 在进化阶段, 设计“平衡−记忆−增强”进化框架, 即利用非线性迭代策略来平衡全局开发和局部搜索, 采用个体历史记忆启发机制(PHMM)增强算法的全局开发能力, 并引入进化粒子, 增强种群对于群体极值附近空间的探索能力, 降低算法陷入局部最优的概率. 在CEC2020测试函数集上与山地/城市场景下的对比实验结果表明, MSEPSO展现出了稳定的寻优性能, 可以规划长度更短、平滑度更高的安全路径.
智能网联无人系统云控制平台的关键理论与技术
夏元清, 刘丹阳, 杨洪玖, 于东东, 高润泽
, doi: 10.16383/j.aas.c250423 , cstr: 32138.14.j.aas.c250423
摘要:
针对智慧城市中无人系统因通信架构不统一、任务调度效率低下及数字孪生技术难以支撑实时全局决策所导致的跨域协同难题, 融合云控制系统理论与数字孪生技术, 基于云网边端协同云控制架构, 构建智能网联无人系统云控制平台及关键理论与技术体系. 该体系涵盖云控制系统综合建模、模型-数据联合驱动控制、多运动体跨域协同云控制等关键理论, 研究数字孪生系统、容器化云工作流调度系统、动态云控制系统、远程驾驶系统等关键技术. 在校园场景下部署无人机、无人车、无人船、机器人等异构无人系统, 形成空基、地基、海(水)基动态云并实现跨域协同, 验证了所提理论体系的可行性与有效性, 为未来智慧城市发展与跨域无人系统协同应用提供理论支撑与技术路径.
基于分层策略强化学习的多类型流量差异化路由优化
赵之栩, 刘坤, 王璐瑶, 夏元清
, doi: 10.16383/j.aas.c250413 , cstr: 32138.14.j.aas.c250413
摘要:
路由是优化网络资源分配的重要方法. 然而, 传统路由算法依赖静态策略优化单一服务质量指标, 难以应对多类型流量爆发性增长下的差异化需求. 尽管深度强化学习为动态网络环境下的路由优化提供了新思路, 现有方法仍缺乏对流量类型的精细化感知能力, 无法灵活调整路由策略. 为此, 本文针对不同类型流量的差异化路由需求, 设计一种基于分层策略强化学习的流量感知路由算法. 首先, 引入流量分类模块, 实现对不同流量差异化业务需求的精细感知. 其次, 利用图卷积网络对网络拓扑进行高效建模, 并在此基础上设计分层决策网络以及差异化奖励函数, 引导智能体生成自适应路由决策, 实现对各流量类别路由策略的动态调整. 同时, 在演员-评论家框架中引入全局注意力机制, 增强智能体对网络状态时空依赖关系的建模能力, 并通过广义优势估计和近端策略优化算法提升训练的效率与稳定性. 最后, 在多种拓扑网络上验证了所提算法的有效性.
螺旋桨转速受限多四旋翼无人机的编队运输分层控制方案
武权伟, 王翔宇, 刘金浩
, doi: 10.16383/j.aas.c250439 , cstr: 32138.14.j.aas.c250439
摘要:
多四旋翼无人机协同编队运输技术因其高容错性和强灵活性等特点, 近年来受到广泛关注. 针对受到螺旋桨转速约束和外界环境干扰影响的多四旋翼无人机系统, 提出一种分层控制方案以实现多无人机协同编队运输. 该方案设计主要包含分布式协调器设计和跟踪控制器设计. 在分布式协调器中, 位置协调器基于虚拟领导者的位置、速度等信息生成各带载无人机的期望位置, 然后微分平坦器输出无人机的期望无偏轨迹; 跟踪控制器采用非线性模型预测控制、角速度控制以及螺旋桨转速分配算法相结合的策略, 为各带载无人机生成合理的螺旋桨转速指令, 确保无人机精确跟踪其期望轨迹. 在所提方案作用下, 多带载无人机能维持期望编队队形并跟踪虚拟领导者, 从而实现多无人机协同编队运输. 特别地, 当省略位置协调器时, 该方案可简化为单无人机轨迹跟踪控制器. 数值仿真包括单机轨迹跟踪和多机协同运输两个场景, 结果表明: 在单机跟踪任务中, 所提方案展现出良好的跟踪精度; 在多机运输场景下, 多无人机能够有效实现协同编队运输.
基于“形态−感知−动作”仿生机理的机器人自适应力控抓取方法
赵洲, 耿明强, 何秋实, 何赟鑫, 蔡明达, 周翔宇, 罗晶
, doi: 10.16383/j.aas.c250453 , cstr: 32138.14.j.aas.c
摘要:
随着机器人技术快速发展, 其对精细感知能力需求日益增长. 然而, 现有机器人仍难以具备如人类般灵活的操作能力. 在精细抓取任务中, 机器人恒力抓取策略存在局限性: 抓取力过大易损伤物体, 抓取力过小则导致抓取不稳. 为应对上述问题, 提出一种基于视觉与触觉融合的机器人自适应力控抓取方法. 该方法由视觉模块、触觉模块和抓取策略组成: 视觉模块用于预测目标抓取位置; 在接触阶段, 触觉模块借助视触觉传感器恢复触觉深度并估算接触面积与法向力; 随后, 通过最大深度变化率和帧间均方差进行形变判定, 并触发抓取力调整策略, 从而实现“渐进增力–形变检测–力回退”的仿生反馈抓取机制. 实验结果表明, 该方法将多种日常物体的整体抓取成功率由87.50% 提升至98.75%, 在易碎物体抓取中实现零损坏.
基于社会化协同的无人机集群目标合围控制
彭雅兰, 段海滨, 范彦铭, 李明
, doi: 10.16383/j.aas.c250415 , cstr: 32138.14.j.aas.c
摘要:
面向感知、通信受限且存在环境障碍的移动目标合围控制, 提出一种基于社会化协同的控制策略. 首先, 借鉴生物集群社会化行为, 构建协同响应模型与层级交互机制; 在拓扑切换与丢包条件下, 显式建模受限信息流, 以驱动集群实现目标合围. 其次, 提出强引导式任务-避碰并行协同控制, 在优先保障飞行安全的前提下实现鲁棒合围控制. 再次, 设计一致性目标状态观测器, 对目标位置与速度进行稳健估计. 最后, 仿真结果表明, 所提方法在障碍环境以及感知、通信受限条件下能够实现稳定合围, 并表现出较好的鲁棒性.
基于观测器的混杂切换多智能体系统有界群一致性追踪
裴惠琴, 谭鉴恒, 肖红利, 梁炜森
, doi: 10.16383/j.aas.c250303 , cstr: 32138.14.j.aas.c
摘要:
考虑脉冲作用下基于观测器二阶混杂切换多智能体系统的有界群一致性追踪问题, 建立一种在脉冲作用下的混杂切换多智能体系统动力学模型, 每个跟踪智能体只能够获取邻居智能体或者目标的位置信息. 然而, 每个跟踪智能体并不能获得邻居和目标的速度信息. 针对跟踪智能体在获取邻居和目标速度信息方面存在的限制, 设计一种基于目标加速度和智能体位置的状态观测器, 为跟踪智能体提供其子群目标的速度估计. 在此基础上, 提出一种在脉冲作用下基于目标速度观测器的有界群一致性追踪控制策略, 通过矩阵理论和Hurwitz稳定性判据, 证明了在该策略下系统可实现有界群一致性追踪. 仿真实例验证了所提出方法的有效性.
视觉SLAM运动分割技术综述
冯嘉琪, 杨恺伦, 林家丞, 杨观赐
, doi: 10.16383/j.aas.c250365 , cstr: 32138.14.j.aas.c250365
摘要:
作为移动机器人与自动驾驶领域的关键基础技术, 视觉同时定位与地图构建(V-SLAM)在动态环境中面临严峻挑战. 由动态物体引起的特征匹配错误常常导致定位偏差、地图失真以及系统鲁棒性受损. 运动分割技术是提高V-SLAM性能的重要手段, 但在复杂动态场景中准确区分静态和动态元素仍极具挑战性. 本文系统梳理V-SLAM运动分割研究进展, 根据对环境的潜在假设, 将现有方法分为三个主要研究范式, 并给出各范式的技术原理, 代表性策略的核心优势、本质局限及适用边界. 最后展望未来的研究方向.
工业边缘异构集群的大模型分布式弹性推理框架
陈致蓬, 何健, 沈玲, 桂卫华
, doi: 10.16383/j.aas.c250497 , cstr: 32138.14.j.aas.c250497
摘要:
在工业4.0时代, 大语言模型向工业边缘异构集群的迁移已成为一项关键技术挑战.边缘设备计算与存储资源受限、动态负载波动、异构架构复杂以及网络高延迟等特性, 使得传统推理框架难以满足工业场景对实时性、鲁棒性和隐私保护的需求.提出一种动态弹性推理框架(Dynama), 设计全域心跳被动感知器和实时弹性量化调度算法.该框架采用管道环并行结构, 实现模型层动态分配与懒加载; 通过被动监测设备延迟向量, 触发实时弹性量化调度算法在不改变层分配前提下优化量化版本, 平衡延迟最小化和精度损失. Dynama通过优化数据传输与量化策略, 显著提升高延迟网络环境下的推理效率, 适应工业边缘的动态环境变化.实验结果表明, Dynama在工业边缘异构集群中展现出优异的实时性与鲁棒性, 为工业智能的落地应用提供高效、可靠的解决方案.
面向低空交通运输的无人机−无人车协同感知技术综述
李永福, 黄鑫, 郭常员, 王怡然, 吴三妹, 简金埠
, doi: 10.16383/j.aas.c250386 , cstr: 32138.14.j.aas.c
摘要:
随着低空经济的兴起与智能交通的发展, 低空交通运输作为空地一体化的新兴交通系统, 对环境感知、通信与计算能力提出更高要求. 本文旨在全面阐述面向低空交通运输的无人机−无人车协同感知关键技术及发展趋势. 系统梳理协同感知的三类基础支撑技术, 包括基于LiDAR、视觉与多传感器融合的感知方法, C-V2X、5G、Wi-Fi等通信技术, 以及端−边−云协作的边缘计算架构. 在此基础上, 进一步总结协同感知信息融合、感知信息压缩与传输、协同组网、通信安全及资源分配等关键技术研究进展. 最后, 分析当前无人机−无人车协同感知系统在感知模型优化、未来应用场景等方面的挑战, 并对该领域的未来发展趋势进行探讨与展望, 以期为低空交通运输中多智能体协同感知系统的研究与落地应用提供参考.
视觉强化学习方法研究综述
王荣荣, 程玉虎, 王雪松
, doi: 10.16383/j.aas.c250422 , cstr: 32138.14.j.aas.c250422
摘要:
视觉作为强化学习智能体感知环境的主要途径, 能够提供丰富的细节信息, 从而支持智能体实现更复杂、精准的决策. 然而, 视觉数据的高维特性易导致信息冗余与样本效率低下, 成为强化学习应用中的关键挑战. 如何在有限交互数据中高效提取关键视觉表征, 提升智能体决策能力, 已成为当前研究热点. 为此, 系统梳理视觉强化学习方法, 依据核心思想与实现机制, 将其归纳为五类: 图像增强型、模型增强型、任务辅助型、知识迁移型以及离线视觉强化学习, 深入分析各类方法的研究进展及代表性工作的优势与局限. 同时, 综述DMControl、DMControl-GB、Distracting Control Suite 和RL-ViGen四大主流基准平台, 总结视觉强化学习在机器人控制、自动驾驶以及多模态大模型等典型场景中的应用实践. 最后, 结合当前研究瓶颈, 探讨未来发展趋势与潜在研究方向, 以期为该领域提供清晰的技术脉络与研究参考.
非线性多智能体系统的动态事件触发固定时间一致性控制
邵蝉云, 安爱民, 徐承承, 刘向航, 李二超
, doi: 10.16383/j.aas.c250304 , cstr: 32138.14.j.aas.c250304
摘要:
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低, 控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.
基于PIML的微观人群移动建模仿真与干预决策框架
郭润康, 朱正秋, 艾川, 叶佩军, 秦龙, 尹全军, 王飞跃
, doi: 10.16383/j.aas.c250312 , cstr: 32138.14.j.aas.c250312
摘要:
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图神经网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.
基于局部分形维数最大化的单幅图像细节增强
江鹤, 乙夫迪, 郑州, 顾豪, 寇旗旗, 程德强
, doi: 10.16383/j.aas.c250368 , cstr: 32138.14.j.aas.c250368
摘要:
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出了一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨了分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现了图像细节的有效增强, 进而为图像增强提供了一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行4倍增强因子的测试中, 所提方法在PSNR和SSIM指标上相较于当前流行方法QWLS分别提升了5.20 dB和0.1456, 充分展示了其在图像细节增强任务中的优势与算法良好的泛化特性.
基于运动过滤和调整的离群点移除
赖桃桃, 张一凡, 李佐勇, 肖国宝, 林维斯, 王菡子
, doi: 10.16383/j.aas.c250235 , cstr: 32138.14.j.aas.c250235
摘要:
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响了特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(Convolutional neural network, CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面的固有缺点, 如过度平滑和感受野的有限和固定大小, 限制了这些方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文通过尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务上, 在室内和室外数据集上评估了本文所提出的方法的性能. 实验结果表明, 与现有多种方法相比, 本文所提方法展现出更优的性能.
基于空−海−潜跨域无人平台协同的海上目标探测追踪策略
田泽兴, 闫敬, 高麒媛, 杨睍, 关新平
, doi: 10.16383/j.aas.c250438 , cstr: 32138.14.j.aas.c250438
摘要:
提出一种基于空−海−潜跨域无人平台协同的海上目标探测追踪策略. 首先, 构建无人机−水面艇−潜器协同的海上跨域无人系统; 进一步, 针对海上目标的高机动性以及无人平台自身约束, 采用测度理论解析无人机−水面艇−潜器最佳探测编队队形, 实现目标探测概率最大化; 当探测到目标后, 设计基于逆强化学习的无人机−水面艇−潜器编队控制器, 实现障碍物环境下水面/水下目标的可靠有效追踪. 最后, 通过仿真与实验验证了所提方法的有效性. 结果表明, 所提探测模式可以实现有限时间内移动目标探测概率最大化, 同时所提逆强化学习编队控制器可以在保持队形稳定的基础上, 结合动态避障策略, 实现复杂环境下跨域无人平台安全协同追踪.
知识−数据−模型驱动的低空动目标轨迹融合预测方法
周同乐, 刘子仪, 陈谋
, doi: 10.16383/j.aas.c250429 , cstr: 32138.14.j.aas.c250429
摘要:
针对低空环境下动目标轨迹预测问题, 提出一种知识—数据—模型驱动的动目标轨迹融合预测框架. 基于低空飞行器运动特征构建飞行知识混合专家模型, 通过将多源传感器数据输入至各飞行知识专家模块, 实现目标机动模态的精细化识别, 并使用Mamba模型提取时空关联特征; 设计权值自适应调节机制, 利用注意力机制动态融合多源感知数据, 解决传感器时空异步问题; 采用门控循环单元建模长期时序依赖关系, 根据目标历史飞行数据生成初步预测轨迹; 基于低空目标运动学方程构建物理信息神经网络, 通过动态权衡数据驱动损失与物理约束损失, 矫正数据驱动偏差, 确保预测轨迹满足运动学约束并有效抑制多步预测误差累积. 数值仿真及实验验证结果表明, 所提出的知识—数据—模型驱动的动目标轨迹融合预测方法, 能够有效预测低空目标飞行轨迹.
城市空中交通系统最优规模评估与调度
郭戈, 郑智远, 张忍永康
, doi: 10.16383/j.aas.c250396 , cstr: 32138.14.j.aas.c250396
摘要:
针对城市空中交通系统,提出一种优化方法以同时确定满足乘客需求的最小系统规模和最佳系统再平衡策略.研究构建了流体模型与多服务器M/M/s排队模型的联合框架,描述乘客、飞行器与电池在站点间迁移、换电及充电过程.在该模型框架下对飞行器和电池数量的适定性进行了证明,并给出了系统供需均衡时的必要条件.在此基础上,通过线性规划求解系统供需均衡下的再平衡分配率与最小机队规模,并计算最优充电站位置、电池数量及电池运输车数量.数值仿真分析了影响系统规模的因素,实例验证证明了所提再平衡方法的有效性.
3D空间先验驱动的相机轨迹可控视频扩散生成模型
朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军
, doi: 10.16383/j.aas.c250124 , cstr: 32138.14.j.aas.c250124
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
一种基于单比特通信压缩的大模型训练方法研究
陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威
, doi: 10.16383/j.aas.c250087 , cstr: 32138.14.j.aas.c250087
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
, doi: 10.16383/j.aas.c240805 , cstr: 32138.14.j.aas.c240805
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.