2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
显示方式:
目录
2021, 47(2).  
[封面浏览] [PDF 4171KB](2)
综述
基于水下传感器网络的目标跟踪技术研究现状与展望
刘妹琴, 韩学艳, 张森林, 郑荣濠, 兰剑
2021, 47(2): 235-251.   doi: 10.16383/j.aas.c190886
[摘要](61) [HTML全文](8) [PDF 1475KB](28)
摘要:
水下目标跟踪在海洋资源的开发利用以及国家安全的防御等方面都具有广泛的应用价值和重要的战略意义. 基于水下传感器网络(Underwater sensor networks, USNs)的目标跟踪技术凭借其覆盖范围广、观测时间长和实时融合等优势已经成为一个新的研究热点. 本文针对基于USNs的目标跟踪关键技术的基本思想、研究进展、应用及局限性进行了综述, 主要从以下几个角度对其展开论述: USNs的建设现状、系统组成及其分类、目标跟踪系统模型、单目标跟踪技术、多目标跟踪技术以及能效优化措施. 最后, 本文不仅指出了基于USNs的目标跟踪研究目前存在的主要挑战, 并对该领域的未来发展方向进行了展望.
基于特征的视线跟踪方法研究综述
刘佳惠, 迟健男, 尹怡欣
2021, 47(2): 252-277.   doi: 10.16383/j.aas.c180844
[摘要](32) [HTML全文](5) [PDF 3280KB](21)
摘要:
针对基于特征的视线跟踪方法进行了综述.首先对视线跟踪技术的发展、相关研究工作和研究现状进行了阐述; 然后将基于特征的视线跟踪方法分成了两大类:二维视线跟踪方法和三维视线跟踪方法, 从硬件系统配置、误差主要来源、头部运动影响、优缺点等多个方面重点分析了这两类视线跟踪方法, 对近五年现有的部分基于特征的视线跟踪方法进行了对比分析, 并对二维视线跟踪系统和三维视线跟踪系统中的几个关键问题进行了探讨; 此外, 介绍了视线跟踪技术在人机交互、医学、军事、智能交通等多个领域的应用; 最后对基于特征的视线跟踪方法的发展趋势和研究热点进行了总结与展望.
基于功能磁共振成像的人脑效应连接网络识别方法综述
冀俊忠, 邹爱笑, 刘金铎
2021, 47(2): 278-296.   doi: 10.16383/j.aas.c190491
[摘要](109) [HTML全文](77) [PDF 1183KB](27)
摘要:
人脑效应连接网络刻画了脑区间神经活动的因果效应. 对不同人群的脑效应连接网络进行研究不仅能为神经精神疾病病理机制的理解提供新视角, 而且能为疾病的早期诊断和治疗评价提供新的脑网络影像学标记, 具有十分重要的理论意义和应用价值. 利用计算方法从功能磁共振成像(Functional magnetic resonance imaging, fMRI)数据中识别脑效应连接网络是目前人脑连接组学中一项重要的研究课题. 本文首先概括了从fMRI数据中进行脑效应连接网络识别的主要流程, 说明了其中的主要步骤和方法; 然后, 给出了一种脑效应连接网络识别方法的分类体系, 并对其中一些代表性的识别算法进行了阐述; 最后, 通过对该领域挑战性问题的分析, 预测了脑效应连接网络识别未来的研究方向, 以期对相关研究提供一定的参考.
基于小样本学习的图像分类技术综述
刘颖, 雷研博, 范九伦, 王富平, 公衍超, 田奇
2021, 47(2): 297-315.   doi: 10.16383/j.aas.c190720
[摘要](51) [HTML全文](6) [PDF 1216KB](29)
摘要:
图像分类的应用场景非常广泛, 很多场景下难以收集到足够多的数据来训练模型, 利用小样本学习进行图像分类可解决训练数据量小的问题. 本文对近年来的小样本图像分类算法进行了详细综述, 根据不同的建模方式, 将现有算法分为卷积神经网络模型和图神经网络模型两大类, 其中基于卷积神经网络模型的算法包括四种学习范式: 迁移学习、元学习、对偶学习和贝叶斯学习; 基于图神经网络模型的算法原本适用于非欧几里得结构数据, 但有部分学者将其应用于解决小样本下欧几里得数据的图像分类任务, 有关的研究成果目前相对较少. 此外, 本文汇总了现有文献中出现的数据集并通过实验结果对现有算法的性能进行了比较. 最后, 讨论了小样本图像分类技术的难点及未来研究趋势.
论文与报告
基于神经网络和支持矢量机的多机动车车牌在线检测方法
刘进博, 朱新新, 伍越, 杨凯, 陈卫
2021, 47(2): 316-326.   doi: 10.16383/j.aas.c180753
[摘要](27) [HTML全文](5) [PDF 9431KB](19)
摘要:
针对道路交通多车牌识别问题, 提出了一种快速鲁棒的多车牌检测识别方法, 包括多车牌检测和车牌字符识别两部分:构造BP (Back-Propagation)神经网络模型用于颜色识别, 结合图像形态学运算方法, 筛选候选车牌目标, 基于支持矢量机从候选车牌目标中判别真正的车牌目标; 通过轮廓尺寸判断, 并结合车牌尺寸特征, 依次分割提取城市代码字符块、省份代码字符块及5位机动车编码字符块, 最后基于BP神经网络识别字符块内容.基于上述原理, 开发了鲁棒的多机动车车牌自动检测识别系统, 并在真实场景中进行了实验测试, 结果表明: 1)车辆在正常速度行驶条件下, 系统依然可以保证90%以上的车牌检测识别正确率; 2)系统可实现同时多车牌检测识别; 3)文中实验硬件配置下, 系统单幅图像检测识别平均时间低于130 ms, 处理频率约8 Hz.
基于水平集和形状描述符的腹部CT序列肝脏自动分割
李阳, 赵于前, 廖苗, 廖胜辉, 杨振
2021, 47(2): 327-337.   doi: 10.16383/j.aas.c180544
[摘要](8) [HTML全文](4) [PDF 11041KB](1)
摘要:
肝脏分割是计算机辅助肝脏疾病诊断的重要前提和基础.本文提出了一种新的基于水平集和形状描述符的腹部CT序列图像肝脏自动分割方法.首先, 对原始腹部CT序列图像进行预处理, 去除与肝脏不相关的器官和组织.然后, 利用灰度偏移场, 结合周长项、距离正则项和相邻切片肝脏分割结果构建水平集能量函数, 实现CT序列肝脏自动分割.为避免分割误差累积, 提出一种基于形状描述符和瓶颈率的肝脏边缘优化方法, 在每张切片分割完毕后去除由于灰度重叠造成的过分割.通过对XHCSU14数据库和Sliver07数据库中腹部CT序列的肝脏分割实验, 以及与其他肝脏分割算法的比较, 表明了本文方法的有效性, 且分割精度高, 鲁棒性强.
基于改进结构保持数据降维方法的故障诊断研究
韩敏, 李宇, 韩冰
2021, 47(2): 338-348.   doi: 10.16383/j.aas.c180138
[摘要](25) [HTML全文](4) [PDF 3801KB](10)
摘要:
传统基于核主成分分析(Kernel principal component analysis, KPCA)的数据降维方法在提取有效特征信息时只考虑全局结构保持而未考虑样本间的局部近邻结构保持问题, 本文提出一种改进全局结构保持算法的特征提取与降维方法.改进的特征提取与降维方法将流形学习中核局部保持投影(Kernel locality preserving projection, KLPP)的思想融入核主成分分析的目标函数中, 使样本投影后的特征空间不仅保持原始样本空间的整体结构, 还保持样本空间相似的局部近邻结构, 包含更丰富的特征信息.上述方法通过同时进行的正交化处理可避免局部子空间结构发生失真, 并能够直观显示出低维结果, 将低维数据输入最近邻分类器, 以识别率和聚类分析结果作为衡量指标, 同时将所提方法应用于故障诊断中.使用AVL Boost软件模拟的柴油机故障数据和田纳西(Tennessee Eastman, TE)化工数据仿真, 验证了所提方法的有效性.
结构辨识和参数优化协同学习的概率TSK模糊系统
顾晓清, 倪彤光, 张聪, 戴臣超, 王洪元
2021, 47(2): 349-362.   doi: 10.16383/j.aas.c180298
[摘要](13) [HTML全文](3) [PDF 1425KB](5)
摘要:
传统Takagi-Sugeno-Kang (TSK)模糊系统的结构辨识和参数优化往往分阶段进行, 同时模糊规则数需要预先设定, 因此TSK模糊系统的逼近性能和解释性往往不理想.针对此问题, 提出了一种结构辨识和参数优化协同学习的概率TSK模糊系统(Probabilistic TSK fuzzy system, PTSK).首先, PTSK使用概率模型表示模糊回归系统, 将结构辨识和参数优化作为一个整体来考虑.其次, PTSK不借助于专家经验, 使用粒子滤波方法对规则数和前后件参数协同学习, 得到系统全部参数的最优解.实验结果表明, PTSK具有良好的逼近性能, 同时能获得较少的模糊规则数.
基于莱维飞行樽海鞘群优化算法的多阈值图像分割
邢致恺, 贾鹤鸣, 宋文龙
2021, 47(2): 363-377.   doi: 10.16383/j.aas.c180140
[摘要](20) [HTML全文](2) [PDF 13551KB](9)
摘要:
针对Otsu算法用于多阈值图像分割中存在运算时间长和精度低的不足, 利用群智能优化算法对图像分割算法进行优化.本文首先应用莱维飞行算法对樽海鞘群优化算法进行改进, 将多阈值Otsu函数作为优化算法的适应度函数, 利用改进后的LSSA寻找适应度函数的最大值, 同时获得相对应的多阈值.其次, 通过对几幅基本图像、伯克利大学图像分割库中的图像和实际污油图像进行多阈值Otsu分割研究, 在最佳适应度值、PSNR、SSIM指标以及算法耗时方面进行对比分析.实验结果表明本文提出的算法可以获得更为准确的分割阈值和更高的分割效率.
级联稀疏卷积与决策树集成的病理图像细胞核分割方法
宋杰, 肖亮, 练智超
2021, 47(2): 378-390.   doi: 10.16383/j.aas.c190672
[摘要](12) [HTML全文](3) [PDF 4697KB](5)
摘要:
数字病理图像分析对于乳腺癌、肾癌等良恶性分级诊断具有重要意义, 其中细胞核的形态测量是病理量化分析的关键. 然而, 由于病理图像背景复杂, 细胞核高密度分布、细胞粘连等, 个体细胞核精准分割是一个挑战性问题. 本文提出一个级联稀疏卷积与决策树集成学习的细胞核分割模型. 该模型由稀疏可分离卷积模块和集成决策树学习的正则化回归模块堆叠级联组成, 其中: 前者采取秩-1张量分解学习机制, 可分层抽取细胞核的多尺度方向分布式抽象特征; 而后者采取随机采样、树剪枝以及正则化回归机制提升逐像素回归分类能力. 相比于现有深度学习模型, 该模型无需非线性激活和后向传播计算, 参数规模较小, 可实现端到端的学习. 通过乳腺、前列腺、肾脏、胃和膀胱等多组病理图像的分割实验表明: 该模型能够实现复杂数字病理图像中的高密度细胞核的快速个体目标检测和分割, 在Jaccard相似性系数、F1分数和平均边缘距离三个指标上均优于目前CNN2、CNN3和U-Net等深度学习方法, 具有较好应用前景.
一种具有发育机制的感知行动认知模型
张晓平, 阮晓钢, 王力, 李志军, 闫佳庆, 毕松
2021, 47(2): 391-403.   doi: 10.16383/j.aas.c180750
[摘要](18) [HTML全文](3) [PDF 1668KB](3)
摘要:
针对结构固定认知模型中存在的学习浪费与计算浪费问题, 在具有内发动机机制的感知行动认知模型基础上, 根据操作条件反射学习特性, 借鉴潜在动作原理, 建立起一种具有发育机制的感知行动认知模型D-SSCM (Development-sensorimotor cognitive model), 具体为一个14元组, 包含离散学习时间集、内部可感知离散状态集、可输出动作集、有效输出动作空间集、潜在动作关系集、可输出动作空间探索率集及发育算法等.针对模型发育过程, 分别设计了模型结构扩展式发育方法和算法以及缩减式发育方法和算法, 定义了模型的发育式学习过程.使用两轮机器人自平衡任务对设计的学习模型进行验证, 实验结果表明, 发育机制下的感知行动认知模型D-SSCM具有更快的学习速度及更稳定的学习效果.
自耦PID控制器
曾喆昭, 刘文珏
2021, 47(2): 404-422.   doi: 10.16383/j.aas.c180290
[摘要](23) [HTML全文](5) [PDF 2329KB](21)
摘要:
针对比例—积分—微分(Proportional-integral-differential, PID)控制器的整定问题, 提出了自耦PID (Self-coupling PID, SC-PID)控制方法.该方法将系统动态和内外不确定性定义为总和扰动, 从而将非线性不确定系统变换为线性不确定系统, 进而构建了总和扰动反相激励下的误差动态系统, 据此设计了SC-PID控制律模型和整定规则, 进而设计了自适应速度因子(Adaptive speed factor, ASF)模型.数值仿真结果表明, SC-PID具有快的响应速度、高的控制精度、良好的抗总和扰动鲁棒性等诸多优点. SC-PID整定规则为现有PID整定结果的技术评估与技术升级提供了科学的理论依据, 在国防和工业控制领域具有广泛的应用价值.
带未知模型参数和衰减观测率系统自校正分布式融合估计
段广全, 孙书利
2021, 47(2): 423-431.   doi: 10.16383/j.aas.c180270
[摘要](21) [HTML全文](3) [PDF 1525KB](5)
摘要:
研究了带未知模型参数和衰减观测率多传感器线性离散随机系统的信息融合估计问题.在模型参数和衰减观测率未知的情形下, 应用递推增广最小二乘(Recursive extend least squares, RELS)算法和加权融合估计算法提出了分布式融合未知模型参数辨识器; 应用相关函数对描述衰减观测现象的随机变量的数学期望和方差进行在线辨识.将辨识后的模型参数、数学期望和方差代入到最优分布式融合状态滤波器中, 获得了相应的自校正融合状态滤波算法.应用动态误差系统分析(Dynamic error system analysis, DESA)方法证明了算法的收敛性.仿真例子验证了算法的有效性.
一种面向云端辅助工业控制系统的安全机制
屠袁飞, 杨庚, 张成真
2021, 47(2): 432-441.   doi: 10.16383/j.aas.c180142
[摘要](16) [HTML全文](2) [PDF 1389KB](7)
摘要:
随着云计算、物联网等信息通信技术与数据采集与监控系统的整合, 工业控制系统面临新的安全问题, 其中数据的完整性、机密性保护和有效的身份认证问题受到了关注.为了在这样一个多功能、分布式的环境中解决这些问题, 该文利用基于属性的加密方法, 构建访问控制策略, 为用户提供身份认证和授权服务, 保护用户与工业控制系统间的数据通信安全并实时检查存储数据的完整性.方案从正确性、安全性及系统性能等方面做出分析, 并与常用的认证方法进行了对比.
猕猴手指移动神经解码线性时不变模型的时间相关性研究
冯景义, 吴海锋, 曾玉
2021, 47(2): 442-452.   doi: 10.16383/j.aas.c180098
[摘要](11) [HTML全文](3) [PDF 1428KB](1)
摘要:
利用猕猴运动皮层神经元峰电位数信号估计其手指移动位置是一神经解码问题, 通常采用时不变线性模型(Time-invariant linear model, TILM)来解决.本文分析了传统TILM模型的时间相关性问题, 依据猕猴手指移动位置的连续性特点, 采用一种新的模型去解码其手指移动位置, 称之为卷积空间模型(Convolution space model, CSM).与传统的模型相比, 卷积空间模型不但将当前时刻的状态与前一个时刻建立了相关, 而且与前多个时刻的状态也有相关.在实验中, 利用公开数据来评判本文方法的解码性能, 实验结果表明, 传统方法的解码误差要大于CSM模型的方法, 因此CSM模型具有更好的解码准确性.
一种锂电池SOH估计的KNN-马尔科夫修正策略
赵光财, 林名强, 戴厚德, 武骥, 汪玉洁
2021, 47(2): 453-463.   doi: 10.16383/j.aas.c180124
[摘要](33) [HTML全文](5) [PDF 3127KB](9)
摘要:
锂离子电池的健康状态(State of health, SOH)是决定电池使用寿命的关键因素.由于锂电池生产工艺、工作环境和使用习惯等的差异性导致其衰退特性具有较大差异, 因此锂电池SOH难以精确估算.本文采用数据驱动的方式通过对采集的电压数据进行特征提取, 使用贝叶斯正则化神经网络对锂电池SOH进行预测, 同时引入KNN-马尔科夫修正策略对预测结果进行修正.实验结果证明, 贝叶斯正则化算法对锂电池SOH的预测准确度较高, KNN-马尔科夫修正策略提高了预测的精确度和鲁棒性, 组合预测模型对锂电池SOH的平均预测误差小于\begin{document}$1\,\%$\end{document}, 与采用数据分组处理方法(Group method of data handling, GMDH)、概率神经网络(Probabilistic neural network, PNN)、循环神经网络(Recurrent neural network, RNN)的预测精度进行对比, 该模型的预测精度分别提高了\begin{document}$33.3\,\%$\end{document}\begin{document}$48.7\,\%$\end{document}\begin{document}$53.1\,\%$\end{document}.
自动化学科面临的挑战
孙长银, 吴国政, 王志衡, 丛杨, 穆朝絮, 贺威
2021, 47(2): 464-474.   doi: 10.16383/j.aas.c200904
[摘要](426) [HTML全文](453) [PDF 1733KB](389)
摘要:
本文分析了控制理论与应用、模式识别与智能系统、导航制导与控制、系统科学与工程、人工智能与自动化交叉等领域的发展现状. 结合科技发展、国内国际研究前沿和新兴领域对自动化科学技术的需求, 提出重点发展智能控制理论和方法、高性能作业机器人、信息物理系统、导航与控制技术、重大装备自动化技术、自主智能系统和人工智能驱动的自动化技术优先领域, 加强数据驱动控制理论、人工智能基础理论研究, 进一步发展人机协同、跨域融合的智能自动化, 为实现国家社会的全面信息化智能化提供理论和技术保障.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
数据驱动的保证收敛速率最优输出调节
姜艺, 范家璐, 柴天佑
当前状态:  doi: 10.16383/j.aas.c200932
[摘要](0) [HTML全文](0) [PDF 1346KB](0)
摘要:
本文针对具有外部系统扰动的线性离散时间系统的输出调节问题, 提出了可保证收敛速率的数据驱动最优输出调节方法, 包括状态可在线测量系统的基于状态反馈的算法, 与状态不可在线测量系统的基于输出反馈的算法. 首先, 该问题被分解为输出调节方程求解问题与反馈控制律设计问题, 基于输出调节方程的解, 本文通过引入收敛速率参数, 建立了可保证收敛速率的最优控制问题, 通过求解该问题得到具有保证收敛速率的输出调节器. 之后, 利用强化学习的方法, 设计基于值迭代的数据驱动状态反馈控制器, 学习得到基于状态反馈的最优输出调节器. 对于状态无法在线测量的被控对象, 本文利用历史输入输出数据对状态进行重构, 并以此为基础设计基于值迭代的数据驱动输出反馈控制器. 仿真实验验证了本文所提方法的有效性.
节点分类及失效对网络能控性的影响
孔芝, 袁航, 王立夫, 郭戈
当前状态:  doi: 10.16383/j.aas.c200900
[摘要](0) [HTML全文](0) [PDF 1148KB](0)
摘要:
复杂系统间的相互作用能够用复杂网络描述. 复杂网络中某些节点遭受攻击或破坏会造成网络故障, 导致整个网络能控性变化. 不同节点失效会对网络能控性有不同的影响. 本文提出一种网络节点的分类方式, 将网络中的节点根据边的方向和匹配关系分成九种类型, 并给出了辨识节点类型的算法. 另外, 本文给出了基于此分类方式下复杂网络中某类节点失效时, 网络中驱动节点数量(用来衡量网络能控性大小的指标)的变化规律. 并通过模型网络进行仿真实验, 验证了当节点失效时本文给出的驱动节点数量变化情况, 同时还分析社交网络中不同类型节点的占比与实际中人际交往的对应关系.
基于事件触发的分布式优化算法
杨涛, 徐磊, 易新蕾, 张圣军, 陈蕊娟, 李渝哲
当前状态:  doi: 10.16383/j.aas.c200838
[摘要](0) [HTML全文](0) [PDF 1565KB](0)
摘要:
本文研究了一类分布式优化问题, 其目标是通过局部信息交换使由局部成本函数之和构成的全局成本函数最小. 针对无向连通图, 我们提出了两种基于比例积分策略的分布式优化算法. 在局部成本函数可微且凸的条件下, 证明了所提算法渐近收敛到全局最小值点. 更进一步, 在局部成本函数具有局部Lipschitz梯度和全局成本函数关于全局最小值点是有限强凸的条件下, 证明了所提算法的指数收敛性. 此外, 为了避免智能体之间的连续通信和减少通信负担, 将所提的两种分布式优化算法与事件触发通信相结合, 提出了两种基于事件触发的分布式优化算法. 证明了提出的事件触发优化算法不存在Zeno行为, 并且在相应条件下保持了与连续通信下分布式优化算法一样的收敛性. 最后, 通过数值仿真验证了上述理论结果.
基于DDPG的三维重建模糊概率点推理
李雷, 徐浩, 吴素萍
当前状态:  doi: 10.16383/j.aas.c200543
[摘要](0) [HTML全文](0) [PDF 2130KB](0)
摘要:
单视图物体三维重建是一个长期存在的具有挑战性的问题. 为了解决具有复杂拓扑结构的物体以及一些高保真度的表面细节信息仍然难以准确进行恢复的问题, 本文提出了一种基于深度强化学习的算法深度确定性策略梯度(Deep deterministic policy gradient, DDPG)对三维重建中模糊概率点进行再推理, 实现了具有高保真和丰富细节的单视图三维重建. 本文的方法是端到端的, 包括以下四个部分: 拟合物体三维形状的动态分支代偿网络的学习过程, 聚合模糊概率点周围点的邻域路由机制, 注意力机制引导的信息聚合和基于深度强化学习算法的模糊概率调整. 本文在公开的大规模三维形状数据集上进行了大量的实验证明了本文方法的正确性和有效性. 本文提出的方法结合了强化学习和深度学习, 聚合了模糊概率点周围的局部信息和图像全局信息, 从而有效的提升了模型对复杂拓扑结构和高保真度的细节信息的重建能力.
基于一致性的分布式变结构多模型方法
王昱淇, 卢宙, 蔡云泽
当前状态:  doi: 10.16383/j.aas.c190091
[摘要](17) [HTML全文](2) [PDF 1446KB](3)
摘要:
本文针对由雷达与红外组成的分布式传感器网络, 研究基于一致性的分布式变结构多模型方法(Distributed variable structure multiple model, DVSMM). 首先使用无迹信息滤波(Unscented information filter, UIF)解决系统非线性的问题, 然后将变结构交互式多模型(Variable structure interacting multiple model, VSMM)方法进行改进, 提出一类可应用于分布式状态估计的分布式变结构多模型DVSMM方法. 仿真试验结果验证了该方法的有效性.
基于跨模态深度度量学习的甲骨文字识别
张颐康, 张恒, 刘永革, 刘成林
当前状态:  doi: 10.16383/j.aas.c200443
[摘要](9) [HTML全文](4) [PDF 1627KB](2)
摘要:
甲骨文字图像可以分为拓片甲骨文字与临摹甲骨文字两类. 拓片甲骨文字图像是从龟甲、兽骨等载体上获取的原始拓片图像, 临摹甲骨文字图像是经过专家手工书写得到的高清图像. 拓片甲骨文字样本难以获得, 而临摹文字样本相对容易获得. 为了提高拓片甲骨文字识别的性能, 本文提出一种基于跨模态深度度量学习的甲骨文字识别方法, 通过对临摹甲骨文字和拓片甲骨文字进行共享特征空间建模和最近邻分类, 实现了拓片甲骨文字的跨模态识别. 实验结果表明, 在拓片甲骨文字识别任务上, 本文提出的跨模态学习方法比单模态方法有明显的提升, 同时对新类别拓片甲骨文字也能增量识别.
多级注意力传播驱动的生成式图像修复方法
曹承瑞, 刘微容, 史长宏, 张浩琛
当前状态:  doi: 10.16383/j.aas.c200485
[摘要](19) [HTML全文](2) [PDF 1500KB](2)
摘要:
现有图像修复方案普遍存在着结构错乱和细节纹理模糊的问题, 这主要是因为在图像破损区域的重建过程中, 修复网络难以充分利用非破损区域内的信息来准确地推断破损区域内容. 为此, 本文提出了一种由多级注意力传播驱动的图像修复网络. 该网络通过将全分辨率图像中提取的高级特征压缩为多尺度紧凑特征, 进而依据尺度大小顺序驱动紧凑特征进行多级注意力特征传播, 以期达到包括结构和细节在内的高级特征在网络中充分传播的目标. 为进一步实现细粒度图像修复重建, 本文还同时提出了一种复合粒度判别器, 以期实现对图像修复过程进行全局语义约束与非特定局部密集约束. 大量实验表明, 本文提出的方法可以产生更高质量的修复结果.
基于多层BP神经网络的无参考视频质量客观评价
姚军财, 申静, 黄陈蓉
当前状态:  doi: 10.16383/j.aas.c190539
[摘要](29) [HTML全文](9) [PDF 1619KB](4)
摘要:
机器学习在视频质量评价(Video quality assessment, VQA)模型回归方面具有较大的优势, 能够较大地提高构建模型的精度. 基于此, 设计了合理的多层BP神经网络, 并以提取的失真视频的内容特征、编解码失真特征、传输失真特征及其视觉感知效应特征参数为输入, 通过构建的数据库中的样本对其进行训练学习, 构建了一个无参考VQA模型. 在模型构建中, 首先采用图像的亮度和色度及其视觉感知、图像的灰度梯度期望值、图像的模糊程度、局部对比度、运动矢量及其视觉感知、场景切换特征、比特率、初始时延、单次中断时延、中断频率和中断平均时长共11个特征, 来描述影响视频质量的4个主要方面, 并对建立的两个视频数据库中的大量视频样本, 提取其特征参数; 再以该特征参数作为输入, 对设计的多层BP神经网络进行训练, 从而构建VQA模型; 最后, 对所提模型进行测试, 同时与14种现有的VQA模型进行对比分析, 研究其精度、复杂性和泛化性能. 实验结果表明: 所提模型的精度明显高于其14种现有模型的精度, 其最低高出幅度为4.34%; 且优于该14种模型的泛化性能, 同时复杂性处于该15种模型中的中间水平. 综合分析所提模型的精度、泛化性能和复杂性表明, 所提模型是一种较好的基于机器学习的VQA模型.
基于事件触发的离散 MIMO 系统自适应评判容错控制
王敏, 黄龙旺, 杨辰光
当前状态:  doi: 10.16383/j.aas.c200721
[摘要](57) [HTML全文](15) [PDF 1906KB](8)
摘要:
本文针对具有执行器故障的一类离散非线性多输入多输出(Multi-input multi-output, MIMO)系统, 提出了一种基于事件触发的自适应评判容错控制方案. 该控制方案包括评价和执行网络. 在评价网络里, 为了缓解现有的非光滑二值效用函数可能引起的执行网络跳变问题, 利用高斯函数构建了一个光滑的效用函数, 并采用评价网络近似最优性能指标函数. 在执行网络里, 通过变量替换将系统状态的将来信息转化成关于系统当前状态的函数, 并结合事件触发机制设计了最优跟踪控制器. 该控制器引入了动态补偿项, 不仅能够抑制执行器故障对系统性能的影响, 而且能够改善系统的控制性能. 稳定性分析表明所有信号最终一致有界且跟踪误差收敛于原点的有界小领域内. 数值系统和实际系统的仿真结果验证了该方案的有效性.
基于分布式有限感知网络的多伯努利目标跟踪
吴孙勇, 王力, 李天成, 孙希延, 蔡如华, 伍雯雯
当前状态:  doi: 10.16383/j.aas.c200481
[摘要](31) [HTML全文](10) [PDF 1975KB](9)
摘要:
针对感知范围受限的分布式传感网多目标跟踪问题, 在多伯努利滤波跟踪理论基础上提出分布式视场互补多伯努利关联算术平均融合跟踪方法. 首先, 通过视场互补扩大传感器感知范围, 其中, 局部公共区域只互补一次以降低计算成本. 其次, 每个传感器分别运行局部多伯努利滤波器, 并将滤波后验结果与相邻传感器进行泛洪通信使得每个传感器获取多个相邻传感器的后验信息. 随后, 通过距离划分进行多伯努利关联, 将对应于同一目标的伯努利分量关联到同一个子集中, 并对每个关联子集进行算术平均融合完成融合状态估计. 仿真实验表明, 所提方法在有限感知范围的分布式传感器网络中能有效地进行多目标跟踪.
复杂装备系统弹性度量方法研究
杨博帆, 张琳, 汪文峰, 唐东丽, 丁尔启, 项阳
当前状态:  doi: 10.16383/j.aas.c200642
[摘要](12) [HTML全文](8) [PDF 1220KB](4)
摘要:
由于复杂装备系统缺少可工程应用的弹性度量方法, 且传统可靠性工程难以描述装备从故障到修复全过程的性质, 因此考虑装备系统在工作过程中性能变化的连续性以及扰动、故障和修复的不确定性, 利用可靠性工程相关参数, 针对无子系统的简单装备提出了一种混合型弹性度量方法. 在此基础上, 考虑子系统对复杂系统的影响, 以及复杂系统故障和修复概率, 提出了一种针对复杂装备系统的弹性度量方法. 最后, 通过基于弹性理论的组件重要度计算案例, 评估复杂装备系统各个子系统性能变化对整个装备的影响重要程度, 验证了方法的可行性和有效性.
结合领域知识的因子分析: 在金融风险模型上的应用
冯栩, 喻文健, 李凌
当前状态:  doi: 10.16383/j.aas.c200342
[摘要](82) [HTML全文](23) [PDF 1473KB](9)
摘要:
因子分析是一种在工业领域广泛使用的统计学方法. 在金融资产管理中, 因子分析通过对历史价格波动的极大似然估计推导自适应的统计学因子来生成风险模型. 与通过使用预先设定具有经济学含义的因子来生成风险模型的基本面因子模型相比, 通过因子分析生成的模型不仅更灵活, 还能发现在基本面模型中缺失的因子. 然而, 由于因子分析所生成模型中的统计学因子缺少可解释性, 因此当金融数据中存在显著噪音时容易过拟合. 针对中国股市数据的风险模型生成问题, 本文提出快速因子分析算法以及将基本面因子结合到因子分析中的挑选基本面因子的混合因子分析方法, 使风险模型同时在因子探索及模型可解释性上达到最优. 实验结果显示快速因子分析方法能够达到31倍以上的加速比, 且新混合因子分析方法能够增大人造数据集以及真实数据集上预测的对数似然估计值. 在真实数据集上, 新方法能最好够达到平均对数似然估计值12.00, 比因子分析构建模型的7.56大4.44, 并且两个算法均值差值的标准差为1.58, 表现出新方法能构建更准确的风险模型.
基于深度学习的单幅图像超分辨率重建算法综述
李佳星, 赵勇先, 王京华
当前状态:  doi: 10.16383/j.aas.c190859
[摘要](234) [HTML全文](86) [PDF 2048KB](28)
摘要:
单幅图像超分辨率重建是计算机视觉领域上的一个重要问题, 在安防视频监控、飞机航拍以及卫星遥感等方面具有重要的研究意义和应用价值. 近年来, 深度学习在图像分类、检测、识别等诸多领域中取得了突破性进展, 也推动着图像超分辨率重建技术的发展. 本文首先介绍单幅图像超分辨率重建的常用公共图像数据集; 然后重点阐述基于深度学习的单幅图像超分辨率重建方向的创新与进展; 最后讨论了单幅图像超分辨率重建方向上存在的困难和挑战, 并对未来的发展趋势进行了思考与展望.
基于多粒度对抗训练的鲁棒跨语言对话系统
向露, 朱军楠, 周玉, 宗成庆
当前状态:  doi: 10.16383/j.aas.c200764
[摘要](42) [HTML全文](14) [PDF 1641KB](3)
摘要:
跨语言对话系统是当前国际研究的热点和难点. 在实际的应用系统搭建中通常需要翻译引擎作为不同语言之间对话的桥梁. 然而, 翻译引擎往往是基于不同训练样本构建的, 无论是所在领域, 还是擅长处理语言的特性, 均与对话系统的实际应用需求存在较大的差异, 从而导致整个对话系统的鲁棒性差, 响应性能低. 因此, 如何增强跨语言对话系统的鲁棒性对于提升其实用性具有重要的意义. 本文提出了一种基于多粒度对抗训练的鲁棒性跨语言对话系统构建方法. 该方法首先面向机器翻译构建多粒度噪声数据, 分别在词汇、短语和句子层次生成相应的对抗样本, 之后利用多粒度噪声数据和干净数据进行对抗训练, 从而更新对话系统的参数, 进而指导对话系统学习噪声无关的隐层表示, 最终达到提升跨语言对话系统性能的目的. 在公开对话数据集上对两种语言的实验表明, 本文所提出的方法能够显著提升跨语言对话系统的性能, 尤其提升跨语言对话系统的鲁棒性.
生成式不完整多视图数据聚类
赵博宇, 张长青, 陈蕾, 刘新旺, 李泽超, 胡清华
当前状态:  doi: 10.16383/j.aas.c200121
[摘要](43) [HTML全文](12) [PDF 1685KB](7)
摘要:
基于自表示子空间聚类的多视图聚类引起越来越多的关注. 大多数现有算法假设每个样本的所有视图都可获得, 然而在实际应用中, 由于各种因素, 可能会导致某些视图缺失. 为了对视图不完整数据进行聚类, 本文提出了一种在统一框架下同时执行缺失视图补全和多视图子空间聚类的方法. 具体地, 缺失视图是由已观测视图数据约束的隐表示生成的. 此外, 多秩张量应用于挖掘不同视图之间的高阶相关性. 这样通过隐表示和高阶张量同时挖掘了不同视图以及所有样本(即使是不完整视图样本)之间的相关性. 本文使用增广拉格朗日交替方向最小化(AL-ADM)方法求解优化问题. 在真实数据集上的实验结果表明, 我们的方法优于最新的多视图聚类算法, 具有更好的聚类准确度和鲁棒性.
基于背景值和结构相容性改进的多维灰色预测模型
缪燕子, 王志铭, 李守军, 代伟
当前状态:  doi: 10.16383/j.aas.c200780
[摘要](23) [HTML全文](10) [PDF 1174KB](5)
摘要:
现有的多变量灰色预测模型的背景值估计误差及模型结构单一是导致该模型预测性能不稳定的重要因素, 致使该模型在实际预测领域中应用并不广泛. 本文通过分析背景值函数的几何意义, 结合积分几何面积公式, 提出一种改进的背景值优化方法, 使预测模型在背景值系数的选取上更加灵活.在此基础上, 模型中加入灰色作用量, 提出一种新的多维灰色预测模型IBSGM(1,N). 通过对模型参数的改变分析, 新模型理论上可达到与传统单变量和多变量灰色预测模型的兼容性. 为检验新模型的性能, 本文进行了三个案例对比分析, 实验结果表明, 与现有的GM(1,1)和GM(1,N)预测模型相比较, 所提出的IBSGM(1,N)模型在背景值参数估计上误差明显减小, 结构相容性更强, 泛化性能更好, 具有更高的预测精度.
绳长时变情况下轮胎式集装箱起重机非线性防摆控制算法
曹海昕, 郝运嵩, 林静正, 卢彪, 方勇纯
当前状态:  doi: 10.16383/j.aas.200859
[摘要](21) [HTML全文](15) [PDF 1557KB](4)
摘要:
四绳轮胎式集装箱起重机由于自身的动力学特性较为复杂, 目前仍缺乏稳定高效的控制手段. 为解决港口起重机作业过程中台车定位精准度低、负载易受干扰摆幅大的问题, 文章设计了一种面向工业场景的非线性反馈控制器. 首先在未进行近似处理的前提下对起重机吊具摆动情况进行了建模分析. 在此基础上, 通过在控制器中引入摆幅反馈信息, 实现了绳长时变情况下台车的精确定位与负载摆幅的有效抑制, 为集装箱的运送路径增加了更多选择. 随后基于Lyapunov方法对控制器进行了稳定性分析. 所设计的控制方案在港口实际设备上进行了验证, 在定位精度与消摆性能上相较于人工操作取得了很大提升.
基于生理信号的情感计算研究综述
权学良, 曾志刚, 蒋建华, 张亚倩, 吕宝粮, 伍冬睿
当前状态:  doi: 10.16383/j.aas.c200783
[摘要](97) [HTML全文](79) [PDF 1705KB](20)
摘要:
情感计算是现代人机交互中的一个重要研究方向, 旨在研究与开发能够识别、解释、处理和模拟人类情感的理论、方法与系统. 脑电、心电、皮肤电等生理信号是情感计算中重要的输入信号. 本文总结了近年来基于脑电等生理信号的情感计算研究所取得的进展. 首先介绍情感计算的相关基础理论, 不同生理信号与情感变化之间的联系, 以及基于生理信号的情感计算工作流程和相关公开数据集. 接下来介绍生理信号的特征工程和情感计算中的机器学习算法, 重点介绍适合处理个体差异的迁移学习、降低数据标注量的主动学习和融合特征工程与学习器的深度学习算法. 最后, 指出基于生理信号的情感计算研究中面临的一些挑战.
基于堆叠降噪自编码器的神经-符号模型及在晶圆表面缺陷识别
刘国梁, 余建波
当前状态:  doi: 10.16383/j.aas.c190857
[摘要](23) [HTML全文](12) [PDF 2118KB](8)
摘要:
深度神经网络是具有复杂结构和多个非线性处理单元的模型, 通过模块化的方式分层从数据提取代表性特征, 已经在晶圆缺陷识别领域(Wafer map pattern recognition, WMPR)得到了较为广泛的应用. 但是, 深度神经网络在应用过程中本身存在 “黑箱”和过度依赖数据的问题, 显著地影响深度神经网络在晶圆缺陷识别的工业可应用性. 本文提出了一种基于堆叠降噪自编码器(Stacked denoising auto-encoders, SDAE)的神经-符号模型. 首先, 根据SDAE的网络特点设计了一套全新的符号规则系统, 规则形式和组成结构使其可与深度神经网络有效融合. 其次, 根据网络和符号规则之间的关联性提出完整的知识抽取与插入算法, 实现了深度网络和规则之间的知识转换. 在实际工业晶圆表面图像数据集WM-811K上的试验结果表明, 基于SDAE的神经-符号模型不仅取得了较好的缺陷探测与识别性能, 而且可有效提取规则并通过规则有效描述深度神经网络内部计算逻辑, 综合性能优于目前经典的深度神经网络.
基于深度强化学习的组合优化研究进展
李凯文, 张涛, 王锐, 覃伟健, 贺惠晖, 黄鸿
当前状态:  doi: 10.16383/j.aas.c200551
[摘要](938) [HTML全文](299) [PDF 1483KB](151)
摘要:
组合优化问题广泛存在于国防、交通、工业、生活等各个领域, 几十年来, 传统运筹优化方法是解决组合优化问题的主要手段, 但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高, 传统运筹优化算法面临着很大的计算压力, 很难实现组合优化问题的在线求解. 近年来随着深度学习技术的迅猛发展, 深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力. 鉴于此, 近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法, 具有求解速度快、模型泛化能力强的优势, 为组合优化问题的求解提供了一种全新的思路. 因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究, 对其基本原理、相关方法、应用研究进行总结和综述, 并指出未来该方向亟待解决的若干问题.
具有未建模动态的互联大系统事件触发自适应模糊控制
赵光同, 曹亮, 周琪, 李鸿一
当前状态:  doi: 10.16383/j.aas.c200846
[摘要](89) [HTML全文](28) [PDF 1420KB](30)
摘要:
针对一类具有未建模动态及执行器故障的非严格反馈非线性互联大系统, 提出一类基于事件触发机制的模糊分散自适应输出反馈控制算法. 首先, 通过设计模糊状态观测器估计系统中不可测的状态, 并引入李雅普诺夫函数约束未建模动态. 然后, 提出一种基于事件触发机制的自适应容错控制器补偿多个执行器故障产生的影响. 最后, 利用障碍李雅普诺夫函数实现对系统输出的约束, 并证明闭环系统中所有信号均是半全局一致最终有界的, 且设计的事件触发机制可以避免Zeno行为. 数值仿真结果验证所提出设计方案的可行性及有效性.
从视频到语言: 视频标题生成与描述研究综述
汤鹏杰, 王瀚漓
当前状态:  doi: 10.16383/j.aas.c200662
[摘要](128) [HTML全文](41) [PDF 1421KB](24)
摘要:
视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码-解码”架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑等信息的结构化语段, 并在模型优化、数据集构建、评价指标等方面进行更为深入的研究.
基于强化学习的部分线性离散时间系统的最优输出调节
庞文砚, 范家璐, 姜艺, LewisFrank L.
当前状态:  doi: 10.16383/j.aas.c190853
[摘要](67) [HTML全文](22) [PDF 1981KB](24)
摘要:
本文针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题, 提出了仅利用在线数据的基于强化学习的数据驱动控制方法. 首先, 该问题可拆分为一个受约束的静态优化问题和一个动态规划问题, 第一个问题可以解出调节器方程的解. 第二个问题可以确定出控制器的最优反馈增益. 然后, 运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性. 针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题, 本文提出了一种数据驱动离线策略更新算法, 该算法仅使用在线数据找到动态规划问题的解. 然后, 基于动态规划问题的解, 利用在线数据为静态优化问题提供了最优解. 最后, 仿真结果验证了所提方法的有效性.
基于拓扑一致性对抗互学习的知识蒸馏
赖轩, 曲延云, 谢源, 裴玉龙
当前状态:  doi: 10.16383/j.aas.200665
[摘要](36) [HTML全文](18) [PDF 936KB](4)
摘要:
针对基于互学习的知识蒸馏方法中存在的不足——模型只关注教师网络和学生网络的分布差异而没有考虑其他的约束条件; 只关注了结果导向的监督, 而缺少过程导向的监督——本文提出了一种拓扑一致性指导的对抗互学习知识蒸馏方法(Topology-guided aadversarial deep mutual learning, TADML)该方法将教师网络和学生网络同时训练, 网络之间相互指导学习, 不仅采用网络输出的类分布之间的差异, 还设计了网络中间特征的拓扑性差异度量. 训练过程采用对抗训练, 进一步提高教师网络和学生网络的判别性. 在分类数据集CIFAR10、CIFAR100和Tiny-ImageNet及行人重识别数据集Market1501上的实验结果表明本文所提方法TADML的有效性, TADML取得了同类模型压缩方法中最好的效果.
基于表面肌电的意图识别方法在非理想条件下的研究进展
李自由, 赵新刚, 张弼, 丁其川, 张道辉, 韩建达
当前状态:  doi: 10.16383/j.aas.c200263
[摘要](28) [HTML全文](15) [PDF 1843KB](10)
摘要:
在基于表面肌电信号(surface electromyogram, sEMG)的意图识别研究领域, 目前大多数的研究主要集中在提高肌电识别的准确性方面. 然而, 在实际应用中, 基于sEMG识别的交互系统往往受到诸多非理想因素干扰, 肌电识别的准确性被大大降低. 本文主要关注在非理想条件下肌电识别的鲁棒性研究, 首先详细归纳了肌电识别方法受到的非理想干扰因素(如电极偏移、个体性差异、肌肉疲劳、肢体姿态或其他综合性干扰), 总结了当前研究的抗干扰方法; 随后讨论了非理想干扰因素研究现状中的主要问题; 最后在构建肌电数据集、探索深度学习和迁移学习, 以及肌电分解研究等方面, 对未来的关键技术进行了展望.
基于图像和特征联合约束的跨模态行人重识别
张玉康, 谭磊, 陈靓影
当前状态:  doi: 10.16383/j.aas.c200184
[摘要](61) [HTML全文](20) [PDF 1365KB](6)
摘要:
近年来, 基于可见光与近红外的行人重识别研究受到业界人士的广泛关注. 现有方法主要是利用二者之间的相互转换以减小模态间的差异. 但由于可见光图像和近红外图像之间的数据具有独立且分布不同的特点, 导致其相互转换的图像与真实图像之间存在数据差异. 因此, 本文提出了一个基于图像层和特征层联合约束的可见光与近红外相互转换的中间模态, 不仅实现了行人身份的一致性, 而且减少了模态间转换的差异性. 此外, 考虑到跨模态行人重识别数据集的稀缺性, 本文还构建了一个跨模态的行人重识别数据集, 并通过大量的实验证明了文章所提方法的有效性, 本文所提出的方法在经典公共数据集SYSU-MM01上比D2RL算法在 Rank-1和mAP上分别高出4.2%和3.7%, 该方法在本文构建的Parking-01数据集的近红外检索可见光模式下比ResNet-50算法在Rank-1和mAP上分别高出10.4%和10.4%.
城市污水处理过程动态多目标智能优化控制研究
韩红桂, 张璐, 卢薇, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c190154
[摘要](93) [HTML全文](24) [PDF 2022KB](27)
摘要:
城市污水处理过程(Municipal waster water treatment process, MWWTP)是一个典型的复杂流程工业过程, 其优化运行涉及到多个动态性能指标. 为了实现城市污水处理运行过程的优化控制, 本文提出了一种城市污水处理过程动态多目标智能优化控制方法(Dynamic multiobjective intelligent optimal control, DMIOC). 首先, 建立了一种基于自适应核函数的动态性能指标模型, 实现了城市污水处理关键性能指标的准确描述; 其次, 设计了一种基于自适应飞行参数调整机制的动态多目标粒子群优化算法(Dynamic multiobjective particle swarm optimization, DMOPSO), 可有效平衡粒子的多样性和收敛性, 完成了溶解氧和硝态氮优化设定值的实时获取; 最后, 利用多回路PID控制方法对溶解氧和硝态氮优化设定值进行控制, 实现了城市污水处理过程安全稳定运行. 将提出的DMIOC应用于城市污水处理基准仿真平台, 实验结果显示: DMIOC 能够提高溶解氧和硝态氮的控制效果, 实现城市污水处理过程出水水质达标, 并降低运行成本.
基于ISDAE模型的复杂工业过程运行状态评价方法及应用
褚菲, 傅逸灵, 赵旭, 王佩, 尚超, 王福利
当前状态:  doi: 10.16383/j.aas.c200475
[摘要](65) [HTML全文](13) [PDF 2536KB](15)
摘要:
工业过程运行状态评价通过识别生产过程的运行状态优劣情况, 并通过对非最优因素实时在线追溯, 指导操作人员及时进行生产调整, 保证产品质量, 保障企业的综合经济效益. 针对工业过程中存在强非线性、信息冗余以及不确定性影响而难以建立稳健可靠的运行状态评价模型问题, 提出了一种基于综合经济指标驱动的稀疏降噪自编码器模型(Comprehensive economic index driven sparse denoising autoencoder, ISDAE)的复杂工业过程运行状态评价方法. 首先, 在SDAE(Sparse denoising autoencoder)模型中引入综合经济指标预测误差项, 迫使SDAE学习与综合经济指标相关的数据特征, 建立ISDAE特征提取模型; 其次, 将ISDAE模型所学特征作为输入训练运行状态识别模型, 级联特征提取模型和运行状态识别模型级并通过微调网络结构参数获得运行状态评价模型. 针对非优状态, 提出了一种基于自编码器贡献图算法的非优因素识别方法, 通过计算相应变量的贡献率识别非优因素. 最后, 将所提方法应用于重介质选煤过程的运行状态评价, 实验结果验证了所提方法的有效性和实用性.
基于中心点搜索的无锚框全卷积孪生跟踪器
谭建豪, 郑英帅, 王耀南, 马小萍
当前状态:  doi: 10.16383/j.aas.c200469
[摘要](59) [HTML全文](17) [PDF 1546KB](5)
摘要:
为了解决孪生网络跟踪器鲁棒性差的问题, 本文重新设计了孪生网络跟踪器的分类与回归分支, 提出了一种基于像素上直接预测方式的高鲁棒性跟踪算法(AFST). 目前高性能的跟踪算法, 如SiamRPN、SiamRPN++、CRPN都是基于预定义的锚框进行分类和目标框回归. 与之相反, 我们提出的AFST则是直接在每个像素上进行分类和预测目标框. 通过去掉锚框, 本文大大简化了分类任务和回归任务的复杂程度, 并消除了锚框和目标误匹配问题. 在训练中, 我们还进一步添加了同类不同实例的图像对, 从而引入了相似语义干扰物, 使得网络的训练更加充分. 在VOT2016、GOT-10k、OTB2015三个公开的基准上的实验表明, 与现有的跟踪算法对比, AFST达到了先进的性能.
基于多层次特征融合的图像超分辨率重建
李金新, 黄志勇, 李文斌, 周登文
当前状态:  doi: 10.16383/j.aas.c200585
[摘要](66) [HTML全文](27) [PDF 1176KB](15)
摘要:
深度卷积神经网络显著改进了单图像超分辨率的性能. 更深的网络往往能获得更好的性能. 但是, 加深网络会导致参数量急剧增加, 限制了它在资源受限设备上的应用, 比如智能手机. 本文提出了一个融合多层次特征的轻量级单图像超分辨率网络. 网络构件主要是双层嵌套残差块. 为了更好地提取特征, 减少参数量, 每个残差块采用对称结构: 先两次扩张, 然后两次压缩通道数. 在残差块中, 通过添加自相关权重单元, 加权融合不同通道的特征信息. 实验证明: 我们的方法显著优于当前同类方法.
串联弹性驱动器设计、建模及在机器人上的应用
孙宁, 程龙
当前状态:  doi: 10.16383/j.aas.c200202
[摘要](54) [HTML全文](17) [PDF 1641KB](9)
摘要:
相比于传统的刚性驱动器, 串联弹性驱动器具有被动柔顺性、阻抗低、抗冲击、力感知等诸多优点, 因而已经广泛地应用到各种机器人系统当中. 本文首先根据弹性和阻尼特性将串联弹性驱动器分为: 弹性型、阻尼型和弹性-阻尼型串联弹性驱动器, 介绍不同类型串联弹性驱动器的优缺点, 并详细概述弹性和阻尼特性的机械实现方式; 然后对各类串联弹性驱动器作为力传感器的建模方法进行介绍; 接下来叙述串联弹性驱动器在机器人中的主要应用: 力传感器、安全保护、降低能耗; 最后展望串联弹性驱动器未来的发展方向.
基于图像与电流特征的电熔镁炉欠烧工况半监督分类方法
卢绍文, 温乙鑫
当前状态:  doi: 10.16383/j.aas.c200754
[摘要](48) [HTML全文](16) [PDF 1236KB](11)
摘要:
本文针对电熔镁炉异常工况识别任务, 在半监督学习框架下提出了一种将电流与图像两类特征融合的解决方案. 本文的贡献主要为: 使用多元图像分析技术代替人眼, 更为准确客观地对镁炉火焰进行特征提取; 利用基于熵正则化的半监督学习框架, 同时使用具有强互补性的生产图像与电流数据进行工况分类, 从而弥补了基于单一特征分类的某些缺点; 采用交叉熵方法优化分类器目标函数, 较传统优化方法显著地提升了训练速度. 通过仿真数据与公开数据集测试并讨论了本文算法的优势; 并通过工业数据验证了本文所提出的方法有效性、应用价值与良好的鲁棒性.
基于变分信息瓶颈的半监督神经机器翻译
于志强, 余正涛, 黄于欣, 郭军军, 高盛祥
当前状态:  doi: 10.16383/j.aas.c190477
[摘要](49) [HTML全文](28) [PDF 1519KB](15)
摘要:
变分方法是机器翻译领域的有效方法, 其性能较依赖于数据量规模. 然而在低资源环境下, 平行语料资源匮乏, 不能满足变分方法对数据量的需求, 因此导致基于变分的模型翻译效果并不理想. 针对该问题, 我们提出基于变分信息瓶颈的半监督神经机器翻译方法, 所提方法的具体思路为: 首先在小规模平行语料的基础上, 通过引入跨层注意力机制充分利用神经网络各层特征信息, 训练得到基础翻译模型; 随后, 利用基础翻译模型, 使用回译方法从单语语料生成含噪声的大规模伪平行语料, 对两种平行语料进行合并形成组合语料, 使其在规模上能够满足变分方法对数据量的需求; 最后, 为了减少组合语料中的噪声, 利用变分信息瓶颈方法在源与目标之间添加中间表征, 通过训练使该表征具有放行重要信息、阻止非重要信息流过的能力, 从而达到去除噪声的效果. 多个数据集上的实验结果表明, 本文所提方法能够显著地提高译文质量, 是一种适用于低资源场景的半监督神经机器翻译方法.
时滞忆阻神经网络动力学分析与控制综述
章联生, 金耀初, 宋永端
当前状态:  doi: 10.16383/j.aas.c200691
[摘要](95) [HTML全文](19) [PDF 1398KB](20)
摘要:
忆阻器(memristor)是一种无源的二端电子元件, 同时也是一种纳米级元件, 具有低能耗、高存储、小体积和非易失性等特点. 作为一种新型的存储器件, 忆阻器的研制, 有望使计算机实现人脑特有的信息存储与信息处理一体化的功能, 打破目前冯·诺伊曼(Von Neumann)计算机架构, 为下一代计算机的研制提供了一种全新的架构. 鉴于忆阻器与生物神经元突触具有十分相似的功能, 使忆阻器得以充当人工神经元的突触, 建立起一种基于忆阻器的人工神经网络即忆阻神经网络. 忆阻器的问世, 为人工神经网络从电路上模拟人脑提供了可能, 必将极大推动人工智能的发展. 此外, 忆阻神经网络的硬件实现及信号传递过程中, 不可避免会出现时滞与分岔等现象, 因此考虑含各种时滞, 如离散、分布、泄漏时滞以及它们混合的时滞忆阻神经网络系统更具有现实意义. 本文首先介绍了忆阻器的多种数学模型及其分类, 建立了忆阻神经网络的数学模型并阐述了其优点, 然后提出了处理时滞忆阻神经网络动力学行为与控制问题两种思路, 详细综述了时滞忆阻神经网络系统的稳定性(镇定)、耗散性与无源性、同步控制方面的内容, 简述了其他方面的动力学行为与控制, 并介绍了时滞忆阻神经网络动力学行为与控制研究新方向. 最后, 对本文所述问题进行了总结与展望.
基于径向空间划分的昂贵多目标进化算法
顾清华, 周煜丰, 李学现, 阮顺领
当前状态:  doi: 10.16383/j.aas.c200791
[摘要](50) [HTML全文](10) [PDF 4874KB](8)
摘要:
为了解决难以建立精确数学模型或者真实评估实验成本高昂的多目标优化问题, 本文提出了一种基于径向空间划分的昂贵多目标进化算法. 首先算法使用高斯回归作为代理模型逼近目标函数; 然后将目标空间的个体投影到径向空间, 结合目标空间和径向空间信息保留对种群贡献更高的个体; 之后由径向空间中个体的位置分布决定下一步应该选择哪些个体进行真实评估; 最后, 采用一种双档案管理策略维护代理模型的质量. 数值实验和现实问题上的结果表明, 与五种先进的算法相比, 本文提出的算法在解决昂贵多目标优化问题时能够提供更高质量的解.
一种规模化混杂生产线缓冲区容量优化分配技术
刘军, 任建华, 冯硕
当前状态:  doi: 10.16383/j.aas.c200578
[摘要](38) [HTML全文](11) [PDF 1712KB](7)
摘要:
针对传统技术难以解决规模化混杂生产线缓冲区容量优化分配问题, 提出了一种规模化生产线递阶分解并行寻优技术, 该技术结合混杂生产线系统综合方法与分解方法的技术思想, 兼顾生产线平衡性与系统规模, 将原系统递阶分解为包含虚拟生产线在内的n+1个子生产线系统, 通过求解子系统的最优解构造原系统的渐进最优解, 并在系统递阶建模阶段建议了一种设备模糊聚类的辅助方式; 同时, 基于混杂生产线系统综合方法也建议了一种系统渐次综合的初解改进确定方法; 并提出了一种通过构造动态步长来设计领域结构的改进型禁忌搜索算法对子系统进行并行寻优; 最后对技术算法的收敛性进行了证明.本文提出的生产线递阶分解建模并行寻优技术具有一般性, 对受设备随机故障等随机事件影响的生产线尤其是规模化生产线系统其它优化、控制问题也具有借鉴、参考价值.
基于非凸复合函数的稀疏信号恢复算法
周洁容, 李海洋, 凌军, 陈浩, 彭济根
当前状态:  doi: 10.16383/j.aas.c200666
[摘要](57) [HTML全文](10) [PDF 1602KB](6)
摘要:
本文基于泛函深度作用的思想, 通过将两种非凸稀疏泛函进行复合, 构造了一种新的稀疏信号重构模型, 实现了对0范数的深度逼近. 综合运用MM技术、外点罚函数法和共轭梯度法, 提出了一种求解该模型的算法, 称为NCCS算法. 为降低重构信号陷入局部极值的可能性, 提出了在算法的每步迭代中以BP模型的解作为初始迭代值. 为验证所建模型和所提算法的有效性, 本文进行了多项数值实验. 实验结果表明: 相较于SL0算法、IRLS算法、SCSA算法以及BP算法等经典算法, 本文提出的算法在重构误差、信噪比、归一化均方差、支撑集恢复成功率等方面都有更优的表现.
基于分步子空间映射的无标记膈肌运动预测算法
余航, 李晨阳, 余绍德, 冯冬竹, 许录平
当前状态:  doi: 10.16383/j.aas.c200471
[摘要](55) [HTML全文](13) [PDF 2271KB](9)
摘要:
呼吸会引起体内器官和肿瘤的运动, 这会显著影响放射治疗的过程和效果. 人体内部膈肌和胸腹部外表面是当前两种与呼吸系统高度相关的结构, 本文对其进行系统研究, 提出了一种新的分步子空间映射(TSSM)算法, 通过对体外胸腹部表面的测量, 来预测体内膈肌的运动. 本文首先采用三维图像分割技术对4D CT图像进行分割, 在不使用标记物的情况下, 准确测量体内膈肌和体外胸腹部表面的位移. 为了解决跨空间的预测问题, TSSM首先构造特征子空间, 并将膈肌数据和胸腹外表面数据分别映射到各自的子空间中, 以减少数据的相关性和冗余信息; 然后通过线性岭回归优化过程, 对两个子空间进行二次映射, 从而有效地捕获跨空间数据之间的相关性. 根据训练得到的相关模型, 通过体外胸腹部外表面的运动情况, 对体内膈肌的运动情况进行准确的预测. 为了研究数据之间的非线性关系, 本文进一步将TSSM推广到了基于核的TSSM(kTSSM)算法. 实验表明, 该方法可以根据腹腔外表面的运动情况, 准确的对体内膈肌位移进行预测, 优于经典的线性模型和ANN模型. 本文给出了优化算法的解析解, 其运算速度快, 将有助于提高放射治疗中门控技术和跟踪技术的效率和精度.
电动汽车电子差速控制技术研究综述
姚芳, 林祥辉, 吴正斌, 李贵强
当前状态:  doi: 10.16383/j.aas.c190293
[摘要](37) [HTML全文](26) [PDF 1520KB](16)
摘要:
首先, 阐述电动汽车(Electric vehicle, EV)驱动系统的布置结构以及差速控制的原理和优缺点, 并介绍用于电子差速控制(Electronic differential control, EDC)的Acekermann转向模型和3自由度整车动力学模型, 进而剖析非线性扰动和整车模型的设计理念; 其次, 重点综述电动汽车分布式驱动结构的电子差速控制策略、多机抗扰控制及优化算法的相关研究成果, 并从成果走向、局限性及可能的发展空间分析其发展态势; 最后, 从整车模型、控制策略、抗扰算法和效果验证等四个方面, 总结电动汽车电子差速控制技术的现状, 并展望未来发展可能.
全景分割研究综述
徐鹏斌, 瞿安国, 王坤峰, 李大字
当前状态:  doi: 10.16383/j.aas.c200657
[摘要](190) [HTML全文](84) [PDF 1964KB](30)
摘要:
在计算机视觉领域, 全景分割是一个新颖且重要的研究问题, 它是机器感知、自动驾驶等新兴前沿技术的基石, 有着十分重要的研究意义. 本文综述了基于深度学习的全景分割研究的最新进展, 总结了全景分割任务的基本处理流程, 并对已发表的全景分割工作基于其网络结构特点进行分类, 并作了全面的介绍与分析, 最后对全景分割任务目前面临的问题以及未来的发展趋势做出了分析, 并针对所面临的问题提出了一些切实可行的解决思路.
深度学习方法在糖尿病视网膜病变诊断中的应用
范家伟, 张如如, 陆萌, 何佳雯, 康霄阳, 柴文俊, 石珅达, 宋美娜, 鄂海红, 欧中洪
当前状态:  doi: 10.16383/j.aas.c190069
[摘要](82) [HTML全文](62) [PDF 1720KB](27)
摘要:
深度学习可以有效提取图像隐含特征,在医学影像识别方面的应用快速发展. 由于糖尿病视网膜病变(Diabetic retinopathy, DR)诊断标准明确、分类体系成熟,应用深度学习诊断糖尿病视网膜病变近年来成为研究热点. 本文从深度学习方法在DR诊断中的最新研究进展、DR诊断的一般流程、公共数据集、医学影像标注方法、主要实现模型、面临的主要挑战几方面, 对深度学习方法在糖尿病视网膜病变诊断中的应用进行了详细综述, 便于更多机器视觉、尤其是深度学习医学影像的研究者们参照对比,加快该领域研究的成熟度和临床落地应用.
基于事件触发的全信息粒子群优化器及其应用
王闯, 韩非, 申雨轩, 李学贵, 董宏丽
当前状态:  doi: 10.16383/j.aas.c200621
[摘要](102) [HTML全文](28) [PDF 1603KB](18)
摘要:
针对标准粒子群优化算法存在早熟收敛和容易陷入局部最优的问题, 本文提出了一种基于事件触发的全信息粒子群优化算法(Event-Triggering-Based Full-Information Particle Swarm Optimization, EFPSO). 首先, 引入一类基于粒子空间特性的事件触发策略实现粒子群优化算法(Particle Swarm Optimization, PSO) 的模态切换, 更好地维持了算法搜索和收敛能力之间的动态平衡. 然后, 鉴于引入历史信息能够降低算法陷入局部最优的可能性, 提出一种全信息策略来克服PSO算法搜索能力不足的缺陷. 数值仿真实验表明, EFPSO算法在种群多样性、收敛率、成功率方面是优于其它改进的PSO算法. 最后, 应用EFPSO算法对变分模态分解(Variational Mode Decomposition, VMD)去噪算法进行改进, 并在现场管道信号去噪取得了很好的效果.
一致性约束下末制导系统最大可容许模式决策延迟
项盛文, 范红旗, 达凯, 付强
当前状态:  doi: 10.16383/j.aas.c200717
[摘要](61) [HTML全文](13)
摘要:
对于大机动目标拦截问题, 模式决策器是基于逻辑的集成估计导引系统(Integrated estimation and guidance, IEG)中的一个重要组件. 为了保证系统的估计精度和制导性能, 模式决策器的模式延迟应尽可能小. 本文针对末制导场景, 首先推导了离散时间系统零控脱靶量的估计误差模型, 然后在一致性约束条件下给出了系统最大可容许模式决策延迟的数值计算方法. 本文的研究结果可为IEG系统中模式决策器的设计提供指标参考.
软体机械臂水下自适应鲁棒视觉伺服
徐璠, 王贺升
当前状态:  doi: 10.16383/j.aas.c200457
[摘要](113) [HTML全文](25) [PDF 1379KB](30)
摘要:
水下仿生软体机器人在水底环境勘测, 水下生物观测等方面具有极高的应用价值. 本文为进一步提升仿章鱼臂软体机器人在特殊水下环境中控制效果, 提出一种自适应鲁棒视觉伺服控制方法, 实现其在干扰无标定环境中的高精度镇定控制. 本文基于水底动力学模型, 设计保证动力学稳定的控制器; 针对柔性材料离线标定过程繁琐成本高, 提出料参数自适应估计算法; 针对水下特殊工作条件, 设计自适应鲁棒视觉伺服控制器, 实现折射效应的在线补偿, 并通过自适应未知环境干扰上界, 避免先验环境信息的求解. 所提算法在软体机器人样机中验证其镇定控制性能, 为仿生软体机器人的实际应用提供理论基础.
鱼集群游动的节能机理研究综述
张天栋, 王睿, 程龙, 王宇, 王硕
当前状态:  doi: 10.16383/j.aas.c200293
[摘要](43) [HTML全文](39) [PDF 1468KB](13)
摘要:
集群是鱼类生物中一种常见的现象, 特定编队的集群运动可以显著提高鱼群的游动效率. 鱼集群游动节能机理的研究为机器人集群编队设计和控制提供启发与帮助, 得到了研究人员的广泛关注. 本文介绍了鱼集群游动节能机理研究的主要方法及最新的研究成果, 将研究方法分为鱼群观察分析法、计算流体力学仿真法和实验装置研究法, 并基于此对近些年的研究成果进行了综述和分析, 最后列举了鱼集群游动节能机理研究的主要问题与未来发展方向.
基于信息几何的高超声速飞行器搜索方法
罗艺, 谭贤四, 王红, 曲智国
当前状态:  doi: 10.16383/j.aas.c200738
[摘要](70) [HTML全文](10) [PDF 1630KB](4)
摘要:
由于地面雷达受视距限制无法对高超声速飞行器进行连续观测, 针对高超声速飞行器飞出雷达视距盲区后难以搜索的问题, 提出了一种基于信息几何的雷达搜索方法. 本文利用非参数概率密度估计法对高超声速飞行器的出现位置的概率密度进行估计, 并把估计的位置概率密度作为雷达搜索的引导信息; 根据引导信息确定搜索区域, 以区域覆盖率最大化作为优化目标在搜索区域内进行波位编排; 基于信息几何理论, 将搜索策略建模为统计流形, 利用KL(Kullback-Leibler)散度来度量搜索策略与引导信息之间的差异, 通过最小化KL散度获得最优搜索策略. 通过仿真实验验证了本文所提方法的有效性和可行性, 并验证了相比其他搜索方法具有较明显的优势.
基于集成信用度评估智能合约的安全数据共享模型
张乐君, 刘智栋, 谢国, 薛霄
当前状态:  doi: 10.16383/j.aas.c200797
[摘要](81) [HTML全文](17) [PDF 1401KB](7)
摘要:
区块链技术是一种新兴技术, 它具备防篡改、去中心化、分布式存储等特点, 可以有效的解决现有数据共享模型中隐私安全、用户控制权不足以及单点故障问题. 本文以电子病历(Electronic health record, EHR)共享为例提出一种基于集成信用度评估智能合约的数据共享访问控制模型, 为患者提供可信EHR共享环境和动态访问控制策略接口. 实验表明所提模型有效解决了患者隐私安全和对EHR控制权不足的问题. 同时就模型的特点、安全性以及性能进行了分析.
多维注意力特征聚合立体匹配算法
张亚茹, 孔雅婷, 刘彬
当前状态:  doi: 10.16383/j.aas.c200778
[摘要](67) [HTML全文](32) [PDF 1455KB](20)
摘要:
现有基于深度学习的立体匹配算法在学习推理过程中缺乏有效信息交互, 而特征提取和代价聚合两个子模块的特征维度存在差异, 导致注意力方法在立体匹配网络中应用较少、方式单一. 针对这些问题, 本文提出了一种多维注意力特征聚合立体匹配算法. 设计二维(Two-dimensional, 2D)注意力残差模块, 通过在原始残差网络中引入无降维自适应2D注意力残差单元, 局部跨通道交互并提取显著信息, 为匹配代价计算提供丰富有效的特征. 构建三维(Three-dimensional, 3D)注意力沙漏聚合模块, 以堆叠沙漏结构为骨干设计3D注意力沙漏单元, 捕获多尺度几何上下文信息, 进一步扩展多维注意力机制, 自适应聚合和重新校准来自不同网络深度的代价体. 在三大标准数据集上进行评估, 并与相关算法对比, 实验结果表明所提算法具有更高的预测视差精度, 且在无遮挡的显著对象上效果更佳.
基于灵活平衡约束的图聚类方法
罗辉, 韩纪庆
当前状态:  doi: 10.16383/j.aas.c200144
[摘要](43) [HTML全文](10) [PDF 1837KB](4)
摘要:
现有的图聚类方法主要存在两方面的问题, 一是对各个类规模一致的假设, 在许多实际应用中并不成立. 二是在处理多类聚类问题时, 其所常借助的递归技术或启发式算法会影响聚类的性能. 为此, 本文提出一种基于灵活平衡约束的多类图聚类方法. 其能够覆盖从绝对平衡约束到无平衡约束的范围, 可同时处理类别规模一致和不一致的问题. 为有效求解新方法中的参数, 进一步提出一个紧松弛方法来使所提出的图聚类方法不仅易于求解, 且在处理多类聚类问题时不必依赖递归技术, 而能直接得到聚类结果. 文中也给出一种实现松弛图聚类的有效求解算法. 在合成数据和真实数据上的实验结果表明, 所提出的方法具有良好的性能.
基于加权矩阵的多维广义特征值并行分解算法
高迎彬, 徐中英
当前状态:  doi: 10.16383/j.aas.c200399
[摘要](75) [HTML全文](9) [PDF 1269KB](2)
摘要:
针对串行广义特征值分解算法实时性差的缺点, 提出了基于加权矩阵的多维广义特征值分解算法. 与串行算法不同, 所提算法能够在一次迭代过程中并行地估计出多维广义特征向量. 平稳点分析表明: 当且仅当算法中状态矩阵等于所需的广义特征向量时, 算法达到收敛状态. 通过对比相邻时刻的状态矩阵模值证明了所提算法的自稳定特性. 所提算法参数选取简单, 实际实施较为容易. 数值仿真和实例应用进一步验证了算法的并行性、自稳定性和实用性.
基于中心对称多胞体的故障可分离性评价
王桢榕, 王振华, 沈毅
当前状态:  doi: 10.16383/j.aas.cxxxxxx
[摘要](17) [HTML全文](21) [PDF 1216KB](4)
摘要:
针对包含幅值有界而分布形式未知的故障及输入干扰项的线性离散系统, 提出了一种新的系统故障可分离性的量化评价方法. 故障可分离性是故障可诊断性中的重要部分, 针对现有方法中基于方向相似度的故障可分离性评价方法存在的不足加以补充, 提出了利用中心对称多胞体对故障可分离性进行分析, 将中心对称多胞体集合转化为多面体的表示形式, 以达到对故障可分离性量化评价的目的, 同时给出了具体评价原理和评价指标. 最后, 通过数值仿真算例, 验证了该方法的有效性和优越性.
基于定制内点法的多无人机协同轨迹规划
王祝, 徐广通, 龙腾
当前状态:  doi: 10.16383/j.aas.c200361
[摘要](79) [HTML全文](27) [PDF 2161KB](17)
摘要:
为了提高多无人机协同轨迹规划效率, 在解耦序列凸优化方法基础上, 提出一种高效求解凸优化子问题的定制内点法. 首先引入松弛变量, 构建子问题的等价描述形式, 并推导该形式下的子问题最优性条件. 然后在预测-校正原对偶内点法的框架下, 构建一套高效求解最优性条件方程组的计算流程以降低子问题计算复杂度, 并利用约束矩阵特征提出一种快速计算原对偶搜索方向的方法以提高规划效率. 仿真结果表明, 在解耦序列凸优化框架下, 定制内点法可将协同轨迹规划耗时降低一个数量级, 达到秒级.
动态水印攻击检测方法的鲁棒性研究
杜大军, 张竞帆, 张长达, 费敏锐, YANGTai-Cheng
当前状态:  doi: 10.16383/j.aas.c200614
[摘要](50) [HTML全文](15) [PDF 3241KB](10)
摘要:
本文针对传统动态水印检测方法无法适用模型不确定系统的攻击检测问题, 首先分析模型不确定项导致的传统动态水印检测失效原因, 然后考虑模型不确定项和过程噪声的统计规律, 将其影响转化为对方差变化特性进行分析, 提出两个具有鲁棒性的攻击检测式以及检测式中关键时变方差阈值的确定方法; 其次采用系统失真信号功率定量刻画攻击信号造成系统性能损失程度, 理论证明了系统失真信号功率上界; 在此基础上考虑最坏情况下攻击能够躲过检测, 基于水印信号与其它混合信号相互独立性新增第三检测式, 同时理论证明了系统失真信号功率上界进一步受限范围, 进而提升不确定系统的安全性; 最后仿真算例验证了所提方法的有效性和可行性.
文本无关说话人识别中句级特征提取方法研究综述
陈晨, 韩纪庆, 陈德运, 何勇军
当前状态:  doi: 10.16383/j.aas.c200521
[摘要](75) [HTML全文](41) [PDF 2135KB](18)
摘要:
句级 (Utterance-level) 特征提取是文本无关说话人识别领域中的重要研究方向之一. 与只能刻画短时语音特性的帧级 (Frame-level) 特征相比, 句级特征中包含了更丰富的说话人个性信息; 且不同时长语音的句级特征均具有固定维度, 更便于与大多数常用的模式识别方法相结合. 近年来, 句级特征提取的研究取得了很大的进展, 鉴于其在说话人识别中的重要地位, 本文将对近期具有代表性的句级特征提取方法与技术进行整理与综述, 并分别从前端处理、基于任务分段式与驱动式策略的特征提取方法, 以及后端处理4方面进行论述, 最后还将对未来的研究趋势展开探讨与分析.
基于深度学习初始位姿估计的机器人摄影测量视点规划
姜涛, 崔海华, 程筱胜, 田威
当前状态:  doi: 10.16383/j.aas.c200255
[摘要](75) [HTML全文](75) [PDF 2290KB](20)
摘要:
针对机器人摄影测量中离线规划受初始位姿标定影响的问题, 提出融合初始位姿估计的机器人摄影测量系统视点规划方法. 首先构建基于YOLO的深度学习网络估计被测对象3D包围盒, 利用PNP算法快速求解对象姿态; 然后随机生成机器人无奇异无碰撞的视点, 基于相机成像的2D-3D正逆性映射, 根据深度原则计算每个视角下目标可见性矩阵; 最后, 引入熵权法, 以最小化重建信息熵为目标建立优化模型, 并基于TSP模型规划机器人路径. 结果表明: 利用深度学习估计的平移误差低于5 mm, 角度误差低于2°. 考虑熵权的视点规划方法提高了摄影测量质量, 融合深度学习初始姿态的摄影测量系统提高了重建效率. 利用本算法对典型零件进行摄影测量质量和效率的验证, 均获得优异的位姿估计和重建效果. 提出的算法适用于实际工程应用, 尤其是快速稀疏摄影重建, 促进了工业摄影测量速度与自动化程度提升.
基于改进CycleGAN的水下图像颜色校正与增强
李庆忠, 白文秀, 牛炯
当前状态:  doi: 10.16383/j.aas.c200510
[摘要](226) [HTML全文](82) [PDF 1467KB](24)
摘要:
针对水下观测图像的颜色失真和散射模糊问题, 提出一种基于改进循环一致性生成对抗网络(Cycle-consistent generative adversarial networks, CycleGAN)的水下图像颜色校正与增强算法. 为了利用CycleGAN学习水下降质图像到空气中图像的映射关系, 对传统CycleGAN的损失函数进行了改进, 提出了基于图像强边缘结构相似度(Strong edge and structure similarity, SESS)损失函数的SESS-CycleGAN, SESS-CycleGAN可以在保留原水下图像的边缘结构信息的前提下实现水下降质图像的颜色校正和对比度增强. 为了确保增强后图像和真实脱水图像颜色的一致性, 建立了SESS-CycleGAN和正向生成网络G相结合的网络结构; 并提出了两阶段学习策略, 即先利用非成对训练集以弱监督方式进行SESS-CycleGAN学习, 然后再利用少量成对训练集以强监督方式进行正向生成网络G的监督式学习. 实验结果表明: 本文算法在校正水下图像颜色失真的同时还增强了图像对比度, 且较好地实现了增强后图像和真实脱水图像视觉颜色的一致性.
分级特征反馈融合的深度图像超分辨率重建
张帅勇, 刘美琴, 姚超, 林春雨, 赵耀
当前状态:  doi: 10.16383/j.aas.c200542
[摘要](76) [HTML全文](28) [PDF 7664KB](6)
摘要:
受采集装置的限制, 采集的深度图像存在分辨率较低、易受噪声干扰等问题. 本文提出了分级特征反馈融合网络 (Hierarchical Feature Feedback Network, HFFN), 以实现深度图像的超分辨率重建. 该网络利用金字塔结构挖掘深度-纹理特征在不同尺度下的分层特征, 构建深度-纹理的分层特征表示. 为了有效利用不同尺度下的结构信息, 本文设计了一种分级特征的反馈式融合策略, 综合深度-纹理的边缘特征, 生成重建深度图像的边缘引导信息, 完成深度图像的重建过程. 与对比方法相比, 实验结果表明本文方法实现了深度图像的主、客观质量的提升.
基于海马体位置细胞的认知地图构建与导航
阮晓钢, 柴洁, 武悦, 张晓平, 黄静
当前状态:  doi: 10.16383/j.aas.c190288
[摘要](64) [HTML全文](32) [PDF 2126KB](13)
摘要:
针对移动机器人环境认知问题, 受老鼠海马体位置细胞在特定位置放电的启发, 构建动态增减位置细胞认知地图模型DGP-PCCMM(Dynamic growing and pruning place cells-based cognitive map model), 使机器人在与环境交互的过程中自组织构建认知地图, 进行环境认知. 初始时刻, 认知地图由初始点处激活的位置细胞构成; 随着与环境的交互, 逐渐得到不同位置点处激活的位置细胞, 并建立其之间的连接关系, 实现认知地图的动态增长; 如果机器人在已访问区域发现新的障碍物, 利用动态缩减机制对认知地图进行更新. 此外, 提出一种位置细胞序列规划算法, 该算法以所构建的认知地图作为输入, 进行位置细胞序列规划, 实现机器人导航. 为验证模型的正确性和有效性, 对Tolman的经典老鼠绕道实验进行再现. 实验结果表明, 本文模型能使机器人在与环境交互的过程中动态构建并更新认知地图, 能初步完成对Tolman老鼠绕道实验的再现. 此外, 进行了与四叉树栅格地图、动态窗口法的对比实验和与其他认知地图模型的讨论分析. 结果表明了本文方法在所构建地图的简洁性、完整性和对动态障碍适应性方面的优势.
稀缺资源语言神经网络机器翻译研究综述
李洪政, 冯冲, 黄河燕
当前状态:  doi: 10.16383/j.aas.c200103
[摘要](125) [HTML全文](207) [PDF 1000KB](12)
摘要:
作为目前主流翻译方法的神经网络机器翻译已经取得了很大突破, 在很多具有丰富数据资源的语言上的翻译质量也不断得到改善, 但对于稀缺资源语言的翻译效果却仍然并不理想. 稀缺资源语言机器翻译是目前机器翻译领域的重要研究热点之一, 近几年来吸引了国内外的广泛关注. 本文对稀缺资源语言机器翻译的研究进行比较全面的回顾, 首先简要介绍了与稀缺资源语言翻译相关的学术活动和数据集, 然后重点梳理了目前主要的研究方法和一些研究结论, 总结了每类方法的特点, 在此基础上总结了不同方法之间的关系并分析了目前的研究现状. 最后, 对稀缺资源语言机器翻译未来可能的研究趋势和发展方向进行了展望,并给出了相关建议.
基于草图纹理和形状特征融合的草图识别
张兴园, 黄雅平, 邹琪, 裴艳婷
当前状态:  doi: 10.16383/j.aas.c200070
[摘要](41) [HTML全文](37) [PDF 1624KB](10)
摘要:
人类具有很强的草图识别能力. 然而, 由于草图具有稀疏性和缺少细节的特点, 目前的深度学习模型在草图分类任务上仍然面临挑战. 目前的工作只是将草图看作灰度图像而忽略了不同草图类别间的形状表示差异. 本文提出一种端到端的手绘草图识别模型, 简称双模型融合网络(Dual-Model Fusion Network, DMF-Net), 它可以通过相互学习策略获取草图的纹理和形状信息. 具体来说, 该模型由两个分支组成: 一个分支能够从图像表示(即原始草图)中自动提取纹理特征, 另一个分支能够从图形表示(即基于点的草图)中自动提取形状特征. 此外, 提出视觉注意一致性损失来度量两个分支之间视觉显著图的一致性, 这样可以保证两个分支关注相同的判别性区域. 最终将分类损失、类别一致性损失和视觉注意一致性损失结合完成DMF-Net网络的优化. 本文在两个具有挑战性的数据集TU-Berlin数据集和Sketchy数据集上进行草图分类实验, 评估结果说明了DMF-Net显著优于基准方法并达到最佳性能.
基于“雁阵效应”的扑翼飞行机器人高效集群编队研究
尹曌, 贺威, 邹尧, 穆新星, 孙长银
当前状态:  doi: 10.16383/j.aas.c190900
[摘要](155) [HTML全文](64) [PDF 2809KB](23)
摘要:
本文借鉴“雁阵效应”, 研究了扑翼飞行机器人高效集群编队飞行问题. 通过对“V”字雁阵的分析得知, 当前排大雁(简称头雁)和后排大雁(简称从雁)保持某一合适的相对位置偏移时, 后排大雁可有效利用前排大雁挥翅产生的上洗涡流, 从而节省体能; 并且, 雁阵通过阵型的变换, 可以实现能量整体消耗的均衡性, 确保长航时飞行. 仿照该“雁阵效应”, 分析得出耗能最少的扑翼飞行机器人集群阵型排布方式, 并设计了阵型变换机制, 实现集群能量整体消耗的最优性和均衡性. 在此基础上, 参考雁群的交互方式, 设计了一种使用局部信息的控制方法, 保证最优阵型的稳定维持以及阵型间的灵活变换. 最后, 仿真结果验证了所提理论结果的有效性.
基于USARSim和ROS的无人平台编队仿真系统
张浩杰, 苏治宝, 杨甜甜
当前状态:  doi: 10.16383/j.aas.c200102
[摘要](183) [HTML全文](58) [PDF 1571KB](26)
摘要:
针对越野非结构化环境下的地面无人平台(Unmanned Ground Vehicle, UGV)编队仿真系统存在功能模块不完善及算法集成测试困难等问题, 为便于有效测试地面无人平台编队协同控制方法性能及其适用的任务场景, 降低编队协同系统的开发成本, 本文提出了一种基于Unified System for Automation and Robotics Simulator(USARSim)和Robot Operating System(ROS)的地面无人平台编队协同仿真系统. 该仿真系统由人机交互界面、基于ROS架构的地面无人平台控制系统和基于USARSim的虚拟仿真场景三个部分组成, 其测试对象为地面无人平台编队协同控制算法. 通过充分利用ROS中集成的开源导航算法和USARSim中丰富的机器人及环境模型, 该系统为研究地面无人平台编队协同控制算法提供了新的思路和快速验证工具. 以领航者-跟随者编队控制方法为例进行该仿真系统的性能测试, 实验结果表明, 该仿真系统能够在外界条件一致的情况下完成对编队协同控制方法的性能测试, 系统稳定可靠.
基于篇章的汉语句法结构树库构建
卢露, 矫红岩, 李梦, 荀恩东
当前状态:  doi: 10.16383/j.aas.c190828
[摘要](53) [HTML全文](15) [PDF 1158KB](2)
摘要:
为快速构建一个大规模、多领域的高质树库, 本文提出一种基于短语功能与句法角色的组块的、便于标注多层次结构的标注体系, 在篇章中综合利用标点、句法结构、表述功能作为句边界判断标准, 确立合理的句边界与层次; 在句子中以组块的句法功能为主, 参考篇章功能、人际功能, 以4个性质标记、8个功能标记、4个句标记来描写句中3类5种组块, 标注基本句型骨架, 突出中心词信息. 目前已初步构建有质量保证的千万汉字规模的浅层结构分析树, 包含60余万小句的9千余条句型结构库, 语料涉及百科、新闻、专利等应用领域文本1万余篇; 与此同时也探索了高效的标注众包管理模式.
基于轻量化重构网络的表面缺陷视觉检测
余文勇, 张阳, 姚海明, 石绘
当前状态:  doi: 10.16383/j.aas.c200535
[摘要](360) [HTML全文](96) [PDF 1830KB](39)
摘要:
基于深度学习的方法在某些工业产品的表面缺陷识别和分类方面表现出优异的性能, 然而大多数工业产品缺陷样本稀缺, 而且特征差异大, 导致这类需要大量缺陷样本训练的检测方法难以适用. 本文提出一种基于重构网络的无监督缺陷检测算法(Reconstruction network for defects detection, ReNet-D), 仅使用容易大量获得的无缺陷样本数据实现对异常缺陷的检测. 本文提出的算法包括两个阶段: 图像重构网络训练阶段和表面缺陷区域检测阶段. 训练阶段通过一种轻量化结构的全卷积自编码器设计重构网络, 仅使用少量正常样本进行训练, 使得重构网络能够生成无缺陷重构图像, 进一步提出一种结合结构性损失和L1损失的函数作为重构网络的损失函数, 解决自编码器检测算法对不规则纹理表面缺陷检测效果较差的问题; 缺陷检测阶段以重构图像与待测图像的残差作为缺陷的可能区域, 通过常规图像操作即可实现缺陷的定位. 本文对所提出的ReNet-D方法的网络结构、训练像素块(patch)大小、损失函数系数等影响因素进行了详细的实验分析, 并在多个缺陷图像样本集上与其他同类算法做了对比, 结果表明ReNet-D有较强的鲁棒性和准确性. 由于ReNet-D的轻量化结构, 检测1024x1024像素大小的图像仅仅耗时2.82 ms, 适合工业在线检测.
执行机构带宽对动态逆方法的影响及解决方案
程艳青, 朱纪洪
当前状态:  doi: 10.16383/j.aas.c190236
[摘要](55) [HTML全文](15) [PDF 5372KB](5)
摘要:
本文从理论上分析了执行机构带宽对动态逆闭环控制系统动态特性影响, 发现较低的执行机构带宽会在伪线性系统中引入一个非线性干扰项, 为此提出了两种方法来消除这个非线性干扰项, 一个是采用参考模型的思想设计补偿器提高执行机构子系统的等效带宽, 另一个思路则是直接在非线性反馈项中引入补偿直接对消非线性干扰项. 仿真结果表明, 两类方法都能较好的消除非线性干扰项, 直接补偿方法能精确消除干扰项, 但需要准确动力学模型, 提高等效带宽的方法虽然是近似的, 但能方便的引入自适应算法, 可以抑制执行机构模型参数不确定的影响.
一种基于深度迁移学习的滚动轴承早期故障在线检测方法
毛文涛, 田思雨, 窦智, 张迪, 丁玲
当前状态:  doi: 10.16383/j.aas.c190593
[摘要](126) [HTML全文](41) [PDF 1976KB](24)
摘要:
近年来, 深度学习技术已在滚动轴承故障检测和诊断领域取得了成功应用, 但面对不停机情况下的早期故障在线检测问题, 仍存在着早期故障特征表示不充分、误报警率高等不足. 为解决上述问题, 本文从时序异常检测的角度出发, 提出了一种基于深度迁移学习的早期故障在线检测方法. 首先, 提出一种面向多域迁移的深度自编码网络, 通过构建具有改进的最大均值差异正则项和Laplace正则项的损失函数, 在自适应提取不同域数据的公共特征表示同时, 提高正常状态和早期故障状态之间特征的差异性; 基于该特征表示, 提出一种基于时序异常模式的在线检测模型, 利用离线轴承正常状态的排列熵值构建报警阈值, 实现在线数据中异常序列的快速匹配, 同时提高在线检测结果的可靠性. 在XJTU-SY数据集上的实验结果表明, 与现有代表性早期故障检测方法相比, 本文方法具有更好的检测实时性和更低的误报警数.
基于注意力机制的协同卷积动态推荐网络
汤文兵, 任正云, 韩芳
当前状态:  doi: 10.16383/j.aas.c190820
[摘要](81) [HTML全文](42) [PDF 1132KB](12)
摘要:
一直以来, 各种推荐系统关注于如何挖掘用户与物品特征间的潜在关联, 特征信息的充分利用有利于用户到物品的精准匹配. 基于矩阵分解和分解机的推荐算法是该领域的主流, 前者学习用户历史行为而后者分析对象特征关系, 但都难以兼顾用户行为与个体特征. 而近年来, 深度神经网络凭借其强大的特征学习能力和灵活可变的结构被应用到了推荐系统领域. 鉴于此, 本文提出了一种基于注意力机制的协同卷积动态推荐网络, 它通过注意力机制实现用户历史行为、用户画像与物品属性的多重交互, 再通过卷积网络逐层捕捉更高阶的特征交互. 网络同时接受不同组块输出的低阶至高阶信息, 最后给出用户对指定物品青睐评分概率的预估. 而且本文还提出了一种基于无参时间衰减的用户兴趣标签来量化用户关注的变化. 通过比较若干先进模型在两个现实数据集的表现, 本文设计的动态推荐模型不但能够缓解推荐时滞性, 还能明显提高推荐质量, 为用户带来更好的个性化服务体验.
深度EM胶囊网络全重叠手写数字识别与分离
姚红革, 董泽浩, 喻钧, 白小军
当前状态:  doi: 10.16383/j.aas.c190849
[摘要](59) [HTML全文](31) [PDF 2874KB](8)
摘要:
基于胶囊网络的向量神经元思想和EM算法, 本文设计了一种以EM为向量聚类算法的深度胶囊网络, 实现了重叠手写数字的识别与分离. 该网络由两部分组成, 第一部分使用两个卷积层、两个基础胶囊层、两个EM聚类胶囊层构成六层网络结构. 其将胶囊维数由常规的8维扩充为16维, 并利用姿态转换矩阵实现低级特征到高级特征的预测, 同时将EM算法改为EM向量聚类算法, 以替换原胶囊网络中的迭代路由部分, 优化了网络的运算过程, 实现了重叠目标识别. 第二部分是重构网络部分, 由结构完全相同的两个并行网络组成, 对双向量进行并行重构, 实现了重叠目标的分离. 实验结果显示, 对于100%全重叠手写数字图片本网络识别率达到了96%, 对比现有的胶囊网络CapsNet在80%的重叠率下95%的识别率, 在100%的重叠率下88%的识别率, 本文网络在难度提升的情况下, 识别率有明显提高, 能够将完全叠加的两张手写数字图片进行准确地分离.
基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别
周平, 刘记平, 梁梦圆, 张瑞垚
当前状态:  doi: 10.16383/j.aas.c180579
[摘要](55) [HTML全文](30) [PDF 2339KB](4)
摘要:
作为钢铁冶金制造的核心工序, 高炉炼铁是典型的高能耗过程, 其运行能耗约占钢铁总能耗的50%以上, 这 其中80%的能耗是焦炭和煤粉等燃料消耗. 因此, 对表征高炉燃料消耗的燃料比参数进行监测, 并尽可能早地 识别影响燃料比异常波动的关键因素, 对于高炉炼铁过程的节能降耗具有重要意义. 本文针对先验故障知识少的 高炉燃料比监测与异常识别难题, 提出一种基于核偏最小二乘(Kernel partial least squares, KPLS)鲁棒重构误差的故障识别方法. 该方法首先 建立过程变量与监测变量的KPLS监测模型, 然后根据非线性映射空间的协方差矩阵和核空间Gram矩阵之间的关系, 反向估计原始空间变量的正常估值. 为了增强算法的鲁棒性, 采用迭代去噪算法减少异常数据对原始空间正常估值的影响. 通过利用原始空间正常估值和真实值来构造故障识别指标, 并给出故障识别指标的控制限. 基于实际工业数据的高炉数据试验表明所提方法不仅可以监测出正常工况下影响燃料比异常变化的潜在因素, 还可识别出异常工况下影响燃料比异常变化的关键因素, 具有很好的工程应用前景.
基于蠕虫传播和FDI的电力信息物理协同攻击策略
冯晓萌, 孙秋野, 王冰玉, 高嘉文
当前状态:  doi: 10.16383/j.aas.c190574
[摘要](65) [HTML全文](41) [PDF 1857KB](9)
摘要:
随着信息技术与现代电力系统的结合日趋紧密, 通信系统异常和网络攻击均可能影响到电力系统的安全稳定运行. 为了研究工控蠕虫病毒对电网带来的安全隐患, 本文首次建立了基于马尔科夫决策过程(Markov Decision Process, MDP)的电力信息物理系统跨空间协同攻击模型, 该模型同时考虑通信设备漏洞被利用的难易程度为代价以及对电力网络的破坏程度为收益两方面因素, 能够更有效的识别系统潜在风险. 其次, 采用Q学习算法求解在该模型下的最优攻击策略, 并依据电力系统状态估计的误差值来评定该攻击行为对电力系统造成的破坏程度. 最后, 本文在通信8节点-电力14节点的耦合系统上进行联合仿真, 对比结果表明相较单一攻击方式, 协同攻击对电网的破坏程度更大. 与传统的不考虑通信网络的电力层攻击研究相比, 本模型辨识出的薄弱节点也考虑了信息层的关键节点的影响, 对防御资源的分配有指导作用.
一种基于UDP的电力广域保护系统可靠通信方法
袁凯, 李俊娥, 刘开培, 陆秋余, 倪明, 罗剑波
当前状态:  doi: 10.16383/j.aas.c180641
[摘要](41) [HTML全文](13) [PDF 1274KB](0)
摘要:
电力广域保护系统从点到点通信逐步走向网络化通信, 如何在拥塞状态下保障业务的实时性和可靠性, 成为亟待解决的问题. 针对TCP不能保障实时性和UDP不能保障可靠性的问题, 本文提出一种联合应用层纠错、检错和重发机制的UDP传输方案, 在提供低时延传输服务的同时也能保障报文的可靠性. 考虑到算法的复杂性, 选择本原BCH码作为纠错编码算法, 设计了编码分组方法, 并通过实验验证了分组方法的正确性; 对增加纠错机制后的报文实时性进行了理论分析和仿真验证; 为了解决突发误码和丢包情况下的可靠性问题, 进一步设计了应用层检错和重发机制, 并分析了时延. 分析表明, 在应用层增加本文所设计的纠错、检错和重发机制后增加的时延几乎可以忽略不计. 最后给出了所提方法的联合应用算法并进行了可靠性分析, 结果表明本文方案的可靠性高于其他UDP传输方案.
基于改进型自主发育网络的机器人场景识别方法
余慧瑾, 方勇纯
当前状态:  doi: 10.16383/j.aas.c180779
[摘要](107) [HTML全文](20) [PDF 1226KB](8)
摘要:
场景识别是移动机器人在陌生动态环境中完成任务的前提. 考虑到现有方法的不足, 本文提出了一种基于改进型自主发育网络的场景识别方法, 它通过引入基于多优胜神经元的Top-k竞争机制、基于负向学习的权值更新、基于连续性样本的加强型学习等步骤实现对场景的快速识别, 并使该方法具有更好的适应能力. 对于这种基于改进型自主发育网络的场景识别方法, 通过实验进行了对比测试. 结果表明, 这种改进型自主发育神经网络节点利用率高, 场景识别准确可靠, 可以较好地满足机器人作业的实际需求.
多聚点子空间下的时空信息融合及其在行为识别中的应用
杨天金, 侯振杰, 李兴, 梁久祯, 宦娟, 郑纪翔
当前状态:  doi: 10.16383/j.aas.c190327
[摘要](93) [HTML全文](17) [PDF 1620KB](2)
摘要:
基于深度图序列的人体行为识别, 一般通过提取特征图来提高识别精度, 但这类特征图通常存在时序信息缺失的问题. 针对上述问题, 本文提出了一种新的深度图序列表示方式, 即深度时空图(Depth Space Time Maps, DSTM), 该算法降低了特征图的冗余度, 弥补了时序信息缺失的问题. 本文通过融合空间信息占优的Depth Motion Maps (DMM) 与时序信息占优的DSTM, 进行高精度的人体行为研究. 提出了一种名为多聚点子空间学习Multi-Center Subspace Learning (MCSL)的多模态数据融合算法. 该算法为各类别数据构建了多个投影聚点,以此增大了样本的类间距离, 降低了投影目标区域维度. 本文在MSR-Action3D深度数据集和UTD-MHAD深度数据集上进行人体行为识别最后实验结果表明, 本文方法相较于现有人体行为识别方法有着较高的识别率.
基于RCNN-LSTM的脑电情感识别研究
柳长源, 李文强, 毕晓君
当前状态:  doi: 10.16383/j.aas.c190357
[摘要](109) [HTML全文](35) [PDF 1024KB](18)
摘要:
情感作为人脑的高级功能, 对人们的个性特征和心理健康有很大的影响, 利用网上公开的脑电情感数据库(Deap数据库), 根据心理效价和激励唤醒度等级进行情感划分, 对压力和平静等五种情感进行研究分析. 针对脑电信号时空特征结合的特点, 把深度学习中的卷积神经网络(Convolutional neural networks, CNN)和长短期记忆网络(Long short term memory, LSTM)两者作为基本前提, 并在此基础之上设计了一个RCNN-LSTM的脑电情感信号分类模型. 利用循环卷积神经网络(Recurrent convolutional neural network, RCNN)自动提取脑电信号中的抽象特征, 省去了人工选择与降维的过程, 然后结合LSTM网络对脑电情感信号进行分类识别. 实验结果表明, 利用该方法对5种情感类别的平均分类识别率达到了96.63%, 证明了该方法的有效性.
具有输入约束和输出噪声的不确定系统级联线性自抗扰控制
高阳, 吴文海, 王子健
当前状态:  doi: 10.16383/j.aas.c190305
[摘要](45) [HTML全文](23) [PDF 1474KB](23)
摘要:
针对一类具有输入约束和输出噪声的SISO不确定非线性系统, 提出了一种基于误差补偿和工程滤波的抗饱和级联线性自抗扰控制(LADRC)方法. 首先针对高频量测噪声, 分析了线性扩张状态观测器(LESO)对噪声的放大机理及其与观测器增益的定量关系, 进而设计了一种基于工程滤波器的级联LADRC方法, 在滤除噪声的同时有效补偿了因滤波所造成的输出幅值和相位损失, 确保了闭环系统的跟踪精度. 然后继续考虑输入饱和的问题, 利用LADRC的实时估计/补偿能力, 通过将饱和差值信号引入LESO, 设计了一种基于误差补偿的抗饱和LADRC方法, 有效减小了系统设计控制量, 避免了系统长时间陷入饱和. 通过实时仿真比较, 验证了所提出方法的有效性.
OTH雷达图像的粗糙度指标及用于射频干扰自适应抑制
罗忠涛, 郭人铭, 郭杰, 何子述, 卢琨
当前状态:  doi: 10.16383/j.aas.c190286
[摘要](27) [HTML全文](18) [PDF 3042KB](1)
摘要:
针对OTH雷达距离-多普勒(Range-Doppler, RD)图, 本文首次提出采用纹理粗糙度作为RD图质量的评价指标, 即计算RD图所转化灰度图的Tamura纹理粗糙度. 分析表明, 粗糙度指标能准确反映RD图受干扰情况, 对于不同灰度转换函数具有稳健性. 作为应用举例, 本文将图像粗糙度用于改进射频干扰抑制算法, 使干扰抑制达到自适应优化. 实验结果表明, Tamura粗糙度能够正确反映RD图干扰抑制情况, 优化粗糙度指标能够使干扰抑制自适应达到最优.
基于GPR和深度强化学习的分层人机协作控制
金哲豪, 刘安东, 俞立
当前状态:  doi: 10.16383/j.aas.c190451
[摘要](50) [HTML全文](25) [PDF 1621KB](18)
摘要:
本文提出了一种基于高斯过程回归(Gaussian Process Regression, GPR)与深度强化学习(Deep Reinforcement Learning, DRL)的分层人机协作(Human-Robot Collaborative, HRC)控制方法, 并以人机协作控制球杆系统为例检验该方法的高效性. 本文的主要贡献是: 1)在模型未知的情况下, 采用DRL算法设计了一种有效的非线性次优控制策略, 并将其作为顶层期望控制策略以引导HRC控制过程, 解决了传统控制方法无法直接应用于模型未知人机协作场景的问题; 2) 针对HRC过程中人未知和随机控制策略带来的不利影响, 采用GPR拟合人体控制策略以建立机器人对人控制行为的认知模型, 在减弱该不利影响的同时提升机器人在协作过程中的主动性, 从而进一步提升协作效率; 3)利用所得认知模型和期望控制策略设计机器人末端速度的控制律, 并通过实验对比验证了所提方法的有效性.
基于局部空间信息的可变类模糊阈值光学遥感图像分割
杨蕴, 李玉, 赵泉华
当前状态:  doi: 10.16383/j.aas.c190412
[摘要](42) [HTML全文](18) [PDF 2446KB](8)
摘要:
阈值法分割在光学遥感图像分析中被得到广泛的应用, 然而传统阈值法也存在诸多局限性, 如对噪声敏感, 需人为设定类别数, 计算复杂度高等. 针对传统阈值法的局限性, 提出一种基于局部空间信息的可变类模糊阈值光学遥感图像分割方法. 首先, 以图像光谱的一阶矩为初始类中心, 利用二分法原理和区域间最大相似度准则来快速确定类别数及其中心. 然后, 通过岭形模糊隶属函数计算各像素点对不同类的隶属程度, 同时考虑到像素点的隶属度局部空间信息, 在隶属度域中定义一个模糊加权滤波器对各类的隶属度矩阵进行滤波, 以滤波后的隶属度集合为依据, 按照最大隶属原则确定图像的标号场. 最后, 对标号场中的局部异常标号进行替换, 将修正后的标号场由对应的类中心赋色得到分割图像. 视觉和统计分析评价结果表明, 与传统阈值法相比, 该方法能在减少计算时间的同时获得更好的分割结果, 可适用于光学遥感图像的多阈值分割.
具有间歇性执行器故障的非线性系统自适应CFB控制
乃永强, 杨清宇, 周文兴, 杨莹
当前状态:  doi: 10.16383/j.aas.190673
[摘要](48) [HTML全文](31) [PDF 3111KB](30)
摘要:
控制系统的执行器在运行过程中经常发生各种各样不可预测的间歇性故障. 如何有效地处理这些故障仍然是控制领域的一个难题. 针对一类不确定严格反馈非线性系统, 提出一种自适应CFB (Command Filtered Backstepping) 控制方案解决了间歇性执行器故障的补偿问题. 利用神经网络逼近控制器中的未知函数, 并采用投影算子实时在线更新控制器中的估计参数使得参数估计随着故障次数的累积而不断增加的问题被消除. 考虑到未知参数间歇性跳变对系统稳定性的影响, 提出一种改进的Lyapunov函数分析了闭环系统的稳定性. 证明了所提出的控制方案能够保证所有闭环信号的有界性, 同时建立了跟踪误差与Lyapunov函数跳变幅度, 最小故障时间间隔, 设计参数之间的关系. 如果Lyapunov函数的跳变幅度越小以及两个连续故障之间的时间间隔越长, 系统的稳态跟踪指标越好. 通过迭代计算建立了暂态跟踪误差指标的均方根型界. 该界表明了通过选择恰当的设计参数, 可改善系统的暂态指标. 仿真结果表明了所提方案的有效性.
基于样本特征解码约束的GANs
陈泓佑, 陈帆, 和红杰, 朱翌明
当前状态:  doi: 10.16383/j.aas.c190496
[摘要](45) [HTML全文](15) [PDF 1559KB](7)
摘要:
生成式对抗网络(Generative Adversarial Networks, GANs)是一种有效模拟训练数据分布的生成模型, 其训练的常见问题之一是优化JS散度(Jensen-Shannon divergence)时可能产生梯度消失问题(Vanishing gradient problem). 针对该问题, 本文提出了一种解码约束条件下的GANs, 以尽量避免JS散度近似为常数而引发梯度消失现象, 从而提高生成图像的质量. 首先利用U-Net结构的自动编码机学习出与用于激发生成器的随机向量同维度的训练样本网络中间层特征. 然后在每次对抗训练前使用本文设计的解码约束条件训练解码器. 其中, 解码器与生成器结构