集群是鱼类生物中一种常见的现象, 特定编队的集群运动可以显著提高鱼群的游动效率. 鱼集群游动节能机理的研究为机器人集群编队设计和控制提供启发与帮助, 得到了研究人员的广泛关注. 本文介绍了鱼集群游动节能机理研究的主要方法及最新的研究成果, 将研究方法分为鱼群观察分析法、计算流体力学仿真法和实验装置研究法, 并基于此对近些年的研究成果进行了综述和分析, 最后列举了鱼集群游动节能机理研究的主要问题与未来发展方向.
Wiener在控制论(Cybernetics)中强调了两大类控制对象: 机器与动物. 半个世纪以来, 机器控制领域已形成一套较为完备且先进的控制理论, 而在生物控制方面, 由于生物系统的特殊性和复杂性, 对生命的基本组成单位—细胞的控制仍然进展缓慢. 近年来, 随着合成生物学技术的发展, 基于细胞—计算机交互的胞外控制手段开始引起研究者们的关注, 为细胞控制带来了前所未有的机遇. 胞机交互的方式能够适应生物系统的特殊性, 发挥计算机控制的优势, 实现细胞的自动化实时控制, 为人类研究细胞内部基因调控机制与其他各项生命活动提供了大量的数据与方法支持. 本文根据目前基于胞机交互的细胞控制工作, 归纳与总结了胞机交互中常用的生物学工具以及控制算法, 分析了细胞控制的特殊性与难点, 指出研究实现细胞智能控制的可行性与重要性.
流程工业是制造业的重要组成部分, 是国民经济发展的重要基础, 主要包括化工、冶金、石化等行业, 其安全高效的生产对国家而言具有重要的战略意义. 然而, 流程工业物理化学变化反应复杂、流程间能质流严重耦合、多目标冲突、在线实验风险大, 给生产流程系统建模与高效协同优化带来极大困难, 严重制约了生产质量和资源利用率的进一步提升. 随着信息技术与人工智能的发展, 建立虚实结合、协同优化运行的流程工业数字孪生生产线所需技术逐渐成熟, 其在流程工业的应用价值与潜力日益凸显. 本文首先阐述数字孪生在流程工业应用的必要性与重要性, 并通过边界定义法将数字孪生与信息物理系统(Cyber-physical system, CPS)、工业互联网等概念进行对比分析,从而明确数字孪生的基本内涵与功能边界. 其次描述流程工业抽象模型和数字孪生理论模型间的映射关系, 并分析了如何用数字孪生技术解决流程工业系统建模与高效协同优化的瓶颈问题. 最后, 从数字孪生系统构建的角度探讨数字孪生发展的关键技术, 并以一条炼铁生产线为例, 展示数字孪生技术在实际工业中的应用解决方案.
信息时代产生的大量数据使机器学习技术成功地应用于许多领域. 大多数机器学习技术需要满足训练集与测试集独立同分布的假设, 但在实际应用中这个假设很难满足. 域适应是一种在训练集和测试集不满足独立同分布条件下的机器学习技术. 一般情况下的域适应只适用于源域目标域特征空间与标签空间都相同的情况, 然而实际上这个条件很难满足. 为了增强域适应技术的适用性, 复杂情况下的域适应逐渐成为研究热点, 其中标签空间不一致和复杂目标域情况下的域适应技术是近年来的新兴方向. 随着深度学习技术的崛起, 深度域适应已经成为域适应研究领域中的主流方法. 本文对一般情况与复杂情况下的深度域适应的研究进展进行综述, 对其缺点进行总结, 并对其未来的发展趋势进行预测. 首先对迁移学习相关概念进行介绍, 然后分别对一般情况与复杂情况下的域适应、域适应技术的应用以及域适应方法性能的实验结果进行综述, 最后对域适应领域的未来发展趋势进行展望并对全文内容进行总结.
在计算机视觉领域, 全景分割是一个新颖且重要的研究主题, 它是机器感知、自动驾驶等新兴前沿技术的基石, 具有十分重要的研究意义. 本文综述了基于深度学习的全景分割研究的最新进展, 首先总结了全景分割任务的基本处理流程, 然后对已发表的全景分割工作基于其网络结构特点进行分类, 并进行了全面的介绍与分析, 最后对全景分割任务目前面临的问题以及未来的发展趋势做出了分析, 并针对所面临的问题提出了一些切实可行的解决思路.
随着5G商用规模部署、下一代互联网IPv6的深化应用, 新一代网络技术的发展引发产业界的关注. 网络的智能化被认为是新一代网络发展的趋势. 网络为数字化社会的信息传输提供了基础, 而网络本身的数字化是智能化发展的先决条件. 面向数字化、智能化的新一代网络发展目标, 本文首次系统化提出了 “数字孪生网络(DTN: Digital twin network)” 的概念, 给出了系统架构设计, 分析了DTN的关键技术. 通过对DTN发展挑战的分析, 本文指出了未来 “数字孪生网络” 的发展方向.
无纺布生产过程中产生的疵点会严重影响产品质量并限制生产效率. 提高疵点检测的自动化程度对于无纺布的生产效率和质量管控至关重要. 传统疵点检测方法难以应对纹理、疵点类型以及环境变化等问题, 限制了其应用范围. 近年来基于卷积神经网络的方法在疵点检测领域得到了广泛应用, 具有泛化性强、准确度高的特点. 但是在无纺布生产过程中, 布匹宽度大、速度快的特点会产生大量图像数据, 基于卷积神经网络的方法难以实现实时检测. 针对上述难题, 本文提出了一种基于最大稳定极值区域分析与卷积神经网络协同的疵点实时检测方法, 并设计了分布式计算处理架构应对数据流过大的问题. 在实际生产部署应用中, 本文所设计的系统与算法无需使用专用计算硬件(GPU、FPGA等), 通过8台工控机与16路工业摄像头对复卷机上布宽2.8 m、速度30 m/min的无纺布进行分布式实时在线检测, 大幅度提高无纺布生产中疵点检测的自动化程度与效率. 本文所提出的系统能够实现对0.3 mm以上疵点召回率100%, 对0.1 mm丝状疵点召回率98.8%.
区块链技术是一种新兴技术, 它具备防篡改、去中心化、分布式存储等特点, 可以有效地解决现有数据共享模型中隐私安全、用户控制权不足以及单点故障问题. 本文以电子病历(Electronic health record, EHR)共享为例提出一种基于集成信用度评估智能合约的数据共享访问控制模型, 为患者提供可信EHR共享环境和动态访问控制策略接口. 实验表明所提模型有效解决了患者隐私安全和对EHR控制权不足的问题. 同时就模型的特点、安全性以及性能进行了分析.
双流卷积神经网络能够获取视频局部空间和时间特征的一阶统计信息, 测试阶段将多个视频局部特征的分类器分数平均作为最终的预测. 但是, 一阶统计信息不能充分建模空间和时间特征分布, 测试阶段也未考虑使用多个视频局部特征之间的更高阶统计信息. 针对这两个问题, 本文提出一种基于二阶聚合的视频多阶信息融合方法. 首先, 通过建立二阶双流模型得到视频局部特征的二阶统计信息, 与一阶统计信息形成多阶信息. 其次, 将基于多阶信息的视频局部特征分别进行二阶聚合, 形成高阶视频全局表达. 最后, 采用两种策略融合该表达. 实验表明, 本文方法能够有效提高行为识别精度, 在HMDB51和UCF101数据集上的识别准确率比双流卷积神经网络分别提升了8 % 和2.1 %, 融合改进的密集点轨迹(Improved dense trajectory, IDT) 特征之后, 其性能进一步提升.
城市污水处理过程(Municipal wastewater treatment process, MWWTP)是一个典型的复杂流程工业过程, 其优化运行涉及到多个动态性能指标. 为了实现城市污水处理运行过程的优化控制, 本文提出了一种城市污水处理过程动态多目标智能优化控制方法(Dynamic multiobjective intelligent optimal control, DMIOC). 首先, 建立了一种基于自适应核函数的动态性能指标模型, 实现了城市污水处理关键性能指标的准确描述; 其次, 设计了一种基于自适应飞行参数调整机制的动态多目标粒子群优化算法(Dynamic multiobjective particle swarm optimization, DMOPSO), 可有效平衡粒子的多样性和收敛性, 完成了溶解氧和硝态氮优化设定值的实时获取; 最后, 利用多回路PID控制方法对溶解氧和硝态氮优化设定值进行控制, 实现了城市污水处理过程安全稳定运行. 将提出的DMIOC应用于城市污水处理基准仿真平台, 实验结果显示: DMIOC 能够提高溶解氧和硝态氮的控制效果, 实现城市污水处理过程出水水质达标, 并降低运行成本.
传统的基于直方图分布的目标颜色模型, 由于跟踪过程的实时性要求其区间划分不宜过细, 因此易导致同一区间有差异的颜色难以区分; 此外, 还存在易受背景干扰的问题. 本文提出一种新的背景抑制目标颜色分布模型, 并在此基础上设计了一个合成式的目标跟踪算法. 新的颜色分布模型将一阶及二阶统计信息纳入模型, 并设计了基于人类视觉特性的权重计算方式, 能有效区分同一区间内的差异色且抑制背景颜色在模型中的比重; 算法基于该颜色模型构建目标的产生式模型, 并引入结合方向梯度直方图(Histogram of oriented gradient, HOG) 特征的相关滤波器对目标形状进行判别式建模, 同时将两个模型相互融合; 针对融合参数不易设计的难点, 分析并建立了一套定性原则, 用于判定模型各自的可信度并指导模型更新; 最终利用粒子群算法的搜索机制对候选目标的位置、尺度进行搜索, 其中适应值函数设计为两个跟踪器的融合结果. 实验结果表明, 本文算法在绝大多数情况下准确率较对比算法更优且能满足实时性要求.
针对挠性航天器系统中同时存在单框架控制力矩陀螺群(Single gimbaled control moment gyroscopes, SGCMGs) 摩擦非线性、电磁干扰力矩、惯量摄动以及外部干扰等问题, 提出了一种有限时间自适应鲁棒控制(Finite-time adaptive robust control, FTARC) 方法. 针对系统中存在未知参数的情况, 分别设计自适应更新律, 使得控制器的设计不依赖参数信息, 同时减小外部干扰对系统的不利影响. 应用Lyapunov稳定性理论证明了闭环系统姿态角误差和姿态角速度误差可在有限时间内收敛到原点附近的邻域内. 仿真结果表明, 所提控制律可实现挠性航天器姿态快速机动, 并获得甚高指向精度.
现有进化算法大都从问题的零初始信息开始搜索最优解, 没有利用先前解决相似问题时获得的历史信息, 在一定程度上浪费了计算资源.将迁移学习的思想扩展到进化优化领域, 本文研究一种基于相似历史信息迁移学习的进化优化框架.从已解决问题的模型库中找到与新问题匹配的历史问题, 将历史问题对应的知识迁移到新问题的求解过程中, 以提高种群的搜索效率.首先, 定义一种基于多分布估计的最大均值差异指标, 用来评价新问题与历史模型之间的匹配程度; 接着, 将相匹配的历史问题的知识迁移到新问题中, 给出一种基于模型匹配程度的进化种群初始化策略, 以加快算法的搜索速度; 然后, 给出一种基于迭代聚类的代表个体保存策略, 保留求解过程中产生的优势信息, 用于更新历史模型库; 最后, 将自适应骨干粒子群优化算法嵌入到所提框架, 给出一种基于相似历史信息迁移学习的骨干粒子群优化算法.针对多个改进的典型测试函数, 实验结果表明, 所提迁移策略可以加速粒子群的搜索过程, 显著提高算法的收敛速度和搜索效率.
针对移动机器人环境认知问题, 受老鼠海马体位置细胞在特定位置放电的启发, 构建动态增减位置细胞认知地图模型(Dynamic growing and pruning place cells-based cognitive map model, DGP-PCCMM), 使机器人在与环境交互的过程中自组织构建认知地图, 进行环境认知. 初始时刻, 认知地图由初始点处激活的位置细胞构成; 随着与环境的交互, 逐渐得到不同位置点处激活的位置细胞, 并建立其之间的连接关系, 实现认知地图的动态增长; 如果机器人在已访问区域发现新的障碍物, 利用动态缩减机制对认知地图进行更新. 此外, 提出一种位置细胞序列规划算法, 该算法以所构建的认知地图作为输入, 进行位置细胞序列规划, 实现机器人导航. 为验证模型的正确性和有效性, 对Tolman的经典老鼠绕道实验进行再现. 实验结果表明, 本文模型能使机器人在与环境交互的过程中动态构建并更新认知地图, 能初步完成对Tolman老鼠绕道实验的再现. 此外, 进行了与四叉树栅格地图、动态窗口法的对比实验和与其他认知地图模型的讨论分析. 结果表明了本文方法在所构建地图的简洁性、完整性和对动态障碍适应性方面的优势.
孤独症是一种先天的大脑发育障碍性疾病, 孤独症儿童的早期评估诊断尤为重要. 脑电图(Electroencephalography, EEG)是大脑神经细胞电生理活动在大脑皮层或头皮表面的总体反映. EEG信号中包含了大量的生理与疾病信息, 可为某些脑疾病提供诊断依据. 本文按照国际10-20系统标准电极分布将全脑划分为5个脑区, 采用小波相干性算法对孤独症(Autistic spectrum disorder, ASD)儿童和正常(Typical development, TD)儿童任意两通道之间在不同节律下的连接性进行计算, 按脑区进行划分, 得到脑区内和跨脑区功能连接结果, 随后应用独立样本t检验分析和FDR (False discovery rate)多重校正方法后给出脑区内和跨脑区在不同节律下的组间差异.结果表明, ASD组相对于TD组跨脑区连接和脑区内连接普遍较弱, 除delta频段外其他频段均差异显著, 尤其是额叶与其他脑区连接. 多重校正后通道间长程连接中额叶与枕叶、中央区与枕叶在四个频段差异显著较明显, 通道间短程连接额叶在theta和alpha频段较显著, 其他频段其他脑区对比不显著.
图像风格转化在计算机视觉领域广受关注, 其研究目标在于将输入图像利用计算机转化为具有某种特定艺术风格的图像. 线描画作为一种古老的画种, 它通过简单的线条勾勒物体的轮廓, 具有简约、抽象的风格. 本文提出一种基于方向场正则化的线描画生成算法, 该算法由4部分构成: 1)采用非局部平均滤波对输入图像进行预处理; 2)计算输入图像的方向场, 并基于自表示的思想对方向场进行Tikhonov正则化, 为了提高运算速度, 采用Sherman-Morrison-Woodbury公式来对正则化算法进行加速; 3)以正则方向场作为引导, 对预处理图像作高斯差分滤波; 4)根据人类视觉系统的非线性特点, 设计感知阈值(Perceptual thresholding)算法来对高斯差分滤波的结果进行阈值处理, 得到二值化的线描画图像. 仿真实验表明, 该算法可将输入图像转化为线条流畅且能有效表达输入图像主要信息的线描画图像.
邻域粗糙集可以直接处理数值型数据, F- 粗糙集是第一个动态粗糙集模型. 针对动态变化的数值型数据, 结合邻域粗糙集和F- 粗糙集的优势, 提出了F- 邻域粗糙集和F- 邻域并行约简. 首先, 定义了F- 邻域粗糙集上下近似、边界区域; 其次, 在F- 邻域粗糙集中提出了F- 属性依赖度和属性重要度矩阵; 根据F- 属性依赖度和属性重要度矩阵分别提出了属性约简算法, 证明了两种约简方法的约简结果等价; 最后, 比对实验在UCI数据集、真实数据集和MATLAB生成数据集上完成, 实验结果显示, 与相关算法比较, F- 邻域粗糙集可以获得更好的分类准确率. 为粗糙集在大数据方面的应用增加了一种新方法.
研究了具有拓扑切换特性的离散型不确定时空网络的指数同步问题. 基于稳定性理论, 构造了具有指数形式的Lyapunov函数, 并设计了同步控制器的结构方程, 进而获得了时空网络的同步条件. 同时, 我们设计了未知参数的识别律, 有效地识别了网络中的未知参数. 最后, 选取实际的激光相位共轭波空间扩展系统作为网络节点进行仿真模拟, 验证了同步方案的可行性与控制器的有效性. 通过构造具有指数形式的Lyapunov函数, 能够有效地调节网络的同步速率. 并且获得的同步条件中不包含网络的耦合矩阵项, 消除了拓扑切换特性对同步过程的影响, 使得网络同步性能更加稳定.
共识算法作为区块链底层关键技术, 可解决决策权分散的分布式系统中的一致性难题. 良好的共识算法可提升系统健壮性, 但大多数方案在网络故障或主动攻击下存在鲁棒性不可控、活性表现差、可扩展性不足等问题. 针对上述问题, 本文提出一种抗自适应攻击的健壮拜占庭容错共识算法. 该算法利用环签名的无条件强匿名性构造排序选主算法, 隐匿选举每一轮共识中的提案者, 进而达到模糊敌手攻击对象、有效抵抗自适应攻击的目的. 同时, 通过在多轮投票中合成代表法定人数投票意愿的门限签名, 将网络划分为众多最小连通性网络, 以保证在最小连通性网络环境中实现低延迟、高鲁棒性的拜占庭容错共识算法. 分析表明, 系统在提升可扩展性、减少视图更换、降低签名验证开销的同时, 能够有效保证系统活性.
针对二阶多智能体系统中的分布式资源分配问题, 本文设计两种连续时间算法. 基于KKT(Karush-Kuhn-Tucker, 卡罗需-库恩-塔克)优化条件, 第一种控制算法利用节点局部不等式及其梯度信息来约束节点状态. 与上述梯度方法不同, 第二种控制算法包括一致性梯度下降法和固定时间收敛映射算子, 其中固定时间收敛映射算子确保算法的节点状态在固定时间收敛到局部约束集, 一致性梯度下降法目的是确保节点迭代到资源分配问题最优解. 两种控制算法都对状态无初始值约束, 且控制参数都是常数. 利用凸优化理论和固定时间李雅普诺夫方法, 分别分析了上述控制策略在有向平衡网络条件下的渐近和指数收敛性. 最后通过数值仿真验证了所设计算法在一维和高维资源分配问题的有效性.
传统多视角聚类都基于视角完备假设, 要求所有样本的视角信息完整, 不能处理存在部分视角缺失情形下的不完整多视角聚类任务. 为解决该问题, 本文提出一种基于低秩张量图学习的不完整多视角聚类方法. 为了恢复相似图中缺失视角所对应的样本关联信息, 该方法将低秩张量图约束和视角内在图保持约束融入到多视角谱聚类模型. 通过在一个统一模型中同时挖掘视角间的互补信息和视角内未缺失样例的关联信息, 所提出的方法能够得到表征样例邻接关系的完整相似图和视角间一致的最优聚类指示矩阵. 与12种不完整多视角聚类方法进行实验对比, 实验结果表明所提出的方法在多种视角缺失率下的五个数据集上获得了最好的聚类性能.
为避免使用函数逼近器(神经网络或模糊系统), 并提高双惯量伺服系统的瞬态响应和稳态性能, 本文针对含外部扰动的双惯量伺服系统, 提出一种基于预设性能函数的类比例状态反馈控制策略. 首先, 提出一种改进的带有最大超调、收敛速率以及稳态误差的预设性能函数, 并将该函数融入控制器设计使二惯量伺服的跟踪误差保持在预定的边界之内. 其次, 基于预设性能函数设计了类比例状态反馈控制器实现跟踪控制. 与传统基于函数逼近控制方法相比较, 该方法可降低控制系统计算复杂度同时消除反演控制中存在的复杂度爆炸问题. 最后, 利用双惯量伺服系统实验平台开展了对比实验, 验证了所提出的方法有效性和性能改进.
网络入侵样本数据特征间存在未知的非欧式空间图结构关系, 深入挖掘并利用该关系可有效提升网络入侵检测方法的检测效能. 对此, 本文设计了一种元图神经网络(Meta graph neural network, MGNN), MGNN能够对样本数据特征内部隐藏的图结构关系进行挖掘与利用, 在应对入侵检测问题时优势明显. 首先, 设计了元图网络层MGNL, 挖掘出样本数据特征内部隐藏的图结构关系, 并利用该关系对样本数据的原始特征进行更新; 然后, 针对MGNN存在的图信息传播过程中父代信息湮灭现象提出反信息湮灭策略, 并设计了注意力损失函数, 简化MGNN中实现注意力机制的运算过程. KDD-NSL、UNSW-NB15、CICDoS2019数据集上的实验表明, 与经典深度学习算法DNN、CNN、RNN、LSTM和传统机器学习算法SVM、DT、RF、KNN、LR相比MGNN在准确率、F1值、精确率、召回率评价指标上均具有良好效果.
在大多数系统辨识方法中, 通常假设时变时滞在其可能的取值范围内服从均匀分布. 但是这种假设是非常受限的并且在实际过程中常常无法得到满足. 因此本文在时滞取值概率条件未知的情况下, 针对一类线性时变时滞系统提出有效的辨识方法. 利用期望最大化算法将拟研究的辨识问题公式化, 期望最大化算法通过不断地迭代执行期望步骤和最大化步骤来得到优化的参数估计. 在期望步骤中, 将未知的时变时滞当作隐含变量来处理并且假设它可能的取值范围已知. 在每一个采样时刻, 时滞的变换由一个概率向量控制, 并且该向量中的每一个元素是未知的, 将其当作待估计的未知参数处理. 在算法的每次迭代过程中, 计算时滞的后验概率密度函数并在此基础上构造代价函数(Q-函数). 在最大化步骤中, 通过不断优化(Q-函数)来估计想要的参数, 包括: 模型参数、噪声参数、控制概率向量中的每一个元素和未知的时滞. 最后通过一个数值例子来验证本文提出的算法的有效性.
转发预测在社交媒体网站(Social media sites, SMS)中是一个很有挑战性的问题. 本文研究了SMS中的图像转发预测问题, 预测用户再次转发图像推特的图像共享行为. 与现有的研究不同, 本文首先提出异构图像转发建模网络(IRM), 所利用的是用户之前转发图像推特中的相关内容、之后在SMS中的联系和被转发者的偏好三方面的内容. 在此基础上, 提出文本引导的多模态神经网络, 构建新型多方面注意力排序网络学习框架, 从而学习预测任务中的联合图像推特表征和用户偏好表征. 在Twitter的大规模数据集上进行的大量实验表明, 我们的方法较之现有的解决方案而言取得了更好的效果.
复杂过程工业控制一直是控制应用领域研究的前沿问题. 浓密机作为一种复杂大型工业设备广泛用于冶金、采矿等领域. 由于其在运行过程中具有多变量、非线性、高时滞等特点, 浓密机的底流浓度控制技术一直是学界、工业界的研究难点与热点. 本文提出了一种基于强化学习技术的浓密机在线控制算法. 该算法在传统启发式动态规划 (Heuristic dynamic programming, HDP)算法的基础上, 设计融合了评价网络与模型网络的双网结构, 并提出了基于短期经验回放的方法用于增强评价网络的训练准确性, 实现了对浓密机底流浓度的稳定控制, 并保持控制输入稳定在设定范围之内. 最后, 通过浓密机仿真实验的方式验证了算法的有效性, 实验结果表明本文提出的方法在时间消耗、控制精度上优于其他算法.
目标检测技术是光学遥感图像理解的基础问题, 具有重要的应用价值. 本文对遥感图像目标检测算法发展进行了梳理和分析. 首先阐述了遥感图像目标检测的特点和挑战; 之后系统总结了典型的检测方法, 包括早期的基于手工设计特征的算法和现阶段基于深度学习的方法, 对于深度学习方法首先介绍了典型的目标检测模型, 进而针对遥感图像本身的难点详细梳理了优化改进方案; 接着介绍了常用的检测数据集, 并对现有方法的性能进行比较; 最后对现阶段问题进行总结并对未来发展趋势进行展望.
电熔镁砂熔炼过程通过电极电流熔化物料, 采用埋弧方式, 边熔化边加料, 其被控对象是以转动方向与频率为输入, 以电极电流为输出的三相电机. 本文通过引入中间变量并转化控制目标, 将电熔镁砂熔炼过程三相电极电流的复杂非线性控制问题简化为线性控制问题, 提出了一种简化的电极电流饱和约束一步最优控制方法, 并通过引入拉格朗日乘子向量和松弛向量验证了该方法的最优性. 理论分析和仿真对比实验结果表明本文所提简化控制方法的有效性和优越性. 此外, 当考虑电熔镁砂熔炼过程中存在的不可测外部干扰时, 在上述简化的电极电流饱和约束算法的基础上设计了高阶干扰观测器, 理论分析和仿真结果验证了具有高阶干扰观测器的简化算法的优越性.
作者识别是根据已知文本推断未知文本作者的学科, 这是一个历史悠久的、涉及多学科的领域. 其传统研究主要基于文学或语言学的经验知识, 而现代研究则主要依靠数学方法量化作者的写作风格. 本文主要站在计算语言学的角度综述作者识别领域现代研究中的方法和思路. 首先, 简要介绍了作者识别的发展历程. 然后, 详细介绍了文体风格特征、作者识别方法以及该领域中多层面的研究. 接着介绍了与作者识别相关的一些评测、数据集及评价指标. 最后, 指出该领域存在的一些问题, 结合这些问题分析并展望了作者识别的发展趋势.
研究复杂网络能控性鲁棒性对包括社会网络、生物和技术网络等在内的复杂系统的控制和应用具有重要价值. 复杂网络的能控性是指: 可通过若干控制节点和适当的输入, 在有限时间内将系统状态驱动至任意目标状态. 能控性鲁棒性则是指在受到攻击的情况下, 复杂网络依然维持能控性的能力. 设计具有优异能控性鲁棒性的复杂网络模型和优化实际网络的能控性鲁棒性一直是复杂网络领域的重要研究内容. 本文首先比较了常用的能控性鲁棒性定义及度量, 接着从攻击策略的角度分析了三类攻击的特点及效果, 包括随机攻击、基于特征的蓄意攻击和启发式攻击. 然后比较了常见模型网络的能控性鲁棒性. 介绍了常用优化策略, 包括模型设计和重新连边等. 目前的研究在攻击策略和拓扑结构优化方面都取得了进展, 也为进一步理论分析提供条件. 最后总结全文并提出潜在研究方向.
针对现有图像超分辨率重建方法恢复图像高频细节能力较弱、特征利用率不足的问题, 提出了一种多尺度特征融合反投影网络用于图像超分辨率重建. 该网络首先在浅层特征提取层使用多尺度的卷积核提取不同维度的特征信息, 增强跨通道信息融合能力; 然后构建多尺度反投影模块通过递归学习执行特征映射, 提升网络的早期重建能力; 最后将局部残差反馈结合全局残差学习促进特征的传播和利用, 从而融合不同深度的特征信息进行图像重建. 对图像2到8倍超分辨率重建的实验结果表明, 本方法重建图像的质量在主观感受和客观评价指标上均优于现有图像超分辨率重建方法, 放大倍数大时重建性能相比更优秀.
处理高维复杂数据的聚类问题, 通常需先降维后聚类, 但常用的降维方法未考虑数据的同类聚集性和样本间相关关系, 难以保证降维方法与聚类算法相匹配, 从而导致聚类信息损失. 非线性无监督降维方法极限学习机自编码器(ELM-AE)因其学习速度快、泛化性能好, 近年来被广泛应用于降维及去噪. 为使高维数据投影至低维空间后仍能保持原有子空间结构, 本文提出基于子空间结构保持的多层极限学习机自编码器降维方法(ML-SELM-AE). 该方法在保持聚类样本多子空间结构的同时, 利用多层极限学习机自编码器捕获样本集的深层特征. 实验结果表明, 该方法在UCI数据、脑电数据和基因表达谱数据上可以有效提高聚类准确率且取得较高的学习效率.
权重求和是基于分解的超多目标进化算法中常用的方法, 相比其它方法具有计算简单、搜索效率高等优点, 但难以有效处理帕累托前沿面(Pareto optimal front, PF)为非凸型的问题. 为充分发挥权重求和方法的优势, 同时又能处理好PF为非凸型的问题, 本文提出了一种基于目标空间转换权重求和的超多目标进化算法, 简称NSGAIII-OSTWS. 该算法的核心是将各种问题的PF转换为凸型曲面, 再利用权重求和方法进行优化. 具体地, 首先利用预估PF的形状计算个体到预估PF的距离; 然后, 根据该距离值将个体映射到目标空间中预估凸型曲面与理想点之间的对应位置; 最后, 采用权重求和函数计算出映射后个体的适应值, 据此实现对问题的进化优化. 为验证NSGAIII-OSTWS的有效性, 将NSGAIII-OSTWS与7个NSGAIII的变体, 以及9个具有代表性的先进超多目标进化算法在WFG、DTLZ和LSMOP基准问题上进行对比, 实验结果表明NSGAIII-OSTWS具备明显的竞争性能.
针对存在量化数据、通信时滞等通信约束以及带有竞争关系的多智能体系统, 研究其二分实用一致性问题, 提出了一种基于量化器的分布式控制协议. 该协议基于结构平衡拓扑假设, 通过规范变换将具有竞争关系系统转变为具有非负连接权重系统, 使二分实用一致性问题转变为一般实用一致性问题. 利用微分包含理论、菲利波夫解的框架、代数图论以及Lyapunov稳定性理论, 证明了在本文所提控制策略下, 具有竞争关系的多智能体系统能实现二分实用一致, 即智能体状态收敛至模相同但符号不同的可控区间, 并给出了误差收敛上界值. 仿真试验进一步验证了理论结果的有效性.
复杂多变的战场环境要求后装保障能够根据战场环境变化, 预见性地做出决策, 为此提出了基于强化学习的动态调度方法. 为了准确描述保障调度问题, 提出了支持抢占调度、重分配及重部署决策的马尔可夫决策过程模型, 模型中综合考量了任务排队、保障优先级以及油料约束等诸多问题的影响; 随后设计了改进策略迭代算法, 训练基于神经网络的保障调度模型; 训练后的神经网络模型能够近似计算状态价值函数, 从而求解出产生最大期望价值的优化调度策略. 最后设计了一个分布式战场保障仿真实验, 通过与常规调度策略的对比, 验证了动态调度算法具有良好的自适应性和自主学习能力, 能够根据历史数据和当前态势预判后续变化, 并重新规划和配置保障资源的调度方案.
数字货币作为区块链技术迄今为止最典型也最成功的应用, 得益于区块链分布式共识与去中心化信任的技术优势, 也促使了区块链技术与经济活动的深度融合, 并由此改变了数字社会的组织方式. 近年来, 无论是在基础理论研究方面, 还是在实践应用发展方面, 数字货币均呈现出了蓬勃向上的态势. 本文从技术创新、机制设计以及风险监管三个角度梳理了数字货币主要研究问题, 详细阐述了基础支撑技术、隐私保护技术、共识机制、激励机制、币值机制、发行机制、风险分析、监管考量等方面的研究进展、存在问题及应用现状, 并展望了未来重点研究方向, 致力于为数字货币领域的研究提供有益借鉴.
近年来, 基于深度学习的表面缺陷检测技术广泛应用在各种工业场景中. 本文对近年来基于深度学习的表面缺陷检测方法进行了梳理, 根据数据标签的不同将其分为全监督学习模型方法、无监督学习模型方法和其他方法三大类, 并对各种典型方法进一步细分归类和对比分析, 总结了每种方法的优缺点和应用场景. 本文探讨了表面缺陷检测中三个关键问题, 介绍了工业表面缺陷常用数据集. 最后, 对表面缺陷检测的未来发展趋势进行了展望.
本文针对具有外部系统扰动的线性离散时间系统的输出调节问题, 提出了可保证收敛速率的数据驱动最优输出调节方法, 包括状态可在线测量系统的基于状态反馈的算法, 与状态不可在线测量系统的基于输出反馈的算法. 首先, 该问题被分解为输出调节方程求解问题与反馈控制律设计问题, 基于输出调节方程的解, 本文通过引入收敛速率参数, 建立了可保证收敛速率的最优控制问题, 通过求解该问题得到具有保证收敛速率的输出调节器. 之后, 利用强化学习的方法, 设计基于值迭代的数据驱动状态反馈控制器, 学习得到基于状态反馈的最优输出调节器. 对于状态无法在线测量的被控对象, 本文利用历史输入输出数据对状态进行重构, 并以此为基础设计基于值迭代的数据驱动输出反馈控制器. 仿真实验验证了本文所提方法的有效性.
复杂系统间的相互作用能够用复杂网络描述. 复杂网络中某些节点遭受攻击或破坏会造成网络故障, 导致整个网络能控性变化. 不同节点失效会对网络能控性有不同的影响. 本文提出一种网络节点的分类方式, 将网络中的节点根据边的方向和匹配关系分成九种类型, 并给出了辨识节点类型的算法. 另外, 本文给出了基于此分类方式下复杂网络中某类节点失效时, 网络中驱动节点数量(用来衡量网络能控性大小的指标)的变化规律. 并通过模型网络进行仿真实验, 验证了当节点失效时本文给出的驱动节点数量变化情况, 同时还分析社交网络中不同类型节点的占比与实际中人际交往的对应关系.
本文研究了一类分布式优化问题, 其目标是通过局部信息交换使由局部成本函数之和构成的全局成本函数最小. 针对无向连通图, 我们提出了两种基于比例积分策略的分布式优化算法. 在局部成本函数可微且凸的条件下, 证明了所提算法渐近收敛到全局最小值点. 更进一步, 在局部成本函数具有局部Lipschitz梯度和全局成本函数关于全局最小值点是有限强凸的条件下, 证明了所提算法的指数收敛性. 此外, 为了避免智能体之间的连续通信和减少通信负担, 将所提的两种分布式优化算法与事件触发通信相结合, 提出了两种基于事件触发的分布式优化算法. 证明了提出的事件触发优化算法不存在Zeno行为, 并且在相应条件下保持了与连续通信下分布式优化算法一样的收敛性. 最后, 通过数值仿真验证了上述理论结果.
单视图物体三维重建是一个长期存在的具有挑战性的问题. 为了解决具有复杂拓扑结构的物体以及一些高保真度的表面细节信息仍然难以准确进行恢复的问题, 本文提出了一种基于深度强化学习的算法深度确定性策略梯度(Deep deterministic policy gradient, DDPG)对三维重建中模糊概率点进行再推理, 实现了具有高保真和丰富细节的单视图三维重建. 本文的方法是端到端的, 包括以下四个部分: 拟合物体三维形状的动态分支代偿网络的学习过程, 聚合模糊概率点周围点的邻域路由机制, 注意力机制引导的信息聚合和基于深度强化学习算法的模糊概率调整. 本文在公开的大规模三维形状数据集上进行了大量的实验证明了本文方法的正确性和有效性. 本文提出的方法结合了强化学习和深度学习, 聚合了模糊概率点周围的局部信息和图像全局信息, 从而有效的提升了模型对复杂拓扑结构和高保真度的细节信息的重建能力.
本文针对由雷达与红外组成的分布式传感器网络, 研究基于一致性的分布式变结构多模型方法(Distributed variable structure multiple model, DVSMM). 首先使用无迹信息滤波(Unscented information filter, UIF)解决系统非线性的问题, 然后将变结构交互式多模型(Variable structure interacting multiple model, VSMM)方法进行改进, 提出一类可应用于分布式状态估计的分布式变结构多模型DVSMM方法. 仿真试验结果验证了该方法的有效性.
甲骨文字图像可以分为拓片甲骨文字与临摹甲骨文字两类. 拓片甲骨文字图像是从龟甲、兽骨等载体上获取的原始拓片图像, 临摹甲骨文字图像是经过专家手工书写得到的高清图像. 拓片甲骨文字样本难以获得, 而临摹文字样本相对容易获得. 为了提高拓片甲骨文字识别的性能, 本文提出一种基于跨模态深度度量学习的甲骨文字识别方法, 通过对临摹甲骨文字和拓片甲骨文字进行共享特征空间建模和最近邻分类, 实现了拓片甲骨文字的跨模态识别. 实验结果表明, 在拓片甲骨文字识别任务上, 本文提出的跨模态学习方法比单模态方法有明显的提升, 同时对新类别拓片甲骨文字也能增量识别.
现有图像修复方案普遍存在着结构错乱和细节纹理模糊的问题, 这主要是因为在图像破损区域的重建过程中, 修复网络难以充分利用非破损区域内的信息来准确地推断破损区域内容. 为此, 本文提出了一种由多级注意力传播驱动的图像修复网络. 该网络通过将全分辨率图像中提取的高级特征压缩为多尺度紧凑特征, 进而依据尺度大小顺序驱动紧凑特征进行多级注意力特征传播, 以期达到包括结构和细节在内的高级特征在网络中充分传播的目标. 为进一步实现细粒度图像修复重建, 本文还同时提出了一种复合粒度判别器, 以期实现对图像修复过程进行全局语义约束与非特定局部密集约束. 大量实验表明, 本文提出的方法可以产生更高质量的修复结果.
机器学习在视频质量评价(Video quality assessment, VQA)模型回归方面具有较大的优势, 能够较大地提高构建模型的精度. 基于此, 设计了合理的多层BP神经网络, 并以提取的失真视频的内容特征、编解码失真特征、传输失真特征及其视觉感知效应特征参数为输入, 通过构建的数据库中的样本对其进行训练学习, 构建了一个无参考VQA模型. 在模型构建中, 首先采用图像的亮度和色度及其视觉感知、图像的灰度梯度期望值、图像的模糊程度、局部对比度、运动矢量及其视觉感知、场景切换特征、比特率、初始时延、单次中断时延、中断频率和中断平均时长共11个特征, 来描述影响视频质量的4个主要方面, 并对建立的两个视频数据库中的大量视频样本, 提取其特征参数; 再以该特征参数作为输入, 对设计的多层BP神经网络进行训练, 从而构建VQA模型; 最后, 对所提模型进行测试, 同时与14种现有的VQA模型进行对比分析, 研究其精度、复杂性和泛化性能. 实验结果表明: 所提模型的精度明显高于其14种现有模型的精度, 其最低高出幅度为4.34%; 且优于该14种模型的泛化性能, 同时复杂性处于该15种模型中的中间水平. 综合分析所提模型的精度、泛化性能和复杂性表明, 所提模型是一种较好的基于机器学习的VQA模型.
本文针对具有执行器故障的一类离散非线性多输入多输出(Multi-input multi-output, MIMO)系统, 提出了一种基于事件触发的自适应评判容错控制方案. 该控制方案包括评价和执行网络. 在评价网络里, 为了缓解现有的非光滑二值效用函数可能引起的执行网络跳变问题, 利用高斯函数构建了一个光滑的效用函数, 并采用评价网络近似最优性能指标函数. 在执行网络里, 通过变量替换将系统状态的将来信息转化成关于系统当前状态的函数, 并结合事件触发机制设计了最优跟踪控制器. 该控制器引入了动态补偿项, 不仅能够抑制执行器故障对系统性能的影响, 而且能够改善系统的控制性能. 稳定性分析表明所有信号最终一致有界且跟踪误差收敛于原点的有界小领域内. 数值系统和实际系统的仿真结果验证了该方案的有效性.
针对感知范围受限的分布式传感网多目标跟踪问题, 在多伯努利滤波跟踪理论基础上提出分布式视场互补多伯努利关联算术平均融合跟踪方法. 首先, 通过视场互补扩大传感器感知范围, 其中, 局部公共区域只互补一次以降低计算成本. 其次, 每个传感器分别运行局部多伯努利滤波器, 并将滤波后验结果与相邻传感器进行泛洪通信使得每个传感器获取多个相邻传感器的后验信息. 随后, 通过距离划分进行多伯努利关联, 将对应于同一目标的伯努利分量关联到同一个子集中, 并对每个关联子集进行算术平均融合完成融合状态估计. 仿真实验表明, 所提方法在有限感知范围的分布式传感器网络中能有效地进行多目标跟踪.
由于复杂装备系统缺少可工程应用的弹性度量方法, 且传统可靠性工程难以描述装备从故障到修复全过程的性质, 因此考虑装备系统在工作过程中性能变化的连续性以及扰动、故障和修复的不确定性, 利用可靠性工程相关参数, 针对无子系统的简单装备提出了一种混合型弹性度量方法. 在此基础上, 考虑子系统对复杂系统的影响, 以及复杂系统故障和修复概率, 提出了一种针对复杂装备系统的弹性度量方法. 最后, 通过基于弹性理论的组件重要度计算案例, 评估复杂装备系统各个子系统性能变化对整个装备的影响重要程度, 验证了方法的可行性和有效性.
因子分析是一种在工业领域广泛使用的统计学方法. 在金融资产管理中, 因子分析通过对历史价格波动的极大似然估计推导自适应的统计学因子来生成风险模型. 与通过使用预先设定具有经济学含义的因子来生成风险模型的基本面因子模型相比, 通过因子分析生成的模型不仅更灵活, 还能发现在基本面模型中缺失的因子. 然而, 由于因子分析所生成模型中的统计学因子缺少可解释性, 因此当金融数据中存在显著噪音时容易过拟合. 针对中国股市数据的风险模型生成问题, 本文提出快速因子分析算法以及将基本面因子结合到因子分析中的挑选基本面因子的混合因子分析方法, 使风险模型同时在因子探索及模型可解释性上达到最优. 实验结果显示快速因子分析方法能够达到31倍以上的加速比, 且新混合因子分析方法能够增大人造数据集以及真实数据集上预测的对数似然估计值. 在真实数据集上, 新方法能最好够达到平均对数似然估计值12.00, 比因子分析构建模型的7.56大4.44, 并且两个算法均值差值的标准差为1.58, 表现出新方法能构建更准确的风险模型.
单幅图像超分辨率重建是计算机视觉领域上的一个重要问题, 在安防视频监控、飞机航拍以及卫星遥感等方面具有重要的研究意义和应用价值. 近年来, 深度学习在图像分类、检测、识别等诸多领域中取得了突破性进展, 也推动着图像超分辨率重建技术的发展. 本文首先介绍单幅图像超分辨率重建的常用公共图像数据集; 然后重点阐述基于深度学习的单幅图像超分辨率重建方向的创新与进展; 最后讨论了单幅图像超分辨率重建方向上存在的困难和挑战, 并对未来的发展趋势进行了思考与展望.
跨语言对话系统是当前国际研究的热点和难点. 在实际的应用系统搭建中通常需要翻译引擎作为不同语言之间对话的桥梁. 然而, 翻译引擎往往是基于不同训练样本构建的, 无论是所在领域, 还是擅长处理语言的特性, 均与对话系统的实际应用需求存在较大的差异, 从而导致整个对话系统的鲁棒性差, 响应性能低. 因此, 如何增强跨语言对话系统的鲁棒性对于提升其实用性具有重要的意义. 本文提出了一种基于多粒度对抗训练的鲁棒性跨语言对话系统构建方法. 该方法首先面向机器翻译构建多粒度噪声数据, 分别在词汇、短语和句子层次生成相应的对抗样本, 之后利用多粒度噪声数据和干净数据进行对抗训练, 从而更新对话系统的参数, 进而指导对话系统学习噪声无关的隐层表示, 最终达到提升跨语言对话系统性能的目的. 在公开对话数据集上对两种语言的实验表明, 本文所提出的方法能够显著提升跨语言对话系统的性能, 尤其提升跨语言对话系统的鲁棒性.
基于自表示子空间聚类的多视图聚类引起越来越多的关注. 大多数现有算法假设每个样本的所有视图都可获得, 然而在实际应用中, 由于各种因素, 可能会导致某些视图缺失. 为了对视图不完整数据进行聚类, 本文提出了一种在统一框架下同时执行缺失视图补全和多视图子空间聚类的方法. 具体地, 缺失视图是由已观测视图数据约束的隐表示生成的. 此外, 多秩张量应用于挖掘不同视图之间的高阶相关性. 这样通过隐表示和高阶张量同时挖掘了不同视图以及所有样本(即使是不完整视图样本)之间的相关性. 本文使用增广拉格朗日交替方向最小化(AL-ADM)方法求解优化问题. 在真实数据集上的实验结果表明, 我们的方法优于最新的多视图聚类算法, 具有更好的聚类准确度和鲁棒性.
现有的多变量灰色预测模型的背景值估计误差及模型结构单一是导致该模型预测性能不稳定的重要因素, 致使该模型在实际预测领域中应用并不广泛. 本文通过分析背景值函数的几何意义, 结合积分几何面积公式, 提出一种改进的背景值优化方法, 使预测模型在背景值系数的选取上更加灵活.在此基础上, 模型中加入灰色作用量, 提出一种新的多维灰色预测模型IBSGM(1,N). 通过对模型参数的改变分析, 新模型理论上可达到与传统单变量和多变量灰色预测模型的兼容性. 为检验新模型的性能, 本文进行了三个案例对比分析, 实验结果表明, 与现有的GM(1,1)和GM(1,N)预测模型相比较, 所提出的IBSGM(1,N)模型在背景值参数估计上误差明显减小, 结构相容性更强, 泛化性能更好, 具有更高的预测精度.
四绳轮胎式集装箱起重机由于自身的动力学特性较为复杂, 目前仍缺乏稳定高效的控制手段. 为解决港口起重机作业过程中台车定位精准度低、负载易受干扰摆幅大的问题, 文章设计了一种面向工业场景的非线性反馈控制器. 首先在未进行近似处理的前提下对起重机吊具摆动情况进行了建模分析. 在此基础上, 通过在控制器中引入摆幅反馈信息, 实现了绳长时变情况下台车的精确定位与负载摆幅的有效抑制, 为集装箱的运送路径增加了更多选择. 随后基于Lyapunov方法对控制器进行了稳定性分析. 所设计的控制方案在港口实际设备上进行了验证, 在定位精度与消摆性能上相较于人工操作取得了很大提升.
情感计算是现代人机交互中的一个重要研究方向, 旨在研究与开发能够识别、解释、处理和模拟人类情感的理论、方法与系统. 脑电、心电、皮肤电等生理信号是情感计算中重要的输入信号. 本文总结了近年来基于脑电等生理信号的情感计算研究所取得的进展. 首先介绍情感计算的相关基础理论, 不同生理信号与情感变化之间的联系, 以及基于生理信号的情感计算工作流程和相关公开数据集. 接下来介绍生理信号的特征工程和情感计算中的机器学习算法, 重点介绍适合处理个体差异的迁移学习、降低数据标注量的主动学习和融合特征工程与学习器的深度学习算法. 最后, 指出基于生理信号的情感计算研究中面临的一些挑战.
深度神经网络是具有复杂结构和多个非线性处理单元的模型, 通过模块化的方式分层从数据提取代表性特征, 已经在晶圆缺陷识别领域(Wafer map pattern recognition, WMPR)得到了较为广泛的应用. 但是, 深度神经网络在应用过程中本身存在 “黑箱”和过度依赖数据的问题, 显著地影响深度神经网络在晶圆缺陷识别的工业可应用性. 本文提出了一种基于堆叠降噪自编码器(Stacked denoising auto-encoders, SDAE)的神经-符号模型. 首先, 根据SDAE的网络特点设计了一套全新的符号规则系统, 规则形式和组成结构使其可与深度神经网络有效融合. 其次, 根据网络和符号规则之间的关联性提出完整的知识抽取与插入算法, 实现了深度网络和规则之间的知识转换. 在实际工业晶圆表面图像数据集WM-811K上的试验结果表明, 基于SDAE的神经-符号模型不仅取得了较好的缺陷探测与识别性能, 而且可有效提取规则并通过规则有效描述深度神经网络内部计算逻辑, 综合性能优于目前经典的深度神经网络.
组合优化问题广泛存在于国防、交通、工业、生活等各个领域, 几十年来, 传统运筹优化方法是解决组合优化问题的主要手段, 但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高, 传统运筹优化算法面临着很大的计算压力, 很难实现组合优化问题的在线求解. 近年来随着深度学习技术的迅猛发展, 深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力. 鉴于此, 近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法, 具有求解速度快、模型泛化能力强的优势, 为组合优化问题的求解提供了一种全新的思路. 因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究, 对其基本原理、相关方法、应用研究进行总结和综述, 并指出未来该方向亟待解决的若干问题.
针对一类具有未建模动态及执行器故障的非严格反馈非线性互联大系统, 提出一类基于事件触发机制的模糊分散自适应输出反馈控制算法. 首先, 通过设计模糊状态观测器估计系统中不可测的状态, 并引入李雅普诺夫函数约束未建模动态. 然后, 提出一种基于事件触发机制的自适应容错控制器补偿多个执行器故障产生的影响. 最后, 利用障碍李雅普诺夫函数实现对系统输出的约束, 并证明闭环系统中所有信号均是半全局一致最终有界的, 且设计的事件触发机制可以避免Zeno行为. 数值仿真结果验证所提出设计方案的可行性及有效性.
视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码-解码”架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑等信息的结构化语段, 并在模型优化、数据集构建、评价指标等方面进行更为深入的研究.
本文针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题, 提出了仅利用在线数据的基于强化学习的数据驱动控制方法. 首先, 该问题可拆分为一个受约束的静态优化问题和一个动态规划问题, 第一个问题可以解出调节器方程的解. 第二个问题可以确定出控制器的最优反馈增益. 然后, 运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性. 针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题, 本文提出了一种数据驱动离线策略更新算法, 该算法仅使用在线数据找到动态规划问题的解. 然后, 基于动态规划问题的解, 利用在线数据为静态优化问题提供了最优解. 最后, 仿真结果验证了所提方法的有效性.
针对基于互学习的知识蒸馏方法中存在的不足——模型只关注教师网络和学生网络的分布差异而没有考虑其他的约束条件; 只关注了结果导向的监督, 而缺少过程导向的监督——本文提出了一种拓扑一致性指导的对抗互学习知识蒸馏方法(Topology-guided aadversarial deep mutual learning, TADML)该方法将教师网络和学生网络同时训练, 网络之间相互指导学习, 不仅采用网络输出的类分布之间的差异, 还设计了网络中间特征的拓扑性差异度量. 训练过程采用对抗训练, 进一步提高教师网络和学生网络的判别性. 在分类数据集CIFAR10、CIFAR100和Tiny-ImageNet及行人重识别数据集Market1501上的实验结果表明本文所提方法TADML的有效性, TADML取得了同类模型压缩方法中最好的效果.
在基于表面肌电信号(surface electromyogram, sEMG)的意图识别研究领域, 目前大多数的研究主要集中在提高肌电识别的准确性方面. 然而, 在实际应用中, 基于sEMG识别的交互系统往往受到诸多非理想因素干扰, 肌电识别的准确性被大大降低. 本文主要关注在非理想条件下肌电识别的鲁棒性研究, 首先详细归纳了肌电识别方法受到的非理想干扰因素(如电极偏移、个体性差异、肌肉疲劳、肢体姿态或其他综合性干扰), 总结了当前研究的抗干扰方法; 随后讨论了非理想干扰因素研究现状中的主要问题; 最后在构建肌电数据集、探索深度学习和迁移学习, 以及肌电分解研究等方面, 对未来的关键技术进行了展望.
近年来, 基于可见光与近红外的行人重识别研究受到业界人士的广泛关注. 现有方法主要是利用二者之间的相互转换以减小模态间的差异. 但由于可见光图像和近红外图像之间的数据具有独立且分布不同的特点, 导致其相互转换的图像与真实图像之间存在数据差异. 因此, 本文提出了一个基于图像层和特征层联合约束的可见光与近红外相互转换的中间模态, 不仅实现了行人身份的一致性, 而且减少了模态间转换的差异性. 此外, 考虑到跨模态行人重识别数据集的稀缺性, 本文还构建了一个跨模态的行人重识别数据集, 并通过大量的实验证明了文章所提方法的有效性, 本文所提出的方法在经典公共数据集SYSU-MM01上比D2RL算法在 Rank-1和mAP上分别高出4.2%和3.7%, 该方法在本文构建的Parking-01数据集的近红外检索可见光模式下比ResNet-50算法在Rank-1和mAP上分别高出10.4%和10.4%.
工业过程运行状态评价通过识别生产过程的运行状态优劣情况, 并通过对非最优因素实时在线追溯, 指导操作人员及时进行生产调整, 保证产品质量, 保障企业的综合经济效益. 针对工业过程中存在强非线性、信息冗余以及不确定性影响而难以建立稳健可靠的运行状态评价模型问题, 提出了一种基于综合经济指标驱动的稀疏降噪自编码器模型(Comprehensive economic index driven sparse denoising autoencoder, ISDAE)的复杂工业过程运行状态评价方法. 首先, 在SDAE(Sparse denoising autoencoder)模型中引入综合经济指标预测误差项, 迫使SDAE学习与综合经济指标相关的数据特征, 建立ISDAE特征提取模型; 其次, 将ISDAE模型所学特征作为输入训练运行状态识别模型, 级联特征提取模型和运行状态识别模型级并通过微调网络结构参数获得运行状态评价模型. 针对非优状态, 提出了一种基于自编码器贡献图算法的非优因素识别方法, 通过计算相应变量的贡献率识别非优因素. 最后, 将所提方法应用于重介质选煤过程的运行状态评价, 实验结果验证了所提方法的有效性和实用性.
为了解决孪生网络跟踪器鲁棒性差的问题, 本文重新设计了孪生网络跟踪器的分类与回归分支, 提出了一种基于像素上直接预测方式的高鲁棒性跟踪算法(AFST). 目前高性能的跟踪算法, 如SiamRPN、SiamRPN++、CRPN都是基于预定义的锚框进行分类和目标框回归. 与之相反, 我们提出的AFST则是直接在每个像素上进行分类和预测目标框. 通过去掉锚框, 本文大大简化了分类任务和回归任务的复杂程度, 并消除了锚框和目标误匹配问题. 在训练中, 我们还进一步添加了同类不同实例的图像对, 从而引入了相似语义干扰物, 使得网络的训练更加充分. 在VOT2016、GOT-10k、OTB2015三个公开的基准上的实验表明, 与现有的跟踪算法对比, AFST达到了先进的性能.
深度卷积神经网络显著改进了单图像超分辨率的性能. 更深的网络往往能获得更好的性能. 但是, 加深网络会导致参数量急剧增加, 限制了它在资源受限设备上的应用, 比如智能手机. 本文提出了一个融合多层次特征的轻量级单图像超分辨率网络. 网络构件主要是双层嵌套残差块. 为了更好地提取特征, 减少参数量, 每个残差块采用对称结构: 先两次扩张, 然后两次压缩通道数. 在残差块中, 通过添加自相关权重单元, 加权融合不同通道的特征信息. 实验证明: 我们的方法显著优于当前同类方法.
相比于传统的刚性驱动器, 串联弹性驱动器具有被动柔顺性、阻抗低、抗冲击、力感知等诸多优点, 因而已经广泛地应用到各种机器人系统当中. 本文首先根据弹性和阻尼特性将串联弹性驱动器分为: 弹性型、阻尼型和弹性-阻尼型串联弹性驱动器, 介绍不同类型串联弹性驱动器的优缺点, 并详细概述弹性和阻尼特性的机械实现方式; 然后对各类串联弹性驱动器作为力传感器的建模方法进行介绍; 接下来叙述串联弹性驱动器在机器人中的主要应用: 力传感器、安全保护、降低能耗; 最后展望串联弹性驱动器未来的发展方向.
本文针对电熔镁炉异常工况识别任务, 在半监督学习框架下提出了一种将电流与图像两类特征融合的解决方案. 本文的贡献主要为: 使用多元图像分析技术代替人眼, 更为准确客观地对镁炉火焰进行特征提取; 利用基于熵正则化的半监督学习框架, 同时使用具有强互补性的生产图像与电流数据进行工况分类, 从而弥补了基于单一特征分类的某些缺点; 采用交叉熵方法优化分类器目标函数, 较传统优化方法显著地提升了训练速度. 通过仿真数据与公开数据集测试并讨论了本文算法的优势; 并通过工业数据验证了本文所提出的方法有效性、应用价值与良好的鲁棒性.
变分方法是机器翻译领域的有效方法, 其性能较依赖于数据量规模. 然而在低资源环境下, 平行语料资源匮乏, 不能满足变分方法对数据量的需求, 因此导致基于变分的模型翻译效果并不理想. 针对该问题, 我们提出基于变分信息瓶颈的半监督神经机器翻译方法, 所提方法的具体思路为: 首先在小规模平行语料的基础上, 通过引入跨层注意力机制充分利用神经网络各层特征信息, 训练得到基础翻译模型; 随后, 利用基础翻译模型, 使用回译方法从单语语料生成含噪声的大规模伪平行语料, 对两种平行语料进行合并形成组合语料, 使其在规模上能够满足变分方法对数据量的需求; 最后, 为了减少组合语料中的噪声, 利用变分信息瓶颈方法在源与目标之间添加中间表征, 通过训练使该表征具有放行重要信息、阻止非重要信息流过的能力, 从而达到去除噪声的效果. 多个数据集上的实验结果表明, 本文所提方法能够显著地提高译文质量, 是一种适用于低资源场景的半监督神经机器翻译方法.
忆阻器(memristor)是一种无源的二端电子元件, 同时也是一种纳米级元件, 具有低能耗、高存储、小体积和非易失性等特点. 作为一种新型的存储器件, 忆阻器的研制, 有望使计算机实现人脑特有的信息存储与信息处理一体化的功能, 打破目前冯·诺伊曼(Von Neumann)计算机架构, 为下一代计算机的研制提供了一种全新的架构. 鉴于忆阻器与生物神经元突触具有十分相似的功能, 使忆阻器得以充当人工神经元的突触, 建立起一种基于忆阻器的人工神经网络即忆阻神经网络. 忆阻器的问世, 为人工神经网络从电路上模拟人脑提供了可能, 必将极大推动人工智能的发展. 此外, 忆阻神经网络的硬件实现及信号传递过程中, 不可避免会出现时滞与分岔等现象, 因此考虑含各种时滞, 如离散、分布、泄漏时滞以及它们混合的时滞忆阻神经网络系统更具有现实意义. 本文首先介绍了忆阻器的多种数学模型及其分类, 建立了忆阻神经网络的数学模型并阐述了其优点, 然后提出了处理时滞忆阻神经网络动力学行为与控制问题两种思路, 详细综述了时滞忆阻神经网络系统的稳定性(镇定)、耗散性与无源性、同步控制方面的内容, 简述了其他方面的动力学行为与控制, 并介绍了时滞忆阻神经网络动力学行为与控制研究新方向. 最后, 对本文所述问题进行了总结与展望.
为了解决难以建立精确数学模型或者真实评估实验成本高昂的多目标优化问题, 本文提出了一种基于径向空间划分的昂贵多目标进化算法. 首先算法使用高斯回归作为代理模型逼近目标函数; 然后将目标空间的个体投影到径向空间, 结合目标空间和径向空间信息保留对种群贡献更高的个体; 之后由径向空间中个体的位置分布决定下一步应该选择哪些个体进行真实评估; 最后, 采用一种双档案管理策略维护代理模型的质量. 数值实验和现实问题上的结果表明, 与五种先进的算法相比, 本文提出的算法在解决昂贵多目标优化问题时能够提供更高质量的解.
针对传统技术难以解决规模化混杂生产线缓冲区容量优化分配问题, 提出了一种规模化生产线递阶分解并行寻优技术, 该技术结合混杂生产线系统综合方法与分解方法的技术思想, 兼顾生产线平衡性与系统规模, 将原系统递阶分解为包含虚拟生产线在内的n+1个子生产线系统, 通过求解子系统的最优解构造原系统的渐进最优解, 并在系统递阶建模阶段建议了一种设备模糊聚类的辅助方式; 同时, 基于混杂生产线系统综合方法也建议了一种系统渐次综合的初解改进确定方法; 并提出了一种通过构造动态步长来设计领域结构的改进型禁忌搜索算法对子系统进行并行寻优; 最后对技术算法的收敛性进行了证明.本文提出的生产线递阶分解建模并行寻优技术具有一般性, 对受设备随机故障等随机事件影响的生产线尤其是规模化生产线系统其它优化、控制问题也具有借鉴、参考价值.
本文基于泛函深度作用的思想, 通过将两种非凸稀疏泛函进行复合, 构造了一种新的稀疏信号重构模型, 实现了对0范数的深度逼近. 综合运用MM技术、外点罚函数法和共轭梯度法, 提出了一种求解该模型的算法, 称为NCCS算法. 为降低重构信号陷入局部极值的可能性, 提出了在算法的每步迭代中以BP模型的解作为初始迭代值. 为验证所建模型和所提算法的有效性, 本文进行了多项数值实验. 实验结果表明: 相较于SL0算法、IRLS算法、SCSA算法以及BP算法等经典算法, 本文提出的算法在重构误差、信噪比、归一化均方差、支撑集恢复成功率等方面都有更优的表现.
呼吸会引起体内器官和肿瘤的运动, 这会显著影响放射治疗的过程和效果. 人体内部膈肌和胸腹部外表面是当前两种与呼吸系统高度相关的结构, 本文对其进行系统研究, 提出了一种新的分步子空间映射(TSSM)算法, 通过对体外胸腹部表面的测量, 来预测体内膈肌的运动. 本文首先采用三维图像分割技术对4D CT图像进行分割, 在不使用标记物的情况下, 准确测量体内膈肌和体外胸腹部表面的位移. 为了解决跨空间的预测问题, TSSM首先构造特征子空间, 并将膈肌数据和胸腹外表面数据分别映射到各自的子空间中, 以减少数据的相关性和冗余信息; 然后通过线性岭回归优化过程, 对两个子空间进行二次映射, 从而有效地捕获跨空间数据之间的相关性. 根据训练得到的相关模型, 通过体外胸腹部外表面的运动情况, 对体内膈肌的运动情况进行准确的预测. 为了研究数据之间的非线性关系, 本文进一步将TSSM推广到了基于核的TSSM(kTSSM)算法. 实验表明, 该方法可以根据腹腔外表面的运动情况, 准确的对体内膈肌位移进行预测, 优于经典的线性模型和ANN模型. 本文给出了优化算法的解析解, 其运算速度快, 将有助于提高放射治疗中门控技术和跟踪技术的效率和精度.
首先, 阐述电动汽车(Electric vehicle, EV)驱动系统的布置结构以及差速控制的原理和优缺点, 并介绍用于电子差速控制(Electronic differential control, EDC)的Acekermann转向模型和3自由度整车动力学模型, 进而剖析非线性扰动和整车模型的设计理念; 其次, 重点综述电动汽车分布式驱动结构的电子差速控制策略、多机抗扰控制及优化算法的相关研究成果, 并从成果走向、局限性及可能的发展空间分析其发展态势; 最后, 从整车模型、控制策略、抗扰算法和效果验证等四个方面, 总结电动汽车电子差速控制技术的现状, 并展望未来发展可能.
深度学习可以有效提取图像隐含特征,在医学影像识别方面的应用快速发展. 由于糖尿病视网膜病变(Diabetic retinopathy, DR)诊断标准明确、分类体系成熟,应用深度学习诊断糖尿病视网膜病变近年来成为研究热点. 本文从深度学习方法在DR诊断中的最新研究进展、DR诊断的一般流程、公共数据集、医学影像标注方法、主要实现模型、面临的主要挑战几方面, 对深度学习方法在糖尿病视网膜病变诊断中的应用进行了详细综述, 便于更多机器视觉、尤其是深度学习医学影像的研究者们参照对比,加快该领域研究的成熟度和临床落地应用.
针对标准粒子群优化算法存在早熟收敛和容易陷入局部最优的问题, 本文提出了一种基于事件触发的全信息粒子群优化算法(Event-Triggering-Based Full-Information Particle Swarm Optimization, EFPSO). 首先, 引入一类基于粒子空间特性的事件触发策略实现粒子群优化算法(Particle Swarm Optimization, PSO) 的模态切换, 更好地维持了算法搜索和收敛能力之间的动态平衡. 然后, 鉴于引入历史信息能够降低算法陷入局部最优的可能性, 提出一种全信息策略来克服PSO算法搜索能力不足的缺陷. 数值仿真实验表明, EFPSO算法在种群多样性、收敛率、成功率方面是优于其它改进的PSO算法. 最后, 应用EFPSO算法对变分模态分解(Variational Mode Decomposition, VMD)去噪算法进行改进, 并在现场管道信号去噪取得了很好的效果.
对于大机动目标拦截问题, 模式决策器是基于逻辑的集成估计导引系统(Integrated estimation and guidance, IEG)中的一个重要组件. 为了保证系统的估计精度和制导性能, 模式决策器的模式延迟应尽可能小. 本文针对末制导场景, 首先推导了离散时间系统零控脱靶量的估计误差模型, 然后在一致性约束条件下给出了系统最大可容许模式决策延迟的数值计算方法. 本文的研究结果可为IEG系统中模式决策器的设计提供指标参考.
水下仿生软体机器人在水底环境勘测, 水下生物观测等方面具有极高的应用价值. 本文为进一步提升仿章鱼臂软体机器人在特殊水下环境中控制效果, 提出一种自适应鲁棒视觉伺服控制方法, 实现其在干扰无标定环境中的高精度镇定控制. 本文基于水底动力学模型, 设计保证动力学稳定的控制器; 针对柔性材料离线标定过程繁琐成本高, 提出料参数自适应估计算法; 针对水下特殊工作条件, 设计自适应鲁棒视觉伺服控制器, 实现折射效应的在线补偿, 并通过自适应未知环境干扰上界, 避免先验环境信息的求解. 所提算法在软体机器人样机中验证其镇定控制性能, 为仿生软体机器人的实际应用提供理论基础.
由于地面雷达受视距限制无法对高超声速飞行器进行连续观测, 针对高超声速飞行器飞出雷达视距盲区后难以搜索的问题, 提出了一种基于信息几何的雷达搜索方法. 本文利用非参数概率密度估计法对高超声速飞行器的出现位置的概率密度进行估计, 并把估计的位置概率密度作为雷达搜索的引导信息; 根据引导信息确定搜索区域, 以区域覆盖率最大化作为优化目标在搜索区域内进行波位编排; 基于信息几何理论, 将搜索策略建模为统计流形, 利用KL(Kullback-Leibler)散度来度量搜索策略与引导信息之间的差异, 通过最小化KL散度获得最优搜索策略. 通过仿真实验验证了本文所提方法的有效性和可行性, 并验证了相比其他搜索方法具有较明显的优势.
现有基于深度学习的立体匹配算法在学习推理过程中缺乏有效信息交互, 而特征提取和代价聚合两个子模块的特征维度存在差异, 导致注意力方法在立体匹配网络中应用较少、方式单一. 针对这些问题, 本文提出了一种多维注意力特征聚合立体匹配算法. 设计二维(Two-dimensional, 2D)注意力残差模块, 通过在原始残差网络中引入无降维自适应2D注意力残差单元, 局部跨通道交互并提取显著信息, 为匹配代价计算提供丰富有效的特征. 构建三维(Three-dimensional, 3D)注意力沙漏聚合模块, 以堆叠沙漏结构为骨干设计3D注意力沙漏单元, 捕获多尺度几何上下文信息, 进一步扩展多维注意力机制, 自适应聚合和重新校准来自不同网络深度的代价体. 在三大标准数据集上进行评估, 并与相关算法对比, 实验结果表明所提算法具有更高的预测视差精度, 且在无遮挡的显著对象上效果更佳.
现有的图聚类方法主要存在两方面的问题, 一是对各个类规模一致的假设, 在许多实际应用中并不成立. 二是在处理多类聚类问题时, 其所常借助的递归技术或启发式算法会影响聚类的性能. 为此, 本文提出一种基于灵活平衡约束的多类图聚类方法. 其能够覆盖从绝对平衡约束到无平衡约束的范围, 可同时处理类别规模一致和不一致的问题. 为有效求解新方法中的参数, 进一步提出一个紧松弛方法来使所提出的图聚类方法不仅易于求解, 且在处理多类聚类问题时不必依赖递归技术, 而能直接得到聚类结果. 文中也给出一种实现松弛图聚类的有效求解算法. 在合成数据和真实数据上的实验结果表明, 所提出的方法具有良好的性能.
针对串行广义特征值分解算法实时性差的缺点, 提出了基于加权矩阵的多维广义特征值分解算法. 与串行算法不同, 所提算法能够在一次迭代过程中并行地估计出多维广义特征向量. 平稳点分析表明: 当且仅当算法中状态矩阵等于所需的广义特征向量时, 算法达到收敛状态. 通过对比相邻时刻的状态矩阵模值证明了所提算法的自稳定特性. 所提算法参数选取简单, 实际实施较为容易. 数值仿真和实例应用进一步验证了算法的并行性、自稳定性和实用性.
针对包含幅值有界而分布形式未知的故障及输入干扰项的线性离散系统, 提出了一种新的系统故障可分离性的量化评价方法. 故障可分离性是故障可诊断性中的重要部分, 针对现有方法中基于方向相似度的故障可分离性评价方法存在的不足加以补充, 提出了利用中心对称多胞体对故障可分离性进行分析, 将中心对称多胞体集合转化为多面体的表示形式, 以达到对故障可分离性量化评价的目的, 同时给出了具体评价原理和评价指标. 最后, 通过数值仿真算例, 验证了该方法的有效性和优越性.
为了提高多无人机协同轨迹规划效率, 在解耦序列凸优化方法基础上, 提出一种高效求解凸优化子问题的定制内点法. 首先引入松弛变量, 构建子问题的等价描述形式, 并推导该形式下的子问题最优性条件. 然后在预测-校正原对偶内点法的框架下, 构建一套高效求解最优性条件方程组的计算流程以降低子问题计算复杂度, 并利用约束矩阵特征提出一种快速计算原对偶搜索方向的方法以提高规划效率. 仿真结果表明, 在解耦序列凸优化框架下, 定制内点法可将协同轨迹规划耗时降低一个数量级, 达到秒级.
本文针对传统动态水印检测方法无法适用模型不确定系统的攻击检测问题, 首先分析模型不确定项导致的传统动态水印检测失效原因, 然后考虑模型不确定项和过程噪声的统计规律, 将其影响转化为对方差变化特性进行分析, 提出两个具有鲁棒性的攻击检测式以及检测式中关键时变方差阈值的确定方法; 其次采用系统失真信号功率定量刻画攻击信号造成系统性能损失程度, 理论证明了系统失真信号功率上界; 在此基础上考虑最坏情况下攻击能够躲过检测, 基于水印信号与其它混合信号相互独立性新增第三检测式, 同时理论证明了系统失真信号功率上界进一步受限范围, 进而提升不确定系统的安全性; 最后仿真算例验证了所提方法的有效性和可行性.
句级 (Utterance-level) 特征提取是文本无关说话人识别领域中的重要研究方向之一. 与只能刻画短时语音特性的帧级 (Frame-level) 特征相比, 句级特征中包含了更丰富的说话人个性信息; 且不同时长语音的句级特征均具有固定维度, 更便于与大多数常用的模式识别方法相结合. 近年来, 句级特征提取的研究取得了很大的进展, 鉴于其在说话人识别中的重要地位, 本文将对近期具有代表性的句级特征提取方法与技术进行整理与综述, 并分别从前端处理、基于任务分段式与驱动式策略的特征提取方法, 以及后端处理4方面进行论述, 最后还将对未来的研究趋势展开探讨与分析.
针对机器人摄影测量中离线规划受初始位姿标定影响的问题, 提出融合初始位姿估计的机器人摄影测量系统视点规划方法. 首先构建基于YOLO的深度学习网络估计被测对象3D包围盒, 利用PNP算法快速求解对象姿态; 然后随机生成机器人无奇异无碰撞的视点, 基于相机成像的2D-3D正逆性映射, 根据深度原则计算每个视角下目标可见性矩阵; 最后, 引入熵权法, 以最小化重建信息熵为目标建立优化模型, 并基于TSP模型规划机器人路径. 结果表明: 利用深度学习估计的平移误差低于5 mm, 角度误差低于2°. 考虑熵权的视点规划方法提高了摄影测量质量, 融合深度学习初始姿态的摄影测量系统提高了重建效率. 利用本算法对典型零件进行摄影测量质量和效率的验证, 均获得优异的位姿估计和重建效果. 提出的算法适用于实际工程应用, 尤其是快速稀疏摄影重建, 促进了工业摄影测量速度与自动化程度提升.
针对水下观测图像的颜色失真和散射模糊问题, 提出一种基于改进循环一致性生成对抗网络(Cycle-consistent generative adversarial networks, CycleGAN)的水下图像颜色校正与增强算法. 为了利用CycleGAN学习水下降质图像到空气中图像的映射关系, 对传统CycleGAN的损失函数进行了改进, 提出了基于图像强边缘结构相似度(Strong edge and structure similarity, SESS)损失函数的SESS-CycleGAN, SESS-CycleGAN可以在保留原水下图像的边缘结构信息的前提下实现水下降质图像的颜色校正和对比度增强. 为了确保增强后图像和真实脱水图像颜色的一致性, 建立了SESS-CycleGAN和正向生成网络G相结合的网络结构; 并提出了两阶段学习策略, 即先利用非成对训练集以弱监督方式进行SESS-CycleGAN学习, 然后再利用少量成对训练集以强监督方式进行正向生成网络G的监督式学习. 实验结果表明: 本文算法在校正水下图像颜色失真的同时还增强了图像对比度, 且较好地实现了增强后图像和真实脱水图像视觉颜色的一致性.
受采集装置的限制, 采集的深度图像存在分辨率较低、易受噪声干扰等问题. 本文提出了分级特征反馈融合网络 (Hierarchical Feature Feedback Network, HFFN), 以实现深度图像的超分辨率重建. 该网络利用金字塔结构挖掘深度-纹理特征在不同尺度下的分层特征, 构建深度-纹理的分层特征表示. 为了有效利用不同尺度下的结构信息, 本文设计了一种分级特征的反馈式融合策略, 综合深度-纹理的边缘特征, 生成重建深度图像的边缘引导信息, 完成深度图像的重建过程. 与对比方法相比, 实验结果表明本文方法实现了深度图像的主、客观质量的提升.
作为目前主流翻译方法的神经网络机器翻译已经取得了很大突破, 在很多具有丰富数据资源的语言上的翻译质量也不断得到改善, 但对于稀缺资源语言的翻译效果却仍然并不理想. 稀缺资源语言机器翻译是目前机器翻译领域的重要研究热点之一, 近几年来吸引了国内外的广泛关注. 本文对稀缺资源语言机器翻译的研究进行比较全面的回顾, 首先简要介绍了与稀缺资源语言翻译相关的学术活动和数据集, 然后重点梳理了目前主要的研究方法和一些研究结论, 总结了每类方法的特点, 在此基础上总结了不同方法之间的关系并分析了目前的研究现状. 最后, 对稀缺资源语言机器翻译未来可能的研究趋势和发展方向进行了展望,并给出了相关建议.
人类具有很强的草图识别能力. 然而, 由于草图具有稀疏性和缺少细节的特点, 目前的深度学习模型在草图分类任务上仍然面临挑战. 目前的工作只是将草图看作灰度图像而忽略了不同草图类别间的形状表示差异. 本文提出一种端到端的手绘草图识别模型, 简称双模型融合网络(Dual-Model Fusion Network, DMF-Net), 它可以通过相互学习策略获取草图的纹理和形状信息. 具体来说, 该模型由两个分支组成: 一个分支能够从图像表示(即原始草图)中自动提取纹理特征, 另一个分支能够从图形表示(即基于点的草图)中自动提取形状特征. 此外, 提出视觉注意一致性损失来度量两个分支之间视觉显著图的一致性, 这样可以保证两个分支关注相同的判别性区域. 最终将分类损失、类别一致性损失和视觉注意一致性损失结合完成DMF-Net网络的优化. 本文在两个具有挑战性的数据集TU-Berlin数据集和Sketchy数据集上进行草图分类实验, 评估结果说明了DMF-Net显著优于基准方法并达到最佳性能.
本文借鉴“雁阵效应”, 研究了扑翼飞行机器人高效集群编队飞行问题. 通过对“V”字雁阵的分析得知, 当前排大雁(简称头雁)和后排大雁(简称从雁)保持某一合适的相对位置偏移时, 后排大雁可有效利用前排大雁挥翅产生的上洗涡流, 从而节省体能; 并且, 雁阵通过阵型的变换, 可以实现能量整体消耗的均衡性, 确保长航时飞行. 仿照该“雁阵效应”, 分析得出耗能最少的扑翼飞行机器人集群阵型排布方式, 并设计了阵型变换机制, 实现集群能量整体消耗的最优性和均衡性. 在此基础上, 参考雁群的交互方式, 设计了一种使用局部信息的控制方法, 保证最优阵型的稳定维持以及阵型间的灵活变换. 最后, 仿真结果验证了所提理论结果的有效性.
针对越野非结构化环境下的地面无人平台(Unmanned Ground Vehicle, UGV)编队仿真系统存在功能模块不完善及算法集成测试困难等问题, 为便于有效测试地面无人平台编队协同控制方法性能及其适用的任务场景, 降低编队协同系统的开发成本, 本文提出了一种基于Unified System for Automation and Robotics Simulator(USARSim)和Robot Operating System(ROS)的地面无人平台编队协同仿真系统. 该仿真系统由人机交互界面、基于ROS架构的地面无人平台控制系统和基于USARSim的虚拟仿真场景三个部分组成, 其测试对象为地面无人平台编队协同控制算法. 通过充分利用ROS中集成的开源导航算法和USARSim中丰富的机器人及环境模型, 该系统为研究地面无人平台编队协同控制算法提供了新的思路和快速验证工具. 以领航者-跟随者编队控制方法为例进行该仿真系统的性能测试, 实验结果表明, 该仿真系统能够在外界条件一致的情况下完成对编队协同控制方法的性能测试, 系统稳定可靠.
为快速构建一个大规模、多领域的高质树库, 本文提出一种基于短语功能与句法角色的组块的、便于标注多层次结构的标注体系, 在篇章中综合利用标点、句法结构、表述功能作为句边界判断标准, 确立合理的句边界与层次; 在句子中以组块的句法功能为主, 参考篇章功能、人际功能, 以4个性质标记、8个功能标记、4个句标记来描写句中3类5种组块, 标注基本句型骨架, 突出中心词信息. 目前已初步构建有质量保证的千万汉字规模的浅层结构分析树, 包含60余万小句的9千余条句型结构库, 语料涉及百科、新闻、专利等应用领域文本1万余篇; 与此同时也探索了高效的标注众包管理模式.
基于深度学习的方法在某些工业产品的表面缺陷识别和分类方面表现出优异的性能, 然而大多数工业产品缺陷样本稀缺, 而且特征差异大, 导致这类需要大量缺陷样本训练的检测方法难以适用. 本文提出一种基于重构网络的无监督缺陷检测算法(Reconstruction network for defects detection, ReNet-D), 仅使用容易大量获得的无缺陷样本数据实现对异常缺陷的检测. 本文提出的算法包括两个阶段: 图像重构网络训练阶段和表面缺陷区域检测阶段. 训练阶段通过一种轻量化结构的全卷积自编码器设计重构网络, 仅使用少量正常样本进行训练, 使得重构网络能够生成无缺陷重构图像, 进一步提出一种结合结构性损失和L1损失的函数作为重构网络的损失函数, 解决自编码器检测算法对不规则纹理表面缺陷检测效果较差的问题; 缺陷检测阶段以重构图像与待测图像的残差作为缺陷的可能区域, 通过常规图像操作即可实现缺陷的定位. 本文对所提出的ReNet-D方法的网络结构、训练像素块(patch)大小、损失函数系数等影响因素进行了详细的实验分析, 并在多个缺陷图像样本集上与其他同类算法做了对比, 结果表明ReNet-D有较强的鲁棒性和准确性. 由于ReNet-D的轻量化结构, 检测1024x1024像素大小的图像仅仅耗时2.82 ms, 适合工业在线检测.
本文从理论上分析了执行机构带宽对动态逆闭环控制系统动态特性影响, 发现较低的执行机构带宽会在伪线性系统中引入一个非线性干扰项, 为此提出了两种方法来消除这个非线性干扰项, 一个是采用参考模型的思想设计补偿器提高执行机构子系统的等效带宽, 另一个思路则是直接在非线性反馈项中引入补偿直接对消非线性干扰项. 仿真结果表明, 两类方法都能较好的消除非线性干扰项, 直接补偿方法能精确消除干扰项, 但需要准确动力学模型, 提高等效带宽的方法虽然是近似的, 但能方便的引入自适应算法, 可以抑制执行机构模型参数不确定的影响.
近年来, 深度学习技术已在滚动轴承故障检测和诊断领域取得了成功应用, 但面对不停机情况下的早期故障在线检测问题, 仍存在着早期故障特征表示不充分、误报警率高等不足. 为解决上述问题, 本文从时序异常检测的角度出发, 提出了一种基于深度迁移学习的早期故障在线检测方法. 首先, 提出一种面向多域迁移的深度自编码网络, 通过构建具有改进的最大均值差异正则项和Laplace正则项的损失函数, 在自适应提取不同域数据的公共特征表示同时, 提高正常状态和早期故障状态之间特征的差异性; 基于该特征表示, 提出一种基于时序异常模式的在线检测模型, 利用离线轴承正常状态的排列熵值构建报警阈值, 实现在线数据中异常序列的快速匹配, 同时提高在线检测结果的可靠性. 在XJTU-SY数据集上的实验结果表明, 与现有代表性早期故障检测方法相比, 本文方法具有更好的检测实时性和更低的误报警数.
一直以来, 各种推荐系统关注于如何挖掘用户与物品特征间的潜在关联, 特征信息的充分利用有利于用户到物品的精准匹配. 基于矩阵分解和分解机的推荐算法是该领域的主流, 前者学习用户历史行为而后者分析对象特征关系, 但都难以兼顾用户行为与个体特征. 而近年来, 深度神经网络凭借其强大的特征学习能力和灵活可变的结构被应用到了推荐系统领域. 鉴于此, 本文提出了一种基于注意力机制的协同卷积动态推荐网络, 它通过注意力机制实现用户历史行为、用户画像与物品属性的多重交互, 再通过卷积网络逐层捕捉更高阶的特征交互. 网络同时接受不同组块输出的低阶至高阶信息, 最后给出用户对指定物品青睐评分概率的预估. 而且本文还提出了一种基于无参时间衰减的用户兴趣标签来量化用户关注的变化. 通过比较若干先进模型在两个现实数据集的表现, 本文设计的动态推荐模型不但能够缓解推荐时滞性, 还能明显提高推荐质量, 为用户带来更好的个性化服务体验.
基于胶囊网络的向量神经元思想和EM算法, 本文设计了一种以EM为向量聚类算法的深度胶囊网络, 实现了重叠手写数字的识别与分离. 该网络由两部分组成, 第一部分使用两个卷积层、两个基础胶囊层、两个EM聚类胶囊层构成六层网络结构. 其将胶囊维数由常规的8维扩充为16维, 并利用姿态转换矩阵实现低级特征到高级特征的预测, 同时将EM算法改为EM向量聚类算法, 以替换原胶囊网络中的迭代路由部分, 优化了网络的运算过程, 实现了重叠目标识别. 第二部分是重构网络部分, 由结构完全相同的两个并行网络组成, 对双向量进行并行重构, 实现了重叠目标的分离. 实验结果显示, 对于100%全重叠手写数字图片本网络识别率达到了96%, 对比现有的胶囊网络CapsNet在80%的重叠率下95%的识别率, 在100%的重叠率下88%的识别率, 本文网络在难度提升的情况下, 识别率有明显提高, 能够将完全叠加的两张手写数字图片进行准确地分离.