2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于混合推理的仿真实验设计方法智能选择

陆凌云 李伟 杨明 马萍

陆凌云, 李伟, 杨明, 马萍. 基于混合推理的仿真实验设计方法智能选择. 自动化学报, 2019, 45(6): 1055-1064. doi: 10.16383/j.aas.c180177
引用本文: 陆凌云, 李伟, 杨明, 马萍. 基于混合推理的仿真实验设计方法智能选择. 自动化学报, 2019, 45(6): 1055-1064. doi: 10.16383/j.aas.c180177
LU Ling-Yun, LI Wei, YANG Ming, MA Ping. Intelligent Selection of Simulation Experiment Design Methods Based on Hybrid Reasoning. ACTA AUTOMATICA SINICA, 2019, 45(6): 1055-1064. doi: 10.16383/j.aas.c180177
Citation: LU Ling-Yun, LI Wei, YANG Ming, MA Ping. Intelligent Selection of Simulation Experiment Design Methods Based on Hybrid Reasoning. ACTA AUTOMATICA SINICA, 2019, 45(6): 1055-1064. doi: 10.16383/j.aas.c180177

基于混合推理的仿真实验设计方法智能选择


DOI: 10.16383/j.aas.c180177
详细信息
    作者简介:

    陆凌云  哈尔滨工业大学博士研究生.主要研究方向为仿真实验设计, 仿真数据分析.E-mail:lulingyun987@163.com

    李伟   哈尔滨工业大学副教授.2009年获得哈尔滨工业大学博士学位.主要研究方向为仿真分析与评估, 分布式仿真, 仿真实验设计.E-mail:frank@hit.edu.cn

    杨明   哈尔滨工业大学教授.1997年获得哈尔滨工业大学博士学位.主要研究方向为飞行器制导与控制, 复杂系统仿真理论与方法.E-mail:myang@hit.edu.cn

    通讯作者: 马萍  哈尔滨工业大学教授.2003年获得哈尔滨工业大学博士学位.主要研究方向为复杂系统建模与仿真, 仿真可信度评估.本文通信作者.E-mail:pingma@hit.edu.cn
  • 基金项目:

    国家自然科学基金 61627810

    国家自然科学基金 61403097

Intelligent Selection of Simulation Experiment Design Methods Based on Hybrid Reasoning

More Information
    Author Bio:

       Ph.D. candidate at Harbin Institute of Technology (HIT). His research interest covers simulation experiment design and simulation data analysis

      Associate professor at Harbin Institute of Technology (HIT). He received his Ph.D. degree from HIT in 2009. His research interest covers simulation analysis and evaluation, distributed simulation, simulation experiment design

      Professor at Harbin Institute of Technology (HIT). He received his Ph.D. degree from HIT in 1997. His research interest covers vehicle guidance and control, complex system simulation theory and method

    Corresponding author: MA Ping   Professor at Harbin Institute of Technology (HIT). She received her Ph.D. degree from HIT in 2003. Her research interest covers complex system modeling and simulation, simulation credibility evaluation. Corresponding author of this paper
  • Fund Project:

    National Natural Science Foundation of China 61627810

    National Natural Science Foundation of China 61403097

  • 摘要: 针对仿真实验设计方法众多而在实际应用中难以准确选择的问题,提出一种用于仿真实验设计方法智能选择的混合推理方法.首先,给出了基于混合推理的仿真实验智能化设计流程;然后,针对案例检索策略,将仿真实验设计案例的属性分为三种类型,分别给出其属性差异度量模型及特征值归一化方法,并采用训练后的神经网络模型分配属性权重;进一步,当推荐的案例未能满足给定的相似度阈值时,引入属性优先级的概念,提出了一种基于规则的柔性逐层推理方法;在此基础上,设计了案例库和规则库;最后,通过实验验证了所提出方法的有效性.
    本文责任编委 刘艳军
  • 图  1  仿真实验智能化设计流程

    Fig.  1  Flow chart of intelligent design of simulation experiment

    图  2  属性归一化处理函数

    Fig.  2  Normalized processing fuction of attributes

    图  3  基于NN的属性权重分配网络结构

    Fig.  3  Network structure of attribute weight assignment based on neural network

    图  4  RBFLR方法流程图

    Fig.  4  Flow chart of RBFLR method

    图  5  不同分配比例下各推理方法的平均分配准确率

    Fig.  5  Averaging classification accuracy of different assignment proportions

    表  1  案例属性

    Table  1  Attributes of the cases

    ID 属性 属性取值 属性类型
    1 实验目的 $\text{EP}\in\textbf{ N}$ 语义型离散
    2 实验点分布 $\text{ED}\in\textbf{ N}$ 语义型离散
    3 系统复杂度假设 $\text{SC}\in\textbf{ N}$ 语义型离散
    4 二因子交互效应估计 $\text{FI}\in\textbf{ N}$ 语义型离散
    5 模型独立性 $\text{MI}\in\textbf{ N}$ 语义型离散
    6 处理群组因子 $\text{CG}\in\textbf{ N}$ 语义型离散
    7 实验点可扩展性 $\text{EE}\in\textbf{ N}$ 语义型离散
    8 水平数 $\text{FL}\in\textbf{ N}$ 语义型离散
    9 实验次数 $\text{EN}\in\textbf{ N}$ $^{+}$ 实数型离散
    10 因子数 $\text{FN}\in\textbf{ N}$ $^{+}$ 实数型离散
    11 仿真实验设计方法 $\text{EM}\in\textbf{ N}$ $^{+}$ 语义型离散
    下载: 导出CSV

    表  2  规则属性

    Table  2  Attributes of the rules

    ID 属性 属性取值 属性类型 优先级
    1 实验目的 $\text{EP}\in\textbf{ N}$ 语义型离散 ${{k}_{1}}$
    2 实验点分布 $\text{ED}\in\textbf{ N}$ 语义型离散 ${{k}_{2}}$
    3 系统复杂度假设 $\text{SC}\in\textbf{ N}$ 语义型离散 ${{k}_{3}}$
    4 二因子交互效应估计 $\text{FI}\in\textbf{ N}$ 语义型离散 ${{k}_{4}}$
    5 模型独立性 $\text{MI}\in\textbf{ N}$ 语义型离散 ${{k}_{5}}$
    6 处理群组因子 $\text{CG}\in\textbf{ N}$ 语义型离散 ${{k}_{6}}$
    7 实验点可扩展性 $\text{EE}\in\textbf{ N}$ 语义型离散 ${{k}_{7}}$
    8 水平数 $\text{FL}\in\textbf{ N}$ 语义型离散 ${{k}_{8}}$
    9 实验次数 $\text{EN}\in [{s}_{1}, {s}_{2}]$ 实数型区间 ${{k}_{9}}$
    10 因子数 $\text{FN}\in [{n}_{1}, {n}_{2}]$ 实数型区间 ${{k}_{10}}$
    11 仿真实验设计方法 $\text{EM}\in\textbf{ N}$ $^{+}$ 语义型离散 $/$
    备注: EP $\in $ {1)寻找重要因子, 2)寻找稳健参数, 3)优化, 4)不确定性分析, 5)灵敏度分析, 6)方差分析, 7)综合评估}; ED $\in $ {1)均匀性, 2)正交性, 3)空间填充性, 4)随机性, 5)鲁棒性, 6)序贯性}; SC $\in $ {1)一阶多项式(主效应模型), 2)一阶多项式+二因子交互效应, 3)二阶多项式(含完全平方项), 4)高阶交互效应}; FI $\in $ {1)能, 2)否}; MI $\in $ {1)是, 2)否}; CG $\in $ {1)能, 2)否}; EE $\in $ {1)能, 2)否}; FL $\in $ {1) 2$ \sim $3水平为主, 2) 4$ \sim $10水平为主, 3)大于10水平为主, 4)水平较为分散}; EN $\in $ {1) $[1, n)$, 2) $[n, +\infty)$, 3) $[{{2}^{n}}, +\infty)$}, 其中$n$为因子数; FN $\in $ {1) $[2, 13]$, 2) $[14, 50]$, 3) $[51, 100]$, 4) $[101, 500]$, 5) $[501, +\infty)$}; EM $\in $ {1)全面析因设计, 2)分式析因设计, 3)正交设计, 4)均匀设计, 5)拉丁超立方抽样, 6)蒙特卡罗抽样, 7)拟蒙特卡罗抽样, 8)重要性抽样, 9)中心复合设计, 10)稳健设计, 11)顺序分支法, 12)迭代分式析因设计, 13)二阶段组筛选法, 14) Trocine筛选流程}.
    下载: 导出CSV

    表  3  规则库

    Table  3  Rule base

    ID $Pc$ $Cq$
    1 $\text{EP}=2$ $\text{EM}=\left\{ 10 \right\}$
    2 $\text{ED}=3$ $\text{EM}=\left\{ 3, 4, 5 \right\}$
    3 $\text{CG}=1$ $\text{EM}=\left\{ 11, 12, 13, 14 \right\}$
    $\vdots $ $\vdots $ $\vdots $
    60 $\text{FL}=4$, $\text{EN}=2$, $\text{FN}=3$ $\text{EM}=\left\{ 11, 14 \right\}$
    下载: 导出CSV

    表  4  规则的条件属性优先级

    Table  4  Priority of condition attribute for the rules

    EP ED SC FI MI CG EE FL EN FN
    5 2 3 3 4 4 3 1 1 1
    下载: 导出CSV

    表  5  案例库

    Table  5  Case base

    ID EP ED SC FI MI CG EE FL EN FN EM
    1 6 2 2 1 1 2 2 1 32 5 1
    2 5 3 1 1 1 2 2 1 8 7 3
    3 5 3 2 1 1 2 1 3 500 7 5
    $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $
    142 3 1 1 1 1 2 2 2 10 8 4
    下载: 导出CSV

    表  6  不同推理方法的平均分类准确率($\%$)

    Table  6  Averaging classification accuracy of different reasoning methods ($\%$)

    推理方法 分配比例
    1 : 1 3 : 2 2 : 1 2 : 3
    MA-CBR 67.61 66.67 72.34 68.24
    NN$\_$Rel-CBR 74.51 72.46 79.57 71.41
    NN$\_$Sal-CBR 73.10 72.63 79.15 71.18
    MA-CBR&RBFLR 80.28 80.70 85.11 ${\bf 80.00}$
    NN$\_$Rel-CBR & RBFLR ${\bf 81.13}$ ${\bf 82.11}$ 85.74 ${\bf 80.00}$
    NN$\_$Sal-CBR & RBFLR 79.58 80.00 ${\bf 86.60}$ 78.59
    下载: 导出CSV
  • [1] Kleijnen J P C[著], 张列刚, 张建康, 刘兴科[译].仿真实验设计与分析.北京: 电子工业出版社, 2010. 1-136

    Kleijnen J P C[Author], Zhang Lie-Gang, Zhang Jian-Kang, Liu Xing-Ke[Translator]. Design and Analysis of Simulation Experiments. Beijing: Publishing House of Electronics Industry, 2010. 1-136
    [2] Wu Y L, Song X, Gong G H. Real-time load balancing scheduling algorithm for periodic simulation models. Simulation Modelling Practice and Theory, 2015, 52:123-134 doi:  10.1016/j.simpat.2015.01.001
    [3] Simpson T W, Booker A J, Ghosh D, Giunta A A, Koch P N, Yang R J. Approximation methods in multidisciplinary analysis and optimization:a panel discussion. Structural and Multidisciplinary Optimization, 2004, 27(5):302-313
    [4] Trocine L, Malone L C. Experimental design and analysis: an overview of newer, advanced screening methods for the initial phase in an experimental design. In: Proceedings of the 33rd Conference on Winter Simulation. Arlington, Virginia: IEEE, 2001. 169-178
    [5] Wang G G, Shan S. Review of metamodeling techniques in support of engineering design optimization. Journal of Mechanical Design, 2007, 129(4):370-380 doi:  10.1115/1.2429697
    [6] Sanchez S M, Wan H. Work smarter, not harder: a tutorial on designing and conducting simulation experiments. In: Proceedings of the 2012 Winter Simulation Conference. Berlin, Germany: IEEE, 2012. 1-15
    [7] Burnaev E, Panin I, Sudret B. Efficient design of experiments for sensitivity analysis based on polynomial chaos expansions. Annals of Mathematics and Artificial Intelligence, 2017, 81(1-2):187-207 doi:  10.1007/s10472-017-9542-1
    [8] Garud S S, Karimi I A, Kraft M. Design of computer experiments:a review. Computers & Chemical Engineering, 2017, 106:71-95 http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_b0be64b1b06c0793fe44ccf7da68bb9b
    [9] Fang K T, Lin D K J, Winker P, Zhang Y. Uniform design:theory and application. Technometrics, 2000, 42(3):237-248 doi:  10.1080/00401706.2000.10486045
    [10] Sheldon M R. Simulation (Fifth edition). San Diego:Academic Press, 2012. 153-232
    [11] Husslage B G M, Rennen G, van Dam E R, den Hertog D. Space-filling Latin hypercube designs for computer experiments. Optimization and Engineering, 2011, 12(4):611-630 doi:  10.1007/s11081-010-9129-8
    [12] Damblin G, Couplet M, Iooss B. Numerical studies of space-filling designs:optimization of Latin hypercube samples and subprojection properties. Journal of Simulation, 2013, 7(4):276-289 doi:  10.1057/jos.2013.16
    [13] Tong C. Refinement strategies for stratified sampling methods. Reliability Engineering & System Safety, 2006, 91(10-11):1257-1265 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=1df7de336bbf9bd363998586d5bd0ebf
    [14] Li W, Lu L Y, Xie X T, Yang M. A novel extension algorithm for optimized Latin hypercube sampling. Journal of Statistical Computation and Simulation, 2017, 87(13):2549-2559 doi:  10.1080/00949655.2017.1340475
    [15] Williamson D. Exploratory ensemble designs for environmental models using k-extended Latin hypercubes. Environmetrics, 2015, 26(4):268-283 doi:  10.1002/env.2335
    [16] Kleijnen J P C, Sanchez S M, Lucas T W, Cioppa T M. State-of-the-art review:a user's guide to the brave new world of designing simulation experiments. Informs Journal on Computing, 2005, 17(3):263-289 doi:  10.1287/ijoc.1050.0136
    [17] Bursztyn D, Steinberg D M. Comparison of designs for computer experiments. Journal of Statistical Planning and Inference, 2006, 136(3):1103-1119 doi:  10.1016/j.jspi.2004.08.007
    [18] 赵辉, 严爱军, 王普.提高案例推理分类器的可靠性研究.自动化学报, 2014, 40(9):2029-2036 http://www.aas.net.cn/CN/abstract/abstract18475.shtml

    Zhao Hui, Yan Ai-Jun, Wang Pu. On improving reliability of case-based reasoning classifier. Acta Automatica Sinica, 2014, 40(9):2029-2036 http://www.aas.net.cn/CN/abstract/abstract18475.shtml
    [19] 苏锑, 杨明, 王春香, 唐卫, 王冰.一种基于分类回归树的无人车汇流决策方法.自动化学报, 2018, 44(1):35-43 http://www.aas.net.cn/CN/abstract/abstract19202.shtml

    Su Ti, Yang Ming, Wang Chun-Xiang, Tang Wei, Wang Bing. Classification and regression tree based traffic merging for method self-driving vehicles. Acta Automatica Sinica, 2018, 44(1):35-43 http://www.aas.net.cn/CN/abstract/abstract19202.shtml
    [20] 郑文博, 王坤峰, 王飞跃.基于贝叶斯生成对抗网络的背景消减算法.自动化学报, 2018, 44(5):878-890 http://www.aas.net.cn/CN/abstract/abstract19279.shtml

    Zheng Wen-Bo, Wang Kun-Feng, Wang Fei-Yue. Background subtraction algorithm with Bayesian generative adversarial networks. Acta Automatica Sinica, 2018, 44(5):878-890 http://www.aas.net.cn/CN/abstract/abstract19279.shtml
    [21] Richhariya B, Tanveer M. EEG signal classification using universum support vector machine. Expert Systems with Applications, 2018, 106:169-182 doi:  10.1016/j.eswa.2018.03.053
    [22] Deng Y, Ren Z Q, Kong Y Y, Bao F, Dai Q H. A hierarchical fused fuzzy deep neural network for data classification. IEEE Transactions on Fuzzy Systems, 2017, 25(4):1006-1012 doi:  10.1109/TFUZZ.2016.2574915
    [23] 万秋生.复杂仿真实验设计与监控技术研究[硕士学位论文], 哈尔滨工业大学, 中国, 2012. 25-30

    Wan Qiu-Sheng. The Technology of Designing and Monitoring for Complex Simulation Experiments[Master thesis], Harbin Institute of Technology, China, 2012. 25-30
    [24] Li W, Lu L Y, Liu Z Z, Ma P, Yang M. HIT-SEDAES: an integrated software environment for simulation experiment design, analysis and evaluation. International Journal of Modeling, Simulation, and Scientific Computing, 2016, 7(3): Article No.1650027
    [25] Im K H, Park S C. Case-based reasoning and neural network based expert system for personalization. Expert Systems with Applications, 2007, 32(1):77-85 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=43719736fdd3ca8416f853887e59ec35
    [26] Ahn H, Kim K J. Bankruptcy prediction modeling with hybrid case-based reasoning and genetic algorithms approach. Applied Soft Computing, 2009, 9(2):599-607 doi:  10.1016/j.asoc.2008.08.002
    [27] Biswas S K, Chakraborty M, Singh H R, Devi D, Purkayastha B, Das A K. Hybrid case-based reasoning system by cost-sensitive neural network for classification. Soft Computing, 2017, 21(24):7579-7596 doi:  10.1007/s00500-016-2312-x
  • [1] 刘广灿, 曹宇, 许家铭, 徐波. 基于对抗正则化的自然语言推理[J]. 自动化学报, 2019, 45(8): 1455-1463. doi: 10.16383/j.aas.c190076
    [2] 王玲, 孟建瑶, 李俊飞, 彭开香. 基于多维时态关联规则的演化模糊推理预测算法[J]. 自动化学报, 2018, 44(8): 1446-1459. doi: 10.16383/j.aas.2018.c170222
    [3] 刘阳, 张天石, 李世超, 佟星, 曾鹏, 于海斌. 基于Bitmap的油水井采注优化实时推理引擎[J]. 自动化学报, 2017, 43(6): 1007-1016. doi: 10.16383/j.aas.2017.c170132
    [4] 赵福均, 周志杰, 胡昌华, 常雷雷, 王力. 基于证据推理的动态系统安全性在线评估方法[J]. 自动化学报, 2017, 43(11): 1950-1961. doi: 10.16383/j.aas.2017.c160384
    [5] 李新德, 王丰羽. 一种基于ISODATA聚类和改进相似度的证据推理方法[J]. 自动化学报, 2015, 41(3): 575-590. doi: 10.16383/j.aas.2015.c140543
    [6] 李伟, 焦松, 陆凌云, 杨明. 基于特征差异的仿真模型验证及选择方法[J]. 自动化学报, 2014, 40(10): 2134-2144. doi: 10.3724/SP.J.1004.2014.02134
    [7] 李成栋, 张桂青, 王会东, 任伟娜. 基于感知推理方法的语言动力系统性质及数据驱动设计研究[J]. 自动化学报, 2014, 40(10): 2221-2232. doi: 10.3724/SP.J.1004.2014.02221
    [8] 严爱军, 钱丽敏, 王普. 案例推理属性权重的分配模型比较研究[J]. 自动化学报, 2014, 40(9): 1896-1902. doi: 10.3724/SP.J.1004.2014.01896
    [9] 赵辉, 严爱军, 王普. 提高案例推理分类器的可靠性研究[J]. 自动化学报, 2014, 40(9): 2029-2036. doi: 10.3724/SP.J.1004.2014.02029
    [10] 张春晓, 严爱军, 王普. 一种改进的案例推理分类方法研究[J]. 自动化学报, 2014, 40(9): 2015-2021. doi: 10.3724/SP.J.1004.2014.02015
    [11] 片锦香, 柴天佑, 李界家. 案例推理及迭代学习在层流冷却控制中的应用[J]. 自动化学报, 2012, 38(12): 2032-2037. doi: 10.3724/SP.J.1004.2012.02032
    [12] 王智锋, 马书根, 李斌, 王越超. 基于能量的蛇形机器人蜿蜒运动控制方法的仿真与实验研究[J]. 自动化学报, 2011, 37(5): 604-614. doi: 10.3724/SP.J.1004.2011.00604
    [13] 李佳宁, 易建强, 赵冬斌, 西广成. 一种新的基于神经模糊推理网络的复杂系统模糊辨识方法[J]. 自动化学报, 2006, 32(5): 695-703.
    [14] 刘国才, 王耀南. 基于水平集逐层迭代算法的多层Mumford-Shah图像分割、去噪与重建模型[J]. 自动化学报, 2006, 32(4): 534-540.
    [15] 徐颂华, 潘云鹤, 庄越挺, 刘智满. 综合推理与智能书法创作[J]. 自动化学报, 2005, 31(4): 495-509.
    [16] 龙图景, 孙政顺, 李春文, 姜培刚. 基于小波分解的MIMO系统辨识最优实验设计[J]. 自动化学报, 2003, 29(6): 959-964.
    [17] 王希若, 荣冈. 基于证据推理的显著误差检测方法[J]. 自动化学报, 2000, 26(增刊B): 86-90.
    [18] 应晶, 何志均. 支持产生式系统并行推理的动态推理网[J]. 自动化学报, 1996, 22(4): 489-493.
    [19] 杨光正. 句法知识系统的推理方法[J]. 自动化学报, 1993, 19(5): 625-628.
    [20] 宋逢明. 一个基于专家知识的不确定性分析推理系统[J]. 自动化学报, 1992, 18(4): 400-407.
  • 加载中
图(5) / 表(6)
计量
  • 文章访问数:  279
  • HTML全文浏览量:  97
  • PDF下载量:  262
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-03-28
  • 录用日期:  2018-07-02
  • 刊出日期:  2019-06-20

基于混合推理的仿真实验设计方法智能选择

doi: 10.16383/j.aas.c180177
    作者简介:

    陆凌云  哈尔滨工业大学博士研究生.主要研究方向为仿真实验设计, 仿真数据分析.E-mail:lulingyun987@163.com

    李伟   哈尔滨工业大学副教授.2009年获得哈尔滨工业大学博士学位.主要研究方向为仿真分析与评估, 分布式仿真, 仿真实验设计.E-mail:frank@hit.edu.cn

    杨明   哈尔滨工业大学教授.1997年获得哈尔滨工业大学博士学位.主要研究方向为飞行器制导与控制, 复杂系统仿真理论与方法.E-mail:myang@hit.edu.cn

    通讯作者: 马萍  哈尔滨工业大学教授.2003年获得哈尔滨工业大学博士学位.主要研究方向为复杂系统建模与仿真, 仿真可信度评估.本文通信作者.E-mail:pingma@hit.edu.cn
基金项目:

国家自然科学基金 61627810

国家自然科学基金 61403097

摘要: 针对仿真实验设计方法众多而在实际应用中难以准确选择的问题,提出一种用于仿真实验设计方法智能选择的混合推理方法.首先,给出了基于混合推理的仿真实验智能化设计流程;然后,针对案例检索策略,将仿真实验设计案例的属性分为三种类型,分别给出其属性差异度量模型及特征值归一化方法,并采用训练后的神经网络模型分配属性权重;进一步,当推荐的案例未能满足给定的相似度阈值时,引入属性优先级的概念,提出了一种基于规则的柔性逐层推理方法;在此基础上,设计了案例库和规则库;最后,通过实验验证了所提出方法的有效性.

本文责任编委 刘艳军

English Abstract

  • 仿真具有经济、安全、可重复等优点, 为复杂系统的分析提供了一种灵活、有力、直观的工具[1].随着仿真技术的发展以及在航天航空、信息、材料、能源等领域的广泛应用[2], 如何经济而又科学地设计仿真实验成为用户关注的焦点之一.仿真实验设计旨在根据因子信息、实验设计要求等, 期望利用尽可能少的仿真实验次数达到某个实验目的.其中因子是指仿真中的输入变量或参数.不同的仿真对象包含的因子信息及实验设计要求也不同.因而, 针对不同的仿真实验目的和仿真对象, 其适用的仿真实验设计方法各异.对于不熟悉现有仿真实验设计方法的研究人员来说, 如何选择合适的仿真实验设计方法是一个很大的挑战.

    针对不同的实验目的, 学者们提出了多种类型的仿真实验设计方法.例如, 筛选设计实现从大量实验因子中筛选出真正重要的因子, 从而有效地解决了仿真实验设计中由于因子数和水平数多而导致的"维数灾"问题[3].该类设计方法包括分辨率为Ⅲ的设计、Conference设计、超饱和设计和组筛选设计等[1].其中组筛选设计是一种依赖于模型的两阶段或多阶段序贯设计, 方法如顺序分支法、迭代分式析因设计、多步组筛选设计、Trocine筛选流程等[4].此外, 对于实验点不依赖于模型的仿真实验设计方法, 按其实验点分布特点可分为两大类:经典实验设计和空间填充设计[5].经典实验设计的实验点主要分布于设计空间的边界处附近, 仅少量实验点位于设计空间的中心, 常用方法有:全面/分式析因设计、中心复合设计、Box-Behnken设计和D-最优设计等[5-7].与经典实验设计不同的是, 空间填充设计的实验点填满整个设计空间, 方法如正交设计、均匀设计、蒙特卡罗法、拟蒙特卡罗法、拉丁超立方采样(Latin hypercube sampling, LHS)、Maximin设计等[5, 8-10].其中LHS作为一种分层采样方法, 为了提高其采样效率, 一方面在设计LHS时考虑实验点的"空间填充性"准则[11-12], 另一方面提出LHS扩展方法, 即当LHS样本大小不足时, 在尽量保留已有样本及其结构的基础上增加新的实验点[13-15].

    综上可见, 现有的仿真实验设计方法种类繁多, 其优缺点、适用范围各异.在仿真应用中, 不同的实验目的和仿真对象, 适用的仿真实验设计方法也不同.研究人员因不熟悉现有的仿真实验设计方法, 往往用当前的仿真问题去适应某个特定的或者已熟悉的方法, 而不是试图找到一个最佳的方法去满足当前的需求[16].如果所选择的仿真实验设计方法不合理, 那么可能会导致影响最终分析评估结果的正确性, 以及需要更多的实验次数, 尤其对于昂贵仿真或要求快速获取仿真结果的情形.鉴于此, Kleijnen等[16]指出在选择仿真实验设计方法时, 可以从实验次数、正交性、效率、空间填充性等方面评价设计的优劣; 文献[17]基于实验设计应满足因子筛选的高效性以及处理复杂模型的灵活性, 提出一种度量仿真实验设计的准则; 文献[4]认为选择筛选设计方法时, 应考虑效率、有效性、鲁棒性和易于实施等四个方面的准则; 而文献[6]指出在设计仿真实验时避免陷入误区, 同时注意因子和样本规模的选取等问题.以上四篇文献都各自选取了几种常见的实验设计方法进行对比分析.上述研究都是从理论层面对如何选择仿真实验设计方法给出部分指导性建议或选取准则; 而对于不熟悉现有仿真实验设计方法的研究人员来说, 花费大量精力调研相关文献来选择合适的方法, 在实际应用中这无疑是不可取的.因此, 研究如何智能地选择合适的仿真实验设计方法, 具有非常重要的应用价值.

    针对上述问题, 可采用人工智能领域的相关技术, 辅助研究人员选择合适的仿真实验设计方法, 实现仿真实验智能化设计.自1956年Minsky、McCarthy等学者提出人工智能以来, 机器学习作为人工智能的一个分支, 经历了由浅层学习到深度学习两次发展的浪潮.常见的机器学习方法可划分为分类、聚类、回归和降维等四类, 而仿真实验设计方法的选择属于一种分类问题.目前, 处理分类问题的方法有K近邻(K-nearest neighbor, KNN)、基于案例推理(Case-based reasoning, CBR)、决策树、Logistic回归、贝叶斯、支持向量机、神经网络(Neural network, NN)等[18-22].文献[23]提出利用传统的基于规则推理(Rule-based reasoning, RBR)推荐仿真实验设计方法, 但RBR方法受规则描述方式的限制, 只有当规则库中的规则与用户选择的规则所有条件属性值相一致时才能推荐出相应的仿真实验设计方法, 可操作性有待提高.

    针对仿真实验方法智能选择问题, 本文结合仿真实验设计问题的特点, 提出一种混合推理方法.首先给出基于混合推理的仿真实验智能化设计的技术框架; 然后针对仿真实验设计案例中不同类型的条件属性, 给出各自的属性差异度量模型及其特征值归一化方法, 采用神经网络算法分配属性权重, 用于提高案例检索的准确率; 此外, 引入规则条件属性优先级的概念, 提出一种基于规则的柔性逐层推理方法(Rule-based flexible layer-by-layer reasoning, RBFLR), 使其根据规则属性优先级的高低顺序进行逐层推理, 实现属性规则构建的柔性化, 增强规则的可操作性; 最后通过实验验证了本文方法的有效性.

    • 仿真实验智能化设计面临两个方面的问题: 1)根据新问题的特征及用户需求信息, 如何智能地推荐合适的仿真实验设计方法; 2)在选择仿真实验设计方法之后, 根据当前实验因子信息(因子类型、水平、取值范围等), 如何智能地生成实验方案, 实现实验设计数据由问题空间$\to$方法空间$\to$仿真实验空间的自动映射.由此, 仿真实验智能化设计问题可描述为:

      $$ \begin{equation} {\pmb E}=G({\pmb A}, {\pmb K}, M) \end{equation} $$ (1)

      其中, ${\pmb A}=[{{A}_{p}}, {{A}_{f}}, {{A}_{r}}]$为问题的属性, 包括实验目的${{A}_{p}}$、因子信息${{A}_{f}}$和实验设计要求${{A}_{r}}$; ${\pmb K}=[{{K}_{c}}, {{K}_{r}}, {{K}_{e}}]$为知识库, 包括案例库${{K}_{c}}$、规则库${{K}_{r}}$和专家经验${{K}_{e}}$; $M$为决策推理方法; ${\pmb E}=[{{E}_{m}}, {{E}_{s}}]$为仿真实验智能化设计输出, ${{E}_{m}}$为仿真实验设计方法, ${{E}_{s}}$为实验方案; $G(\cdot)$为仿真实验智能化设计模型.

      模型$G(\cdot)$的难点在于采用何种决策推理方法$M$, 从而充分利用已有的知识库${\pmb K}$. CBR是一种非常经典的决策推理方法, 通过检索历史案例库中相同或相似的案例来求解新问题, 具体工作原理可参见文献[18].其刻画目标案例$T$与历史案例${{X}_{i}}$之间的相似度计算公式为:

      $$ \begin{equation} \left\{ \begin{array}{*{35}{l}} s(T, {{X}_{i}})=1-D(T, {{X}_{i}}), \text{ }i=1, 2, \cdots , n \\ D(T, {{X}_{i}})=\sqrt{\sum\limits_{j=1}^{{{n}_{c}}}{{{w}_{j}}d({{t}_{j}}, {{x}_{ij}})}} \\ \end{array} \right. \end{equation} $$ (2)

      其中, $D(T, {{X}_{i}})$为两案例间的差异度量模型, $d({{t}_{j}}, {{x}_{ij}})$为两案例间第$j$个属性的差异度量模型, ${{w}_{j}}$为第$j$个属性的权重, $n$为案例中历史案例的个数, ${{n}_{c}}$为案例条件属性的个数.

      然而, 当案例相似度$s(T, {{X}_{i}})$较低时, 其案例推理结果的可信度较低, 可以利用规则库中的规则做进一步推理.在采用"CBR+RBR"作为决策推理方法时, 则存在如下问题:

      1) 属性差异度量模型$d({{t}_{j}}, {{x}_{ij}})$的定义和属性权重${{w}_{j}}$的分配影响到案例检索的准确率.由于案例属性${\pmb A}$的特征值涉及到语义型离散和实数型离散属性, 采用传统的实数型连续属性的差异度量模型不再适用, 如何合理地定义$d({{t}_{j}}, {{x}_{ij}})$尤为重要.另外, 案例属性${\pmb A}$中的某些属性间存在相关性, 导致各条件属性对决策属性的影响程度不相等, 因此均权法分配权重不能满足实际应用需求.

      2) 假设规则的条件属性有$m$个, 即使每个属性有2种取值, 考虑所有可能的最大组合, 共有${{2}^{m}}$条规则.易知, 规则数量随着$m$的增大呈指数倍增长, 当$m$较大时所需的规则数量非常多.另外, 在对规则库${{K}_{r}}$中的条件属性进行扩充或删除时, 因RBR的规则描述方式存在局限性, 会破坏原有的规则结构而导致规则库${{K}_{r}}$中大量规则不可用.显然, 这些情况不利于构建与维护规则库, RBR有待改进.

      针对上述第一个问题, 本文将仿真实验设计案例库中的属性分为实数型连续、实数型离散和语义型离散三类属性, 分别给出其属性差异度量模型及特征值归一化方法, 并采用训练后的神经网络模型分配属性权重; 针对第二个问题, 在RBR的理论基础上, 重新定义规则的描述方式, 并引入规则属性优先级的概念, 提出一种基于规则的柔性逐层推理方法, 在很大程度上减少规则数量的同时, 可以柔性地扩充和删除规则库中的条件属性, 并保证推理结果的可信性.

    • 为了更好地实现仿真实验智能化设计, 结合仿真实验设计问题的特点, 将NN-CBR (Case-based reasoning with neural network)和RBFLR相结合的混合推理方法应用于仿真实验设计方法的智能推荐中, 充分发挥两者的优势.仿真实验智能化设计流程如图 1所示.

      图  1  仿真实验智能化设计流程

      Figure 1.  Flow chart of intelligent design of simulation experiment

      该流程主要包括NN-CBR和RBFLR两个阶段.其中, 问题是指仿真实验设计问题, 所需提取的特征信息包括实验目的${{A}_{p}}$、因子信息${{A}_{f}}$和实验设计要求${{A}_{r}}$等.在NN-CBR阶段, 案例检索采用KNN检索策略, 利用目标案例和历史案例间的差异度量模型$D(T, {{X}_{i}})$计算其相似度.其中属性权重${{w}_{j}}$由基于NN的属性权重分配方法在线学习, 即每当加入新的案例时需要对${{w}_{j}}$进行动态调整.常用的案例重用策略包括最大相似度重用和多数重用.这里采用最大相似度重用, 即直接选择与目标案例最为相似的一个案例的类别作为目标案例的结论.在RBFLR阶段, 规则属性优先级的确定是为了将各个属性归类为某一层, 为逐层推理服务.逐层推理则根据属性所在层的高低顺序, 一层层的检索满足条件的所有规则, 即仿真实验设计方法.当同一层存在多条规则时, 则进行规则融合.

      当遇到一个新问题时, 首先提取问题的属性${\pmb A}$信息; 然后根据所提取的信息在案例库中检索与目标案例最为相似的$K$个案例, 并对检索到的案例进行重用, 得到建议解及其案例相似度; 接着判断相似度是否大于设定的相似度阈值$\alpha $, 如果满足条件则将建议解作为新问题的解决方案, 即仿真实验设计方法, 否则需要进一步推理, 即RBFLR, 推荐出仿真实验设计方法.最后利用推荐得到的仿真实验设计方法生成实验方案, 经仿真运行得到仿真输出数据并进行分析, 根据分析结果对该案例所采用的仿真实验设计方法进行评估, 如果合理则将其存储至案例库, 否则结束本次推理过程.

      在整个仿真实验智能化设计流程中, 案例检索和逐层推理是决策推理方法$M$的研究重点, 下面给出相应的解决方法; 而由仿真实验设计方法到生成实验方案的过程, 可使用前期研究工作[24]中的辅助工具来实现.

    • 决策推理方法$M$是仿真实验智能化设计的核心, 关系到最终推理结果的准确性.结合问题属性${\pmb A}$的特点, 提出一种基于NN-CBR和RBFLR的混合推理方法.该方法包括案例推理和规则推理两部分.接下来从CBR中的案例检索策略和RBFLR方法两个方面展开研究.

    • 属性差异度量模型的定义和属性权重的分配是案例检索策略的两个关键.本节针对不同类型的条件属性, 分别给出各类型属性的差异度量模型及其特征值归一化方法; 而属性权重则由基于NN的属性权重分配方法在线学习得到.

    • 在计算不同案例的同一属性间的相似度之前, 需要对属性的特征值归一化处理, 将其映射至[0, 1]区间, 便于后续案例间的相似度计算.不同类型属性的特征值, 其归一化处理方法不同.针对仿真实验设计中不同类型属性${\pmb A}$的特征值, 给出归一化处理方法如下:

      1) 实数型连续属性

      实数型连续属性的特征值由单值构成, 其值域为${{\Phi }_{1}}\subseteq \textbf{ R}$.对于特征值${{x}_{ij}}$, 经归一化后的值${{x}^{\prime }_{ij}}$可表示为

      $$ \begin{equation} {{x}^{\prime }_{ij}}={{\mathcal{K}}_{1}}({{x}_{ij}})=\frac{{{x}_{ij}}-\min ({{x}_{\cdot j}})}{\max ({{x}_{\cdot j}})-\min ({{x}_{\cdot j}})} \end{equation} $$ (3)

      其中, ${{x}_{\cdot j}}=\{{{x}_{1j}}, {{x}_{2j}}, \cdots, {{x}_{mj}}\}$, $\max ({{x}_{\cdot j}})$、$\min ({{x}_{\cdot j}})$分别为${{x}_{\cdot j}}$的最大值和最小值, ${{\mathcal{K}}_{1}}(\cdot)$为归一化函数.

      2) 实数型离散属性

      实数型离散属性的特征值可能由一个或多个值构成, 其值域为${{\Phi }_{2}}\subseteq$$\textbf{ N}^{k}$ ($k$为特征值个数).在仿真实验设计中, 实数型离散属性如"实验次数"、"因子数"的取值范围大, 从1到${{10}^{3}}$以上均有可能.而仿真实验设计方法的选取对该类型属性取值区间的中间段比较敏感, 因而在归一化处理时应提高中间段的变化率, 其形状如图 2所示.相应的, 该类型的特征值${{x}_{ij}}$经归一化处理后的值${{{x}'}_{ij}}$可表示为

      $$ \begin{equation} \begin{split} {{x}^{\prime }_{ij}}={{\mathcal{K}}_{2}}({{x}_{ij}})= & \left\{\begin{array}{ll} \dfrac{{{\rm e}^{\zeta ({{x}_{ij}}-\frac{Q}{\lambda })}}}{{{\rm e}^{\zeta ({{x}_{ij}}-\frac{Q}{\lambda })}}+1}, & {{x}_{ij}} <Q \\ 1, & {{x}_{ij}}\geq Q \\ \end{array} \right. \end{split} \end{equation} $$ (4)

      图  2  属性归一化处理函数

      Figure 2.  Normalized processing fuction of attributes

      其中, $\zeta $、$\lambda $、$Q$均为常数, ${{\mathcal{K}}_{2}}(\cdot)$为归一化函数.

      3) 语义型离散属性

      语义型离散属性的特征值为非数字类型, 如"是"、"否"等.针对此类属性的特征值, 采用$\{0, 1, 2, \cdots\}$的形式进行编码, 并存储于案例库中.由于此类型属性对应的编码值没有实际的数学含义, 因而不需要进行归一化处理.

    • 案例特征可能包含多种类型的属性.不同类型的属性, 其差异度量模型的表达式也不同.针对第3.1.1节描述的三种不同类型的属性, 相应的属性差异度量模型定义如下:

      1) 实数型连续属性

      实数型连续属性的差异可表示为

      $$ \begin{equation} d({{t}_{j}}, {{x}_{ij}})={{\left( {{\mathcal{K}}_{1}}(t_{j}^{{}})-{{\mathcal{K}}_{1}}(x_{ij}^{{}}) \right)}^{2}} \end{equation} $$ (5)

      其中, $t_{j}^{{}}$和$x_{ij}^{{}}$分别为目标案例和历史案例中第$j$个属性的特征值.

      2) 实数型离散属性

      假设实数型离散属性的特征值由$l~(l\in\textbf{ N}$ $^{+}$)个值构成, 则有

      $$ \begin{equation} d({{t}_{j}}, {{x}_{ij}})=\frac{1}{l}\sum\limits_{k=1}^{l}{{{\left( {{\mathcal{K}}_{2}}(t{{_{j}^{{}}}^{(k)}})-{{\mathcal{K}}_{2}}(x{{_{ij}^{{}}}^{(k)}}) \right)}^{2}}} \end{equation} $$ (6)

      其中, $t_{j}^{(k)}$和$x_{ij}^{(k)}$分别为目标案例和历史案例中第$j$个属性的第$k$个特征值.

      3) 语义型离散属性

      对于语义型离散属性, 从概率论的角度出发, 通过属性间的整体相似性度量两者的差异[25], 则有

      $$ \begin{align} {{d}^{\prime }}({{t}_{j}}, {{x}_{ij}})=\;& \sum\limits_{l=1}^{{{n}_{d}}}{\left| \frac{D({{f}_{j}}=t_{j}^{{}}\bigcap g={{c}_{l}})}{D({{f}_{j}}=t_{j}^{{}})} \right.}- \nonumber \\ & \left. \frac{D({{f}_{j}}=x_{ij}^{{}}\bigcap g={{c}_{l}})}{D({{f}_{j}}=x_{ij}^{{}})} \right| \end{align} $$ (7)

      其中, ${{f}_{j}}$为案例的第$j$个条件属性, $g$为决策属性, ${{c}_{l}}$为决策属性值, ${{n}_{d}}$为决策属性的类别数, $D(\cdot)$为案例库中满足当前条件的案例个数.

      由式(7)易知, $0\le {d}'({{t}_{j}}, {{x}_{ij}})\le 2$, 经归一化处理得到其属性差异度量模型$d({{t}_{j}}, {{x}_{ij}})$, 可表示为

      $$ \begin{equation} d({{t}_{j}}, {{x}_{ij}})=\frac{{d}'({{t}_{j}}, {{x}_{ij}})}{2} \end{equation} $$ (8)
    • 案例检索时属性的权重表征了属性对案例解的重要程度, 能否正确分配权重将直接影响案例推理的准确率.常见的权重分配方法如均权法、神经网络法、遗传算法等[25-27].考虑到仿真实验设计案例库中属性包含语义离散类型, 且属性间存在相关性, 这里采用文献[25]中的前馈式BP-NN (Back-propagation neural network)训练模型分配属性权重, 其网络结构如图 3所示.

      图  3  基于NN的属性权重分配网络结构

      Figure 3.  Network structure of attribute weight assignment based on neural network

      图 3中, ${{x}_{j}}~(j=1, 2, \cdots, {{n}_{c}})$为输入节点, 对应于案例属性的特征值; ${{b}_{l}}~(l=1, 2, \cdots, E)$为NN训练模型的输入层节点; ${{z}_{i}}~(i=1, 2, \cdots, M)$为隐含层节点; ${{y}_{k}}~(k=1, 2, \cdots, {{n}_{d}})$为输出层节点, 对应于决策属性值.当输入节点对应于语义型离散属性时, 其特征值需要经过二进制编码, 反之不需要编码.

      假定${{w}_{il}}$、${{w}_{ki}}$分别为${{b}_{l}}$至${{z}_{i}}$、${{z}_{i}}$至${{y}_{k}}$间的连接权值, ${{n}_{j}}$为${{x}_{j}}$经编码得到${{b}_{l}}$的个数.下面从相关性和显著性两个方面给出计算属性权重的方法.

      1) 相关性(Relevance)

      隐含层节点${{z}_{i}}$、输入层节点${{b}_{l}}$和输入节点${{x}_{j}}$的相关性依次为

      $$ \begin{equation} {{R}_{i}}=\sum\limits_{k=1}^{{{n}_{d}}}{w_{ki}^{2}\cdot }\operatorname{var}({{w}_{il}}) \end{equation} $$ (9)
      $$ \begin{equation} {{R}_{l}}=w_{il}^{2}\cdot {{R}_{i}} \end{equation} $$ (10)
      $$ \begin{equation} {{R}_{j}}=\sum\limits_{{{b}_{l}}\in {{x}_{j}}}{\frac{{{R}_{l}}}{{{n}_{j}}}} \end{equation} $$ (11)

      由此, 第$j$个属性的权重${{w}_{j}}$计算公式为

      $$ \begin{equation} {{w}_{j}}=\frac{\left| {{R}_{j}} \right|}{\sum\limits_{j=1}^{{{n}_{c}}}{\left| {{R}_{j}} \right|}} \end{equation} $$ (12)

      2) 显著性(Saliency)

      输入层节点${{b}_{l}}$和输入节点${{x}_{j}}$的显著性分别为

      $$ \begin{equation} S{{a}_{l}}=\sum\limits_{i=1}^{M}{\sum\limits_{k=1}^{{{n}_{d}}}{w_{ki}^{2}w_{il}^{2}}} \end{equation} $$ (13)
      $$ \begin{equation} S{{a}_{j}}=\sum\limits_{{{b}_{l}}\in {{x}_{j}}}{\frac{S{{a}_{l}}}{{{n}_{j}}}} \end{equation} $$ (14)

      由此, 第$j$个属性的权重${{w}_{j}}$计算公式为

      $$ \begin{equation} {{w}_{j}}=\frac{S{{a}_{j}}}{\sum\limits_{j=1}^{{{n}_{c}}}{S{{a}_{j}}}} \end{equation} $$ (15)
    • 当NN-CBR检索到的最相似案例对应的相似度$\leq \alpha $时, 如果采用传统的RBR推荐仿真实验设计方法, 那么只有规则库中存在与用户选择的所有条件属性值均一致的规则, 才能得到相应的仿真实验设计方法.这就需要尽可能多的规则覆盖各种情形, 导致推理具有很大程度上的局限性.为此, 提出一种基于规则的柔性逐层推理方法, 可以在大大减少规则数量的基础上, 实现规则库中的条件属性灵活地进行扩充及删除, 同时保证推理结果的可靠性.

    • 为了描述RBFLR的知识表达系统$S$, 给出如下定义:

      定义1. 称五元组$S=(U, R, V, f, P)$为一个知识表达系统.其中: $U$为对象集合, 即论域; 属性集$R=C\bigcup D$, 且$C\bigcap D=\emptyset$; $C$和$D$分别称为条件属性集和决策属性集, , $m$为条件属性的个数, ; $V={\bigcup }_{r\in R} {{V}_{r}}$为属性的值域集, ${{V}_{r}}$为属性$r$的值域; $f :U\times R\to V$是一个信息函数, 表示$U$中每一个对象在相应属性上的属性值; $P$为$C$的优先级集合.

      进一步, 令${{\Omega }_{c}}=\{1, 2, \cdots, m\}$, 对于${{C}_{i}}$ ($i\in {{\Omega }_{c}}$), 假设相应的优先级取值为${{p}_{i}}\in\textbf{ N}$ $^{+}$, 于是有集合$P=\{{{p}_{1}}, {{p}_{2}}, \cdots, {{p}_{m}}\}$, 其最大值${{p}_{\max }}=\max (P)$.其中, 若${{p}_{i}}>{{p}_{j}}$ ($i, j\in {{\Omega }_{c}}$且$i\ne j$), 则${{C}_{i}}$的优先级高于${{C}_{j}}$.

      在RBFLR中, 采用产生式规则表示法, 其基本形式为

      $$ \mathrm{IF}\text{ } Pc\text{ } \mathrm{THEN}\text{ }Cq $$

      其中, $Pc$表示前提条件, 用于说明规则被用到的条件; $Cq$表示后件, 用于指出符合前提条件$Pc$时所得出的结论或应该执行的操作.

      基于上述定义, 提出一种基于规则的柔性逐层推理方法, 其基本思想是:首先将规则库中的规则按照本文定义的描述形式存储, 然后将规则库中所有条件属性进行优先级划分, 将同一优先级的条件属性归类为同一层, 最后根据条件属性优先级从高到低进行逐层推理, 直到推理至最底层或该层推理结果中可备选方案数小于或等于1时终止.其中, "柔性"体现在对规则库中的条件属性进行扩充或删除时, 只需对与当前条件属性具有相关性的条件属性对应的规则进行改动, 且因规则库中的条件属性大多数均是独立的, 因而需要改动的规则较少, 从而体现出柔性、灵活的特点.下面给出规则库中规则描述的定义以及相应的推理策略.

      定义2. 在产生式规则中, 定义"$\to $"为$Pc$到$Cq$的一种逻辑关系, 即"".

      定义3. 集合$C$中具有相同优先级的条件属性构成的集合称为层, 记作$\Gamma $; 相应的, 优先级为$k$ ($k=1, 2, \cdots, L$)的层记作, 其中$L$为集合$C$的总层数.

      定义4. 若存在${{C}_{i}}$ ($i\in {{\Omega }_{c}}$)与任一${{C}_{j}}$ ($j\ne i$, $j\in {{\Omega }_{c}}$)相互独立, 则定义规则为${{\Psi }_{1}}$, 即存在一种逻辑关系满足: ${{C}_{i}}=q\to d={{\Omega }_{iq}}$, 其中${{\Omega }_{iq}}$为${{C}_{i}}=q$时$d$的取值集合.

      定义5. 若${{C}_{{{m}_{1}}}}, {{C}_{{{m}_{2}}}}, \cdots, {{C}_{{{m}_{s}}}}({{m}_{1}}, {{m}_{2}}, \cdots, {{m}_{s}}$ $\in {{\Omega }_{c}})$存在相关性, 则定义规则为${{\Psi }_{2}}$, 即存在一种逻辑关系满足: , 其中${{\Omega }_{{{m}_{1}}{{i}_{1}}, {{m}_{2}}{{i}_{2}}, \cdots, {{m}_{s}}{{i}_{s}}}}$为时$d$的取值集合.

      策略1. 对于${{\text{ } \Gamma \text{ }}_{k}}$, 若存在${{C}_{i}}=q\to d={{\Omega }_{iq}}$, ${{C}_{j}}=t\to d={{\Omega }_{jt}}$, 则$\{{{C}_{i}}=q, {{C}_{j}}=t\}\to d={{\Omega }_{iq}}\bigcap {{\Omega }_{jt}}$.

      策略2. 对于${{\text{ } \Gamma \text{ }}_{k}}$, 若存在${{C}_{i}}=q\to d={{\Omega }_{iq}}$, ${{C}_{{{m}_{1}}}}={{i}_{1}}, {{C}_{{{m}_{2}}}}={{i}_{2}}, \cdots, {{C}_{{{m}_{s}}}}={{i}_{s}}\to d={{\Omega }_{{{m}_{1}}{{i}_{1}}, {{m}_{2}}{{i}_{2}}, \cdots, {{m}_{s}}{{i}_{s}}}}$, 则${{\Omega }_{{{m}_{1}}{{i}_{1}}, {{m}_{2}}{{i}_{2}}, \cdots, {{m}_{s}}{{i}_{s}}}}$.

      策略3. 利用策略1和策略2获取的推理结果记作${{\Theta }_{k}}$, ${{\text{ } \Gamma \text{ }}_{{{p}_{\max }}}}$层到层的推理结果依次为, 其中$k=1, 2, \cdots, L$, 则${{\text{ } \Gamma \text{ }}_{{{p}_{\max }}}}$层到层融合的推理结果为.

      记的条件属性个数为${{n}_{ck}}=Card(\{{{C}_{j}}\in C|{{p}_{i}}=k\})$, 其决策属性值个数为.

      策略4. 对于${{\text{ } \Gamma \text{ }}_{k}}$, 若${{n}_{dk}}=0$, 则推理结束, 推理结果为; 若${{n}_{dk}}=1$, 则推理结束, 推理结果为; 若${{n}_{dk}}>1$, 则进入下一层推理.

    • RBFLR方法的流程如图 4所示, 具体步骤如下:

      图  4  RBFLR方法流程图

      Figure 4.  Flow chart of RBFLR method

      步骤1. 获取规则库中条件属性优先级的最大值${{p}_{\max }}$, 并置$k={{p}_{\max }}$.

      步骤2. 判断$k$, 如果$k>0$, 则执行步骤3, 否则转至步骤8.

      步骤3. 提取优先级为$k$的条件属性, 计算${{n}_{ck}}$.

      步骤4.判断${{n}_{ck}}$, 如果${{n}_{ck}}>0$, 则执行步骤6, 否则转至步骤5.

      步骤5. 置$k=k-1$, 转至步骤2.

      步骤6. 进行决策推理, 保存本层推理结果${{\Theta }_{k}}$, 并计算${{n}_{dk}}$.

      步骤7. 判断${{n}_{dk}}$, 如果${{n}_{dk}}>1$, 则执行步骤5, 否则转至步骤8.

      步骤8. 如果${{n}_{dk}}\text{=}0$, 则算法终止, 输出上一层推理结果, 否则算法终止, 输出本层推理结果.

    • 基于NN-CBR和RBFLR的混合推理方法在应用中需要仿真实验设计的案例库和规则库予以支撑.下面对案例库和规则库进行设计.

      1) 案例库设计

      案例库用于存储所有历史案例信息, 包括案例的条件属性和决策属性.本文从仿真实验应用需求以及仿真实验的特点出发, 提炼出实验目的、实验点分布、系统复杂度假设、二因子交互效应估计、模型独立性、处理群组因子、实验点可扩展性、水平数、实验次数和因子数等10个条件属性, 以及1个决策属性, 如表 1所示.该表中的语义型离散属性的取值为编码后的值, 便于案例的存储检索.

      表 1  案例属性

      Table 1.  Attributes of the cases

      ID 属性 属性取值 属性类型
      1 实验目的 $\text{EP}\in\textbf{ N}$ 语义型离散
      2 实验点分布 $\text{ED}\in\textbf{ N}$ 语义型离散
      3 系统复杂度假设 $\text{SC}\in\textbf{ N}$ 语义型离散
      4 二因子交互效应估计 $\text{FI}\in\textbf{ N}$ 语义型离散
      5 模型独立性 $\text{MI}\in\textbf{ N}$ 语义型离散
      6 处理群组因子 $\text{CG}\in\textbf{ N}$ 语义型离散
      7 实验点可扩展性 $\text{EE}\in\textbf{ N}$ 语义型离散
      8 水平数 $\text{FL}\in\textbf{ N}$ 语义型离散
      9 实验次数 $\text{EN}\in\textbf{ N}$ $^{+}$ 实数型离散
      10 因子数 $\text{FN}\in\textbf{ N}$ $^{+}$ 实数型离散
      11 仿真实验设计方法 $\text{EM}\in\textbf{ N}$ $^{+}$ 语义型离散

      2) 规则库设计

      RBFLR方法需要相应的规则用于辅助决策推理, 因此设计科学合理的规则库至关重要.为了更好地进行决策推理, 这里采用与案例库相同的属性来刻画规则, 如表 2所示.其中, 前7个属性为独立的条件属性, 第8至第10个属性属于非独立的条件属性, 而仿真实验设计方法为决策属性.在构建规则库时, 由专家给出每个条件属性取不同值时对应的决策属性以及对应的优先级.由第3.2.1节易知, 规则库中的条件属性如果是独立的, 则按照一个条件属性对应一个或多个决策属性的方式存储; 否则按照几个相关的条件属性组合在一起对应一个或多个决策属性的方式存储.在表 2的备注中给出了当前所考虑的各属性取值及其编码格式.

      表 2  规则属性

      Table 2.  Attributes of the rules

      ID 属性 属性取值 属性类型 优先级
      1 实验目的 $\text{EP}\in\textbf{ N}$ 语义型离散 ${{k}_{1}}$
      2 实验点分布 $\text{ED}\in\textbf{ N}$ 语义型离散 ${{k}_{2}}$
      3 系统复杂度假设 $\text{SC}\in\textbf{ N}$ 语义型离散 ${{k}_{3}}$
      4 二因子交互效应估计 $\text{FI}\in\textbf{ N}$ 语义型离散 ${{k}_{4}}$
      5 模型独立性 $\text{MI}\in\textbf{ N}$ 语义型离散 ${{k}_{5}}$
      6 处理群组因子 $\text{CG}\in\textbf{ N}$ 语义型离散 ${{k}_{6}}$
      7 实验点可扩展性 $\text{EE}\in\textbf{ N}$ 语义型离散 ${{k}_{7}}$
      8 水平数 $\text{FL}\in\textbf{ N}$ 语义型离散 ${{k}_{8}}$
      9 实验次数 $\text{EN}\in [{s}_{1}, {s}_{2}]$ 实数型区间 ${{k}_{9}}$
      10 因子数 $\text{FN}\in [{n}_{1}, {n}_{2}]$ 实数型区间 ${{k}_{10}}$
      11 仿真实验设计方法 $\text{EM}\in\textbf{ N}$ $^{+}$ 语义型离散 $/$
      备注: EP $\in $ {1)寻找重要因子, 2)寻找稳健参数, 3)优化, 4)不确定性分析, 5)灵敏度分析, 6)方差分析, 7)综合评估}; ED $\in $ {1)均匀性, 2)正交性, 3)空间填充性, 4)随机性, 5)鲁棒性, 6)序贯性}; SC $\in $ {1)一阶多项式(主效应模型), 2)一阶多项式+二因子交互效应, 3)二阶多项式(含完全平方项), 4)高阶交互效应}; FI $\in $ {1)能, 2)否}; MI $\in $ {1)是, 2)否}; CG $\in $ {1)能, 2)否}; EE $\in $ {1)能, 2)否}; FL $\in $ {1) 2$ \sim $3水平为主, 2) 4$ \sim $10水平为主, 3)大于10水平为主, 4)水平较为分散}; EN $\in $ {1) $[1, n)$, 2) $[n, +\infty)$, 3) $[{{2}^{n}}, +\infty)$}, 其中$n$为因子数; FN $\in $ {1) $[2, 13]$, 2) $[14, 50]$, 3) $[51, 100]$, 4) $[101, 500]$, 5) $[501, +\infty)$}; EM $\in $ {1)全面析因设计, 2)分式析因设计, 3)正交设计, 4)均匀设计, 5)拉丁超立方抽样, 6)蒙特卡罗抽样, 7)拟蒙特卡罗抽样, 8)重要性抽样, 9)中心复合设计, 10)稳健设计, 11)顺序分支法, 12)迭代分式析因设计, 13)二阶段组筛选法, 14) Trocine筛选流程}.
    • 针对不同的实验目的及应用需求, 需要选择合适的仿真实验设计方法, 进而能够利用尽可能少的仿真实验次数获取科学合理的实验结果.在研究人员不熟悉仿真实验设计方法的情况下, 可以利用本文的决策推理方法进行推荐.为了验证本文方法的有效性, 基于已有的体系对抗仿真实验设计知识库进行实验验证.体系对抗仿真一般包括众多的红蓝双方实体, 实验因子包括想定参数、性能参数以及指挥策略等, 其实验目的包括效能评估与分析、效能优化、重要参数筛选、方案排序等.在知识库${\pmb K}$中, 规则库${{K}_{r}}$包含60条规则, 如表 3所示; 相应的, 规则的条件属性优先级如表 4所示; 案例库${{K}_{c}}$有142个案例, 如表 5所示.

      表 3  规则库

      Table 3.  Rule base

      ID $Pc$ $Cq$
      1 $\text{EP}=2$ $\text{EM}=\left\{ 10 \right\}$
      2 $\text{ED}=3$ $\text{EM}=\left\{ 3, 4, 5 \right\}$
      3 $\text{CG}=1$ $\text{EM}=\left\{ 11, 12, 13, 14 \right\}$
      $\vdots $ $\vdots $ $\vdots $
      60 $\text{FL}=4$, $\text{EN}=2$, $\text{FN}=3$ $\text{EM}=\left\{ 11, 14 \right\}$

      表 4  规则的条件属性优先级

      Table 4.  Priority of condition attribute for the rules

      EP ED SC FI MI CG EE FL EN FN
      5 2 3 3 4 4 3 1 1 1

      表 5  案例库

      Table 5.  Case base

      ID EP ED SC FI MI CG EE FL EN FN EM
      1 6 2 2 1 1 2 2 1 32 5 1
      2 5 3 1 1 1 2 2 1 8 7 3
      3 5 3 2 1 1 2 1 3 500 7 5
      $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $
      142 3 1 1 1 1 2 2 2 10 8 4

      在实验中, 分别按照1 : 1、3 : 2、2 : 1和2 : 3分配案例库中训练样本与测试样本的比例, 对比分析不同分配比例下各推理方法的平均分类准确率.其中:对于CBR方法, 采用均权法分配权重(Mean assignment, MA)记为MA-CBR, 采用NN分配权重记为NN-CBR; 相应的, 分别将MA-CBR和NN-CBR两种方法与本文提出的RBFLR方法相结合, 得到的混合推理方法依次记为MA-CBR & RBFLR和NN-CBR & RBFLR; 进一步, 对于NN-CBR和NN-CBR & RBFLR方法, 分别从相关性(Relevance)和显著性(Saliency)两个方面计算案例的属性权重, 分别记为NN$\_$Rel-CBR、NN$\_$Sal-CBR、NN$\_$Rel-CBR & RBFLR和NN$\_$Sal-CBR & RBFLR.实验的主要步骤如下:

      步骤1. 对案例库中案例的条件属性按照3.1.1节中的方法进行归一化处理.

      步骤2. 设定实验参数. CBR方法中的$K=1$; CBR & RBFLR方法中, 案例的相似度阈值$\alpha =0.9$; NN-CBR方法中, 隐含层节点数为10.

      步骤3. 将案例库中的案例按照某个比例分成训练样本和测试样本.

      步骤4. 分别对MA-CBR和NN-CBR两种方法进行实验, 记录其分类准确率.

      步骤5. 分别对MA-CBR & RBFLR和NN-CBR & RBFLR两种方法进行实验, 即当混合推理方法经MA-CBR或NN-CBR推理后的案例相似度小于阈值$\alpha $时, 进入步骤6, 否则转至步骤7.

      步骤6. 根据RBFLR方法, 按照表 4中规则属性优先级从高到低的顺序, 在规则库中逐层检索, 直至推理得到最终结果, 并记录其分类准确率.

      步骤7. 重复步骤3 $\sim$步骤5, 并重复运行10次.

      基于上述实验步骤, 可获得该案例库在不同的推理方法、权重分配方法以及分配比例下的实验结果, 如表 6图 5所示.从整体实验结果来看, NN$\_$Rel-CBR & RBFLR方法最优, 而MA-CBR方法最差.在不同分配比例下, 由图 5可以看出, 训练样本所占的分配比例较大时, 各推理方法在整体上的分类准确率也会相应地提高.在四种分配比例中, 训练样本所占的分配比例最大比值为2 : 1, 对应的分类准确率最高.这与理论上当训练样本在整个案例库中占的比例越来越大时, 各推理方法的分类准确率相应的越高相一致.

      表 6  不同推理方法的平均分类准确率($\%$)

      Table 6.  Averaging classification accuracy of different reasoning methods ($\%$)

      推理方法 分配比例
      1 : 1 3 : 2 2 : 1 2 : 3
      MA-CBR 67.61 66.67 72.34 68.24
      NN$\_$Rel-CBR 74.51 72.46 79.57 71.41
      NN$\_$Sal-CBR 73.10 72.63 79.15 71.18
      MA-CBR&RBFLR 80.28 80.70 85.11 ${\bf 80.00}$
      NN$\_$Rel-CBR & RBFLR ${\bf 81.13}$ ${\bf 82.11}$ 85.74 ${\bf 80.00}$
      NN$\_$Sal-CBR & RBFLR 79.58 80.00 ${\bf 86.60}$ 78.59

      图  5  不同分配比例下各推理方法的平均分配准确率

      Figure 5.  Averaging classification accuracy of different assignment proportions

      进一步, 对比同一分配比例下的平均分类准确率, 从表 6可以看出, CBR & RBFLR方法明显优于CBR方法, 其中分配比例分别为1 : 1、3 : 2、2 : 1和2 : 3时, CBR & RBFLR方法依次至少提高5.07$ \%$、7.37$ \%$、5.54$ \%$和7.18$ \%$; 对于CBR和CBR & RBFLR两类方法, 采用NN$\_$Rel分配权重在整体上均优于采用MA和NN$\_$Sal分配权重; NN-CBR方法在相关性和显著性两方面的平均分类准确率均优于MA-CBR, 其中分配比例分别为1 : 1、3 : 2、2 : 1和2: 3时, NN-CBR方法依次至少提高5.49$ \%$、5.79$ \%$、6.81$ \%$和2.94$ \%$, 究其原因在于NN-CBR方法考虑到属性间存在相关性, 以及各属性对仿真实验设计方法选取的影响程度不相等的情况.

      综上所述, 本文提出的一种基于神经网络的案例推理(NN-CBR)和基于规则的柔性逐层推理(RBFLR)相结合的混合推理方法, 利用较少的规则就能有效地提高仿真实验设计方法智能选择问题的分类准确率.另外, 丰富案例库和规则库, 有助于进一步提高仿真实验设计方法推荐的准确率.

    • 本文针对由于仿真实验设计方法众多而难以选择的问题, 提出了一种基于神经网络的案例推理和基于规则的柔性逐层推理相结合的混合推理方法.该方法能够根据当前问题的特征及用户需求等信息, 智能地推荐出合适的仿真实验设计方法.相比于MA-CBR、NN-CBR方法, 该混合推理方法分类准确率更高.需要说明的是, 本文所提出的基于规则的柔性逐层推理方法重新定义了规则的描述方式, 引入规则属性优先级的概念, 并给出了相应的推理策略.相比较传统的RBR方法, 该方法需要的规则数量大幅减少; 并且在对规则库中的条件属性集进行扩充、修改及删除等操作时, 仅需改动较少的规则即可, 可操作性强.后续可进一步研究属性权重的动态学习机制, 以提高CBR分类的运行性能.

参考文献 (27)

目录

    /

    返回文章
    返回